undefined

Was ist eine Aufgabe? (Version 8)

Tuesday, July 06, 2021 10:47 AM

Alles, was Sie in Octoparse tun, beginnt mit der Erstellung einer Aufgabe. Eine Scraping-Aufgabe wird in Octoparse auch als "ein Bot" bezeichnet. Unabhängig davon, wie sie genannt wird, ist eine Aufgabe im Wesentlichen eine Reihe von Anweisungen, denen das Programm folgen soll.

Eine Aufgabe zu erstellen ist in Octoparse unkompliziert. Zuerst laden Sie Ihre Ziel-Webseite in dem integrierten Browser von Octoparse und wählen die Daten aus, die Sie extrahieren möchten. Sobald Sie die gewünschten Daten ausgewählt haben, wird automatisch ein Workflow generiert, der reflektiert, wie Sie mit der Webseite interagiert haben, z. B. wenn Sie auf eine bestimmte Schaltfläche geklickt haben, wird die Aktion "Click element" bestimmt im Workflow generiert.

Octoparse simuliert die realen Browsing-Aktionen, indem es klickt, sucht, paginiert und schließlich die Zieldaten erreicht und scrapt, alles durch Befolgen der Schritte im Workflow. Auf diese Weise extrahiert Octoparse Daten von der beliebigen Webseite.

 

Advanced Mode vs. Aufgabenvorlagen
Es gibt zwei Möglichkeiten, eine Scraping-Aufgabe in Octoparse zu erstellen. Sie können eine Aufgabe mit "Advanced Mode" erstellen, indem Sie die Aufgabe konfigurieren müssen, oder können Sie "Task Templates" verwenden, indem Sie eine Aufgabenvorlage wählen können und nicht selbst die Aufgabe einrichten müssen. Für Einsteiger ist die zweite Option relativ einfacher.

 

8714871719819.png

 

Advanced Mode
Mit "Advanced Mode" können Sie Ihre eigene Scraping-Aufgabe nach eigenen Bedürfnissen individualisieren, z. B. mit Schlüsselwörtern suchen, sich in Ihr Konto einloggen, eine Option aus dem Dropdown wählen und vieles mehr. Einfach gesagt, dass "Advanced Mode" alle Ihre Bedürfnisse beim Web-Scraping abdecken kann.

 

1651561651561165165.png

 

Aufgabenvorlagen
Im Gegensatz zum "Advanced Mode" bietet Aufgabenvorlagen eine große Anzahl von voreingestellten Vorlagen für die beliebtesten Websites. Diese Aufgaben sind vorgefertigt, sodass Sie nur ein paar Parameter einzugeben brauchen, wie z. B. den Suchbegriff und die Zielseiten-URL, damit Sie Daten von der Website abrufen können.

6516516516165.png

 

Sind Sie bereit, selbst Daten zu scrapen? Folgen Sie den einführenden Lektionen und deren Schritt-für-Schritt-Anleitung, und erstellen Sie Ihre erste Aufgabe.

 

 

Anmerkung:

1. Die Schnittstellen von Version7 und Version8 sind unterschiedlich, die Auto-Detektion-Funktion gibt es nur in Version8.
2. Sie können die Auto-Detektion-Funktion nutzen, um zunächst einen grundlegenden Arbeitsablauf zu erhalten und ihn dann nach eigenen Bedürfnissen zu ändern oder zu optimieren.
3. Normalerweise wird ein Crawler verwendet, um Daten von einer Website (oder URLs unter einer Domain) zu Scrapen. Denn ein Crawler kann nur Daten von Webseiten mit einer ähnlichen Seitenstruktur scrapen. Trotzdem können Sie versuchen, E-Mail-Adressen aus einer Liste von Websites mit einem Crawler zu extrahieren. Hier ist die Anleitung darüber: Kann ich E-Mail-Adressen von mehreren unähnlichen Websites extrahieren? (Englisch Tutorial)

 

 

Tipps für die Verwaltung Ihrer Aufgaben


1. Bearbeiten der Aufgabeninformationen

Der Aufgabenname wird automatisch erstellt, wenn Sie die eingegebene URL speichern.

- Um den Aufgabennamen zu ändern, klicken Sie auf das Textfeld oberhalb des Workflow-Panels und geben Sie einen neuen Namen ein.

 

1956156156165136.png

 

 - Klicken Sie auf , um den Namen einer gespeicherten Aufgabe zu bearbeiten

1651561651651561.png

 

2. Weitere Methoden zur Aufgabenverwaltung

Hier finden Sie weitere Methoden zur Aufgabenverwaltung, die Sie verwenden können.

 

Optionen für die Aufgabenverwaltung in "Weitere Aktionen"

 

·"Edit": "Bearbeiten" - Doppelklicken Sie auf den Aufgabennamen auf dem Dashboard, um ihn zu bearbeiten.

· "Delete": "Löschen" - Aufgabe löschen

· "Rename": "Umbenennen" - Aufgabe umbenennen

·"Settings": "Einstellungen" - Grundeinstellungen (einschließlich Aufgabengruppe und Beschreibung) und Extraktionseinstellungen (einschließlich Cloud-Aufgabenteilung & Bildladeeinstellung & Werbeblockierung; Browser-Benutzeragentenumschaltung; inkrementelle Cloud-Extraktion)

· "Duplicate":"Duplizieren" - Aufgabe duplizieren

· "Export""Exportieren" - Aufgabe exportieren

 

1_6512_62626262.png

 

So verwalten Sie mehreren Aufgaben:

- Wählen Sie mehrere Aufgaben aus (Es funktioniert auch bei der Auswahl einer Aufgabe).

- Wählen Sie die verfügbaren Optionen für die Verarbeitung

- Um die ausgewählten Elemente zu deaktivieren, klicken Sie auf "Unselected"

 

165165165165165165.png

 

 

btnImg
Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen