Alle Kollektionen
Octoparse 101
Lektion 5: Erhalten der Daten
Lektion 5: Erhalten der Daten
Vor über einer Woche aktualisiert

Jetzt haben Sie Ihre erste Scraping-Aufgabe erstellt und vollständig getestet. Sie können nun die Aufgabe ausführen, um einige gewünschten Daten auszulesen.


1. Zwei Möglichkeiten zum Erhalten der Daten

Es gibt gemeinsam zwei Möglichkeiten, wie Sie die Aufgabe ausführen können:

  • Ausführen auf Ihrem Gerät (auch bekannt als Lokal-Datenextraktion)

  • Ausführen in der Cloud (auch bekannt als Cloud-Datenextraktion)

Möglichkeit 1

Wenn Sie eine Aufgabe auf Ihrem Gerät ausführen, müssen Sie während des Extraktionsvorgangs die Octoparse-App öffnen lassen. Es wird ein Extraktionsfenster darin geben, und Sie können beobachten, wie die Daten gescrapt werden, und warten darauf, bis der Vorgang abgeschlossen ist.

Möglichkeit 2

Wenn Sie dagegen eine Aufgabe in der Cloud ausführen, wird die Aufgabe auf der Octoparse-Cloud-Plattform ausgeführt, d.h. Sie können die Octoparse-App oder sogar Ihren Computer ausschalten und danach Ihre Daten abholen, wenn die Aufgabe erledigt ist. Die in der Cloud ausgeführten Aufgaben laufen im Allgemeinen 4- bis 12-mal schneller im Vergleich zu Lokal-Extraktionen, was von Ihren Projektanforderungen abhängig ist. Sie können immer einen Plan wählen, der für Sie geeignet ist.

Notiz: Einige Aufgaben haben zwei Optionen, die jeweils „Standard Modus“ und „Boost Modus“ sind. Und die Optionen sind für die beiden Möglichkeiten Lokal-Datenextraktion und Cloud-Datenextraktion geeignet. Sie können die Unterschiede zwischen den zwei Modi in diesem Tutorial anschauen: Welche Unterschiede gibt es zwischen „Standard Mode“ und „Boost Mode“?


2. Eine Ausführung starten

Sobald Sie mit der Erstellung Ihrer Aufgabe fertig sind, können Sie auf den Button „Starten“ klicken, um eine Ausführung zu starten.

Alternativ können Sie auch auf die Aufgabe im Dashboard zugreifen und die Buttons „Starten/ Fortsetzen/ Stoppen“ verwenden, um den Stutus einer Aufgabe zu verändern.


3. Prüfen Ihrer Daten

Nachdem die Ausführung Ihrer Aufgabe abgeschlossen ist, können Sie Ihre Daten überprüfen.

Gehen Sie zum Dashboard und finden Sie Ihre Aufgabe. Schweben Sie über eine große Menge von gescrapten Zeilen und klicken darauf, um die gescrapten Daten von der neuesten Ausführung zu überprüfen. Klicken Sie auf „Alle Daten“, um die von allen Ausführungen gescrapten Daten zu checken.

Sie können außerdem Ihre Daten überprüfen, indem Sie auf das Symbol „“ auf dem Dashboard klicken. Dann selektieren Sie „Daten sehen“, um alle Cloud- oder Lokal-Daten zu sehen.


4. Export Ihrer Daten

Wenn die Daten gut aussehen, können Sie die Daten direkt exportieren, indem Sie auf „Daten exportieren“ klicken, das in der unteren rechten Ecke vom Datenansicht-Tab liegt. Octoparse unterstützt den Export von Daten in Excel-, CSV-, HTML-, Xml-Dateien oder in eine Datenbank oder Google Sheets.

Tipps!

  • Die in den Cloud gescrapten Daten kann auf jedem Gerät zugegriffen werden, solange Sie sich in Ihrem Konto anmelden.

  • Cloud-Datenextraktion werden nur für 3 Monate gespeichert, danach werden sie von den Cloud-Servern entfernt. Denken Sie bitte an den Export der Daten, bevor sie entfernt werden.

  • Wenn die Datenmenge 20K Datenzeilen übersteigt, werden sie in mehrere Datendateien exportiert (20K Zeilen pro Datei).

  • Die Cloud-Daten einer Aufgabe werden zusammen gespeichert, um Duplikate zu entfernen. Wenn Sie dieselbe Aufgabe zum zweiten Mal ausführen, werden beim zweiten Durchlauf wahrscheinlich Duplikate ausgelesen.

  • Cloud-Duplikate werden automatisch entfernt.

  • Lokal-Datenextraktion können nur auf dem Gerät zugegriffen werden, auf dem die lokale Extraktion ausgeführt wurde.

Funktioniert die Aufgabe nicht gut? Schauen Sie sich die FAQs unten an.


Hat dies Ihre Frage beantwortet?