undefined

Lektion 0: Octoparse-Grundlagen

Monday, May 24, 2021 12:20 PM

Hallo zusammen! Willkommen bei der brandneuen Octoparse-Version 8.1! Wir haben die wichtigste Veränderung der neuen Version zusammengefasst, um Ihnen zu helfen, die neue Funktionen zu entdecken und die Datenextraktion zu vereinfachen.

Nachdem Sie alle Einführungslektionen durchlaufen haben, werden Sie Octoparse 8.1 in- und auswendig kennen und in der Lage sein, Daten aus den meisten Webseiten zu extrahieren. Es dauert etwa 30 bis 60 Minuten, bis Sie alle Lektionen durchgelesen haben. Viel Spaß!

Beginnen wir mit einer Einführung in die Benutzeroberfläche und die wichtigsten Funktionen.

 

1. Die Benutzeroberfläche

 

Der Startbildschirm

 Das Seitenleistenmenü

﹡ Der Arbeitsbereich

 

2. Kernfunktionen

 

 Verwenden von Aufgabenvorlagen

 Scraping von Daten mit dem fortgeschrittenen Modus

 Cloud-Extraktion

 

1. Die Benutzeroberfläche

Sobald Sie sich bei Octoparse einloggen, finden Sie zwei Hauptbereiche: den Startbildschirm und die Seitenleiste.

 

home2.jpg

 

1.1 Der Startbildschirm

In der Mitte des Startbildschirms befindet sich eine Suchleiste. Sie können die URL der Zielwebsite eingeben, um mit der Erstellung einer Aufgabe zu beginnen, oder Sie können auch einen Vorlagennamen eingeben (z. B. Amazon oder eBay), um nach einer integrierten Scraping-Vorlage zu suchen.

Start_a_task.gifStart_a_task.gif

Sie können auch auf einige der beliebtesten Scraping-Vorlagen und Tutorials auf dem Startbildschirm zugreifen.  

 

 

1.2 Das Seitenleistenmenü

Das Seitenleistenmenü auf der linken Seite enthält alles, was Sie zur Navigation in Octoparse benötigen.

 

+Neu Button: Erstellen/Importieren einer neuen Aufgabe oder Erstellen neuer Aufgabengruppen.

Picture.png

 

Dashboard: Der einzige Ort, um alle Ihre Scraping-Aufgaben zu verwalten. Bearbeiten, löschen, umbenennen und organisieren Sie alle Aufgaben in Ihrem Konto. Sie können auch bequem alle Aufgaben ausführen, stoppen oder planen.

dashboard.png

 

Schnellfilter & Letzte Aufgaben: Verwenden Sie den Button, um schnell auf Ihre Aufgaben zuzugreifen.

 

1.3 Der Arbeitsbereich

Der Arbeitsbereich ist der Ort, an dem Sie Ihre Aufgaben erstellen werden. Er ist in vier Hauptbereiche unterteilt, wobei jeder Bereich einen bestimmten Zweck erfüllt.

workspace3.jpg

 

Der integrierte Brower: Sobald Sie die URL der Zielwebsite eingegeben haben, wird die Webseite in dem integrierten Browser geladen. Sie können die Webseite im Browse-Modus durchsuchen oder im Select-Modus die benötigten Daten extrahieren.

 

Der Workflow: Wenn Sie fortfahren, mit der Webseite zu interagieren, z. B. eine Webseite zu öffnen und auf ein Seitenelement/einen Button zu klicken, wird der gesamte Prozess automatisch in Form eines Workflows definiert.

 

Aktions-Tipps: Octoparse verwendet Smart Tipps, um während des Extraktionsprozesses mit Ihnen zu "sprechen", damit Octoparse Sie beim Prozess der Aufgabenerstellung führen kann.

 

Datenvorschau: Lassen Sie sich eine Vorschau der ausgewählten Daten anzeigen. Sie können die Datenfelder auch umbenennen oder die nicht benötigten entfernen.

 

2. Kernfunktionen

 

2.1 Aufgabenvorlagen

Aufgabenvorlagen sind eingebaute Aufgaben, mit denen Benutzer Daten durch Eingabe einfacher Parameter wie URL(s) oder Schlüsselwörter abrufen können. Derzeit gibt es über 60 Vorlagen für die meisten gefragte Website. Man braucht nicht, selbst eine Aufgabe zu erstellen und keine technischen Kenntnisse sind dabei erforderlich. Wählen Sie einfach eine Vorlage aus, die Sie brauchen, und prüfen Sie die Beispieldaten, um zu sehen, ob sie die gewünschten Daten erhalten können, dann los geht’s!

template.gif

 

2.2 Scrapen Daten mit fortgeschrittenem Modus

Im Gegensatz zu Aufgabenvorlagen, bei denen alles bereits voreingestellt ist, ist der Octoparse  fortgeschrittenem Modus ein hochflexibler und leistungsstarker Scraping-Modus, der es Ihnen ermöglicht, eine Scraping-Aufgabe zu erstellen, die an Ihre speziellen Anforderungen angepasst ist. Der fortgeschrittenem Modus ist genug, um komplizierte Webseiten zu scrapen, z. B. Seiten mit JavaScript, AJAX oder andere dynamische Webseiten.

Das Erstellen Ihrer eigenen Scraping-Aufgabe mit dem fortgeschrittenen Modus ist nicht kompliziert und einschüchternd. Mit dem neuen Auto-Detect-Algorithmus erkennt Octoparse automatisch Elemente auf einer Webseite und generiert empfohlene Aufgabeneinstellungen wie das Extrahieren der Liste und das Weitergehen zur nächsten Seite.

3.gif

Zusätzlich zu den automatisch erkannten Daten können Sie die Aufgabeneinstellungen jederzeit manuell bearbeiten oder eine Aufgabe selbst erstellen, indem Sie den Schritt der automatischen Erkennung überspringen können.

2.gif

 

Wenn Sie mit den automatisch erkannten Daten zufrieden sind, speichern Sie einfach die Einstellungen und Octoparse generiert den Aufgaben-Workflow automatisch. Sie können dem Workflow bei Bedürfnissen zusätzliche Schritte hinzufügen oder die Aktionen manuell ändern.

 

2.3 Cloud-Extraktion

Octoparse bietet eine leistungsstarke Cloud-Plattform für Premium-Benutzer (Standard oder höher), um Ihre Aufgaben 24/7 auszuführen.  Wenn Sie eine Aufgabe mit "Cloud-Extraktion" ausführen, läuft sie in der Cloud mit mehreren Servern unter Verwendung unserer IPs. Sie können die App oder Ihren Computer herunterfahren, während die Aufgabe ausgeführt wird. Sie müssen sich keine Gedanken über Hardware-Einschränkungen machen.

Die extrahierten Daten werden in der Cloud gespeichert und können jederzeit abgerufen werden. Erweiterte Funktionen wie automatische IP-Rotation, Aufgabenplanung, Beschleunigung der Extraktion und die Octoparse-API sind Teil des Octoparse-Cloud-Services.

 

Gut, dass Sie es hierher geschafft haben! Sie haben sich bereits die Grundlagen von Octoparse angeeignet.

Um zu lernen, wie Sie Ihre erste Scraping-Aufgabe erstellen, fahren Sie bitte fort mit >> Lektion 1: Daten extrahieren mit dem brandneuen Auto-Detect-Algorithmus

 

btnImg
Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen