undefined

Umblättern mit der "Weiter"-Schaltfläche

Wednesday, July 14, 2021 4:29 PM

Das Umblättern ist der Prozess der Aufteilung eines Dokuments in einzelne Seiten, entweder elektronische Seiten oder gedruckte Seiten. Das Einrichten des Umblätterns ist ein wichtiger Prozess beim Web Scraping, um eine Vielzahl von Daten von mehreren Seiten zu erhalten. Gängige Möglichkeiten sind das Umblättern mit einer "Weiter"-Schaltfläche, einer "Mehr laden"-Schaltfläche oder mit unendlichem Scrollen.

 

In diesem Tutorial wird das Einrichten des Umblätterns mit einer "Weiter"-Schaltfläche in Octoparse vorgestellt.

 

Es gibt zwei Möglichkeiten, Umblättern mit einer "Weiter"-Schaltfläche einzurichten:

 

1) Verwenden den Algorithmus zur automatischen Detektion

 

2) Richten das Umblättern manuell ein

 

 

1) Verwenden den Algorithmus zur automatischen Detektion

 

Möglicherweise benötigen Sie diesen Beispiel-Link, um den Vorgang nachzuvollziehen: https://www.amazon.com/s?k=sunglass&ref=nb_sb_noss_2

 

1. Klicken Sie in "Tipps" auf die Option "Auto-detect web page data".

mark.png

 

 

2. Wenn die automatische Detektion abgeschlossen ist, überprüfen Sie, ob die Option "Paginate to scrape more pages"aktiviert ist. (Normalerweise wird diese Option automatisch in "Tipps" angezeigt).

create_pagination.png

 

 

3. Klicken Sie auf die Schaltfläche "Check", um zu prüfen, welche Schaltfläche als "Weiter"-Schaltfläche gekennzeichnet wird.

 check-pagination1.png

 

Wenn Octoparse die richtige Schaltfläche für die nächste Seite nicht erkennt, klicken Sie auf "Edit", um die nächste Schaltfläche manuell auszuwählen.

edit_pagination.gif

 

 

 

4. Klicken Sie auf "Create workflow" in Tipps und ein Workflow mit Umblättern wird erstellt.

create_workflow.png

 

 

5. Testen Sie den Workflow, indem Sie auf die "Pagination" klicken, um zu sehen, ob die Website zur nächsten Seite geht. Wenn ja, dann wird das Umblättern erfolgreich eingerichtet.

t4.gif

 

 

Tipps!

Wenn nach Abschluss der automatischen Detektion die Option "Paginate to scrape more pages" in Tipps nicht vorhanden ist, können wir zuerst auf "Workflow erstellen" klicken, und dann wird die Option in den Tipps angezeigt.

1.png

 

Wählen Sie die Schaltfläche "Nächste Seite" auf der Webseite und klicken Sie auf "Confirm".

1.gif

 

 

 

2) Richten das Umblättern manuell ein

 

1. Klicken Sie auf die Schaltfläche für die nächste Seite. Wählen Sie danach in Tipps die Option "Loop click single URL".

 nextbutton1.png

 

2. Wenn die Aktion „Pagination“ eingerichtet ist, klicken Sie auf die Leiste von "Pagination" und dann auf "Click to paginate", um zu prüfen, ob die Website zur nächsten Seite gehen kann. Wenn ja, haben Sie das Umblättern erfolgreich eingerichtet.

 t4.gif

 

Tipps!

Falls in Tipps die Option "Loop click single URL" nicht zu finden ist, können Sie "Loop click next page" oder "Loop click single element" auswählen.

 

Wenn Sie Probleme mit dem Extrahieren der Tabellendaten haben, senden Sie eine Anfrage an unser Support-Team! Wir werden uns innerhalb von 24 Stunden bei Ihnen melden.

 

 

btnImg
Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen