Umblättern mit der "Weiter"-Schaltfläche
Wednesday, July 14, 2021 4:29 PMDas Umblättern ist der Prozess der Aufteilung eines Dokuments in einzelne Seiten, entweder elektronische Seiten oder gedruckte Seiten. Das Einrichten des Umblätterns ist ein wichtiger Prozess beim Web Scraping, um eine Vielzahl von Daten von mehreren Seiten zu erhalten. Gängige Möglichkeiten sind das Umblättern mit einer "Weiter"-Schaltfläche, einer "Mehr laden"-Schaltfläche oder mit unendlichem Scrollen.
In diesem Tutorial wird das Einrichten des Umblätterns mit einer "Weiter"-Schaltfläche in Octoparse vorgestellt.
Es gibt zwei Möglichkeiten, Umblättern mit einer "Weiter"-Schaltfläche einzurichten:
1) Verwenden den Algorithmus zur automatischen Detektion
2) Richten das Umblättern manuell ein
1) Verwenden den Algorithmus zur automatischen Detektion
Möglicherweise benötigen Sie diesen Beispiel-Link, um den Vorgang nachzuvollziehen: https://www.amazon.com/s?k=sunglass&ref=nb_sb_noss_2
1. Klicken Sie in "Tipps" auf die Option "Auto-detect web page data".
2. Wenn die automatische Detektion abgeschlossen ist, überprüfen Sie, ob die Option "Paginate to scrape more pages"aktiviert ist. (Normalerweise wird diese Option automatisch in "Tipps" angezeigt).
3. Klicken Sie auf die Schaltfläche "Check", um zu prüfen, welche Schaltfläche als "Weiter"-Schaltfläche gekennzeichnet wird.
Wenn Octoparse die richtige Schaltfläche für die nächste Seite nicht erkennt, klicken Sie auf "Edit", um die nächste Schaltfläche manuell auszuwählen.
4. Klicken Sie auf "Create workflow" in Tipps und ein Workflow mit Umblättern wird erstellt.
5. Testen Sie den Workflow, indem Sie auf die "Pagination" klicken, um zu sehen, ob die Website zur nächsten Seite geht. Wenn ja, dann wird das Umblättern erfolgreich eingerichtet.
Tipps!
Wenn nach Abschluss der automatischen Detektion die Option "Paginate to scrape more pages" in Tipps nicht vorhanden ist, können wir zuerst auf "Workflow erstellen" klicken, und dann wird die Option in den Tipps angezeigt.
Wählen Sie die Schaltfläche "Nächste Seite" auf der Webseite und klicken Sie auf "Confirm".
2) Richten das Umblättern manuell ein
1. Klicken Sie auf die Schaltfläche für die nächste Seite. Wählen Sie danach in Tipps die Option "Loop click single URL".
2. Wenn die Aktion „Pagination“ eingerichtet ist, klicken Sie auf die Leiste von "Pagination" und dann auf "Click to paginate", um zu prüfen, ob die Website zur nächsten Seite gehen kann. Wenn ja, haben Sie das Umblättern erfolgreich eingerichtet.
Tipps!
Falls in Tipps die Option "Loop click single URL" nicht zu finden ist, können Sie "Loop click next page" oder "Loop click single element" auswählen.
Wenn Sie Probleme mit dem Extrahieren der Tabellendaten haben, senden Sie eine Anfrage an unser Support-Team! Wir werden uns innerhalb von 24 Stunden bei Ihnen melden.