undefined

Umgang mit Paginierung (mit Button „Nächste“)

Thursday, June 23, 2022 3:07 PM
Die Paginierung ist der Prozess der Aufteilung eines Dokuments in einzelne Seiten, entweder elektronische Seiten oder gedruckte Seiten. Das Einrichten der Paginierung ist ein wichtiger Prozess beim Web Scraping, um eine Vielzahl von Daten von mehreren Seiten zu erhalten. Gängige Möglichkeiten sind die Paginierung mit einem Button von „Weiter“, „Mehr laden“ oder mit unendlichem Scrollen.

 

In diesem Tutorial würden wir Ihnen die Methoden vorstellen, um mit der Paginierung mit einem Button von „Nächste“ in Octoparse umzugehen.
Es gibt insgesamt zwei Methoden, um die Paginierung mit einem Button von „Nächste“ in Octoparse einzurichten:

 

Methode 1 Einstellung der Paginierung bei Verwendung von Auto-Detect
Methode 2 Einstellung der Paginierung manuell

 

Vielleicht brauchen Sie diesen Beispiel-Link zu probieren:

 

 

Methode 1 Einstellung der Paginierung bei Verwendung von Auto-Detect

 

Schritt 1: Klicken Sie auf „Auto-detect web page data“ in der Tipps-Platte.
Schritt 2: Klicken Sie auf „Check“, um es zu untersuchen, welcher Button als einen Button von „Nächste“ bezeichnet wird.
Der ausgewählte Button würde auf der Seite hervorgehoben.

 

Check

 

Wenn Octoparse ist missgelungen für die Erkennung des richtigen nächsten Button von der Seite, klicken Sie auf „Edit“, um den Button „Nächst“ manuell zu klicken.

 

klicken Sie auf „Edit“

 

Schritt 3: Deselektieren Sie „Add a page scroll“ und klicken Sie dann auf „Create workflow“ in der Tipps-Platte. Und Sie werden einen Workflow mit der erstellten Paginierung ansehen.

 

Add a page scroll

 

Schritt 4: Überprüfen Sie den Workflow beim Klick auf „Pagination“ und „Click to paginate“, um zu sehen, ob Octoparse bereits zur nächsten Seite wechseln könnte.
Wenn es gut funktionieren kann, bedeutet es, dass Ihre Paginierung erfolgreich erstellt wurde.

 

 

Methode 2 Einstellung der Paginierung manuell

 

Wenn die Funktion „Auto-detect“ keinen richtigen Button von „Nächste“ finden könnte, könnten Sie eine Paginierung manuell einrichten.
Schritt 1: Klicken Sie auf „Nächste“, dann wählen Sie „Loop click next page“ in der Tipps-Platte.

 

Loop click next page

 

Tipps!
Wenn es keine Option „Loop click next page“ gibt, können Sie beliebige Option mit „Loop click“ wählen, um einen Loop der Paginierung zu generieren, wie „Loop click single element“, „Loop click single button“ und „Loop click single link“.

 

Schritt 2: Überprüfen Sie den Workflow, indem Sie auf „Pagination“ und „Click to paginate“ klicken, um zu sehen, ob Octoparse jetzt zur nächsten Seite wechseln kann.
Wenn es gut funktionieren kann, bedeutet es, dass Ihre Paginierung erfolgreich erstellt wurde.

 

operation

 

Wenn Sie Probleme bei der Datenextraktion haben, oder uns etwas Vorschlägen geben möchten, reichen Sie bitte uns eine Anfrage ein. Erfüllen Sie eine Anfrage hier. Oder Sie können durch E-Mail (support@octoparse.com) uns kontaktieren.

 

 

Autor*in: Das Octoparse Team

 

Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen