Alle Kollektionen
Octoparse Performance
Pagination Einstellung
Umgang mit Paginierung (mit Button „Mehr Laden“)
Umgang mit Paginierung (mit Button „Mehr Laden“)
Vor über einer Woche aktualisiert

Viele Websites verwenden einen Button von „Mehr laden“ oder „Weiter anzeigen“, um Inhalte kontinuierlich zu laden. Diese Technik wird bei den Websites viel verwendet, die für Benutzer/innen eine bessere Erfahrung anbieten möchten.

Mehr laden Button

Im Vergleich zur Paginierung mit einem Button von „Weiter“ fügen Websites mit „Mehr laden“ kontinuierlich mehrere Inhalte auf einer einzelnen Webseite hinzu, was das Web Scraping schwieriger macht. In diesem Artikel zeige ich Ihnen, wie Sie mit dem Button „Mehr laden“ in Octoparse umgehen können.

Vielleicht brauchen Sie diesen Link als Beispiel zu probieren:


Methode 1 Verwendung des Auto-Detect mit Button „Mehr laden“

  • Schritt 1: Starten Sie den Prozess von Auto-Detect und dann würden Sie die Option „Click on a ‚Load More‘ button“ in der Tipps-Platte.

Click on a ‚Load More‘ button

  • Schritt 2: Klicken Sie auf „Check“ zu sehen, ob der Button „Mehr laden“ schon richtig lokalisiert wurde. Wenn noch nicht, können Sie auf „Edit“ klicken, um den rechten Button auszuwählen.

operation

  • Schritt 3: Klicken Sie auf „Edit“, um „Number of clicks“ einzustellen, was bedeutet, wie viele Male Sie auf den Button „Mehr laden“ klicken möchten.

number of clicks setting

  • Schritt 4: Klicken Sie auf „Create workflow“, um die Eintsllungen zu generieren.

Der Workflow sollte wie das folgende Bild aussehen:

Create workflow

Mit dem Workflow würde Octoparse auf den Button „Mehr laden“ klicken, während die Daten auch gescrapt werden. Wenn „Number of clicks“ bereits die Nummer 20 eingestellt wurde und es nach Ihrem Klick 20 neue Items geladen sind, würde Octoparse jedes Mal 20 neu geladenen Items mit jedem Klick auf „Mehr laden“.


Methode 2 Erstellung einer Paginierung manuell

  • Schritt 1: Selektieren Sie den Button „Mehr laden“ auf der Webseite und dann wählen Sie „Loop click single elemet“.

  • Schritt 2: Stellen Sie einen ordentlichen AJAX-Timeout (Was ist AJAX?).

operation

Tipps!

1. Wenn Sie den Button „Mehr laden“ nur X-mal anklicken wollen, klicken Sie auf das Einstellungssymbol von „Pagination“. Dann kreuzen Sie „Repeats“ an und setzen Sie „Repeats“ auf die Zahl X.

pagination

2. Wenn Sie es versuchen, dass die Aufgabe zahlreiche Duplikate während des Scraping erhält, können Sie das Loop Item aus der Paginierung ziehen, sodass Octoparse starten könnte, nach dem Laden alle Items zu scrapen.

operation
Hat dies Ihre Frage beantwortet?