Alle Kollektionen
Octoparse Performance
Pagination Einstellung
Umgang mit Paginierung (mit Button „Nächst“)
Umgang mit Paginierung (mit Button „Nächst“)
Vor über einer Woche aktualisiert

Die Paginierung ist der Prozess der Aufteilung eines Dokuments in einzelne Seiten, entweder elektronische Seiten oder gedruckte Seiten. Das Einrichten der Paginierung ist ein wichtiger Prozess beim Web Scraping, um eine Vielzahl von Daten von mehreren Seiten zu erhalten. Gängige Möglichkeiten sind die Paginierung mit einem Button von „Weiter“ & „Nächste Seite“, „Mehr laden“ oder mit unendlichem Scrollen.

In der Regel befindet sich auf den meisten Webseiten in der Seitenleiste eine Schaltfläche zum Blättern, z. B. „Nächst“, „Weiter“, „Nächste Seite“, „>“ usw. In diesem Tutorial würden wir Ihnen die Methoden vorstellen, um in Octoparse mit diesem Fall umzugehen.

Vielleicht brauchen Sie diesen Beispiel-Link zu probieren:


Methode 1: Verwendung von Automatischer Detektionserfassung

  • Schritt 1: Klicken Sie auf „Daten der Webseite automatisch“ auf die Tipps-Platte.

  • Schritt 2: Klicken Sie auf den Button „Überprüfen“, um es zu untersuchen, welcher Button als einen Button von „Nächst“ gekennzeichnet wird. Der ausgewählte Button würde auf der Seite hervorgehoben.

Wenn Octoparse ist missgelungen, den richtigen nächsten Button von der Seite zu erkennen, klicken Sie auf „Bearbeiten“, um den Button „>“ manuell auszuwählen.

  • Schritt 3: Deselektieren Sie „Seitenblättern hinzufügen“ und klicken Sie dann auf „Workflow erstellen“ unter Tipps. Und Sie werden einen Workflow mit der erstellten Paginierung ansehen.

  • Schritt 4: Überprüfen Sie den Workflow beim Klick auf „Pagination“ und „Zum Paginieren klicken“, um zu sehen, ob Octoparse bereits genau zur nächsten Seite wechseln könnte.

Wenn es gut funktionieren kann, bedeutet es, dass Ihre Paginierung erfolgreich erstellt wurde.


Methode 2: Manuelle Einstellung

Wenn die Automatische Detektionsfunktion keinen richtigen Button von „Nächst Seite“ finden könnte, empfehlen wir Ihnen, manuell eine Pagination einzurichten.

  • Schritt 1: Klicken Sie auf den Nächst-Button, dann wählen Sie „Schleife klicken Sie auf die nächste Seite“ unter Tipps-Platte.

TIPP

Wenn es keine Option „Schleife klicken Sie auf die nächste Seite“ gibt, können Sie manuell eine Schleife im Workflow hinzufügen.

  • Prozess 1: Klicken Sie auf + im Workflow und eine Schleife darin hinzufügen.

  • Prozess 2: Wählen Sie den Schleifenmodus als „Einzelnes Element“ und dann entsprechen Sie dem Matching-XPath.

  • Prozess 3: Erstellen Sie ein Klick-Item in der Schleife. Wählen Sie den Modus von Matching-XPath als „Relativer XPath zum Schleifenelement“.

  • Schritt 2: Sie sollten diesen Schritt durch Klick überprüfen. Wenn es gut funktionieren kann, bedeutet es, dass Ihre Paginierung erfolgreich erstellt wurde.

Hat dies Ihre Frage beantwortet?