Alle Kollektionen
Octoparse Performance
Daten Scraping aus einem Tab
Daten Scraping aus einem Tab
Vor über einer Woche aktualisiert

Auf vielen Webseiten sind mehre Informationen durch Klicken auf ein Tab angezeigt. Deswegen wenn Sie die Daten aus einem bestimmten Tab extrahieren möchten, lesen Sie bitte das Tutorial duch. Mit einem Beipiel erfahren Sie, wie die Datenextraktion aus dem Tab realisiert ist.

Die Daten sollen aus Tab „Shipping and Returns” und „Size Guide” extahiert werden.

Daten Scraping aus einem Tab_01


Schritt 1: Erledigen Sie zuerst eine Klicken-Einstellung auf Tab.

  • Klicken Sie auf „Shipping and Returns”.

  • Wählen Sie „Click element“ auf „Tips”.

  • Machen Sie eine AJAX-Einstellung.

  • Dann klicken Sie auf die zu erfassenden Daten und wählen Sie „Extract the text of the element” auf „Tips”.

Daten Scraping aus einem Tab_02

Tipps!

  • Erfahren Sie die Hinweise über AJAX hier.

  • Die Einstellung „Open in a new tab” von „Click element” darf nicht geöffnet werden.

Daten Scraping aus einem Tab_03


Schritt 2: Extrahieren Sie die Daten aus Tab.

Hier sind zwei Situationen zu überlegen.

Situation 1: Die Daten sind direkt zu sehen in den Quellencoden ohne Klicken auf Tab.

In dieser Situation ist die Klicken-Einstellung wie oben angedeutet nicht mehr benötigt. Sie können die Daten direkt extrahieren.

Situation 2: Die Daten sind nur nach dem Klicken auf Tab anzuschauen.

Daten Scraping aus einem Tab_04

In dieser Situation gehen Sie zum Schritt 1 zurück und machen Sie die Einstellung wie folgend:

  • Schalten Sie den Button „Browse” an und öffnen Sie die „Browse mode”.

Daten Scraping aus einem Tab_05
  • Klicken Sie auf Tab „Shipping and Returns”, um den Inhalt in voller Form darzustellen.

  • Schalten Sie den Button „Browse” zu und öffnen Sie die „Workflow mode”.

  • Klicken Sie auf die zu extrahierenden Daten und wählen Sie „Extract the text of the element” auf „Tips”.

  • Dann haben Sie die Aufgabe erledigt.

Daten Scraping aus einem Tab_06

Hat dies Ihre Frage beantwortet?