Alle Kollektionen
Praktische Einführung
E-Commerce
Scraping der Produktinformationen von Target.com (V8)
Scraping der Produktinformationen von Target.com (V8)
Vor über einer Woche aktualisiert

Sie folgen jetzt einem Tutorial für die neueste Version von Octoparse. Wenn Sie zur Zeit eine ältere Version verwenden, empfehlen wir Ihnen kräftig es, ein Upgrade zu machen, weil sie schneller, leichter und stärker ist! Herunterladen und Installierung eines Upgrades hier, wenn Sie nicht so bereits machen!

Target.com ist einer der größten Online-Händler in USA. In diesem Tutorial zeigen wir Ihnen, wie Sie die Produktinformationen von Target.com scrapen können.

2022-05-26_18-05-06.jpg

Zum Nachvollziehen können Sie diese URL im Tutorial verwenden:

Hier sind die wichtigsten Schritte in diesem Tutorial. [Aufgabendatei hier herunterladen]


Schritt 1: „Go To Web Page“ - um die Ziel-Webseite zu öffnen

  • Geben Sie die URL auf der Startseite ein und klicken Sie auf „Start“.

target_0007.jpg

  • Klicken Sie auf „Option“.

  • Klicken Sie auf „Scroll down the page after it is loaded“.

  • Kreuzen Sie „Scroll for one screen“ an.

  • Stellen Sie die Wartezeit als 3s und „Repeats“ als 15 times ein.

target_0000.jpg


Schritt 2: Speichern der Cookies - um die Produktinfo zu laden

Da die Produktinformationen nur angezeigt werden, wenn es einen bestimmten Shop auf Target.com gibt, müssen wir einen auswählen und Octoparse anweisen, unsere Wahl zu speichern.

  • Wecheseln Sie den Modus in Browse, indem Sie auf den „Browse“ Button oben rechts auswählen.

  • Klicken Sie auf „Please select a Store“.

target_0005.jpg

  • Geben Sie Ihr Zip-Code ein, um die Geschäfte in der Nähe zu finden. - Wählen Sie dann beim Bedarf die Geschäfte.

target_0004.jpg

  • Klicken Sie auf „Use Cookie“ > Klicken Sie auf „Use cookie from current page“ > „Apply“

target1_0001.jpg
  • Schalten Sie „Browse Mode“ aus.


Schritt 3: Automatisches Detektieren der Daten von Webseite - um einen Workflow zu erstellen

  • Klicken Sie auf „Auto-detect web page data“ und warten, bis die Detektion abgeschlossen ist.

target_0002.jpg

  • Überprüfen Sie die Datenfelder in der Datenvorschau und löschen Sie unerwartete Felder oder bennen Sie sie bei Bedarf um.

target_0000.jpg

  • Kreuzen Sie „Add a page scroll“ nicht an.

  • Klicken Sie auf „Create workflow“.

target_0001.jpg


Schritt 4: Modifizieren der Einstellungen von Pagination - um den Kontext der Webseite umfassend zu laden

  • Wählen Sie „Click to paginate“ im Workflow > Klicken Sie auf „Option“.

  • Klicken Sie auf „Scroll down the page after it is loaded“.

  • Wählen Sie „Scroll for one screen“ aus.

  • Stellen Sie die Wartezeit als 3s und „Repeats“ als 15 times ein.

target_0001.jpg

Notiz: Wir brauchen den XPath der Paginierung verändern. Sonst würde Octoparse immer die letzte Seite scrapen und unendlich enden.

  • Selektieren Sie den Paginierungskasten im Workflow.

  • Geben Sie den Matching-XPath darin ein: //button[@data-test='next' and not(@disabled)].

target00000.jpg


Schritt 5: Ausführen der Aufgabe - um Ihre gewünschten Daten zu erhalten

  • Klicken auf „Save“.

  • Klicken auf „Run“.

  • Wählen „Run on your device“, um die Aufgabe mit Ihrem lokalen Gerät auszuführen.

  • Warten Sie, bis die Aufgabe abgeschlossen ist.


Hier sind die Beispieldaten.

target00001.jpg
Hat dies Ihre Frage beantwortet?