undefined

Scrapen Daten von Walmart  

Friday, June 11, 2021 9:51 AM

In diesem Tutorial zeigen wir Ihnen, wie Sie Produktdaten von Walmart.com scrapen können.

 

Sie können einfach unsere "Aufgabenvorlage" für Walmart verwenden. Mit der Vorlage brauchen Sie keine Aufgabe selbst zu konfigurieren, sondern nur einige Parameter einzugeben. Für weitere Details können Sie hier finden: Aufgabenvorlagen

 121612..png

 

Wenn Sie wissen möchten, wie Sie die Aufgabe von Grund auf selbst erstellen, können Sie das folgende Tutorial weiter lesen.

 

Nehmen wir an, dass wir spezifische Informationen über Kopfhörer scrapen möchten, und wir beginnen mit der Suchergebnisseite (https://www.walmart.com/search/?query=headphones). Wir werden Daten wie den Produkttitel, den Preis, die Produkt-ID und Bewertungen von der Produktdetailseite mit Octoparse scrapen.

 

 

Hier sind die wichtigsten Schritte in diesem Tutorial:  [Aufgabendatei hier herunterladen]

 

1. "Go To Web Page" - Öffnen die Ziel-Webseite

2. Detektieren automatisch die Daten von der Webseite - Erstellen einen Workflow

3. Klicken in jeden Produkt-Link, um weitere Informationen zu scrapen

4. Extrahieren Daten von der Detailseite 

5. Stellen die AJAX-Wartezeit für die Aktion "Click to Paginate"

6. Speichern und starten, um die Aufgabe auszuführen und Daten zu erhalten

 

 

1. "Go To Web Page" - Öffnen die Ziel-Webseite

 

• Geben Sie die Beispiel-URL ein und klicken Sie auf "Start".

 651651561565.png

 

 

2. Detektieren automatisch die Daten von der Webseite - Erstellen einen Workflow

 

• Klicken auf "Auto-detect web page data" und warten, bis die Detektion abgeschlossen ist

5614561481.gif 

 

• Überprüfen Sie die Datenfelder in der Datenvorschau, und Sie können auch die unerwünschten Felder löschen mceclip13.png oder Felder umbenennen mceclip14.png, falls erforderlich

 2.1.png

 

• Klicken auf "Create workflow"

 2.2.png

 

 

 

3. Klicken in jeden Produkt-Link, um weitere Informationen zu scrapen

 

• Wählen “Click on link(s) to scrape the linked page(s)”

• Wählen "Click on an extracted data field" und wählen eine Option aus dem Dropdown-Menü aus. Sie können in der Datenvorschau überprüfen, ob es der richtige Link ist.

• Klicken auf "Confirm"

 484984948498.gif

 

 

4. Extrahieren Daten von der Detailseite 

 

• Wählen Informationen auf der Webseite aus

• Wählen "Extract text of the selected element"

• Wiederholen die obigen Schritte, um alle benötigten Daten zu extrahieren

165156156.gif 

 

• Klicken Sie auf mceclip14.png, um die Feldnamen bei Bedarf zu ändern

 last.png

 

 

5. Stellen die AJAX-Wartezeit für die Aktion "Click to Paginate"

 

• Öffnen die Einstellungen der Aktion von "Click to Paginate"

• Stellen die AJAX-Wartezeit auf 10s ein

 5.1.gif

 

 

6. Speichern und starten, um die Aufgabe auszuführen und Daten zu erhalten

 

• Klicken auf "Save"

• Klicken auf "Run"

• Wählen "Run on your device", um die Aufgabe mit Ihrem lokalen Gerät auszuführen, oder Wählen "Run in the Cloud", um die Aufgabe auf unseren Cloud-Servern auszuführen (nur für Premium-Benutzer)

 6.png

 

 

Hier sind die Beispieldaten.

 mceclip2.png

 

 

 

btnImg
Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen