Scrapen Daten von Walmart
Friday, June 11, 2021 9:51 AMIn diesem Tutorial zeigen wir Ihnen, wie Sie Produktdaten von Walmart.com scrapen können.
Sie können einfach unsere "Aufgabenvorlage" für Walmart verwenden. Mit der Vorlage brauchen Sie keine Aufgabe selbst zu konfigurieren, sondern nur einige Parameter einzugeben. Für weitere Details können Sie hier finden: Aufgabenvorlagen
Wenn Sie wissen möchten, wie Sie die Aufgabe von Grund auf selbst erstellen, können Sie das folgende Tutorial weiter lesen.
Nehmen wir an, dass wir spezifische Informationen über Kopfhörer scrapen möchten, und wir beginnen mit der Suchergebnisseite (https://www.walmart.com/search/?query=headphones). Wir werden Daten wie den Produkttitel, den Preis, die Produkt-ID und Bewertungen von der Produktdetailseite mit Octoparse scrapen.
Hier sind die wichtigsten Schritte in diesem Tutorial: [Aufgabendatei hier herunterladen]
1. "Go To Web Page" - Öffnen die Ziel-Webseite
2. Detektieren automatisch die Daten von der Webseite - Erstellen einen Workflow
3. Klicken in jeden Produkt-Link, um weitere Informationen zu scrapen
4. Extrahieren Daten von der Detailseite
5. Stellen die AJAX-Wartezeit für die Aktion "Click to Paginate"
6. Speichern und starten, um die Aufgabe auszuführen und Daten zu erhalten
1. "Go To Web Page" - Öffnen die Ziel-Webseite
• Geben Sie die Beispiel-URL ein und klicken Sie auf "Start".
2. Detektieren automatisch die Daten von der Webseite - Erstellen einen Workflow
• Klicken auf "Auto-detect web page data" und warten, bis die Detektion abgeschlossen ist
• Überprüfen Sie die Datenfelder in der Datenvorschau, und Sie können auch die unerwünschten Felder löschen oder Felder umbenennen
, falls erforderlich
• Klicken auf "Create workflow"
3. Klicken in jeden Produkt-Link, um weitere Informationen zu scrapen
• Wählen “Click on link(s) to scrape the linked page(s)”
• Wählen "Click on an extracted data field" und wählen eine Option aus dem Dropdown-Menü aus. Sie können in der Datenvorschau überprüfen, ob es der richtige Link ist.
• Klicken auf "Confirm"
4. Extrahieren Daten von der Detailseite
• Wählen Informationen auf der Webseite aus
• Wählen "Extract text of the selected element"
• Wiederholen die obigen Schritte, um alle benötigten Daten zu extrahieren
• Klicken Sie auf , um die Feldnamen bei Bedarf zu ändern
5. Stellen die AJAX-Wartezeit für die Aktion "Click to Paginate"
• Öffnen die Einstellungen der Aktion von "Click to Paginate"
• Stellen die AJAX-Wartezeit auf 10s ein
6. Speichern und starten, um die Aufgabe auszuführen und Daten zu erhalten
• Klicken auf "Save"
• Klicken auf "Run"
• Wählen "Run on your device", um die Aufgabe mit Ihrem lokalen Gerät auszuführen, oder Wählen "Run in the Cloud", um die Aufgabe auf unseren Cloud-Servern auszuführen (nur für Premium-Benutzer)
Hier sind die Beispieldaten.