Daten Scraping von Produktsvarianten
Friday, June 10, 2022 5:27 PMFür E-Commerce ist es nicht selten, die Produktsdaten zu extahieren. Die meisten Informationen eines Produkts sind auf der Webseite direkt zu sehen, aber in einigen Fällen ist die Etraktion der Daten von Produktsvarianten auf einer Seite in Bedarf.
In diesem Tutorial erfahren Sie, wie sind die Daten von verschiedenen Produktsvarianten, wie z.B. die SKU, der Preis, die Farbe zu ersfassen.
Hier ist ein praktisches Beipiel angezeigt: https://www.walmart.com/ip/SoftSheen-Carson-Dark-and-Lovely-Fade-Resist-Rich-Conditioning-Color/10314047
Aufgabe: Extrahieren Sie die Preise von Haarfärbemittel für jede Farbe.

Für dieses Produkt sind die Farbe, der Preis, die Bilder, die Seiten-URL und die Produkt-ID von jeder Option unterschiedlich.

Überblick
Schritt 1: Geben Sie Produkt-URL(s) ein, um eine neue Aufgabe zu starten.

Schritt 2: Erstellen Sie ein „loop item”, um die Daten von jeder Option zu extrahieren.
• Klicken Sie auf die erste Farboption in der Liste, und wählen Sie dann „Select all” in „Tips”.

• Wählen Sie dann „Loop click each element”.

• In diesem Fall sollen Sie die AJAX-Wartezeit einstellen, denn diese Webseite mit AJAX-Technik bestellt ist. (Erfahren Sie mehr über AJAX: Handling AJAX)

• Klicken Sie auf „Click item”, und deaktivieren die Option „Open in a new tab”.
• Klicken Sie auf „Apply” um die Einstellung zu behalten.
Schritt 3: Wählen Sie die Daten auf der Seite und benennen die im Datenfelder um, die Sie extrahieren möchten.

Hier liegt ein Datenausgabe als Beispiel:

Autor*in: Das Octoparse Team