undefined

Scrapen die Produktdaten von Amazon  

Monday, May 31, 2021 3:52 PM

 Amazon ist eine der beliebtesten E-Commerce-Websites auf der ganzen Welt. Viele Benutzer versuchen, die Produktinformationen von Amazon zu scrapen. In diesem Tutorial zeigen wir Ihnen, wie Sie mit Octoparse Produktdaten von Amazon einfach scrapen können.

 

Sie können integrierte Aufgabenvorlagen im Hauptbildschirm des Octoparse-Scraping-Tools  finden und direkt den gebrauchsfertigen Amazon-Vorlagen verwenden. Octoparse bietet mehrere Amazon-Vorlagen, die für verschiedene Länder wie Deutschland, Frankreich, die USA, Spanien und Indien entwickelt wurden. Mit dieser Funktion müssen Sie nicht selbst Scraping-Aufgaben konfigurieren. Für weitere Details können Sie hier nachsehen: Aufgaben-Vorlagen

 

15191515615.png

 

Zum Üben können Sie diese URL im Tutorial verwenden:

https://www.amazon.com/s?rh=i%3Aelectronics%2Cn%3A172541%2Cp_n_feature_four_browse-bin%3A12097501011&ie=UTF8&lo=electronics

 

 

 

Hier sind die wichtigsten Schritte in diesem Lernprogramm: [Sie können hier external-link-symbol-1.png die Aufgabendatei herunterladen ]

 

 

1. "Go To Web Page" - Öffnen Sie die Ziel-Webseite

2. Automatische Detektion der Webseite - Erstellen eines Workflows

3. Klicken Sie in jeden Produkt-Link, um weitere Informationen zu extrahieren

4. Daten extrahieren - Daten auf den Detailseiten extrahieren

5. AJAX-Wartezeit für "Klicken zum Paginieren" einrichten

6. Extraktion ausführen - führen Sie Ihre Aufgabe aus und erhalten Sie die Daten

 

 

1. "Go To Web Page" - Öffnen Sie die Ziel-Webseite

• Geben Sie die Beispiel-URL ein und klicken Sie auf "Start".

61495456415.png

 

2. Automatische Detektion der Webseite - Erstellen eines Workflows

• Klicken Sie auf "Automatische Detektion der Webdaten" und warten Sie, bis die Detektion abgeschlossen ist.

 651565.gif

 

• Löschen Sie unerwünschte Felder und ändern Sie bei Bedarf Feldnamen in der Datenvorschau

 2.1.png

 

• Wählen Sie "Workflow erstellen" in „Tipps“

          2.2.png

 

Eine Paginierung und ein Loop Item würden automatisch im Workflow erzeugt werden.

 

         mceclip0.png

 

Wenn alle Daten, die Sie benötigen, schon gescrapt werden, können Sie hier aufhören und zu der Einstellung der AJAX-Wartezeit in "Klicken zum Paginieren" springen. Wenn Sie noch zu der Produkt-Detailseite gehen möchten, um detaillierte Informationen zu erhalten, folgen Sie bitte den unten stehenden Schritten.

 

3. Klicken Sie in jeden Detail-Link, um weitere Informationen zu scrapen

 

• Wählen Sie "Klicken auf den Link, um die verlinkten Seiten zu scrapen" in „Tipps“

• Wählen Sie "Title_URL" aus der Dropdown-Option

• Klicken Sie auf "Bestätigen"

 15961295.gif

Octoparse würde automatisch auf die erste Detailseite gehen.

 

4. Daten extrahieren - Daten auf den Detailseiten extrahieren

 

• Wählen Sie Informationen auf der Webseite aus

• Wählen Sie "Text des ausgewählten Elements extrahieren"

• Wiederholen Sie die obigen Schritte, um alle Daten zu extrahieren, die Sie benötigen

 95814925962.gif

 

5. AJAX-Wartezeit für "Klicken zum Paginieren" einrichten

 

• Öffnen Sie die Aktionseinstellungen von "Klicken zum Paginieren"

• Wählen Sie "Laden mit AJAX" und stellen Sie 10s AJAX-Wartezeit ein

 5..gif

 

6. Extraktion ausführen - führen Sie Ihre Aufgabe aus und erhalten Sie die Daten

 

• Klicken Sie auf "Speichern"

• Klicken Sie auf "Ausführen"

• Wählen Sie "Aufgabe auf Ihrem Gerät ausführen", um die Aufgabe mit Ihrem lokalen Gerät auszuführen, oder wählen Sie "Aufgabe in der Cloud ausführen", um die Aufgabe auf unseren Cloud-Servern auszuführen (nur für Premium-Benutzer)

 9859_859_59_.gif

 

Hier sind Daten für die Beispielaufgabe.

 56156156.png

 

btnImg
Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen