Octoparse

TripAdvisor bietet Online-Hotelreservierungen und Buchungen für Transport, Unterkunft, Reiseerlebnisse und Restaurants. Nutzer können durch den Vergleich von Hotels und Restaurants auf der Plattform einen besseren Service finden, um ihre Reise besser genießen zu können.

In diesem Tutorial zeigen wir Ihnen, wie Sie Hoteldaten von Tripadvisor scrapen können.

Für das Scraping von Tripadvisor können Sie unsere gebrauchsfertige Aufgabenvorlage verwenden, die Sie auf der Homepage finden, oder Sie folgen dieser Anleitung, um die Aufgabe von Grund auf neu zu erstellen.

Zur Veranschaulichung wird diese URL als Beispiel verwendet: <a href="https://www.tripadvisor.com/Hotels-g186338-London_England-Hotels.html" rel="nofollow noopener noreferrer" target="_blank">https://www.tripadvisor.com/Hotels-g186338-London_England-Hotels.html</a>

Tipps: Wenn Sie überprüfen wollen, ob Ihr Arbeitsablauf korrekt funktioniert, laden Sie bitte die Aufgaben-OTD-Datei für diesen Fall am Ende dieser Seite herunter.

In der rechten Seitenleiste sind die hauptsächlichen Schritte in diesem Tutorial.

___________________________________________________________

Schritt 1: Erstellung von „Go to Web Page“ - um die Ziel-Website zu öffnen

Kopieren Sie die URL und klicken Sie dann auf „Start“.

- Kopieren Sie die URL und klicken Sie dann auf „Start“.

Schritt 2: Klicken auf „See all“ - um alle Hotels herunterzuladen

Wir müssen zuerst auf den „See all“ Button klicken, um alle Hotels angezeigt zu werden.

Selektieren Sie den „See all“ Button.

Wählen Sie dann „Click Button“ auf der Tipps-Platte.

- Selektieren Sie den „See all“ Button.
- Wählen Sie dann „Click Button“ auf der Tipps-Platte.

Stellen Sie AJAX als „5s“ ein.

- Stellen Sie AJAX als „5s“ ein.

Schritt 3: Erstellung einer Paginierung - um die Daten aus verschiedenen Seiten zu scrapen

Scrollen Sie nach unten, um den Button „Next“ zu finden.

Wählen Sie „Loop click next page“ aus.

Stellen Sie „Set AJAX timeout“ als „10s“ ein.

- Scrollen Sie nach unten, um den Button „Next“ zu finden.
- Wählen Sie „Loop click next page“ aus.
- Stellen Sie „Set AJAX timeout“ als „10s“ ein.

Schritt 4: Erstellung eines „Loop Item“ - um die Daten aus der Listing zu scrapen

Selektieren Sie „Loop click each URL“.

- Klicken Sie auf 2 zufällige Hoteltitel.
- Selektieren Sie „Loop click each URL“.

Klicken Sie auf jedes Datum, was Sie extrahieren möchten.

Selektieren Sie „Extract the text of the element“.

Wiederholen Sie den obenen Schritt, bis alle benötigten Daten ausgewählt sind.

- Klicken Sie auf jedes Datum, was Sie extrahieren möchten.
- Selektieren Sie „Extract the text of the element“.
- Wiederholen Sie den obenen Schritt, bis alle benötigten Daten ausgewählt sind.

Gehen Sie zur „Data Preview“. Dann klicken Sie doppelt darauf, um das Feld umzubenennen.

- Gehen Sie zur „Data Preview“. Dann klicken Sie doppelt darauf, um das Feld umzubenennen.

Modifizieren Sie den XPath von dem „Loop Item“: //a[@data-clicksource="HotelName"]

- Modifizieren Sie den XPath von dem „Loop Item“: //a[@data-clicksource="HotelName"]

Folgend ist der endgültige Workflow. Wenn alles in Ordnung ist, können Sie die Aufgabe weiter durchzuführen.

Schritt 5: Speichern und Durchführung der Aufgabe - um die Daten zu erhalten

Führen Sie die Aufgabe in der oben rechten Ecke durch.

Wählen Sie „Run on your device“, um die Aufgabe auf Ihrem eigenen Gerät durchzuführen. Oder selektieren Sie „Run in the cloud“, um die Aufgabe in der Cloud durchzuführen (nur für Premium-Nutzer).

- Führen Sie die Aufgabe in der oben rechten Ecke durch.
- Wählen Sie „Run on your device“, um die Aufgabe auf Ihrem eigenen Gerät durchzuführen. Oder selektieren Sie „Run in the cloud“, um die Aufgabe in der Cloud durchzuführen (nur für Premium-Nutzer).

<a href="https://helpcenter.octoparse.com/hc/en-us/article_attachments/9477985108377/Task_File_-_Tripadvisor_20220814104119_1.otd">Task File - Tripadvisor_20220814104119_1.otd</a>

Scraping der Hotel-Infos von Tripadvisor

Go to Octoparse.com

Octoparse DE

Octoparse FR

Octoparse ES

Octoparse JP

Download

Blog

API Docs

Finden Sie Antworten und erhalten Sie Hilfe vom Intercom-Support und von Community-Experten