Alle Kollektionen
Praktische Einführung
Reisegewerbe
Scraping der Hotelinformationen von Trip.com
Scraping der Hotelinformationen von Trip.com
Vor über einer Woche aktualisiert

Sie folgen jetzt einem Tutorial für die neueste Version von Octoparse. Wenn Sie zur Zeit eine ältere Version verwenden, empfehlen wir Ihnen kräftig es, ein Upgrade zu machen, weil sie schneller, leichter und stärker ist! Herunterladen und Installierung eines Upgrades hier, wenn Sie nicht so bereits machen!

Mit einem Netzwerk, das zahlreiche Hotels in mehr als 200 Ländern und Regionen enthält, hilft Trip.com den Kunden, eine klare Entscheidung zu treffen, dass Sie ein bequemeres und günstiges Hotel finden können. Die Kunden können die Informationen hier finden, z. B. Preis, Service und Kundenbewertungen eines Hotels.

In diesem Tutorial zeigen wir Ihnen, wie Sie Hotelinformationen auf Trip.com mit Octoparse sammeln können.

tripcom0007.jpg

Zum Nachvollziehen können Sie diese URL im Tutorial verwenden:

In der rechten Seitenleiste sind die wichtigsten Schritte in diesem Tutorial. [Aufgabendatei hier herunterladen]


1. „Go To Web Page“ - Öffnen die Ziel-Webseite

  • Geben die URL auf der Startseite ein und klicken auf „Start“.

tripcom0006.jpg

Notiz: Die Art und Weise, wie Trip.com mit der Paginierung umgeht, ist ein wenig kompliziert. Wir müssen mehrere Male nach unten scrollen, bevor die Schaltfläche „Search More Hotels“ erscheint. Daher müssen wir am Anfang der Seite einen Bildlauf nach unten hinzufügen.

  • Klicken Sie auf „Go to Webpage“ > „Option“

  • Klicken Sie auf „Scroll down the page after it is loaded“

  • Stellen Sie den Scroll als 10 Male ein und warten Sie 2s für jedes Scrollen.

  • Klicken Sie auf „Apply“ zur Speicherung der Einstellungen.

tripcom0000.jpg


2. Automatisch die Daten der Webseite detektieren-Einen Workflow erstellen

Sie können mit der Funktion „Auto-detect web page data“ in „Tipps“ ganz einfach eine Aufgabe erstellen.

  • Klicken Sie auf „Auto-detect web page data“ in der Tipps-Platte und warten, bis der Vorgang abgeschlossen ist.

2022-05-27_15-43-35.jpg

  • Klicken Sie auf die Datenfelder in der Datenvorschau und löschen Sie unerwartete Felder oder bei Bedarf sie umbenennen.

tripcom0004.jpg

  • Kreuzen Sie „Paginate to scrape more pages“ und „Add a Page Scroll“ nicht an.

  • Klicken Sie auf „Create workflow“.

tripcom0005.jpg


3. „Load More“ - Klicken Sie auf den Button „show more“, um mehr Hotels zu laden

  • Scrollen Sie nach unten der Webseite, bis Sie den „Search More Hotels“ Button ansehen.

  • Klicken Sie auf „Search More Hotels“ > „Loop click single element“ in der Tipps-Platte.

tripcom0003.jpg


4. Erstellen „Scroll Page“ - um neue Hotelinformation zu scrapen

  • Klicken Sie auf den + Button im Workflow, um einen neuen Schritt hinzuzufügen.

  • Wählen Sie „Loop“.

2022-05-27_15-47-18.jpg

  • Wechseln Sie den Loop-Modus in „Scroll Page“.

  • Stellen Sie „Repeats“ als 10 Male und Wartezeit als 2s für jedes Scroll ein.

tripcom0001.jpg

Notiz: Wenn Sie auf den Button „Search More Hotels“ in Trip.com klicken, dauert es normalerweise lang, die Webseite zu laden. Deshalb brauchen wir eine Wartezeit vor der Aktion hinzufügen, bevor die Seite gescrollt wird.

  • Klicken Sie auf „Option“.

  • Klicken Sie auf „Wait before action“ > Stellen Sie die Wartezeit als 10s ein.

2022-05-27_15-48-49.jpg


5. Führen Sie Ihre Aufgabe aus - Erhalten Sie die gewünschten Daten

  • Klicken Sie auf „Save“.

  • Klicken Sie auf „Run“.

  • Wählen „Run on your device“, um die Aufgabe mit Ihrem lokalen Gerät auszuführen.

  • Warten Sie, bis die Aufgabe abgeschlossen ist.


Hier sind die Beispieldaten.

tripcom0002.jpg

Hat dies Ihre Frage beantwortet?