Hotelinformationen von Trip.com abrufen
Tuesday, June 08, 2021 4:22 PM
In diesem Tutorial zeigen wir Ihnen, wie Sie Hotelinformationen auf Trip.com mit Octoparse sammeln können.
Wir werden Daten wie den Hotelnamen, den Ort, die Entfernung, den Preis und die Bewertung von der Hotellistenseite mit Octoparse scrapen.
Zum Nachvollziehen können Sie diese URL im Tutorial verwenden:
Die Website verwendet die Technik "unendliches Scrollen", um weitere Bewertungen zu laden. Nachdem wir die Seite etwa 2 Mal nach unten gescrollt haben, taucht eine "show more"- Button auf. Wenn wir weiterhin Rezensionen laden möchten, müssen wir weiter auf den Button klicken.
Hier sind die wichtigsten Schritte in diesem Tutorial: [Aufgabendatei hier herunterladen]
1. "Go To Web Page" - Öffnen die Ziel-Webseite
2. Automatisch die Daten der Webseite detektieren - Einen Workflow erstellen
3. "Load More" - Klicken Sie auf den Button "show more", um mehr Hotels zu laden
4. Führen Sie Ihre Aufgabe aus - Erhalten Sie die gewünschten Daten
1. "Go To Web Page" - Öffnen dieZiel-Webseite
• Geben die URL auf der Startseite ein und klicken auf „Start“
2. Automatisch die Daten der Webseite detektieren-Einen Workflow erstellen
Sie können mit der Funktion "Auto-detect web page data" in "Tipps" ganz einfach eine Aufgabe erstellen.
• Klicken auf "Auto-detect web page data" und warten, bis der Vorgang abgeschlossen ist. (Es kann etwas länger dauern, da diese Seite die Technik „unendloses Scrollen“ verwendet)
• Klicken auf "Edit" unter "Add a page scroll" und stellen die Wartezeit auf 5-7s ein
• Überprüfen Sie die Datenfelder in der Datenvorschau. Sie können die unerwünschten Felder löschen oder Felder umbenennen
, falls erforderlich
• Wenn Sie mit der aktuellen Datenvorschau zufrieden sind, klicken Sie auf "Create workflow"
Tipps!
Das Scrollen von Seiten ist in verschiedenen Websites weit verwendet. Um mit solcher Website umzugehen, können Sie entweder die Funktion "Automatische Detektion" verwenden oder selbst einen Paginierung einrichten, indem Sie im Workflow auf den Schritt "Go to Web Page" doppelklicken.
Sehen Sie sich Details in den folgenden Tutorials an:
• Paginierung einstellen (Unendloses Scrollen)
3. "Load More" - Klicken Sie auf den Button"show more", um mehr Hotels zu laden
• Wählen "Click on a 'Load More' button" in Tipps
• Wählen den Button "Search More Hotels" auf der Webseite
• Stellen "Number of clicks" nach Ihren Bedürfnissen ein. Hier stellen wir sie auf 5 ein.
• Erstellen Sie den AJAX-Timeout auf 7s ein
4. Führen Sie Ihre Aufgabe aus - Erhalten Sie die gewünschten Daten
• Klicken auf "Save"
• Klicken auf "Run"
• Wählen "Run on your device", um die Aufgabe mit Ihrem lokalen Gerät auszuführen, oder Wählen "Run in the Cloud", um die Aufgabe auf unseren Cloud-Servern auszuführen (nur für Premium-Benutzer)
Hier sind die Beispieldaten.