Scrapen Bewertungen von Google Play
Wednesday, June 02, 2021 3:56 PMGoogle Play ist eine gute Website, um Bewertungen von mobilen Anwendungen zu sammeln. Die Bewertungen können nicht nur den Nutzern beim Entscheiden helfen, welche App zu herunterladen, sondern auch die Entwickler dazu anregen, ihre Apps zu verbessern.
In diesem Tutorial werden wir Ihnen zeigen, wie man die Bewertungen von Anwendungen aus Google Play scrapen.
Sie können unsere "Aufgabenvorlage" auf dem Startbildschirm des Octoparse besuchen. Alles, was Sie brauchen, ist die Eingabe einiger Parameter und die Aufgabe ist fertig. Für weitere Details, schauen Sie bitte hier nach: Aufgabenvorlage
Zum Nachvollziehen können Sie diese URL im Tutorial verwenden:
https://play.google.com/store/apps/details?id=com.target.ui&hl=en&showAllReviews=true
Wir werden Daten wie Benutzernamen, Bewertungszeit und Bewertungsinhalt von jeder APP mit Octoparse scrapen.
Die Website verwendet unendliches Scrollen, um weitere Bewertungen zu laden. Nachdem wir die Seite etwa 4 Mal nach unten gescrollt haben, würde einen "Mehr anzeigen"-Button auftauchen und wenn wir weiterhin Rezensionen laden möchten, müssen wir auf den Button klicken und dann kann die Seite wieder 4 Mal nach unten scrollen.
Hier sind die wichtigsten Schritte in diesem Tutorial: [Aufgabendatei hier herunterladen]
1. "Go To Web Page" - Öffnen der Ziel-Webseite
2. Automatisch die Daten der Webseite detektieren den Workflow erstellen
3. Loop-klicken auf "Mehr anzeigen" - weitere Bewertungen laden
4. Modifizieren Sie den XPath von Loop Element 1- Lokalisieren Sie den Button "Show More"
5. Extraktion ausführen - führen Sie Ihre Aufgabe aus und erhalten Sie Daten
1. Öffnen Sie die Ziel-Webseite
• Geben Sie die URL auf der Startseite ein und klicken Sie auf „Start“
2. Automatische Detektion der Webseite, um Schritte zur Texteingabe zu erstellen
• Klicken Sie auf "Auto-detect the web page data" und warten Sie, bis die Detektion abgeschlossen ist
• Überprüfen Sie die Datenfelder in der Datenvorschau, und Sie können auch die unerwünschten Felder löschen oder Felder umbenennen, falls erforderlich
• Klicken Sie auf "Edit" unter der Option "Add page scroll" in Tipps
• Stellen Sie die Wartezeit auf 4-5 Sekunden ein (Stellen Sie sicher, dass die Zeit lang genug ist, damit die Seite neue Bewertungen laden kann)
• Klicken Sie im Tipps-Bedienfeld auf "Create workflow".
3. Loop-klicken Sie auf den Button"Mehr anzeigen" - Laden mehr Bewertungen
• Wählen Sie im Bedienfeld "Tips" die Option "Click on a 'Load More' button".
• Wählen Sie den Button "SHOW MORE" auf der Webseite
Tipps!
Wir müssen zuerst den großen Block der "Show More"-Button auswählen. Wenn wir den Button direkt auswählen, kann es sein, dass Octoparse den anklickt, nicht den auswählt.
Dann klicken wir auf den Pfeil rechts neben dem letzten DIV-Tag und wählen das DIV auf dem Pop-up aus.
• Stellen Sie die Anzahl der Klicks ein, je nachdem wie viele Bewertungen Sie benötigen
• Klicken Sie auf "Confirm"
• Öffnen Sie die Einstellungen von "Click on a Load More button"
• Stellen Sie AJAX-Wartezeit als 4s ein
• Richten Sie "scroll to the bottom of the page" ein, wiederholen Sie 4 Mal und warten Sie 4s zwischen jedem Scrollen
• Klicken Sie auf "OK" zum Bestätigen
4. Modifizieren Sie den XPath von Loop Element 1- Lokalisieren Sie den Button"Show More"
• Öffnen Sie die Einstellungen von "Loop Item1"
• Geben Sie den XPath ein //span[text()='Show More']/..
Tipps!
Wenn Sie mehr über XPath erfahren möchten, schauen Sie sich bitte das folgende Tutorial an:
Was ist XPath und wie man es in Octoparse verwendet
5. Speichern und starten, um die Aufgabe auszuführen und Daten zu erhalten
• Klicken Sie auf "Save"
• Klicken Sie auf "Run"
• Wählen Sie "Run on your device", um die Aufgabe mit Ihrem lokalen Gerät auszuführen, oder wählen Sie "Run in the Cloud", um die Aufgabe auf unseren Cloud-Servern auszuführen (nur für Premium-Benutzer)
Hier sind Daten für die Beispielaufgabe.