Daten Scraping von Sternbewertung
Friday, June 10, 2022 4:33 PMAuf einigen Webseiten sind die Daten von der Sternbewertung nicht so direkt wie Textdaten oder URL-Daten extrahiert. Es liegt an den Formen der Sternbewertung, die normalerweise als Bild angezeigt, aber was wir brauchen, ist hingegen der Wert oder die Zahl von der Bedeutung der Sternen. In diesem Tutorial erfahren Sie, wie die Sternenbedeutung in Zahlzeichen extrahiert werden. Dazu ist ein URL als Bespiel gezeigt, damit können Sie es besser verstehen.

Es gibt zwei Lösungen für die Extraktion der Informationen der Sternbewertung.
Überblick
Lösung 1: Extrahieren Sie Attribut aus dem Image-Code.
Schritt 1: Wählen Sie den Bewertungsbereich aus und dann „Extract the URL of the selected image”.

Schritt 2: Klicken Sie auf „Extract Data”, das Icon „...” und „Customize field”.

Schritt 3: Wählen Sie „Extract attribute” und dann „alt” .

Schritt 4: Die Zieldaten werden im Datenfeld gezeigt.

Lösung 2: Extrahieren und bereinigen Sie den HTML-Code.
Schritt 1: Wählen Sie den Bewertungsbereich aus und dann „Extract the URL of the selected image”.

Schritt 2: Klicken Sie auf „Extract Data”, das Icon „...” und „Clean Data” .

Schritt 3: Klicken Sie danach auf „Add step” und wählen Sie „Match with Regular Expression”.

Schritt 4: Geben Sie Regular Expression ein. Wenn Sie mit Regular Expression noch nicht vertraut sind, klicken Sie bitte hier: Try the RegEx tool!.

Schritt 5: Geben Sie auf dem Feld „Start with” und „End with” die Zeichen, die vor und nach den Zieldaten liegen, ein. Dann die Ihnen gewünschten Zeichen werden behaltet.

Schritt 6: Zurück zu der Einstellung und klicken Sie auf „Apply”.

Autor*in: Das Octoparse Team