Daten Scraping von Seiteninformationen (Metadaten, Seiten-URL, Seitentitel, Quellcode)

In diesem Tutorial erfahren Sie, wie Octoparse die Daten auf der Seitenebene extrahiert, die Metadaten, Seiten-URL, Seitentitel, Quellcode enthalten.

Schritt 1: Klicken Sie auf „Extract Data”.

Schritt 2: Klicken Sie auf „Add data field(s) “ in „Data Preview”.

Schritt 3: Klicken Sie auf „Page-level data” und wählen die Daten, die Sie brauchen.

Dann die gewählten Daten werden im Datenfeld angezeigt.

Schritt 4: Benennen Sie die Daten nach Badarf um.

Bedeutung der Daten auf der Seitenebene:

Es ist nützlich, wenn Sie die fehlenden Daten auf einer Seite überprüfen möchten: What to do with those blank fields I got in the extracted result?

Das ist eine kurze Beschreibung einer Webseite und erscheint oben im Browserfenster.

Meta-Beschreibung ist eine kurze Zusammenfassung des Seiteninhalts.

Das Scraping des Seitentitels, der Meta-Description und der Meta-Keywords ist nützlich, wenn Sie Ihre SEO verbessern möchten.

Verwandte Artikel