Scraping der Followersdaten von Instagram-Konto
Tuesday, June 14, 2022 11:08 AMIn diesem Tutorial erfahren Sie, wie man die Followersdaten von Instagram-Konto extrahieren kann. Dazu ist eine URL als Beispiel herausgegeben und die Ziedaten beziehen sich um die Namen und URLs von den Followers.
Hier ist eine URL als Beispiel: https://www.instagram.com/rihannaofficilal/
Überblick
Schritt 1: „Go To Web Page” - Öffnen Sie die Ziel-Webseite.
• Geben Sie die oben angegebene URL in die Suchleiste ein und klicken Sie auf „Start”.

Schritt 2: Melden Sie sich auf Instagram an und speichern die Cookies.
• Schalten Sie zuerst den Browser-Modus an.
• Geben Sie Ihre Informationen in dem Einloggen-Kasten ein und klicken Sie auf „log in”.

• Schalten Sie den Browser-Modus aus.
• Gehen Sie zurück zur Erstellung von „Go To Web Page” und speichern die Cookies.

Tipps!
Hier erfahren Sie mehr über Daten Scraping nach dem Anmelden.
Schritt 3: Extrahieren Daten von den Basis-Informationen der Followers.
• Klicken Sie auf Kontoname, Zahl von Followers, Zahl von Following.
• Klicken Sie auf „Extract data” von „Tips”.

Schritt 4: Klicken Sie auf Followers zum Scraping der Detail-Informationen.
• Klicken Sie auf dem Button „Followers”.
• Klicken Sie auf „Click element” von „Tips”.
• Stellen Sie den AJAX-Wert auf 7s.

• Deaktivieren Sie dann „Open in a new tab” von der Einstellung von „Click Item”.

Dann wird ein Pop Up mit einer Reihe von Followers auf der Webseite dargestellt.
• Klicken Sie den ersten Followersnamen.
• Klicken Sie auf zuerst „Select All”, dann „Extract the text of the selected elements”.

Extrahieren die URLs von diesen Followers.
• Klicken Sie auf den Titel jedes Followers.
• Klicken Sie auf das Zeichen A unter dem Tips.
• Klicken Sie auf „Extract the URL of the selected link”.

• Doppelklicken Sie auf die Header vom Datenvorschau und benennen die Datenfelder nach Bedarf um.

Schritt 5: Modifizieren Sie „Loop Item” und XPath der Daten.
• Klicken Sie auf „Loop Item”.
• Modifizieren Sie XPath: //div[@class="isgrP"]//li
• Klicken Sie „Apply” zum Bestätigen.

• Klicken Sie auf „Extract Data”.
• Klicken Sie auf „Vertical View”.

• Modifizieren Sie XPath von Username : //a/span
• Modifizieren Sie XPath von Username_URL: //a

Schritt 6: Erstellen Sie einen Workflow für Pagination, um mehr Followers darstellen zu lassen.
• Klicken Sie auf den Button „add a step”
der vor dem Loop Item liegt, und dann klicken auf „Loop” .

• Bewegen Sie das „Loop Item” unter das neu erstellte „Loop Item 1” .
• Ändern Sie „Loop Mode” von „Loop Item 1” zu „Scroll Page”.
• Wählen Sie „Partial” von „Scroll area” und XPath eingeben: //div[@class="isgrP"]
• Stellen Sie die Male von „Repeats” auf 30 ein und den Wert von „Wait” auf 5s. (Die zwei Werte sind von der Webseite-Scrollen-Male von oben nach unten oder die Laufzeit des Voll-Ladens bestimmt.)
• Klicken Sie „Apply” zum Bestätigen.

Schritt 7: Scraping starten, um die Aufgabe auszuführen und Daten zu erhalten.
• Klicken Sie auf „Save”.
• Klicken Sie auf „Run”.
• Wählen Sie „Run on your device”, um die Aufgabe mit Ihrem lokalen Gerät auszuführen.
Tipps!
Instagram-Aufgaben können nur lokal ausgeführt werden, sonst wird Ihr Konto von Instagram blockiert.

Autor*in: Das Octoparse Team