undefined
Blog > Big Data > Post

Facebook Data Mining

Thursday, September 16, 2021

Data Mining aus Facebook

Data Mining aus Facebook ist in den letzten Jahren sehr beliebt und nützlich geworden. Die gecrawlten oder gescrapten Daten sind wertvoll und konstruktiv für kommerzielle, wissenschaftliche und viele andere Bereiche der Vorhersage und Analyse, besonders wenn diese Daten tief verarbeitet werden, wie Datenbereinigung und maschinelles Lernen. Zweifelsohne ist Data Mining, das Basis des Prozesses ist, von größter Bedeutung.

 

Inhaltsübersicht

Data Mining aus Facebook

3 Methoden zur Mining Data aus Facebook

  API

  Octoparse

  Visual Scraper

 

 

3 Methoden zum Data Mining aus Facebook

 

API

Facebook hat auch eine Website eingerichtet, die es Entwicklern ermöglicht, auf seine Daten zuzugreifen, da Datenenthusiasten ein so großes Interesse an den Daten von Facebook haben. Auf dieser Website werden viele einfache und leicht verständliche Methoden mit detaillierten Leitlinien für die Nutzer bereitgestellt, damit sie auf die Ressourcen zugreifen können.

 

Bei der Facebook-API, die als Graph-API bekannt ist, handelt es sich um eine Art Schnittstelle mit REST (Representational State Transfer), die auf der Netzwerkarchitektur basiert. Das bedeutet, dass Facebook Funktionen mithilfe Remote-Methoden wie HTTP, GET, POST aufruft, um Nachrichten zu senden und den REST-Dienst zurückzusenden.

 

Nehmen wir ein Facebook-Beispiel der Coca-Cola Corp.: Wenn die Nutzer die auf der Graffiti-Wand geposteten Kommentare abrufen wollen, müssen sie nur eingeben:

https://graph.facebook.com/cocacola/feed.

 

Dann gibt das System die Datenergebnisse in einer JSON-Datei zurück. JSON (JavaScript Object Notation) ist ein Datenaustauschformat, das für Benutzer leicht zu handhaben, und für Geräte leicht zu analysieren und zu erzeugen ist. Die Datenfelder umfassen die Nachrichten-ID, detaillierte Informationen zu den Daten, den Autor, die Autoren-ID und andere Informationen. Nicht nur die Graffiti-Wand, sondern auch alle anderen Facebook-Objekte können die folgende URL-Struktur verwenden, um das Gewünschte abzurufen.

 

       "error": {

                     "message": "Unknown path components: /CONNECTION_TYPE",

                  "type": "OAuthException",

                     "code": 2500,

                      "fbtrace_id": "AU3Q0qQUX1/"  

 

Hier sollten wir beachten, dass wir nur auf die Daten zugreifen können, wenn die Objekte öffentlich sind, andernfalls sollten wir Zugriffstoken bereitstellen, wenn die Objekte als privat definiert sind.  

 

Benutzer sollten sich freuen: Es gibt ein R-Paket, das als Rfacebook-Paket bekannt ist. Es bietet eine Schnittstelle zur Facebook-API. Für das Mining von Facebook mit R bietet das Rfacebook-Paket Funktionen, mit denen R auf die Facebook-API zugreifen kann, um Informationen über Beiträge, Kommentare, Likes, Gruppen, die bestimmte Schlüsselwörter erwähnen, und vieles mehr zu erhalten. Dann können wir die spezifischen Befehle wie unten verwenden, um Seiten zu durchsuchen.

 

Neben R gibt es auch einen Teil der Leute, die lieber Python benutzen. Hier sind auch Tipps dafür. Sehen Sie sich zunächst die Dokumentation der Facebook Graph API https://developers.facebook.com/docs/reference/api/ an. Wenn Sie mit JSON nicht vertraut sind, lesen Sie unbedingt das Tutorial dazu (z. B. http://secretgeek.net/json_3mins.asp). Sobald Sie die Konzepte verstanden haben, können Sie mit der Verwendung dieser API beginnen. Für Python gibt es mehrere Alternativen:   

                                                                                                          

• Facebook/python SDK

• pyFaceGraph 

• Es ist auch nicht so einfach, einen HTTP-Client zu schreiben, der die Graphen-API verwendet. Es wird empfohlen, sich die Python-Bibliotheken anzuschauen, die Beispiele aus ihrer Dokumentation auszuprobieren und zu prüfen, ob sie das, was Sie tun müssen, bereits getan haben. Im Vergleich zu R kann Python das Datenverarbeitungsverfahren vereinfachen, indem es die Zeit für die Codeverwaltung, die Ausgabe und die Notizdateien spart. Die Verwendung von R kann die Visualisierung von Graphen optimieren, da die Benutzer ihre Freunde auf Facebook visualisieren können.                                       

 

Es gibt immer noch einige Tools zur Datenextraktion, mit denen auch Personen ohne Programmierkenntnisse Daten von Facebook auslesen können, z. B. Octoparse, Visual Scraper.                                     

 

Octoparse                                                                         

Das Web-Scraping-Tool ist eine weitere gute Option, um Daten auf Facebook zu extrahieren. Beachten Sie, dass Sie nur öffentliche Beiträge ohne Anmeldeanforderungen extrahieren können. Dies ist auf die Web-Scraping-Ethik zurückzuführen (siehe https://www.octoparse.com/blog/is-web-crawling-legal-well-it-depends).

 

Octoparse ist ein leistungsstarkes Web-Scraping-Tool, das sowohl statische als auch dynamische Websites mit AJAX, JavaScript, Cookies usw. scrapen kann. Zunächst müssen Sie den Client herunterladen, dann können Sie mit Ihren Scraping-Aufgaben beginnen. Für diese Software brauchen Sie keine Programmierkenntnisse, aber es ist empfohlen, die Grundkenntnisse zu lernen, denn die den Nutzern helfen, Daten zu extrahieren. Außerdem bietet die Software die Funktionen wie Cloud-Services und Proxyserver, um IP-Blockierungen zu verhindern und den Extraktionsprozess zu beschleunigen. 

 

Vor kurzem hat Octoparse eine neue Funktion "Web-Scraping-Vorlagen" eingeführt. Sie können einfach die Vorlagen für Facebook verwenden, um die Beiträge ganz einfach zu extrahieren. 

 

Für Details besuchen Sie bitte die Website http://www.octoparse.de/

 

 

Visual Scraper

Visual Scraper ist ein weiterer großartiger kostenloser Web Scraper mit einer einfachen Point-and-Click-Schnittstelle und kann zum Sammeln von Daten aus dem Web verwendet werden. Sie können Echtzeitdaten von mehreren Webseiten abrufen und die extrahierten Daten als CSV-, XML-, JSON- oder SQL-Dateien exportieren.           

 

Die für Windows verfügbare Freeware ermöglicht das Scrapen von Daten aus bis zu 50.000 Webseiten für nur einen Nutzer. Neben dem SaaS bietet Visual Scraper auch Web-Scraping-Dienste wie Datenlieferdienste und die Erstellung von Software-Extraktoren an.

 

Wenn Sie mehr wissen möchten, können Sie die Website besuchen http://www.visualscraper.com/pricing

 

Autor: Das Octoparse Team

Bearbeitet: Ashley Weldon

 

Relative Artikel

 

Scrapen öffentliche Beiträge von Facebook

Scrapen Tweets von Twitter (Version 8)

Scrapen von Beitragsdaten von Instagram

5 beste Scraping-Tools für soziale Medien im Jahr 2021

Wie extrahiert man Daten aus Twitter ohne Kodierung

5 Sachen, die Sie wissen müssen, bevor Sie Daten von Facebook scrapen

 

 

 

 

Laden Sie Octoparse herunter, um mit Web-Scraping zu beginnen, oder kontaktieren Sie uns
für die Fragen über Web Scraping!

Kontaktieren Sie uns Herunterladen
btnImg
Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen