undefined

Scrapen Daten hinter dem Einloggen (Version 8)  

Tuesday, July 20, 2021 12:10 PM

Wenn die Zieldaten hinter einer Authentifizierung liegen, ist es trotzdem möglich, mit Octoparse die Daten zu erhalten. Geben Sie einfach die Anmeldeinformationen (Benutzername und Passwort) ein und klicken Sie dann auf die Schaltfläche "Anmelden", um sich anzumelden. In diesem Tutorial zeigen wir Ihnen, wie Sie Daten hinter dem Einloggen extrahieren können und wie Sie Cookies verwenden, um den Arbeitsablauf zu optimieren.

 16156156156156.png

 

1) Anmeldedaten eingeben, um sich anzumelden

 

2) Verwenden Sie Cookies, um den Arbeitsablauf zu optimieren

 

 

1) Anmeldedaten eingeben, um sich anzumelden

 

• Klicken Sie auf das Textfeld für die Eingabe des Benutzernamens auf der Webseite

1961561651561.png

 

• Wählen Sie "Enter text" aus den Aktionstipps

 195195681256125.png

 

 

• Geben Sie den Benutzernamen in das Textfeld ein, klicken Sie auf "Confirm", und der eingegebene Benutzername wird automatisch in das Textfeld für den Benutzernamen auf der Webseite eingefügt

 19561562.png

 

• Klicken Sie auf "Continue" und wählen Sie "Click button" in Tipps

 2020-08-02_12-35-21.png

(Richten Sie bei Bedarf eine geeignete AJAX-Wartezeit ein.)

 

• Führen Sie die gleichen Schritte aus, um das Passwort einzugeben

 

• Klicken Sie auf der Seite auf die Schaltfläche "Sign In" und wählen Sie in "Tipps" die Option "Click button" aus

 2020-08-02_12-42-10.png

Octoparse hat sich nun erfolgreich auf der Website angemeldet!

 897912512328.gif

 

 

Tipps!

 

Cookies löschen

 

Da alle Websites unterschiedlich mit Cookies umgehen, können Sie jedes Mal mit den Anmeldeschritten beginnen, um sicherzustellen, dass die Aufgaben still ausgeführt werden. Dazu können Sie alle Cookies löschen, die vor dem Laden der Anmeldeseite gespeichert wurden. Auf diese Weise "vergisst" die Ziel-Website Sie und führt Sie zur Anmeldeseite, auf der Sie alle Anmeldeinformationen eingeben können.

 

 Doppelklicken Sie auf die Aktion "Go to Web Page", um die Aktionseinstellungen aufzurufen

 Wählen Sie in den Cache-Einstellungen "Clear cache before opening the web page".

 149619615561561.png

 

 

Verwenden Sie Cookies, um den Arbeitsablauf zu optimieren

 

1. Cookies speichern

 

In den meisten Fällen können Sie den Arbeitsablauf optimieren, indem Sie die Cookies nach der Anmeldung in der Aufgabe speichern. Auf diese Weise sendet Octoparse die gespeicherten Cookies an die Website, und in den meisten Fällen wird die Website sich an "Sie" erinnern und die Anmeldeschritte überspringen.

 Wechseln Sie in den Browser-Modus, indem Sie oben rechts auf 54656.jpg klicken

 195615612651256.png

 

 Sie können sich auf der Website genauso anmelden, wie Sie es in einem normalen Browser tun.

 436345653.gif

 

 Gehen Sie nach der Anmeldung in die Aktionseinstellung "Go to the website" und speichern Sie die Cookies.

 2020-08-02_12-54-05.png

 

 Nun soll sich die Webseite die Anmeldeinfomaitonen "erinnern" und bei der Ausführung der Aufgabe die Einloggen-Schritte überspringen.

 

 

Tipps!

 

1. Ein gespeicherter Cookie ist nur wirksam, bevor er abläuft

 

Cookies gibt es in vielen verschiedenen Formen. Einige haben eine bestimmte Verfallszeit, andere verfallen sofort, wenn der Browser geschlossen wird. In Octoparse wird das gespeicherte Cookie nicht mehr funktionieren, wenn es abgelaufen ist. Um dies zu beheben, müssen Sie die Anmeldeschritte noch einmal im Browser-Modus durchlaufen, um das aktualisierte Cookie zu erhalten und zu speichern.

 

2. Ihr Passwort ist gut geschützt

 

 Wenn Sie in Octoparse Ihr Passwort eingeben, ist es nur in Ihrem eigenen Konto zugänglich. Wenn eine Aufgabe exportiert wird, wird das in der Aufgabe gespeicherte Passwort automatisch entfernt.

 Alle gespeicherten Anmeldeinformationen werden aus Ihrem Konto entfernt, sobald die Aufgabe gelöscht wird.

 

3. Manuelle Captcha-Eingabe während der lokalen Extraktion

 

Wenn ein Captcha angetroffen wird, können Sie das Captcha manuell eingeben, wenn Sie die Aufgabe lokal ausführen. Die Cloud-Extraktion unterstützt den Umgang mit Captcha nicht.

 

 

btnImg
Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen