Scrapen Daten hinter dem Einloggen (Version 8)
Tuesday, July 20, 2021 12:10 PMWenn die Zieldaten hinter einer Authentifizierung liegen, ist es trotzdem möglich, mit Octoparse die Daten zu erhalten. Geben Sie einfach die Anmeldeinformationen (Benutzername und Passwort) ein und klicken Sie dann auf die Schaltfläche "Anmelden", um sich anzumelden. In diesem Tutorial zeigen wir Ihnen, wie Sie Daten hinter dem Einloggen extrahieren können und wie Sie Cookies verwenden, um den Arbeitsablauf zu optimieren.
1) Anmeldedaten eingeben, um sich anzumelden
2) Verwenden Sie Cookies, um den Arbeitsablauf zu optimieren
1) Anmeldedaten eingeben, um sich anzumelden
• Klicken Sie auf das Textfeld für die Eingabe des Benutzernamens auf der Webseite
• Wählen Sie "Enter text" aus den Aktionstipps
• Geben Sie den Benutzernamen in das Textfeld ein, klicken Sie auf "Confirm", und der eingegebene Benutzername wird automatisch in das Textfeld für den Benutzernamen auf der Webseite eingefügt
• Klicken Sie auf "Continue" und wählen Sie "Click button" in Tipps
(Richten Sie bei Bedarf eine geeignete AJAX-Wartezeit ein.)
• Führen Sie die gleichen Schritte aus, um das Passwort einzugeben
• Klicken Sie auf der Seite auf die Schaltfläche "Sign In" und wählen Sie in "Tipps" die Option "Click button" aus
Octoparse hat sich nun erfolgreich auf der Website angemeldet!
Tipps!
Cookies löschen
Da alle Websites unterschiedlich mit Cookies umgehen, können Sie jedes Mal mit den Anmeldeschritten beginnen, um sicherzustellen, dass die Aufgaben still ausgeführt werden. Dazu können Sie alle Cookies löschen, die vor dem Laden der Anmeldeseite gespeichert wurden. Auf diese Weise "vergisst" die Ziel-Website Sie und führt Sie zur Anmeldeseite, auf der Sie alle Anmeldeinformationen eingeben können.
• Doppelklicken Sie auf die Aktion "Go to Web Page", um die Aktionseinstellungen aufzurufen
• Wählen Sie in den Cache-Einstellungen "Clear cache before opening the web page".
Verwenden Sie Cookies, um den Arbeitsablauf zu optimieren
1. Cookies speichern
In den meisten Fällen können Sie den Arbeitsablauf optimieren, indem Sie die Cookies nach der Anmeldung in der Aufgabe speichern. Auf diese Weise sendet Octoparse die gespeicherten Cookies an die Website, und in den meisten Fällen wird die Website sich an "Sie" erinnern und die Anmeldeschritte überspringen.
• Wechseln Sie in den Browser-Modus, indem Sie oben rechts auf klicken
• Sie können sich auf der Website genauso anmelden, wie Sie es in einem normalen Browser tun.
• Gehen Sie nach der Anmeldung in die Aktionseinstellung "Go to the website" und speichern Sie die Cookies.
• Nun soll sich die Webseite die Anmeldeinfomaitonen "erinnern" und bei der Ausführung der Aufgabe die Einloggen-Schritte überspringen.
Tipps!
1. Ein gespeicherter Cookie ist nur wirksam, bevor er abläuft
Cookies gibt es in vielen verschiedenen Formen. Einige haben eine bestimmte Verfallszeit, andere verfallen sofort, wenn der Browser geschlossen wird. In Octoparse wird das gespeicherte Cookie nicht mehr funktionieren, wenn es abgelaufen ist. Um dies zu beheben, müssen Sie die Anmeldeschritte noch einmal im Browser-Modus durchlaufen, um das aktualisierte Cookie zu erhalten und zu speichern.
2. Ihr Passwort ist gut geschützt
• Wenn Sie in Octoparse Ihr Passwort eingeben, ist es nur in Ihrem eigenen Konto zugänglich. Wenn eine Aufgabe exportiert wird, wird das in der Aufgabe gespeicherte Passwort automatisch entfernt.
• Alle gespeicherten Anmeldeinformationen werden aus Ihrem Konto entfernt, sobald die Aufgabe gelöscht wird.
3. Manuelle Captcha-Eingabe während der lokalen Extraktion
Wenn ein Captcha angetroffen wird, können Sie das Captcha manuell eingeben, wenn Sie die Aufgabe lokal ausführen. Die Cloud-Extraktion unterstützt den Umgang mit Captcha nicht.