Warum gibt es während des Selectieren eines Links keine Option, um URLs zu scrapen?
Friday, July 01, 2022 5:54 PMOctoparse ermöglicht es, dass Benutzer*innen mit Webseiten interagieren und bei der Nutzung von einfachen Point-und-Click Elemente auswählen können. Immer wenn wir auf ein Element der Seite klicken, würde ein Tips-Panel mit voreingestellten Vorschläge der Aktion erscheinen. Allerdings waren viele Benutzer*innen mit einem Problem konfontiert, dass es keine Option gibt, um URLs zu scrapen, wenn ihr ein Link selektieren möchtet.
Vorstellen Sie sich jetzt eine Aufgabe, in der wir Lärm Abbrechen Kopfhörer aus Amazon scrapen möchten. Nach der Öffnung der Webseite in Octoparse klicken wir auf den Titel eines bestimmten Produktes, aber nicht erfolgreich war der Versuch, weil eine sogenannte Option nicht gefunden wurde, um die gelinkten URLs derjeniges Items zu scrapen.
-
Ursache
Die Ursache ist es, dass Hyperlinks meistens mit einem A-Tag definiert werden. Anstelle von dem A-Tag wird Octoparse in diesem Fall dennoch das Span-Tag derjeniges Elements detektieren, das nur den Text enthält.
Tipps!
Das A-Tag definiert ein Hyperlink, das für die Verknüpfung von einer Seite zur anderen verwendet wird. Das wichtigste Attribute des A-Elements ist das Href-Attribute, das die Bestimmungsort des Links angibt.
-
Lösung
Schritt 1 Die Lösung ist nicht so komplex. Überprüfen Sie das Tag-Path von HTML am Boden von dem Tips-Panel und klicken dann auf A-Tag, um das selektierte Element zu verändern.
Schritt 2 Achten Sie darauf, dass das Tips-Panel danach eine Option enthalten wird, damit wir das URL des selektierten Links extrahieren können, nachdem wir auf A-Tag klickt haben.
Problem gelöst! Nun können SIe mit der Erstellung Ihrer Aufgabe weiterarbeiten.
Ist dieser Artikel hilfreich? Wenn Sie noch Probleme bei der Datenextraktion haben, oder uns etwas Vorschlägen geben möchten, reichen Sie bitte uns eine Anfrage ein Erfüllen Sie eine Anfrage hier.
Autor*in: Das Octoparse Team