Element XPath anpassen
Monday, August 16, 2021 10:35 AMXPath ist eine Sprache, mit der Sie bestimmte Elemente auf einer Seite lokalisieren können. Das Anpassen von XPath in Octoparse funktioniert sehr gut und bietet mehr Flexibilität und Genauigkeit als der XPath, der durch Anklicken von Elementen während der Aufgabenkonfiguration automatisch generiert wird.
Mit Octoparse können Sie den Element-XPath so anpassen, dass wir die Daten, die wir scrapen wollen, genau lokalisieren können. Es hilft dabei, fehlende Daten, übersprungene Seiten, leere Felder und Duplikate zu finden.
In diesem Tutorial zeigen wir Ihnen, wie Sie das Element XPath anpassen können.
Wo kann ich XPath in Octoparse ändern?
• Klicken Sie auf das Symbol von Aktionseinstellungen von „Extract Data“
• Klicken Sie auf „Customize XPath“ von dem Feld, das Sie ändern möchten
• Geben Sie den neuen XPath in das Textfeld „Matching XPath“ ein
Tipps!
Wenn sich die Funktion "Extract Data" innerhalb eines "Loop Items" befindet, um Informationen von den Elementen in der Schleifenliste zu extrahieren, achten Sie darauf, dass die Option"Relativer XPath" aktiviert ist, und geben Sie dann den richtigen XPath ein.
Für Schritte wie "Loop Item" oder "Pagination" finden Sie das XPath-Textfeld in der Aktieneinstellung. Geben Sie den neuen XPath ein und klicken Sie auf "OK", um Ihre Änderungen zu speichern.
Wie schreibt man XPath?
Wenn Sie XPath noch nicht kennen, sollten Sie sich zunächst Grundlagen von HTML lernen. XPath findet Elemente anhand der Tags und Attribute. Bevor Sie eigenen XPath schreiben, müssen Sie zunächst die HTML-Struktur der Seite untersuchen. (Weitere Tutorials über HTML )
In diesem Tutorial können Sie mehr über XPath erfahren: What is XPath and how to use it in Octoparse?