undefined

Die Einstellung der Aktion „Retry“  

Thursday, August 05, 2021 10:35 AM

Die Aktion "Retry" ist eine Funktion in Octoparse zur Behandlung des Seitenladefehlers.  Es gibt eine Reihe von Bedingungen, die Sie auswählen können, damit Octoparse die aktuelle Webseite neu laden kann. Für das Web Scraping ist es wichtig, dass die Webseite korrekt geladen wird, damit Octoparse die benötigten Informationen extrahieren kann.

 

1. Warum sollen die Aktion "Retry"eingerichtet werden?

 

Wenn die Webseite nicht richtig geladen wird, hat Octoparse Probleme beim Abrufen der Zieldaten oder sogar beim Fortfahren mit der nächsten Aktion. Aus diesem Grund ist es sinnvoll, die Aktion "Retry" einzurichten, wenn die Webseite vor der Datenextraktion neu geladen werden soll.

 

 

2. Wie wird die Aktion "Retry" eingerichtet?

 

Die Aktion "Retry" ist nur für zwei Aktionen im Workflow verfügbar, nämlich "Go to Web Page" und "Click Item/Click to Paginate".  

 

1) Doppelklicken Sie auf die Aktion, um die Einstellungen aufzurufen. Anschließend klicken Sie auf „Retry, um die Optionen zu öffnen.

 mceclip6.png

 

2) Aktivieren Sie "Retry the action when", und klicken Sie dann auf mceclip0.png, um die Bedingungen festzulegen. Auf dieser Weise teilen Sie Octoparse mit, wann die Seite neu geladen werden soll, wenn eine oder mehrere Bedingungen erfüllt sind.

mceclip1.png

 

 

Stellen Sie nun die Bedingungen für das erneute Laden ein. Sie können die angegebenen Optionen verwenden.

 mceclip2.png

mceclip3.png

 

 

Wenn eine Seite nicht richtig geladen wird, erhalten Sie normalerweise Fehlermeldungen wie "errors", "500 Internal Server Error" oder "Too many requests". Nehmen wir an, dass wir möchten, die Seite neu zu laden, wenn ein "500 Internal Server Error" auf der Seite erscheint. In diesem Fall sollte die Bedingung lauten: Wenn der aktuelle Seitentext "500 Internal Server Error" enthält, wird die Seite neu geladen. Folglich würde Octoparse versuchen, die Seite erneut zu laden, wenn die Zeichenfolge auf der aktuellen Seite gefunden wird.

 mceclip4.png

 

Sie können auch den XPath eines bestimmten Elements eingeben, das nur vorhanden ist, wenn die Seite korrekt geladen wurde. In diesem Fall müssen Sie die Option „Does not contain“ auswählen. Wenn das angegebene Element auf der Seite nicht gefunden wird, lädt Octoparse die Seite neu.

 mceclip5.png

Außerdem können Sie je nach Bedürfnissen weiter auf mceclip0.png klicken, um andere Bedingungen hinzuzufügen.

 

3) „Retry for und „Wait time einrichten

 

Nachdem Sie die Bedingungen für die Wiederholung festgelegt haben, können Sie entscheiden, ob Sie das Laden der Webseite einmal, zweimal oder mehrmals wiederholen möchten. Diese Einstellung ist wichtig, damit Octoparse die Webseite nicht endlos neu lädt. Wenn Octoparse die maximale Anzahl von Wiederholungsversuchen erreicht hat, hält es an und fährt mit dem nächsten Schritt fort.

 

 

btnImg
Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen