undefined

Scrapen und Herunterladen der Dateien aus Webseiten

Monday, July 18, 2022 11:43 AM

Sie folgen jetzt einem Tutorial für die neueste Version von Octoparse. Wenn Sie zur Zeit eine ältere Version verwenden, empfehlen wir Ihnen kräftig es, ein Upgrade zu machen, weil sie schneller, leichter und stärker ist! Herunterladen und Installierung eines Upgrades hier, wenn Sie nicht so bereits machen!

 

Die neueste Version führt die Funktion des Herunterladens von Dateien und Bildern auf lokale Geräte ein, so dass wir die Dateien und Bilder aus lokalen Ordnern direkt öffnen können. Derzeit werden Herunterladen von Dokumenten in den Formaten jpg, png, gif, doc, pdf, ppt, txt, xls und zip unterstützt.
In diesem Tutorial zeigen wir Ihnen, wie Sie Dateien und Bilder mit Octoparse herunterladen können. Bitte beachten Sie, dass Herunterladen von Dateien derzeit nur in lokalen Läufen verwendet werden können.

 

 

Beispiel-URL für die Einstellungen der heruntergeladenen Datei: https://www.cclcomponents.com/fronius-gen24-plus-primo-3kw-hybrid-inverter

 

 heruntergeladene Datei

 

Die Beispiel-URL für die heruntergeladenen Bildeinstellungen lautet: https://www.rappi.com.mx/tiendas/tipo/market

 

 heruntergeladene Bildeinstellungen

 

 

1. Herunterladen von Dateien
Schritt 1: Klicken Sie auf einen der Herunterladen-Buttons - Wählen Sie ein Dokument aus, das Sie herunterladen möchten. Das ausgewählte Element wird grün, ähnliche Elemente werden rot.

 

 auf einen der Herunterladen-Buttons klicken

 

Schritt 2: Klicken Sie auf „Select All“ aus dem Tips-Kasten - Alle Dokumente werden identifiziert und grün markiert.

 

 auf „Select All“ klicken

 

Schritt 3: Klicken Sie auf „Extract document URLs and download linked files“ - Da können Sie die Links extrahieren und die Dateien in lokale Ordner herunterladen.

 

 auf „Extract document URLs and download linked files“ klicken

 

Das Datenfeld sieht dann wie unten abgebildet aus. Sie können auf das Symbol ... in der oberen rechten Ecke klicken, um die Datenfelder zu ändern.

 

 auf das Symbol ... klicken

 

 

Tipps!

Wenn Sie das Feld mit dem Ordnersymbol im Namen löschen, werden die Herunterladen-Einstellungen aufgehoben.

Tipps

 

· Name downloaded files: Es gibt fünf Möglichkeiten, die heruntergeladenen Dateien zu benennen. Sie können die Optionen in den Tipps sehen.
· MD5 Hash Value: Verwenden Sie den MD5-Wert, um die Dateien zu benennen.
· Original File Name: Standard-Originaldateiname
· Download Complete Time: Benennen Sie die Dateien nach der vollständigen Downloadzeit.
· Data Field Value: Verwenden Sie den Wert des Datenfeldes, um die Dateien zu benennen.

 

 Name downloaded files

 

Wenn der Dateiname bereits im Ordner vorhanden ist, gibt es ebenfalls drei Möglichkeiten, mit dieser Situation umzugehen.

 

 Dateiname bereits im Ordner vorhanden

 

· Skip the new file: Überspringen Sie die aktuell heruntergeladene Datei.
· Replace the existing file: Ersetzen Sie die vorhandene Datei durch die neu heruntergeladene Datei.
· Rename the new file: Benennen Sie die neue Datei mit einer (1) am Ende des Dateinamens um.

 

 

2. Herunterladen von Bildern

 

Für das Herunterladen von Bildern in lokale Ordner gilt dieselbe Logik wie für die heruntergeladenen Dateien.
Schritt 1: Klicken Sie auf ein Bild - Wählen Sie ein Bild aus.

 

 auf ein Bild klicken

 

Schritt 2: Klicken Sie auf „Select All“ aus dem Tips-Kasten - Wählen Sie alle Bilder aus.

 

 auf „Select All“ klicken

 

Schritt 3: Klicken Sie auf „Extract image URLs and download linked files“ - Da können Sie die Links extrahieren und die Dateien in lokale Ordner herunterladen.

 

 Extract image URLs and download linked files

 

 

3. Herunterladen von Einstellungen

Einstellungen zum Herunterladen von Dateien

Schritt 1: Klicken Sie auf das Pfeilsymbol neben dem Datenfeld.

 

 Pfeilsymbol

 

Schritt 2: Sie können hier die heruntergeladenen Dateien umbenennen, mehrere URLs trennen und URLs zum Überspringen für die Herunterladen-Dateien eingeben.

 

 die heruntergeladenen Dateien ändern

 

✰ Einstellungen zum Herunterladen von Ort

Schritt 1: Klicken Sie auf das Symbol für die Aufgabeneinstellungen  in der oberen rechten Ecke des Bildschirms mit den Aufgabeneinstellungen - Da können Sie das Einstellungsfeld öffnen.
Schritt 2: Klicken Sie auf den Durchsuchen Button - Wählen Sie einen lokalen Ordner für die heruntergeladenen Dateien und Bilder
Schritt 3: Wählen Sie einen Modus für „When a local run starts settings“.
Schritt 4: Klicken Sie auf „Save“ - Speichern Sie alle Änderungen.

 

 auf „Save“ klicken

 

Oben finden Sie eine Einführung, wie Sie mit der neuesten Version von Octoparse Bilder und Dateien im lokalen Gerät herunterladen können. Wenn Sie beim Einrichten einer Aufgabe auf Probleme stoßen, können Sie hier ein Ticket einreichen. Wir melden uns dann so schnell wie möglich bei Ihnen!

 

 

Autor*in: Das Octoparse Team
Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen