undefined

Erfassen aller Bilder aus einem Bildkarussell  

Tuesday, July 20, 2021 12:31 PM

Viele Produkt-Webseiten verwenden Bildkarussells (wie das untenstehende), um mehrere Bilder anzuzeigen, durch die man normalerweise manuell blättern muss. In diesem Tutorial zeige ich Ihnen, wie Sie Bilder aus einem Karussell in Ihr gewünschtes Format extrahieren können.  

 mceclip0.png

 

 

1. Die URL von einem Bild in einer Spalte speichern 

mceclip2.png

 

 

2. Die URL von mehreren Bildern in verschiedenen Zeilen speichern

mceclip0.png

 

 

3. Die URL von allen Bildern in einer Spalte speichern

 mceclip10.png

 

 

1. Die URL von einem Bild in einer Spalte speichern

 

Zum Üben können Sie diese URL verwenden: https://www.ebay.com/itm/Lenovo-Legion-Y540-15-6-144Hz-i7-9750H-16GB-RAM-256GB-SSD-GTX-1660-Ti-Office/303553933195

 

Wählen Sie einfach ein Bild aus, dann wählen "Extract the URL of the selected image" in Tipps. Wiederholen Sie den gleichen Vorgang, um alle anderen Bild-URLs abzurufen.

scrape_one_to_one.gif

 

 

2. Die URL von mehreren Bildern in verschiedenen Zeilen speichern

 

Es ist auch möglich, URLs von Bildern in verschiedenen Zeilen zu extrahieren, indem Sie „Loop“ verwenden können.

 

1) Wählen Sie das erste Bild aus

 

2) Markieren Sie anschließend das zweite Bild und wählen Sie "Extract image URLs".

loop_image.gif

 

 

 

3. Die URL von allen Bildern in einer Spalte speichern

 

Es gibt zwei Möglichkeiten, die URL von allen Bildern in einer Spalte zu speichern.

 

Möglichkeit 1. Kombinieren Sie die extrahierten Bild-URLs

 

Wenn Sie die Bild-URLs extrahiert und in verschiedene Zeilen gespeichert haben (s. Schritt 2), können Sie die extrahierten Daten anschließend kombinieren, um die Zeilen in einer einzigen Zeile zusammenzuführen.  

 

1) Klicken Sie auf das Einstellungssymbol von der Aktion "Extract Data".

 

2) Klicken Sie auf "...", wählen Sie dann "Combine data" und anschließend "Combine the captured data".

2020-07-28_11-20-42.png

 

Möglichkeit 2. Scrapen Sie den HTML-Code des Karussells und gleichen Sie die Bild-URLs aus dem Code ab

 

1) Wählen Sie das gesamte Karussell aus, dann wählen Sie "Extract the outer HTML of the selected element"

 Scrape_HTML.gif

 

2) Gehen Sie zu der Aktionseinstellung von "Extract Data", klicken Sie auf "...", dann wählen Sie "Clean data".

 mceclip4.png

 

3) Finden den Startwert und den Endwert der Bild-URL.

 mceclip5.png

 

4) Klicken Sie auf "Add step" und wählen Sie "Matching with Regular Expression".

mceclip6.png

 

 

5) Klicken Sie auf "Try the ReEx tool"

mceclip7.png

 

 

6) Geben Sie den Startwert und den Endwert in "Start mit" und "Ende mit" ein, um RegEx zu erzeugen. Dann klicken Sie auf „Apply“.

 ReEx.png

 

7) Kreuzen "Match all" an und bestätigen

 mceclip8.png

 

 

Tipps!

Die gescrapten Bild-URLs sind Thumbnail-URLs. Wenn Sie die vollständigen Bild-URLs scrapen möchten, lesen Sie bitte diese Anleitung:

How to scrape the full image URLs instead of thumbnails?

 

 

btnImg
Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen