Erfassen aller Bilder aus einem Bildkarussell
Tuesday, July 20, 2021 12:31 PMViele Produkt-Webseiten verwenden Bildkarussells (wie das untenstehende), um mehrere Bilder anzuzeigen, durch die man normalerweise manuell blättern muss. In diesem Tutorial zeige ich Ihnen, wie Sie Bilder aus einem Karussell in Ihr gewünschtes Format extrahieren können.
1. Die URL von einem Bild in einer Spalte speichern
2. Die URL von mehreren Bildern in verschiedenen Zeilen speichern
3. Die URL von allen Bildern in einer Spalte speichern
1. Die URL von einem Bild in einer Spalte speichern
Zum Üben können Sie diese URL verwenden: https://www.ebay.com/itm/Lenovo-Legion-Y540-15-6-144Hz-i7-9750H-16GB-RAM-256GB-SSD-GTX-1660-Ti-Office/303553933195
Wählen Sie einfach ein Bild aus, dann wählen "Extract the URL of the selected image" in Tipps. Wiederholen Sie den gleichen Vorgang, um alle anderen Bild-URLs abzurufen.
2. Die URL von mehreren Bildern in verschiedenen Zeilen speichern
Es ist auch möglich, URLs von Bildern in verschiedenen Zeilen zu extrahieren, indem Sie „Loop“ verwenden können.
1) Wählen Sie das erste Bild aus
2) Markieren Sie anschließend das zweite Bild und wählen Sie "Extract image URLs".
3. Die URL von allen Bildern in einer Spalte speichern
Es gibt zwei Möglichkeiten, die URL von allen Bildern in einer Spalte zu speichern.
Möglichkeit 1. Kombinieren Sie die extrahierten Bild-URLs
Wenn Sie die Bild-URLs extrahiert und in verschiedene Zeilen gespeichert haben (s. Schritt 2), können Sie die extrahierten Daten anschließend kombinieren, um die Zeilen in einer einzigen Zeile zusammenzuführen.
1) Klicken Sie auf das Einstellungssymbol von der Aktion "Extract Data".
2) Klicken Sie auf "...", wählen Sie dann "Combine data" und anschließend "Combine the captured data".
Möglichkeit 2. Scrapen Sie den HTML-Code des Karussells und gleichen Sie die Bild-URLs aus dem Code ab
1) Wählen Sie das gesamte Karussell aus, dann wählen Sie "Extract the outer HTML of the selected element"
2) Gehen Sie zu der Aktionseinstellung von "Extract Data", klicken Sie auf "...", dann wählen Sie "Clean data".
3) Finden den Startwert und den Endwert der Bild-URL.
4) Klicken Sie auf "Add step" und wählen Sie "Matching with Regular Expression".
5) Klicken Sie auf "Try the ReEx tool"
6) Geben Sie den Startwert und den Endwert in "Start mit" und "Ende mit" ein, um RegEx zu erzeugen. Dann klicken Sie auf „Apply“.
7) Kreuzen "Match all" an und bestätigen
Tipps!
Die gescrapten Bild-URLs sind Thumbnail-URLs. Wenn Sie die vollständigen Bild-URLs scrapen möchten, lesen Sie bitte diese Anleitung:
How to scrape the full image URLs instead of thumbnails?