Kombinieren extrahierte Daten
Monday, August 23, 2021 2:49 PMDie Funktion "Combine data" kann verwendet werden, um Daten, die in verschiedenen Zeilen extrahiert wurden, in EINER einzigen Zeile zu kombinieren.
Nehmen wir an, dass Sie Beiträge aus einem Blog extrahieren möchten. In manchen Fällen ist es nicht möglich, den gesamten Beitrag zu extrahieren, aber Sie möchten trotzdem den gesamten Beitrag in einer einzigen Zeile haben, anstatt verschiedene Absätze in verschiedenen Zeilen wie das Beispiel:
In solcher Situation können Sie die Funktion "Combine data" nutzen, um die extrahierten Daten in einer einzigen Datenzeile zusammenzuführen. Lesen Sie bitte das Tutorial weiter.
Zum Üben verwenden wir die Website: https://philipyancey.com/a-view-from-abroad.
1) Wählen Sie die zu extrahierenden Daten aus
1. Klicken Sie auf den ersten Absatz auf der Seite und wählen Sie "Select all" im Bedienfeld Tipps. Es wird ein "Loop Item" erstellt, um jeden Absatz des Beitrags zu extrahieren.
2. Wählen Sie "Extract text of the selected elements".
2) Kombinieren Sie die extrahierten Daten
1. Doppelklicken Sie auf die Aktion "Extract Data", um das Einstellungsfenster zu öffnen
2. Klicken Sie auf , wählen Sie "Combine data", und wählen Sie "Combine the captured data".
Sie haben alles vorbereitet! Führen Sie die Aufgabe aus und sehen Sie sich an, wie die exportierten Daten tatsächlich aussehen. Sie können sehen, dass die im Feld "Text" erfassten Absätze jetzt in einer einzigen Zeile zusammengefasst sind.
Tipps!
1. Die Funktion "Combine data" ist besonders nützlich für das Extrahieren von Artikeln aus beliebigen Websites.
Sie können den Artikel als ein ganzes Stück extrahieren, ohne andere Elemente wie Leerzeilen, Kommentare oder Bilder.
2. Wenn die Daten zusammengefügt sind, können Sie mit „Data reformat tools “ein Präfix oder Suffix wie "|" und "\" hinzufügen, um die Daten neu zu formatieren.
3. Wenn mehrere Felder zu extrahieren sind, müssen Sie für jedes Feld die Option "Combine captured data" einrichten.