logo
languageDEdown
menu

RegEx: Extrahieren aller E-Mail-Adressen aus TXT-Dateien oder Strings

3 Minuten lesen

In diesem Artikel zeige ich Ihnen, wie Sie mithilfe eines regulären Ausdrucks alle E-Mail-Adressen aus TXT-Dateien oder Zeichenketten extrahieren können.

Was ist ein regulärer Ausdruck (RegEX)?

In der allgemeinen Informatik wird eine Regular Expression (kurz RegEx oder RegExp) verwendet, um eine Reihe von Zeichenfolgen mithilfe bestimmter Syntaxregeln zu beschreiben. Diese sind insbesondere in der Softwareentwicklung und im Webdesign von Bedeutung. RegEx ist beispielsweise wichtig für Anwendungen, die Benutzereingaben verarbeiten, wie Online-Formulare. In manchen Fällen sind E-Mail-Adressen zusammen mit anderen Informationen in einer Zeichenkette enthalten. Um nur die E-Mail-Adressen zu extrahieren, ist es sinnvoll, das RegExp einmalig zu verwenden, anstatt für jede Daten das “Control + F”, “Control + C” und “Control + V” zu tippen.

Option 1: Excel Formel 

=TRIM(RIGHT(SUBSTITUTE(LEFT(A1,FIND (" ",A1&" ",FIND("@",A1))-1)," ", REPT(" ",LEN(A1))),LEN(A1))).

Die Verwendung dieser Formel zum Extrahieren von E-Mail-Adressen ist frustrierend, wenn Sie in Excel unerfahren sind. Excel hat strenge Regeln für die Reihenfolge. Oft kopiert man eine komplexe Formel und fügt sie ein, aber Excel akzeptiert sie nicht, wenn man den Ausdruck nicht in die Zelle eingibt. Ein weiteres Problem, das mit der Excel-Formel verbunden ist, besteht darin, dass Sie eine gewisse Zeit damit verbringen müssen, den Ausdruck zu debuggen, insbesondere wenn es sich um einen langen Ausdruck handelt.

Option 2: Excel VBA Code

Excel VBA Code
  • Schritt1: Drücken Sie die Tasten “ALT+F11”, und Sie gelangen zum Fenster Microsoft Visual Basic for the Application
  • Schritt 2: Klicken Sie auf Einfügen > Modul, kopieren Sie den folgenden Text und fügen Sie ihn in das Modulfenster ein:
Sub ExtractEmail() 
'Update 20130829

Dim WorkRng As Range

Dim arr As Variant

Dim CharList As String

On Error Resume Next

xTitleId = "KutoolsforExcel"

Set WorkRng = Application.Selection

Set WorkRng = Application.InputBox("Range", xTitleId, WorkRng.Address, Type:=8)

arr = WorkRng.Value

CheckStr = "[A-Za-z0-9._-]"
For i = 1 To UBound(arr, 1)

For j = 1 To UBound(arr, 2)

extractStr = arr(i, j)

outStr = ""

Index = 1

Do While True

Index1 = VBA.InStr(Index, extractStr, "@")

getStr = ""

If Index1 > 0 Then

For p = Index1 - 1 To 1 Step -1

If Mid(extractStr, p, 1) Like CheckStr Then

getStr = Mid(extractStr, p, 1) & getStr

Else

Exit For

End If

Next

getStr = getStr & "@"

For p = Index1 + 1 To Len(extractStr)

If Mid(extractStr, p, 1) Like CheckStr Then

getStr = getStr & Mid(extractStr, p, 1)

Else

Exit For

End If

Next

Index = Index1 + 1

If outStr = "" Then

outStr = getStr

Else

outStr = outStr & Chr(10) & getStr

End If

Else

Exit Do

End If


Loop

arr(i, j) = outStr

Next

Next

WorkRng.Value = arr

End Sub
  • Schritt 3: Drücken Sie “Ok”, um mit dem Vorgang fortzufahren.
  • Schritt 4: Wählen Sie den Bereich, den Sie auf den obigen Code anwenden möchten. In diesem Fall den Bereich A1: A4

Option 3: Regulärer Ausdruck

Der reguläre Ausdruck kann schwer zu erlernen sein, wenn Sie keine Programmierkenntnisse haben. Sie können jedoch direkt diesen einfachen Ausdruck kopieren, um die E-Mail-Adresse zu filtern und dann die Daten zu extrahieren.

[a-zA-Z0-9-_]{1,}@[a-zA-Z0-9-_]{1,}.[a-zA-Z]{1,}
Regulärer Ausdruck

Octoparse verfügt über ein eingebautes RegEx-Tool, mit dem sich die extrahierten Daten einfach bereinigen lassen. Besonders für die Menschen, die keine Programmierkenntnisse haben, ist das Tool sehr praktisch, denn sie müssen keine Zeit verbringen, um Python zu lernen. Octoparse ermöglicht es Ihnen, Datenextraktion, Datenbereinigung und Datenexport in einem Tool zu erledigen. 

  • Schritt 1: Octoparse öffnen
  • Schritt 2: Kopieren Sie die Textzeichenfolge unter Quelltext. In diesem Fall ist die Textzeichenfolge:

This email address is valid: web@email.net and this email address is not valid web@email. Same as what_ever@public.com is a valid email address and address test@test. is not valid! OCTOPARSE@test.com is also valid

  • Schritt 3: Kopieren Sie den Ausdruck und fügen Sie ihn in das Feld “Regulärer Ausdruck” ein.
  • Schritt 4: Wählen Sie unten die Option “Match All”, und klicken Sie auf “Match”.
Regulärer Ausdruck

Oder verwenden Sie die Octoparse-Vorlage “E-Mail & Social Media Scraper” oder “Kontaktdaten-Scraper”, um die gewünschten Daten zu extrahieren.

https://www.octoparse.de/template/contact-details-scraper

Weitere Info können Sie hier finden 👉 RegEx: Extrahieren aller Telefonnummern aus Zeichenketten

Zusammenfassung

Zusammenfassend lässt sich sagen, dass das Extrahieren von E-Mail-Adressen aus Textdateien oder Zeichenketten auf verschiedene Weise erfolgen kann, beispielsweise mit Excel-Formeln, VBA-Makros und regulären Ausdrücken. Für Benutzer, die mit der Programmierung nicht vertraut sind, kann der Prozess durch die Verwendung eines Tools wie Octoparse vereinfacht werden, das integrierte Werkzeuge für reguläre Ausdrücke bietet, um Daten schnell und ohne Programmierkenntnisse zu extrahieren und zu bereinigen. Unabhängig davon, ob Sie sich für eine manuelle Methode oder ein automatisiertes Tool entscheiden, kann die korrekte Extraktion von E-Mail-Adressen dazu beitragen, die Effizienz Ihrer Datenverwaltung und Ihrer Marketingkampagnen zu verbessern.

Hier bekommen Sie Octoparse! 🤩

Preis: $0~$249 pro Monat

Packet & Preise: Octoparse Premium-Preise & Verpackung

Kostenlose Testversion: 14-tägige kostenlose Testversion

Herunterladen: Octoparse für Windows und MacOs

Wenn Sie Probleme bei der Datenextraktion haben, oder uns etwas Vorschlägen geben möchten, kontaktieren Sie bitte uns per E-Mail (support@octoparse.com). 💬

Autor*in: Das Octoparse Team ❤️

Beliebte Beiträge

Themen untersuchen

Starten mit Octoparse heute

Download

Verwandte Artikel

  • avatarNeela Schmidt
    Der Scraping von E-Mail-Adressen ermöglicht es Unternehmen, gezielt auf potenzielle Kunden zuzugehen und ihre Marketingkampagnen effektiv zu gestalten. Lassen Sie uns eintauchen in die Welt des E-Mail Scraping und erkunden, wie Sie Ihr Geschäftspotenzial maximieren können – ohne dabei die Privatsphäre oder gesetzlichen Rahmenbedingungen zu verletzen.
    2024-03-19T11:45:41+00:00 · 5 Minuten lesen
  • avatarNeela Schmidt
    Das E-Mail-Scraping kann mithilfe eines Bots E-Mail-Adressen sammeln, die öffentlich angezeigt werden. Ich habe 10 beste E-Mail-Scraping-Tools für E-Mail Marketing aufgelistet. Schauen wir die Liste zusammen.
    2024-01-04T00:00:00+00:00 · 7 Minuten lesen
  • avatarNeela Schmidt
    In der allgemeinen Informatik ist eine Regular Expression (abgekürzt als RegEx oder RegExp) ein regulärer Ausdruck. Also eine Zeichenfolge, mit der eine Reihe von Zeichenfolgen mithilfe einiger Syntaxregeln beschrieben wird. Regex Telefonnummer ist eine Form davon. Diese sind vor allem in der Softwareentwicklung und im Webdesign in Verwendung. RegEx ist zum Beispiel bei Anwendungen wichtig, die Eingaben des Benutzers erwarten. Das ist etwa bei bei Online-Formularen der Fall.
    2022-12-05T00:00:00+00:00 · 6 Minuten lesen
  • avatarNeela Schmidt
    Web Scraping ist eine Technik, damit man mit Programmiersprachen wie Scraping-Bots die Webdaten von einer oder mehreren Websites extrahieren könnte. Für jeden, der eine relativ große Menge an Informationen von einer bestimmten Webseite in großen Mengen erhalten möchte, ist Web Scraping eine gute Wahl und kann den Zeit- und Arbeitsaufwand zur Erfüllung Ihrer Datenerfassungsanforderungen erheblich reduzieren.
    2022-07-08T00:00:00+00:00 · 5 Minuten lesen