logo
languageDEdown
menu

RegEx: Extrahieren aller E-Mail-Adressen aus TXT-Dateien oder Strings

3 Minuten lesen

In diesem Artikel zeige ich Ihnen, wie Sie mithilfe eines regulären Ausdrucks alle E-Mail-Adressen aus TXT-Dateien oder Zeichenketten extrahieren können.

Option 1: Excel Formel 

=TRIM(RIGHT(SUBSTITUTE(LEFT(A1,FIND (" ",A1&" ",FIND("@",A1))-1)," ", REPT(" ",LEN(A1))),LEN(A1))).

Die Verwendung dieser Formel zum Extrahieren von E-Mail-Adressen ist frustrierend, wenn Sie in Excel unerfahren sind. Excel hat strenge Regeln für die Reihenfolge. Oft kopiert man eine komplexe Formel und fügt sie ein, aber Excel akzeptiert sie nicht, wenn man den Ausdruck nicht in die Zelle eingibt. Ein weiteres Problem, das mit der Excel-Formel verbunden ist, besteht darin, dass Sie eine gewisse Zeit damit verbringen müssen, den Ausdruck zu debuggen, insbesondere wenn es sich um einen langen Ausdruck handelt.

Option 2: Excel VBA Code

  • Schritt1: Drücken Sie die Tasten “ALT+F11”, und Sie gelangen zum Fenster Microsoft Visual Basic for the Application
  • Schritt 2: Klicken Sie auf Einfügen > Modul, kopieren Sie den folgenden Text und fügen Sie ihn in das Modulfenster ein:
Sub ExtractEmail() 
'Update 20130829

Dim WorkRng As Range

Dim arr As Variant

Dim CharList As String

On Error Resume Next

xTitleId = "KutoolsforExcel"

Set WorkRng = Application.Selection

Set WorkRng = Application.InputBox("Range", xTitleId, WorkRng.Address, Type:=8)

arr = WorkRng.Value

CheckStr = "[A-Za-z0-9._-]"
For i = 1 To UBound(arr, 1)

For j = 1 To UBound(arr, 2)

extractStr = arr(i, j)

outStr = ""

Index = 1

Do While True

Index1 = VBA.InStr(Index, extractStr, "@")

getStr = ""

If Index1 > 0 Then

For p = Index1 - 1 To 1 Step -1

If Mid(extractStr, p, 1) Like CheckStr Then

getStr = Mid(extractStr, p, 1) & getStr

Else

Exit For

End If

Next

getStr = getStr & "@"

For p = Index1 + 1 To Len(extractStr)

If Mid(extractStr, p, 1) Like CheckStr Then

getStr = getStr & Mid(extractStr, p, 1)

Else

Exit For

End If

Next

Index = Index1 + 1

If outStr = "" Then

outStr = getStr

Else

outStr = outStr & Chr(10) & getStr

End If

Else

Exit Do

End If


Loop

arr(i, j) = outStr

Next

Next

WorkRng.Value = arr

End Sub
  • Schritt 3: Drücken Sie “Ok”, um mit dem Vorgang fortzufahren.
  • Schritt 4: Wählen Sie den Bereich, den Sie auf den obigen Code anwenden möchten. In diesem Fall den Bereich A1: A4

Option 3: Regulärer Ausdruck

Der reguläre Ausdruck kann schwer zu erlernen sein, wenn Sie keine Programmierkenntnisse haben. Sie können jedoch direkt diesen einfachen Ausdruck kopieren, um die E-Mail-Adresse zu filtern und dann die Daten zu extrahieren.

[a-zA-Z0-9-_]{1,}@[a-zA-Z0-9-_]{1,}.[a-zA-Z]{1,}

Octoparse verfügt über ein eingebautes RegEx-Tool, mit dem sich die extrahierten Daten einfach bereinigen lassen. Besonders für die Menschen, die keine Programmierkenntnisse haben, ist das Tool sehr praktisch, denn sie müssen keine Zeit verbringen, um Python zu lernen. Octoparse ermöglicht es Ihnen, Datenextraktion, Datenbereinigung und Datenexport in einem Tool zu erledigen. 

  • Schritt 1: Octoparse öffnen
  • Schritt 2: Kopieren Sie die Textzeichenfolge unter Quelltext. In diesem Fall ist die Textzeichenfolge:

This email address is valid: web@email.net and this email address is not valid web@email. Same as what_ever@public.com is a valid email address and address test@test. is not valid! OCTOPARSE@test.com is also valid

  • Schritt 3: Kopieren Sie den Ausdruck und fügen Sie ihn in das Feld “Regulärer Ausdruck” ein.
  • Schritt 4: Wählen Sie unten die Option “Match All”, und klicken Sie auf “Match”.

Oder verwenden Sie die Octoparse-Vorlage “E-Mail & Social Media Scraper” oder “Kontaktdaten-Scraper”, um die gewünschten Daten zu extrahieren.

https://www.octoparse.de/template/contact-details-scraper

https://www.octoparse.de/template/email-social-media-scraper-for-Germany

Wenn Sie Probleme bei der Datenextraktion haben, oder uns etwas Vorschlägen geben möchten, kontaktieren Sie bitte uns per E-Mail (support@octoparse.com). 💬

Autor*in: Das Octoparse Team ❤️

Beliebte Beiträge

Themen untersuchen

Starten mit Octoparse heute

Download

Verwandte Artikel

  • avatarChristel Kiesel
    Unter Web Crawling versteht man das Extrahieren spezifischer HTML-Daten aus bestimmten Websites. Man kann einen Web Crawler einfach als ein spezielles Programm betrachten, das dafür ausgelegt ist, Websites gezielt zu durchsuchen und Daten zu sammeln. Wir können aber nicht die URL-Adressen aller Seiten einer Website im Voraus ermitteln. Es geht also darum, wie man alle HTML-Webseiten einer Website abrufen kann.
    21. Mai 2024 · 3 Minuten lesen
  • avatarChristel Kiesel
    Wie kann man alle Bilder einer Website downloaden? Es klingt ein bisschen nicht so einfach. Besondere gibt es auch die Bilder, die der Öffentlichkeit nicht erreichbar oder gesperrt sind. In diesem Fall sollte man unbedingt ein Tool nehmen, um die Bilder herunterzuladen. In diesem Artikel werden vier Methoden oder kostenlose Software vorzustellen. Damit kann jeder die Bilder aus einer Website speichern.
    08. Februar 2023 · 5 Minuten lesen
  • avatarNeela Schmidt
    In der allgemeinen Informatik ist eine Regular Expression (abgekürzt als RegEx oder RegExp) ein regulärer Ausdruck. Also eine Zeichenfolge, mit der eine Reihe von Zeichenfolgen mithilfe einiger Syntaxregeln beschrieben wird. Regex Telefonnummer ist eine Form davon. Diese sind vor allem in der Softwareentwicklung und im Webdesign in Verwendung. RegEx ist zum Beispiel bei Anwendungen wichtig, die Eingaben des Benutzers erwarten. Das ist etwa bei bei Online-Formularen der Fall.
    05. Dezember 2022 · 6 Minuten lesen
  • avatarNeela Schmidt
    Web Scraping ist eine Technik, damit man mit Programmiersprachen wie Scraping-Bots die Webdaten von einer oder mehreren Websites extrahieren könnte. Für jeden, der eine relativ große Menge an Informationen von einer bestimmten Webseite in großen Mengen erhalten möchte, ist Web Scraping eine gute Wahl und kann den Zeit- und Arbeitsaufwand zur Erfüllung Ihrer Datenerfassungsanforderungen erheblich reduzieren.
    08. Juli 2022 · 5 Minuten lesen