Definition des E-Mail-Regulären Ausdrucks-Musters
In diesem Schritt beginnen wir damit, das reguläre Ausdrucks-Muster (regex pattern) zu definieren, das wir zur Überprüfung von E-Mail-Adressen verwenden werden. Reguläre Ausdrücke, oft abgekürzt als "regex" oder "regexp", sind Zeichenfolgen, die ein Suchmuster definieren. Sie sind äußerst leistungsstark für die Mustererkennung und Manipulation von Zeichenketten.
Für die E-Mail-Überprüfung hilft uns ein reguläres Ausdrucks-Muster zu überprüfen, ob eine gegebene Zeichenkette dem Standardformat einer E-Mail-Adresse entspricht (z.B. [email protected]
). Während ein perfekter regulärer Ausdruck für alle möglichen gültigen E-Mail-Adressen sehr komplex ist, können wir ein Muster definieren, das die meisten gängigen und gültigen Formate abdeckt.
Wir werden eine neue Java-Datei erstellen, um unseren Code zu speichern.
-
Öffnen Sie die WebIDE, wenn sie noch nicht geöffnet ist. Standardmäßig sollten Sie sich im Verzeichnis ~/project
befinden.
-
Klicken Sie im Dateiexplorer links mit der rechten Maustaste in den leeren Bereich und wählen Sie "Neue Datei". Benennen Sie die Datei EmailValidator.java
.
-
Öffnen Sie die Datei EmailValidator.java
im Editor, indem Sie darauf im Dateiexplorer klicken.
-
Fügen wir nun die Grundstruktur unserer Java-Klasse hinzu und definieren das reguläre Ausdrucks-Muster. Kopieren und fügen Sie den folgenden Code in die Datei EmailValidator.java
ein:
import java.util.regex.Pattern;
public class EmailValidator {
// Email regex pattern
private static final String EMAIL_REGEX =
"^[a-zA-Z0-9_+&*-]+(?:\\.[a-zA-Z0-9_+&*-]+)*@(?:[a-zA-Z0-9-]+\\.)+[a-zA-Z]{2,7}$";
public static void main(String[] args) {
// We will add code here in the next steps
}
}
Werfen wir kurz einen Blick auf die neuen Teile:
import java.util.regex.Pattern;
: Diese Zeile importiert die Pattern
-Klasse, die Teil von Java's integrierter Unterstützung für reguläre Ausdrücke ist.
private static final String EMAIL_REGEX = "...";
: Diese Zeile deklariert eine konstante Variable namens EMAIL_REGEX
und weist ihr unser reguläres Ausdrucks-Muster zu.
^
: Passt auf den Anfang der Zeichenkette.
[a-zA-Z0-9_+&*-]+
: Passt auf ein oder mehrere alphanumerische Zeichen oder _
, +
, &
, *
, -
. Dies ist für den Benutzernamen-Teil.
(?:\\.[a-zA-Z0-9_+&*-]+)*
: Passt auf null oder mehrere Vorkommen eines Punkts, gefolgt von weiteren Benutzernamen-Zeichen. Dies ermöglicht Punkte im Benutzernamen (z.B. first.last
).
@
: Passt auf das Literal "@"-Symbol.
(?:[a-zA-Z0-9-]+\\.)+
: Passt auf ein oder mehrere Vorkommen von alphanumerischen Zeichen oder -
, gefolgt von einem Punkt. Dies ist für den Domainnamen (z.B. domain.
).
[a-zA-Z]{2,7}
: Passt auf 2 bis 7 alphabetische Zeichen für die Top-Level-Domain (z.B. com
, org
, Ländercodes
).
$
: Passt auf das Ende der Zeichenkette.
Machen Sie sich keine Sorgen, wenn das reguläre Ausdrucks-Muster kompliziert aussieht. Das Verständnis aller Details komplexer regulärer Ausdrücke benötigt Zeit und Übung. Konzentrieren Sie sich vorerst darauf, dass diese Zeichenkette die Regel für ein gültiges E-Mail-Format definiert.
-
Speichern Sie die Datei EmailValidator.java
(Strg+S oder Cmd+S).
Sie haben nun erfolgreich die Java-Datei erstellt und das reguläre Ausdrucks-Muster für die E-Mail-Überprüfung definiert. Im nächsten Schritt werden wir dieses Muster verwenden, um tatsächliche E-Mail-Adressen zu überprüfen.