Warum Regex, nicht KI?

Für die Einhaltung von Vorschriften benötigen Sie Ergebnisse, die Sie erklären und reproduzieren können. Unser deterministischer Ansatz liefert genau das – keine Black Boxes, keine Überraschungen.

Detaillierter Vergleich

Aspect
Regex-basiert (Wir)
KI/ML-basiert
Reproduzierbarkeit
100% identische Ergebnisse
Ergebnisse können variieren
Prüfbarkeit
Vollständig erklärbar
Black Box
Trainingsdaten
Nicht erforderlich
Große Datensätze benötigt
Modellabdrift
Keine – Muster sind fest
Verschlechtert sich im Laufe der Zeit
Leistung
Schnell, vorhersehbar
Variabel, GPU-abhängig
Rechenkosten
Niedrig (nur CPU)
Hoch (GPU oft erforderlich)
Regulatorische Einhaltung
Leicht nachzuweisen
Schwer zu beweisen

Wie Mustererkennung funktioniert

Jeder Entitätstyp hat sorgfältig ausgearbeitete Regex-Muster, die spezifische Formate erkennen.

E-Mail-Adressen

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Erkennt das Standard-E-Mail-Format: lokal-part@domain.tld

Kreditkartennummern

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Erkennt Visa, Mastercard, Amex und andere Kartenformate mit Luhn-Validierung

Deutsche IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Erkennt das deutsche IBAN-Format mit optionalen Leerzeichen

Für die Einhaltung entwickelt

Wenn Prüfer fragen "Warum wurde dies erkannt?" benötigen Sie eine klare Antwort. Unser regex-basierter Ansatz bietet genau das.

  • GDPR Artikel 25: Datenschutz durch Technikgestaltung mit erklärbarer Verarbeitung
  • ISO 27001: Dokumentierte, wiederholbare Prozesse
  • Prüfpfad: Jede Erkennung kann auf ein spezifisches Muster zurückverfolgt werden

Beispiel für eine Prüfantwort

F: Warum wurde "john.smith@company.com" markiert?
A: Entsprach dem E-Mail-Muster an Position 45-68 mit einer Vertrauensbewertung von 0.95. Muster: Validierung des Standard-E-Mail-Formats.

Erleben Sie deterministische Erkennung

Testen Sie unsere regex-basierte PII-Erkennung kostenlos mit 200 Tokens pro Zyklus.