Чому Regex, а не ШІ?
Для регуляторної відповідності вам потрібні результати, які ви можете пояснити та відтворити. Наш детермінований підхід забезпечує саме це — жодних чорних скриньок, жодних сюрпризів.
Докладне порівняння
| Aspect | На основі Regex (ми) | На основі ШІ/МШ |
|---|---|---|
| Відтворюваність | 100% ідентичні результати | Результати можуть змінюватися |
| Аудитованість | Повністю пояснювальний | Чорна скринька |
| Навчальні дані | Не потрібні | Потрібні великі набори даних |
| Зміщення моделі | Відсутнє — шаблони фіксовані | Погіршується з часом |
| Продуктивність | Швидка, передбачувана | Змінна, залежна від GPU |
| Вартість обчислень | Низька (тільки CPU) | Висока (часто потрібен GPU) |
| Регуляторна відповідність | Легко продемонструвати | Складно довести |
Як працює співпадіння шаблонів
Кожен тип сутності має ретельно розроблені шаблони regex, які відповідають специфічним форматам.
Адреси електронної пошти
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}Відповідає стандартному формату електронної пошти: local-part@domain.tld
Номери кредитних карт
\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\bВідповідає форматам Visa, Mastercard, Amex та іншим карткам з валідацією Luhn
Німецький IBAN
DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}Відповідає формату німецького IBAN з необов'язковими пробілами
Створено для відповідності
Коли аудитори запитують "чому це було виявлено?" вам потрібна чітка відповідь. Наш підхід на основі regex забезпечує саме це.
- GDPR Стаття 25: Конфіденційність за замовчуванням з пояснювальною обробкою
- ISO 27001: Документовані, повторювані процеси
- Аудиторський слід: Кожне виявлення можна відстежити до конкретного шаблону
Приклад відповіді аудитора
П: Чому "john.smith@company.com" було позначено?
В: Відповідає шаблону електронної пошти на позиції 45-68 з впевненістю 0.95. Шаблон: валідація стандартного формату електронної пошти.
Відчуйте детерміноване виявлення
Спробуйте наше виявлення PII на основі regex безкоштовно з 200 токенами за цикл.