画像の匿名化

画像内の個人情報を自動的に検出し、削除します。写真、スクリーンショット、またはスキャンした文書をアップロードすると、OCRによるパイプラインがテキストベースのPIIを見つけてぼかします。

仕組み

Tesseract OCRは、48の言語をサポートし、単語ごとの信頼スコアを持つ、画像からすべての読み取り可能なテキストを抽出します。

抽出されたテキストは、Microsoft PresidioのNLPエンジンによって分析され、25種類のエンティティタイプ（名前、メール、電話番号、クレジットカードなど）を検出します。

検出されたPIIは、ピクセル座標にマッピングされ、単色の長方形で覆われます。ニーズに合わせて6つの塗りつぶし色から選択できます。

最も一般的な写真形式

ロスレス、透明性をサポート

高品質のスキャン文書

非圧縮ビットマップ画像

モダンなウェブ形式

単一フレームのサポート

すべての25の標準Presidioエンティティタイプは、OCRテキスト抽出を介して画像で機能します

人名

メールアドレス

電話番号

クレジットカード番号

IBANコード

IPアドレス

物理アドレス

日付と時刻

SSN、パスポート、運転免許証

組織名

OCRが読み取れるテキストを検出します。顔、ナンバープレート、QRコード、手書きは検出しません。

高解像度で明瞭なテキストは、より良い結果をもたらします。コントラストが低いまたは小さなテキストは見逃される可能性があります。

典型的な画像は、サイズと複雑さに応じて3-20秒で処理されます。

無料アカウントで画像の匿名化を開始します。クレジットカードは不要です。