コメントデータに含まれる個人情報を自動的にマスキングし、社内展開可能な形で出力する機能です。
マスキング後に分析処理を行うため、レポート(PowerPoint、PDF、Excel)やデータビューで表示されるコメントは、全てマスキング済みとなります。
※ 本機能はオプション機能です。ご利用をご希望の場合には、弊社担当者までお問い合わせください。
【精度について】
・100%の検出精度は保証されません。
文脈によっては検出できない個人情報がある可能性があるため、重要な情報は目視での確認を推奨します。
・一般的な単語が誤ってマスキングされる場合があります。 例)地名と同じ名前の製品名など
【元データについて】
・TopicScan内でマスキング済みデータから元のコメントを復元する機能はありません。
・元データはアップロード元(CSV、BigQuery等)に保持されています。
・マッピング情報(誰が[PERSON_1]か等)は保存されません。
機能概要
コメントデータに含まれる以下の情報を自動的に検出し、プレースホルダーに置き換えます。
マスキングのタイミング
個人情報が含まれたテキストデータをアップロードした後、分析設定の中でマスキング機能の使用有無を選択していただきます。
分析設定完了後に分析を開始したタイミングで、テキストデータ内の個人情報がマスキングされます。
マスキング後に分析処理を行うため、レポート(PowerPoint、PDF、Excel)やデータビューで表示されるコメントは、全てマスキング済みとなります。
自動検出される情報
※ 自動検出に対応しているのは日本語・英語のみです。
※ 「*」がついている情報は、リスト以降の「検出例」でパターンをご確認ください。
| 情報の種類 | マスキング後の表示 | 置き換え例 |
|---|---|---|
| メールアドレス | [EMAIL] | taro@example.com → [EMAIL] |
| 電話番号 | [PHONE] | 03-1234-5678 → [PHONE] |
| 郵便番号 | [ZIPCODE] | 〒123-4567 → [ZIPCODE] |
| URL | [URL] |
https://example.com → [URL] www.example.com → [URL] |
| クレジットカード番号 | [CREDIT_CARD] | 1234-5678-9012-3456 → [CREDIT_CARD] |
| 住所 * | [LOCATION] | 東京都港区西新橋1-1-1 → [LOCATION] |
| 人名 * | [PERSON_1], [PERSON_2]... | 田中太郎さん → [PERSON_1]さん |
| 組織名・会社名 * | [ORG_1], [ORG_2]... | 株式会社ABC → [ORG_1] |
| 生年月日 | [DATE_OF_BIRTH] |
生年月日は1990年5月15日 → [DATE_OF_BIRTH] 誕生日は2月9日 → [DATE_OF_BIRTH] |
| ID・識別子 | [ID] |
user_12345 → [ID] account123 → [ID] 2024A0001 → [ID] |
| マイナンバー | [MY_NUMBER] | 123456789012 → [MY_NUMBER] |
| 車のナンバー | [CAR_NUMBER] | 品川 300 あ 1234 → [CAR_NUMBER] |
| カスタムルール | [CUSTOM] | ユーザー定義のパターン |
住所の検出例
・ 〒105-0003 東京都港区西新橋1-1-1 (郵便番号付き) → [LOCATION]
・東京都港区(都道府県からの入力) → [LOCATION]
・日比谷フォートタワー11階(建物名) → [LOCATION]
人名の検出例
敬称付きの人名(さん、様、さま、氏、くん、君、ちゃん に適用)
・田中太郎さん (敬称は保持) → [PERSON_1]さん
・山田様 → [PERSON_2]様
・鈴木君 → [PERSON_3]君
・田中かすみ様 (名前部分がひらがな) → [PERSON_4]様
・山田カオリさん(名前部分がカタカナ) → [PERSON_5]さん
自己紹介パターン(「〜と申します」 に適用)
・田中と申します → [PERSON_1]と申します
役職付きの人名
・田中課長 → [PERSON_1]課長
・山田先生 → [PERSON_2]先生
続柄付きの人名(区切り文字が必要)
・息子:山田太郎様 → 息子:[PERSON_1]様
・娘・花子さん → 娘・[PERSON_2]さん
・敬称がない場合(例:田中太郎です) はマスキングされません。
・敬称、役職、自己紹介パターンがない場合(例:田中太郎です)はマスキングされません。
会社名の検出例
・株式会社ABC (前株) → [ORG_1]
・XYZ株式会社(後株) → [ORG_2]
・有限会社〇〇 → [ORG_3]
・合同会社△△ → [ORG_4]
・社会福祉法人〇〇 → [ORG_5]
略称にも対応しています。
・(株)ABC(全角括弧) → [ORG_6]
・(株)ABC (半角括弧) → [ORG_7]
・㈱ABC(囲み文字)→ [ORG_8]
・XYZ㈱(後株略称) → [ORG_9]
・(有)〇〇 (有限会社略称) → [ORG_10]
・㈲〇〇 (有限会社囲み文字)→ [ORG_11]
・(合)〇〇 (合同会社略称) → [ORG_12]
一貫性のあるマスキング
同じ人名や組織名は、分析全体を通じて同じプレースホルダーに変換されます。
この一貫性により、マスキング後も「同じ人物が複数回登場している」「同じ会社について言及している」といった文脈が保持されます。
| 元のコメント | マスキング後 |
|---|---|
|
田中太郎さんはABC株式会社の社員です。 山田花子さんも同じABC株式会社に勤務しています。 田中太郎さんは東京都渋谷区に住んでいます。 田中さんは読書を好んでいます。 |
[PERSON_1]さんは[ORG_1]の社員です。 [PERSON_2]さんも同じ[ORG_1]に勤務しています。 [PERSON_1]さんは[LOCATION_1]に住んでいます。 [PERSON_3]さんは読書を好んでいます。 |
「田中太郎」さんと「田中」さんは別の人物として認識されます。
また、「田中太郎さん」と「田中かすみ」様のように苗字が同じでも名前が異なる場合は、別の人物として認識されます。
機能利用方法
- 分析設定の「4.オプションの設定」で「個人情報をマスキングする」をONにします。
- マスキングプレビューで、マスキング結果を確認してください。
・コメント列の実データの最初の10件までが上段(元)に表示されます。
個人情報が含まれる場合、下段(後)にマスキング結果が表示されます。
・上段(元)のエリアに任意のテキストを入力して、マスキング結果を確認することもできます。
その際、入力内容は保存されません。
3. 必要に応じて、カスタムルールを追加してください。
カスタムルールは最大10個まで設定できます。
カスタムルール
自動検出に加えて、独自のマスキングルールを設定できます。
設定方法には、以下の2パターンがあります。
① キーワード指定
指定した文字列に完全一致(大文字小文字区別なし)で検出します。
| キーワード例 | 元のコメント | マスキング後 |
|---|---|---|
| プロジェクトX | プロジェクトXの進捗は順調です |
[CUSTOM]の進捗は順調です |
| XXXXX部 | XXXXX部の対応について |
[CUSTOM]の対応について |
② 正規表現指定
正規表現のパターンに一致する文字列を検出します。
※ 正規表現とは、決められたルールに沿って複数の文字を表現する記法のことです。
| 正規表現例 | 元のコメント | マスキング後 |
|---|---|---|
|
製品[A-Z]\d{3} 「製品」+ 英大文字1文字 + 数字3桁 の形式にマッチ |
製品A123の評価が高い |
[CUSTOM]の評価が高い |
|
Ver\d+\.\d+ 「Ver」+ 数字 + ドット + 数字 の形式にマッチ |
Ver2.0で改善されました |
[CUSTOM]で改善されました |
正規表現の書き方例(詳しくはweb検索にてご確認ください)
・数字1文字:\d
・数字1文字以上:\d+
・英大文字1文字:[A-Z]
・直前の文字が2〜3回:{2,3}
よくある質問
よくある質問は こちら