2024.09.10

コールセンターのVoC分析を支援する個人情報マスキングAIを公開

Uncategorized

コールセンターの通話ログなどのテキストデータから個人情報を高精度で自動マスキングするための生成AIモデル「japanese-gpt-1b-PII-masking」を開発し公開しました。

氏名や住所といった個人情報を含む文章を入力すると、該当部分がマスキングされた文章が出力されます。(※)個人情報データはすべて架空のものを使用しています。

■サマリー

コールセンターの通話ログを対象とした、個人情報の自動マスキングに特化した生成AIモデルを公開
氏名、住所、組織名などの電話問い合わせの中でよく現れる個人情報を高精度で検知し、マスキング
10億パラメータの大規模言語モデル(LLM)をベースに、5000件の通話ログでファインチューニングを実施
性能評価では再現率（Recall）と精度（Precision）がいずれも95％という高い水準を達成
オンプレミス環境での導入が可能で、高いセキュリティ基準にも対応。また、クラウド環境でも利用可能で、柔軟な導入が可能

詳しくはこちらから。

企業の生成AI活用における個人情報の適切な取り扱いは喫緊の課題であり、具体的な対策への期待が高まっています。弊社では今後も企業のVoC活用を支援するためのAIソリューションの開発を進めるとともに、個人情報のセキュアな取り扱いと生成AI活用の両立を支援することで、企業のDXを力強く後押ししてまいります。

これからも、皆様に有益な情報やコンテンツの拡充に努めてまいります。

今後とも、どうぞよろしくお願い申しあげます。