業務効率化のために生成AIを活用する企業が増える一方、個人情報や機密情報をAIサービスに送信することへのリスク認識が追いついていないケースが見られます。どのようなリスクがあるのか、まず何から対処すべきか、取り扱うデータの性質によってどのような追加対応が必要になるかを解説します。
生成AIに情報を送ることで生まれるリスク
生成AIの業務活用が広がるにつれて、個人情報や機密情報をAIサービスに送信することへのリスクが十分に認識されないまま使われているケースが増えています。たとえば以下のような場面がその代表例です。
採用担当者が職務経歴書をそのまま生成AIに貼り付ける
求職者から受け取った職務経歴書(氏名・住所・連絡先・職歴を含む)を、要約や整形のために生成AIサービスに貼り付けて処理しているケースがあります。ATS(採用管理システム)への手動入力を省くために便利だからという理由で現場レベルで始まることが多く、社内のAI利用ポリシーが整備される前に習慣化してしまっているケースも少なくありません。
法務・営業担当者が契約書を生成AIに読み込ませる
契約書のリスク確認や条項の要約のために、取引先名・金額・秘密保持条項を含む契約書全文をそのままAIに渡しているケースがあります。相手方との秘密保持契約(NDA)が締結済みの場合、この行為がNDA違反にあたる可能性があります。
経理・財務担当者が取引データを貼り付けて分析させる
売上データ・仕入先情報・支払い履歴などをExcelからそのままコピーしてAIに渡し、集計・分析をさせているケースがあります。こうしたデータには取引先の個人情報(個人事業主の氏名・口座情報など)が含まれていることもあります。また、自社の未公開の財務情報が含まれる場合は、インサイダー情報の管理という観点からも問題になりえます。
こうした使われ方に共通するのは、「便利だから使ってみた」という現場レベルの判断で始まり、情報の取り扱いに関するルールの整備が後追いになっているという点です。では、実際にどのようなリスクが生じるのでしょうか。
入力データが学習に利用される可能性と対策
生成AIサービスによっては、入力したデータがモデルの改善やサービス品質向上のために利用される場合があります。学習利用を停止する設定がある場合でも、不正利用検知や安全性確保の目的で一定期間ログとして保持されることがあります。「学習に使われない設定=データが一切残らない」ではない点は重要です。加えて、利用するプランやAPIによっては入力データが国外のサーバーで処理されることもあり、日本の個人情報保護法の観点から委託先としての整理やDPA(データ処理契約)の確認が必要になる場合があります。
対策としては、利用しているサービスで学習利用を停止する設定を確認・適用することが出発点です。多くの主要サービスでは設定によってモデル学習への利用を停止できますが、設定の有無や適用範囲はサービスごとに異なります。個人の設定任せにせず組織として管理できる体制を整えることで、利用状況を組織としてコントロールできるようになります。チームプランやエンタープライズプランではSSO(シングルサインオン)による利用者管理や監査ログの取得など、そうした管理を支える機能が提供されることが多くあります。
生成AIの利用方針を整えることが企業の信頼につながる
ツールの設定や技術的な対応は、生成AIを安全に使うための重要な要素です。一方で、個人情報保護法上の利用目的との整合性はプライバシーポリシーの内容に依存するなど、設定だけでは補いきれない部分もあります。企業として生成AIとどう向き合うかを継続的に考え、方針として示していくことが、取引先・顧客・従業員からの信頼につながっていきます。
こうした方針の整備は、AIガバナンス(生成AIの利用を組織として適切に管理・運用する仕組み)の一環です。たとえば以下のような取り組みが出発点になります。
- 自社のプライバシーポリシーに生成AIを用いた業務処理を明記し、個人情報保護法等の関連法令に沿った運用を確認する(プライバシー保護)
- AIの利用方針・承認ツール・責任者を明文化し、社内に周知する(アカウンタビリティ)
- AIの出力をそのまま使用せず、人間が確認・判断を介在させる運用フローを設ける(安全性)
- AIへの入出力のログを記録・保持し、問題が生じたときに追跡できる体制を整える(透明性)
- ハルシネーションや情報漏洩などAI特有のリスクを含め、従業員が正しく理解するための教育・周知を継続して行う(教育・リテラシー)
総務省・経済産業省は2024年4月に「AI事業者ガイドライン」を公表しており、安全性・プライバシー保護・透明性・公平性といった観点での自主的な取り組みの方向性が国として示されています。法律ではないため義務ではありませんが、こうした指針を参考にしながら自社の方針を整えていくことは、企業としての誠実さを示すことにもつながります。運用の状況によっては、後述する独自システム開発を視野に入れることも一つの選択肢です。
独自開発でコンプライアンスと超効率化を両立する
コンプライアンスを確保した上で、個人情報を継続的かつ大量に扱う定型業務を安全に効率化するには、独自のシステム開発が有効な選択肢になります。
利用目的を設計段階で確定する
独自システムを構築・運用するにあたり、あらかじめ自社のプライバシーポリシー等に「AIを利用した業務処理」を明記しておくことで、どのデータをどの目的でAIに渡すかを設計段階から完全にコントロールできます。チャット画面での手動運用と異なり、データフローが設計として確定されているため、法務部門が確認・承認できる状態を整えやすくなります。
個人情報や要配慮情報を自動マスクする
独自システムでは、職務経歴書等に含まれる可能性のある病歴などの「要配慮個人情報」だけでなく、氏名・住所・電話番号などの「個人識別情報」を、事前に自動でマスクしてからAIに渡す設計を組み込むことができます。「何をAIに渡すか」をシステム側で制御することで、法務・コンプライアンス部門が承認できる運用フローを実現できます。
完全自動化で手動作業を排除する
ATS(採用管理システム)・CRM(顧客管理システム)・ERP(基幹業務システム)など既存の業務システムとAPI連携することで、書類が届いた時点から処理・転記までを自動化できます。担当者がチャット画面を操作する必要がなくなり、毎日何十件もの書類処理を自動で完了させることができます。手動コピペ運用では対応しきれなかった処理量を、人員を増やすことなくこなせるようになります。
独自のシステムを開発する場合に組み込める対策
独自開発を選択した場合、以下のような対策を設計段階から組み込むことができます。
AIに渡す前に仮名化処理を行う
氏名・住所・電話番号・取引先名など直接個人または企業を特定できる情報をAIに渡す前に除去・仮名化(ダミー値に置き換える)処理を行い、処理後に復元する仕組みを設けることができます。AIが扱うデータから識別情報を切り離すことで、リスクを根本から低減できます。
AIに渡すデータを最小化する設計にする
業務文書全体をそのままAIに渡すのではなく、処理に必要な項目だけを抽出してから渡す設計にすることで、不要な個人情報・機密情報の送信を防げます。たとえば文書の分類や要約が目的であれば、氏名や連絡先などの識別情報をシステム側で除外してからAIに渡す実装が可能です。
入出力のフィルタリングを組み込む
AIへの入力前と出力後に、個人情報を自動で検知・マスクするフィルタリング処理を組み込むことができます。正規表現やNLP(自然言語処理)を活用したライブラリを使うことで、電話番号・メールアドレス・氏名パターンなどを機械的に検出する仕組みを実装できます。
また、AWSなどの主要なクラウドAIプラットフォームには、入出力の内容を検査・制御するガードレール機能が用意されているものがあります。特定のカテゴリーのコンテンツ検出やブロックをプラットフォームレベルで設定できるため、独自のフィルタリングロジックと組み合わせることで、より多層的な制御を実現できます。利用するAIサービスが対応している場合は、こうした機能の活用も設計の選択肢として検討できます。
ハルシネーション対策のアプローチを組み込む
生成AIは事実と異なる情報を生成するハルシネーションが起こりえます。独自システムでは、このリスクに対するアプローチを設計段階から組み込むことができます。たとえば、社内ドキュメントや信頼できる情報源をもとに回答を生成するRAG(Retrieval Augmented Generation)の仕組みを導入することで、AIが根拠のある情報源に基づいて出力するよう制御できます。また、AIが情報源を正しく参照しているかを検証するロジックを実装したり、出力結果を担当者が確認・修正するワークフローを設計に組み込んだりすることで、誤情報が業務フローに混入するリスクを低減できます。
監査ログと保持期間の管理を実装する
どのデータをいつAIに渡したかを記録する監査ログを実装し、一定期間後に自動削除される仕組みを設けることができます。個人情報・機密情報を扱うシステムでは、データの追跡可能性と削除の確実性がコンプライアンス上も重要になります。
業務に組み込む際に設計が必要になるポイント
生成AIを実業務に安全に組み込むには、個人情報の保護とハルシネーション対策の両面を考慮した設計が必要になります。PoC(概念実証)段階であれば比較的短期間で試すことができますが、本番運用に向けては以下のような設計上の検討が求められます。
- 既存システム(ATS・CRM・ERPなど)とのAPI連携設計
- PDFやドキュメントの形式・品質によるテキスト抽出精度のばらつきへの対処
- 仮名化・復元処理のフロー設計
- RAGの情報源となるデータの整備と更新の運用設計
- AIの出力精度を検証する仕組みと、担当者が確認・修正するワークフローの設計
- 個人情報・機密情報の保持期間・削除ルールの整備
- 社内AI利用ポリシーとの整合性確認
これらはツールを導入するだけでは対応できない部分です。個人情報・機密情報の取り扱いは技術的な実装とコンプライアンスの両面から、出力精度に関わる設計は業務フローと合わせて検討する必要があります。要件整理の段階からご相談いただくことで、後から設計をやり直すコストを抑えられます。
よくある質問
Q. ハルシネーションのリスクはどのように管理すればよいですか?
対応方法は業務フローやシステムの構成によって異なりますが、担当者が出力を確認・修正するワークフローを設けることが選択肢の一つです。独自システムを開発する場合は、社内ドキュメントや信頼できる情報源をもとに回答を生成するRAG(Retrieval Augmented Generation)の仕組みを導入することで、根拠のある情報源に基づいた出力に制御することができます。また、AIが情報源を正しく参照しているかを検証するロジックを組み込むことで、より精度の高い運用が可能になります。
Q. 独自開発はコストが高いのではないですか?
対象業務を限定すれば数週間〜数ヶ月で構築できるケースも多く、人件費の削減効果によって開発費用を回収できるケースが一般的です。個人情報のマスク処理やRAGの導入、出力検証の仕組みなどを最初から組み込んで設計することで、後から対応するよりもトータルコストを抑えられます。
Q. まず何から始めればよいですか?
社内でどのように生成AIを利用して業務を効率化しているかを把握することが最初のステップです。現場担当者へのヒアリングを通じて利用実態を整理し、どの業務でどのような目的にAIが活用されているかを可視化することで、次に取り組むべき優先順位が見えてきます。その上で、個人情報・機密情報を扱っているケースについては適切な設定や運用ルールの整備を進め、さらにAI活用を深めたい業務については独自システム開発による設計の検討もご相談ください。