• 全国
  • 中国で広がるAIの悪用(第3回)たった5秒でそっくりな声を生成する“新オレオレ詐欺”の実態
  • HOME
  • 全国
  • 中国で広がるAIの悪用(第3回)たった5秒でそっくりな声を生成する“新オレオレ詐欺”の実態

中国で広がるAIの悪用(第3回)たった5秒でそっくりな声を生成する“新オレオレ詐欺”の実態

今シリーズでは、技術の発展が著しい中国におけるAI技術を悪用した社会問題の数々を紹介している。今回お伝えする内容は、これまでの技術を応用した犯罪の実例である。

シリーズ第1回では、ある声優の人生を狂わせた「音声窃盗ビジネス」を紹介した。

当人の音声をAIによってディープラーニングすることによって、本人の声そっくりのナレーションを作ることのできるソフトが密売され、本人の収入が激減したという事例だ。中国では、これを応用した詐欺が各地で行われている。

わずか数秒の会話で盗まれる音声

最近、中国では「見知らぬ番号からの電話には、決して声を出してはならない」という警告がSNSを駆けめぐっている。これは、AI音声を利用したオレオレ詐欺がまん延しているためである。

専門家によれば、現代のディープフェイク技術は、わずか5秒から10秒の音声サンプルがあれば、本人特有の声を抽出し、そっくりの合成音声をリアルタイムで生成できる水準に達している。

電話の相手がカスタマーサポート、公的機関、知人を名乗っていても、不審な場合は即座に電話を切る。

もし迷惑電話だとしても、決して暇つぶしに「からかってやろう」と返事をしたり、適当な相づちで時間を引き延ばしてはならない。

電話の向こうには犯罪グループが存在している可能性がある。こちらが発した「もしもし」「どちら様ですか」という数秒の音声が、彼らにとってAIを使った音声合成の材料となるのだ。

こうして窃盗された音声は、次の犯罪へと転用される。例えば、高齢の親のもとに「携帯電話を失くした。これが新しい番号」と、我が子の声で切迫した電話がかかってくる。

これまでのオレオレ詐欺は声のトーンや、話し方による違和感から見破ることが可能だった。

しかし、聞き慣れた身内の声を耳にすると、直感的に「本人の声」と判断し、論理的な思考を停止させてしまう。

この信頼関係を悪用することが、AI音声詐欺の成功率が極めて高い理由である。

リアルタイムAI詐欺の脅威

6月上旬に警察当局が公表した事例は、現代のAI技術が悪用された、極めて典型的な新型詐欺事件だ。

被害に遭ったのは、福建省でIT企業を経営する法人代表。ある日、彼のスマートフォンに、親しい知人からメッセージアプリを通じてビデオ通話が着信した。

画面の向こうの人物は「他県で行われる事業の入札に参加するため、430万元(約9500万円)の保証金が急きょ必要になった。一度、そちらの会社の口座を経由させて送金させてほしい」と、切迫した様子で依頼してきたという。

通常であれば高額な取引に警戒を強めるところだが、その法人代表に迷いはなかった。なぜなら、目の前のビデオ通話の画面には見慣れた知人の顔が映り、間違いなく本人の声だったからである。

画面と音声で直接相手の身元を確認したという安心から、法人代表は完全に警戒を解いた。

そして、通信を開始してからわずか10分のうちに、指示された口座へ430万元の送金を完了した。

ここから悪夢が始まる。送金後、手続きの完了を知らせるために知人の本来の電話番号へ直接連絡を入れた法人代表は、がく然とすることとなる。

知人は入札の事実すら知らず、さきほどのビデオ通話自体が全くの身に覚えのないものだと答えたのだ。

警察のその後の調査により、法人代表が信用しきった通話は、AI技術を用いたリアルタイム顔変換および音声合成によって偽造されたものだったことが判明した。

この事件は、サイバー犯罪が新たな次元に突入したことを世に知らしめたのである。目で見えるもの、耳で聞こえるものすら真実とは限らない時代が到来した。

繰り返しになるが、悪いのはAI技術ではなく人間の倫理観である。しかし、それを使った悪意の標的は特定のクリエーターや店舗のみならず、一般市民にも及んでいるのだ。

文/下川英馬 内外タイムス

関連記事一覧