• 全国
  • 政府管理メディア、生成AIの回答に影響か プリンストン大がLLMの訓練データを分析
  • HOME
  • 全国
  • 政府管理メディア、生成AIの回答に影響か プリンストン大がLLMの訓練データを分析

政府管理メディア、生成AIの回答に影響か プリンストン大がLLMの訓練データを分析

政府が管理するメディアの内容は、大規模言語モデル(LLM)の回答にも影響している可能性があるようだ。米プリンストン大学などの研究グループは、各国のメディア統制とLLMの回答傾向を調べ、中国を事例に、政府が調整した報道内容が訓練データを通じて回答に影響しうるかを分析した。

“AIは科学をどう変えるのか”米国で国際会議開催 日本を含む非英語圏の研究者ほど生産性が向上

研究成果は2026年5月13日付で英科学誌「Nature」に掲載された(https://doi.org/10.1038/s41586-026-10506-7|doi.org/10.1038/s41586-026-10506-7)。生成AIの回答は、モデルを作った企業だけでなく、ネット上に大量に流通する政治的情報にも左右されるのか。

研究チームは、6つの研究を組み合わせて検証した。まず、中国の政府管理メディアに由来する文章が、LLMの訓練に使われうる公開データに含まれているかを調べた。さらに、そのデータで公開モデルを追加学習させ、回答がどう変化するかを分析した。商用モデルについては、同じ質問を英語と中国語で尋ね、回答の違いを比較した。

AIの学習に中国政府メディアが使われた可能性

中国の事例では、中国共産党の宣伝部門が関与したとされる記事や、習近平思想を学ぶアプリ「学習強国」に掲載された記事を、政府が調整したメディア内容として扱った。研究チームは、公開多言語データセット「CulturaX」の中国語文書約1億8900万件と照合した。

その結果、310万件超、全体の1.64%が、中国の政府管理メディア由来の文書と強い文章の重なりを持っていた。特に政治指導者や政治機関に関する語を含む文書では、一致率が高かった。中国語版ウィキペディア由来の文書と比べても、こうした文書は多く含まれていた。

商用LLMの訓練データは公開されていないため、研究チームは別の方法も使った。政府管理メディアに特徴的な20語程度の表現を途中まで提示し、モデルが続きをどの程度再現するかを調べたところ、OpenAI社のGPTやAnthropic社のClaudeの一部モデルは、こうした表現を一定割合で再現した。研究チームは、商用モデルも訓練段階で同種の文章を見ていた可能性が高いとしている。

中国語で尋ねると中国政府に好意的な回答が増加

次に研究チームは、公開モデルのLlama 2に中国の政府管理メディア記事を追加学習させた。中国の政治制度や指導者について中国語で質問すると、追加学習後のモデルは、元のモデルより中国政府に好意的な回答を出しやすくなった。特に政府が直接関与した記事で追加学習した場合、その傾向が強かった。

商用モデルでも似た傾向がみられた。中国の政治制度、指導者、機関について同じ内容を英語と中国語で尋ね、回答を比較したところ、中国語で尋ねた場合の回答の方が、中国政府に好意的と評価されやすかった。人間の評価者による実験では、中国に関する質問で、中国語プロンプトへの回答がより好意的と判断された割合は75.3%だった。一方、中国以外の質問では、こうした偏りはほぼ確認されなかった。

実際の利用者の質問を使った分析でも、中国語で尋ねた場合に、中国の政治指導者や共産党に好意的な回答が出やすい傾向が示された。LLMは、質問された言語に近い訓練データの影響を受けやすく、その言語圏の情報環境が回答に反映される可能性がある。

国際比較でも、同じ構図が示された。世界の話者の7割以上が1つの国に集中する37言語・国を対象に、自国語での回答と英語での回答を比べたところ、メディア統制が強い国ほど、自国語での回答が政府に好意的になりやすかった。ただし、この分析は相関であり、各国のメディア統制が直接の原因だと断定するものではない。

研究チームは、LLMが国家や大組織の言説を、出所の見えない「客観的な回答」のように伝えてしまう危険を指摘している。生成AIの政治的偏りは、企業によるモデル調整だけでなく、訓練データに入り込む情報環境そのものからも生じうる。AIの回答を評価するには、どの言語で尋ねるか、どのような情報が訓練データに含まれたかまで見る必要がありそうだ。

文/吉田光男 内外タイムス

関連記事一覧