医学論文に存在しない参考文献が4046件 コロンビア大が250万本の調査で発覚、編集倫理にも警鐘
医学論文の参考文献に、実在しない研究が紛れ込んでいる――。米コロンビア大学などの研究グループは、生命医学分野の論文約250万本を調べ、2810本の論文に計4046件の「存在しない参考文献」が含まれていたと報告した。調査結果は2026年5月7日付で医学誌「The Lancet」に発表された。https://doi.org/10.1016/S0140-6736(26)00603-3|doi.org/10.1016/S0140-6736(26)00603-3
生成AIの利用が広がる中、実在しない引用は、科学論文の信頼性を揺るがしかねない。参考文献は、論文の主張を支える根拠だ。そこに存在しない研究が載っていれば、読者や査読者、政策決定者は、その根拠を確かめることができない。架空の参考文献は、論文を大量生産する「論文工場」や研究不正だけでなく、生成AIが作った文章を十分に確認せず使うことでも生じる。
研究チームは、無料で読める生命医学系論文のデータベースから、2023年1月から2026年2月18日までに公開された247万1758本を調べた。これらの論文に含まれる参考文献は約1億2600万件あり、そのうち学術データベースで照合できる約9710万件を確認した。
2026年初めには277本に1本
調査では、参考文献に書かれた論文タイトルや掲載情報が、実際の記録と合っているかを自動で調べた。表記ゆれや省略、識別番号の付け間違いなど、単なる記載ミスと考えられるものは除き、複数の学術データベースで探しても実在が確認できないものを「存在しない参考文献」と分類した。
見つかった存在しない参考文献は、合計4046件だった。これらは2810本の論文に含まれていた。多くは一見すると本物の論文のように見え、実在する研究者の名前、自然な論文タイトル、もっともらしい出版年が付いていたという。
問題は本数が急速に増えている点だ。2023年には、存在しない参考文献を少なくとも1件含む論文は2828本に1本程度だった。ところが2025年には458本に1本、2026年の最初の7週間では277本に1本まで増えていた。
AIだけが原因とは限らない
論文1万本あたりでみても、2023年は約4件だったのに対し、2025年末には51.3件、2026年初めには56.9件に達した。3年ほどで12倍以上に増えた計算になる。レビュー論文では、他の種類の論文よりも、存在しない参考文献を含む割合が57%高かった。
レビュー論文は、多くの研究を整理し、医療現場の指針や政策判断の土台になることもある。そこに架空の研究が混じれば、後続の論文や診療ガイドラインにまで影響が及ぶ恐れがある。実際、研究チームは、臨床試験や系統的レビューにも存在しない参考文献が含まれていたと指摘している。
研究チームは、増加の時期が生成AIの普及後に論文が投稿・掲載されるまでの時間差と重なるとみている。大規模言語モデルは、実在しない参考文献を、形式だけは整った形で作ってしまうことがある。過去の研究でも、医学分野でAIが生成した参考文献の相当数が実在しなかったと報告されている。
ただし、今回の研究は、存在しない参考文献がなぜ生じたのかを直接突き止めたものではない。生成AIの確認不足だけでなく、論文工場の活動、意図的な不正、データベース側の収録状況なども関係している可能性がある。
問題のある論文は訂正や撤回を検討すべき
限界もある。調査対象はPubMed Centralに収録されたオープンアクセス論文に限られ、生命医学分野全体を網羅しているわけではない。データベースで照合できない参考文献は調査から外れており、実際の数は今回の結果より多い可能性もある。研究チームも、今回の結果は問題の下限を示すものだとしている。
同じLancetに掲載されたCommentでは、存在しない参考文献は単なるミスではなく、研究の信頼性を脅かす編集上の問題だと指摘している。著者は本文や図表だけでなく、参考文献を含む論文全体に責任を持つべきであり、掲載済み論文にねつ造引用が見つかった場合は、訂正だけでなく撤回も検討すべきだとしている。
科学論文の信頼性は、本文だけでなく、そこで示される参考文献が本当に存在するかにも支えられている。研究チームは、出版社が論文投稿の段階で参考文献を自動確認し、問題のある論文には訂正や撤回を検討すべきだと訴えている。生成AIの利用が広がる中で、引用の確認を人手だけに任せる時代は終わりつつあるのかもしれない。
文/吉田光男 内外タイムス


