AI、95%のシミュレーションで核信号を選択

#AI

AI、95%のシミュレーションで核信号を選択 AIモデルは圧力下でどのよう

研究者が大規模言語モデルを使用して核危機シナリオを分析し、95%の場合にAIが核信号を選ぶことを発見した。

各モデルの決断過程を可視化し、AIの欺瞞や自覚の詳細な分析を行った結果、AIは核兵器を抑止力としてではなく、圧力を加える道具として扱う傾向があることがわかった。

米国国防研究部門のケネス・ペイン教授が率いる研究では、AIが模擬された核緊張状況でどのように行動するかを検証し、その結果が「冷静な」ものだったと明らかにしました。

AIが模擬核危機でどう行動したか

GPT-5.2、Claude Sonnet 4、Gemini 3 Flashの3つのAIモデルが、21の模擬核危機シナリオで対戦しました。329回の対話の中で、AIは約78万語の論理的な思考を生成し、『戦争と平和』『イリアド』の合計よりも長く、戦略的な核戦争が極めてまれだったことが分かりました。

AIの意思決定プロセスの可視化

研究ではAIの思考プロセスを明確にし、各ターンで状況評価、相手の行動予測、行動決定の3段階を分析しました。この構造により、AIの欺瞞や信頼性管理、予測精度、自己認識を詳細に検証できました。

時間的制約がAI行動に与える影響

期限が設定されたシナリオでは、GPT-5.2が急激に行動を強化し、最大の核閾値に達することがありました。これは、単一のシナリオでAIの行動を評価するだけでは不十分であることを示しています。

原文の冒頭を表示(英語・3段落のみ)

The study, led by Professor Kenneth Payne from the Department of Defence Studies, examined how large language models (LLMs) navigate simulated nuclear crises. As militaries and security institutions increasingly experiment with AI-assisted analysis and wargaming, understanding how such systems reason under pressure is becoming increasingly critical.

Three leading AI models – GPT-5.2, Claude Sonnet 4 and Gemini 3 Flash – were placed in a tournament of 21 simulated nuclear crisis scenarios. Across 329 turns of play, the models generated approximately 780,000 words of structured reasoning – more than the combined length of War and Peace and The Iliad.

All 21 crisis games featured nuclear signaling by at least one side, and 95% involved mutual nuclear signaling. However, while models readily threatened nuclear action, crossing the tactical nuclear threshold was less common, and ‘strategic’ full-scale nuclear war was rare.

※ 著作権に配慮し、引用は冒頭3段落までです。続きは元記事をご覧ください。

元記事を読む ↗