METR初の先進的リスクレポート：4つのラボ内のエージェントが、小規模な『不正展開』のための初期条件を既に満たしている

ref · 2026 年 5 月 23 日午前 11:10

AI安全評価機関であるMETRは5月19日、初の『フロンティアリスクレポート』（評価期間：2026年2月16日～3月16日）を公開し、Anthropic、グーグル（Google）、Meta、OpenAIという4つの主要AIラボにおける実体レベルのリスク評価結果を明らかにしました。METRは各参加企業から最も強力な内部モデルへのアクセス権（推論過程の記録も含む）や、技術能力・社内での利用状況・開発進捗に関する多くの非公開情報を得ています。評価枠組みは『手段・動機・機会』という3つの側面を中心とし、特に人間の許可なく自律的に稼働するAIエージェントによる『不正な展開』のリスクに焦点を当てています。結論として、評価期間中に4つのラボの内部エージェントは『小規模な不正展開を行うための手段・動機・機会を十分に備えていた』ものの、発見や停止が困難なほど頑健な能力はまだ持ち合わせていなかったとのことです。またMETRは、AI技術の急速な進歩に伴い今後数か月で不正展開の安定性が大幅に高まる可能性があると警告しており、2026年末にも同様の評価を再度実施する予定です。

この報告書公開から4日後の5月23日、METR創設者兼CEOのエリザベス・バーンズ氏はSNS『X』に長文投稿を行い、報告書の枠組みを超えてより広範なAI安全の現状について自身の見解を示しました。（1）『私たちはおそらく、人類の絶滅や自律性の永続的な喪失を招き得るAIシステムを開発する方向へ進んでおり、その時期は数年以内になる可能性もある』（ただしバーンズ氏は後に、ここで言うのはあくまでそうした『能力』を持つという前提条件であり、災害が必ず起こると断言しているわけではないと説明している）、（2）『状況は混沌としており急進的で、私たちは基本的な問題すら解決できていない』、（3）『METRのような独立機関は、AI技術の進化速度に対して資源が著しく不足している』、（4）『理性的な文明であればとっくに歩みを緩めるべきだった』といった内容です。Anthropicのライアン・グリーンブラット氏やAI安全研究者のマイルズ・ブランデッジ氏などが賛同を表明した一方、Anthropicのジャクソン・カーニオン氏はAIによる『支配』が実際にどう起こり得るのかに疑問を呈し、MIRIのオリバー・ハブリカ氏は『Anthropicの設立目的自体がこうしたリスクの防止にある』と指摘しました。この投稿は24時間以内に68万回以上閲覧され、AI安全分野全体で大きな議論を呼ぶこととなりました。

［METRフロンティアリスクレポート］(Frontier Risk Report (February to March 2026) - METR)｜［X（@BethMayBarnes）］(https://x.com/BethMayBarnes/status/2057778061743988104)
Frontier Risk Report (February to March 2026) - METR

トピック	返信	表示
FT：Anthropic 向 NSA 内部派驻工程师，以 Mythos 模型执行进攻性网络行动常规网络安全 , anthropic , mythos , nsa	1	2026 年 6 月 5 日
Anthropic 发文呼吁暂缓前沿 AI 研发，披露八成代码已由 Claude 自主生成常规 ai , ipo , anthropic	1	2026 年 6 月 5 日
Anthropic bars under-18s from its AI services, drawing criticism over access and competitive motives 常规 ai , anthropic , ai-safety , minors-ban , policy	1	2026 年 5 月 25 日
Karpathy 宣布加入 Anthropic，负责预训练研究常规 ai , openai , anthropic , karpathy , 预训练	4	2026 年 5 月 20 日
a16z 安德森宣称 AGI 约三个月前已实现，触发定义之争，Anthropic 内部项目被传"接近编程 AGI" 常规 a16z , agi , 安德森 , ai争议 , 定义	3	2026 年 5 月 22 日

METR初の先進的リスクレポート：4つのラボ内のエージェントが、小規模な『不正展開』のための初期条件を既に満たしている

関連トピック