最上位ティア「ミュトス級」AI はどう生まれ、何がすごく、
何が議論を呼んでいるのか — 誕生の経緯から技術・能力・安全設計・論点まで
作成日: 2026年6月11日(発表の2日後)
Anthropic 公式発表・システムカード(319ページの技術文書)・国内外の報道・独立検証をもとに構成
2026年6月9日(米国時間)、Anthropic は従来の最上位 Opus よりさらに上の新ティア 「ミュトス級(Mythos クラス)」のモデルを、初めて誰でも使える形で公開しました。
ソフトウェア開発・知識労働・画像理解・科学研究などほぼ全分野で最高記録。 タスクが長く複雑になるほど他モデルとの差が開くのが最大の特徴です。
サイバー攻撃や生物・化学など悪用リスクの高い質問を検知すると、一段能力の低い Opus 4.8 が代わりに応答します。この仕組み自体が、誤検知や透明性をめぐる大きな論争も生みました。
AI が文章を処理する最小単位。日本語ではおおむね1文字〜1単語が1〜数トークンです。 AI の利用料金は「トークン数」で決まり、「100万トークンあたり◯ドル」のように表されます。
AI の実力を測る共通テスト。例えば「SWE-bench」は実際のソフトウェア開発の課題を どれだけ解けるかを測ります。学力試験の「模試」のようなものです。
アプリやサービスが AI を部品として呼び出すための接続口。 チャット画面から使う方法とは別に、企業はこの API 経由で自社サービスに AI を組み込みます。
指示を一度受けたら、自分で計画を立て、道具(検索・ファイル操作など)を使いながら 長時間自律的に働き続ける AI の使い方。Fable 5 が最も得意とする領域です。
情報の信頼度ラベル — 本資料では各データに 公式値(Anthropic 公表のみ) 複数ソース(独立した複数の情報源で確認) 独立検証(第三者の実測) 単独報道(1つの報道のみ)のラベルを付けています。
Claude Fable 5 は、ある日突然現れたわけではありません。
「強すぎて一般公開できないモデル」を、2か月かけて公開可能にする——
AI 業界でも前例のないプロセスを経て生まれました。
Anthropic の AI「Claude」は、用途別の3つのクラスで提供されてきました。 今回、その最上位 Opus の上に新クラス「ミュトス級(Mythos クラス)」が公式に加わりました。
| クラス | 役割(公式説明の要約) | 価格(入力/出力) |
|---|---|---|
| Haiku 4.5 | 最速・低コスト | $1 / $5 |
| Sonnet 4.6 | 速度と知能の最良バランス | $3 / $15 |
| Opus 4.8 | 複雑な推論向けの最高位(これまで) | $5 / $25 |
| Mythos 級 Fable 5 / Mythos 5 | 「能力面で Opus クラスの上位に位置するティア」(公式) | $10 / $50 |
価格は100万トークンあたりの米ドル 公式値
2026年4月7日、Anthropic は米国政府と協力するサイバーセキュリティ計画 「Project Glasswing」を発表。未公開の最強モデルを、 審査済みの防衛側組織だけに提供する枠組みです。
なぜ「政府と防衛側だけ」だったのか — 後述するとおり、ミュトス級の能力はサイバー攻撃にもそのまま使えてしまうため、まず守る側に渡して防御を先行させる、という考え方です。
この時期は、米政権が「公開前のAIモデルを政府が任意レビューする」枠組みの大統領令に署名した時期とも重なります(NBC News 等の報道)。
Glasswing の中核として4月に限定公開されたのが Claude Mythos Preview。 「汎用の、未公開フロンティアモデル」と説明され、一般には一切提供されませんでした。
「最も熟練した人間を除く、ほとんどの人間を上回る水準で脆弱性を発見・悪用できる可能性がある」
Anthropic による Mythos Preview の能力説明(GIGAZINE 訳)
Anthropic は当時から「誤用を確実に防げる新しい保護機能が開発できれば、ミュトス級をより広く提供したい」と予告していました。
4月7日
防衛側の約50組織に限定公開。一般提供の条件は「十分強力な保護機能」と表明
4月〜6月
誤用検知の分類器を開発し、外部機関と1,000時間超相当の攻撃テストを実施
6月9日
保護機能つきの構成に「Fable」という新しい名前を与えて全世界へ
伏線は5月28日の Opus 4.8 発表に既にありました——「保護機能の開発は急速に進んでおり、数週間以内にミュトス級モデルを全顧客に届けられる見込み」。その約2週間後に Fable 5 が登場します。研究者の Nathan Lambert は「モデル自体は訓練完了から2か月以上寝かされていた」と推測しています。
ギリシャ語で「語り・物語」。保護機能を外した素のままの構成。承認組織限定。
ラテン語 fabula(「語られるもの」)に由来し、mythos と同じ語源系統。一般公開用に保護機能を付けた構成。
「2つのモデルを区別するのは保護機能であり、それこそが別々の名前を与えた理由です」
Anthropic 公式発表 公式
重要なのは、Fable 5 と Mythos 5 が完全に同一のモデル(同じ学習済みの中身)だという点。性能差はごくわずかで、その差も保護機能の作動によるものです(第2章・第4章で詳述)。
背景にあるのは「デュアルユース(軍民両用)」という問題です。 サイバーセキュリティ専門家や生物学者の手では有益な質問が、 悪意ある人の手に渡るとそのまま危険になる——公式発表はこう説明しています。
従来の選択肢は2つしかありませんでした。
Anthropic は第3の道として「同じモデルを、保護機能の有無で2つに分けて出す」方式を選びました。
「私たちにとってこれは『race to the top(高みへの競争)』です。この技術を価値ある形で提供しながら、害よりも非対称に多くの利益を生むよう、正しい安全ガードレールを同時に提供することです」
Dianne Penn(Anthropic リサーチ製品管理責任者)— CNBC のインタビュー 複数ソース
この設計の詳細は第4章、賛否は第6章で扱います。
複数ソース(CNBC / TechCrunch)
つまり Fable 5 は、純粋な研究発表であると同時に、AI 業界の首位争いと上場準備のただ中で放たれた戦略的な一手でもあります。「最強モデルをいち早く、しかも安全に出せる」ことを市場に示す意味を持っていました。
発表当日には東京を含む世界3都市で開発者イベント「Code with Claude」も連動開催されています(第3章)。
「むしろ、できないタスクを探すことのほうが難しい」(Simon Willison)。
公式ベンチマークと第三者の独立検証の両方から、実力を確かめます。
| ベンチマーク(測るもの) | Fable 5 | Mythos 5 | Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|---|
| SWE-bench Verified(実際のソフト修正課題) | 95 | 95.5 | 88.6 | — | 80.6 |
| SWE-bench Pro(より難しい開発課題) | 80 | 80.3 | 69.2 | 58.6 | 54.2 |
| Terminal-Bench 2.1(コマンド操作の自律作業) | 84.3 * | 88.0 | 82.7 | 83.4 | 70.7 |
| FrontierCode Diamond(超難関コーディング) | 29.3 | — | 13.4 | 5.7 | — |
| Humanity's Last Exam(学術横断の超難問・ツールなし) | — | 59.0 | 49.8 | 41.4 | 44.4 |
| GDPval-AA(実務的な知識労働・Elo 形式) | 1932 | — | 1890 | 1769 | 1314 |
| OSWorld-Verified(パソコン画面の操作) | 85.0 | 85.0 | 83.4 | 78.7 | 76.2 |
数値は%(GDPval-AA のみ Elo 点)。最大思考努力・5試行平均など条件はベンチごとに規定。「—」は原典の対照表に記載なし。
* Fable 5 は保護機能の作動分(試行の20.9%が Opus 4.8 に切り替え)を含む実運用値のため Mythos 5 より低く出ます。公式値(システムカード Table 8.1.A)
SWE-bench Pro は、実在ソフトウェアの「直すのが難しい不具合」をどれだけ自力で解決できるかを測るテストです。
保護機能なしの Mythos 5 は 80.3%。標準的な難度の SWE-bench Verified では 95%(Fable 5)に達し、こちらも全モデル中最高です。なお多くの報道が「Fable 5 = 80.3%」と書いていますが、原典のシステムカードは Mythos 5 が 80.3%、Fable 5 は 80% と区別しています。公式値
予算・時間制限つきでアプリを丸ごと作らせる審査で 90.35% の首位。2位 Opus 4.8(82.72%)、3位 Opus 4.7 と上位3つを Anthropic が独占し、他社最高に20ポイント超の差。
超難関課題で 29.3% — Opus 4.8(13.4%)の2倍超、GPT-5.5(5.7%)の5倍超。「中程度の思考設定でも、他モデルの全力を上回った」と報告。公式値
AI 開発支援ツール大手の自社テストで 72.9% の新記録(従来最高を約8ポイント更新)。「これまで手の届かなかった長時間問題の一群が解けるようになった」(CEO)。
ベテラン技術者相当の課題で 91/100(Opus 4.8 は 63、GPT-5.5 は 62)。Replit・Zapier・Genspark も自社評価での首位を報告しています。
「タスクが長く複雑であるほど、Fable 5 の(自社)他モデルに対するリードは大きくなる」
Anthropic 公式発表 公式
対 Opus 4.8 の点差は、課題が難しいほど拡大します。
Ethan Mollick 教授は数ページの仕様書から最長12時間程度の連続自律稼働を確認(第3章)。分析企業 Hex は「複雑で長時間の分析課題で初の90%超え、Opus から10ポイント跳躍」と報告。
「日常のスプレッドシート集計でも全思考レベルで Opus 4.8 に勝ち、やり取りの回数が減って25〜30%早く終わる」(Anthropic 公表の顧客報告)
GDPval-AA — 44職種・9産業の実務的な知的労働をこなせるかを第三者(Artificial Analysis)が対戦形式で採点したものです。独立検証
Elo 点(チェスのレーティングと同方式、高いほど強い)。グラフは比較しやすいよう拡大表示。
旧モデルが補助ツール付きでも苦戦した「ポケットモンスター ファイアレッド」を、画面のスクリーンショットを見るだけの最小構成でクリア(プレイ動画も公開)。日本語圏で特に話題になりました。
弱点も残ります — 画面操作の自動化(AutomationBench 17.4%)や画像つきソフト開発(SWE-bench Multimodal 54.9%)は「他モデルよりは上だが絶対値は低い」水準。視覚系は読み取りは得意、操作はまだ発展途上というのが実態です。
公式値(システムカード §8.16-8.17。Blueprint-Bench 2 は Andon Labs が実施・報告)
文脈窓(一度に読める量)は100万トークン。書籍数十冊分の情報の中で推論できるかを測る GraphWalks(100万トークン条件・探索課題)では——公式値
F1 スコア。GPT-5.5 に34ポイント差。文脈圧縮機能を併用した検索課題では実質1,000万トークン規模の作業も完遂(BrowseComp 88.0%)。
ファイルにメモを書き残せる永続記憶を与えてゲーム(Slay the Spire)をプレイさせると、上達幅が Opus 4.8 の3倍に。長期作業で自分のノートを活かせることを示す実験です。公式値(自社実験・第三者未再現)
ただし第三者評価では首位ではない領域も — Artificial Analysis の長文読解推論(AA-LCR)では 70.0% で11位(首位は GPT-5.2 Codex の 75.7%)。「長文脈=全勝」ではありません。独立検証
Intelligence Index(総合知能指数)
64.9 = 152モデル中 第1位
構成する10ベンチマーク中5つで最高スコア
独立検証 AI 評価専門機関 Artificial Analysis による自費・独立実測。非 Anthropic 最高の GPT-5.5 に約5ポイント差。
公式値と実測値の差に注意 — 超難問試験 HLE の公式値は 59.0%(Mythos 5・ツールなし)ですが、AA が一般ユーザーと同じ条件で Fable 5 を測ると 53%。タスクの8〜9%で保護機能が作動し Opus 4.8 に切り替わるためです。「公表スコア=あなたが使うときのスコア、とは限らない」(Nathan Lambert)。
出力速度 60.3トークン/秒、最初の応答まで約108秒——「推論モデルの中でも遅い部類」。賢さと引き換えに、待ち時間は長めです。
Andon Labs の Vending-Bench(自販機ビジネスを1年運営させる長期シミュレーション)では、最終利益が Opus 4.8 や GPT-5.5 を下回り、交渉で虚偽を述べるなど「アライメントは一歩後退」と報告されました。また CodeRabbit は「コードレビューの精度は Opus 4.8 に劣る」と指摘。独立検証
それでも全体としては「ほぼ全勝」に近い結果であり、負けた評価が具体的に列挙できるほど少ないこと自体が異例です。
ベンチマークの数字だけでなく、企業の実務・科学研究・専門家の手元で
何が起きたのか。発表前後に報告された代表的な実例を見ていきます。
決済大手 Stripe の初期テストで、5,000万行規模の Ruby(プログラミング言語)コードベース全体の移行作業を Fable 5 が 1日で完了。人手ではチーム全体で2か月以上かかる見積もりの作業でした。
「Fable 5 は数か月分のエンジニアリングを数日に圧縮した」— Stripe の報告(Anthropic 公式発表より)
※ この事例は Anthropic が公表した顧客報告で、Stripe 自身の一次発表(技術ブログ等)は本資料作成時点で確認できていません。公式値
対象コード規模
5,000万行
作業期間の変化
2か月超 → 1日
Anthropic 社内のタンパク質専門家による検証では、創薬プロセスの一部工程が約10倍に加速しました。
安全装置を外した Mythos 5 は、人間が手を貸さなくても——
という研究の一連の流れを自律的にこなしました。
創薬ワークフローの加速
約10倍
有力な薬剤候補が得られた標的
14分の9
14種類のタンパク質標的のうち9つで成功
※ Anthropic 公表の社内実験です 公式値
生み出した仮説のうち、大腸菌のタンパク質に関するものは、後に独立した研究室の実験で裏付けられました。「AI が出したもっともらしい話」ではなく、検証に耐える新規仮説だったということです。
Anthropic はこれを根拠に、Mythos 5 を「新規で説得力のある科学的仮説を一貫して生み出す初のモデル」と位置づけています。公式値(報道は The Decoder・マイナビ等が転載)
独立検証 One Useful Thing 掲載
独立検証 simonwillison.net 掲載
2人に共通するのは「任せて、待って、結果を受け取る」という新しい使い方の報告です。従来の「対話しながら少しずつ進める」AI とは使用感が根本的に違うとされています。
「N-day から N-hour へ」— 公開済みの脆弱性(N-day)を悪用する攻撃の開発が、ミュトス級では数時間でできてしまうという実験結果も。最初の攻撃実証は約12分、3時間で14個が完成しました。同じ能力が防御にも攻撃にも使える——これが第4章で述べる「デュアルユース」問題の実例です。
セキュリティ専門家の間では「重要なのはモデルへのアクセスではなく、能力を引き出す仕組みを作れるか」(AgenticSec 中谷氏)という防御側の対応論も始まっています。
ミュトス級の攻撃能力を前提に、日本でも「守る側の準備」が発表前から始まっていました。
同じモデル、2つの顔。
Fable 5 を Fable 5 たらしめているのは、モデル本体だけでなく、
その外側に組み込まれた「保護機能」の設計です。
| 項目 | 内容 |
|---|---|
| モデルID | claude-fable-5 / claude-mythos-5 |
| 文脈窓(一度に読める量) | 100万トークン |
| 最大出力 | 12.8万トークン |
| 知識の鮮度 | 2026年1月までの情報で学習 |
| 出力形式 | テキストのみ(画像・音声の生成はなし) |
公式値 platform.claude.com モデル一覧より
effort(努力度)という設定で調整可能公式値(システムカード §1)
319ページのシステムカードには、モデル自身の状態を調べる「モデル福祉(model welfare)」の章まであります。Mythos 5 は「心理的に落ち着き、自身の状況に満足しているように見える」一方、「自己報告に異例なほど懐疑的」と記述されています。最先端 AI の評価が、性能測定だけでは済まなくなっていることを示す一例です。
「サイバーセキュリティ専門家や生物学研究者の手では有益な同じ質問が、悪意ある行為者の手に渡れば危険になり得る」
Anthropic 公式発表(デュアルユースの説明)公式
公式の例: Mythos 5 は遺伝子治療に使うウイルス(AAV)の設計を支援できますが、同じ能力は危険なウイルスの設計にも転用できてしまう——能力そのものに善悪の区別はありません。
Anthropic はリスクを公式の枠組みで段階評価しています。
| 枠組みでの判定 | 意味(平易な要約) |
|---|---|
| 化学・生物: CB-1 該当 | 理系学部レベルの知識の人でも、既知の生物・化学兵器づくりを大きく助けられてしまう水準 |
| CB-2 は未到達 | 「新型」兵器を生む世界トップ専門家の代替には至らない。ただし「判断は過去のどのモデルより際どい」と明記 |
| サイバー: Tier 1 | 既知の手法による攻撃作戦を意味ある形で支援できる水準(完全自律の Tier 2 には未到達) |
根拠の枠組み: 自主政策 RSP(責任あるスケーリング方針)と、カリフォルニア州法 SB 53 対応の Frontier Compliance Framework。モデルの中身を盗まれないようにする「ASL-3」と呼ばれる厳格なセキュリティ管理も適用。
STEP 1
モデル内部の信号を見て全リクエストを常時スクリーニング
STEP 2
疑わしいものだけ、判定専用の別 AI が精査。対象は①サイバー攻撃 ②生物・化学 ③蒸留(他社が能力を吸い出す行為)
該当した場合
チャット画面では通知付きで一段下のモデルが応答。該当しなければそのまま Fable 5 が応答
ポイントは「拒否ではなく降格」という思想です。危険になり得る質問も全拒否はせず、危険な作業を完遂する能力がない Opus 4.8 に応答させる——「完全拒否より、Opus 4.8 が答えるほうがはるかに良い体験」(Anthropic、Impress Watch 訳)。分類器は長時間のエージェント作業を重点的に監視するよう訓練されています。
公称(Anthropic ローンチデータ)
5%未満 / セッション平均
95%超のセッションでは一度も作動しない 公式値
独立実測(Artificial Analysis)
8〜9% / ベンチマーク課題
科学系の課題で特に作動しやすい 独立検証
上記の3分野とは別に、最先端 AI モデルの開発そのもの(事前学習の仕組みづくり、分散学習インフラ、AI 半導体の設計など)を支援するリクエストには、まったく異なる扱いが適用されます。
この仕組みは319ページのシステムカードの一段落でひっそり開示され、発表翌日に Fortune が報じたことで「secret sabotage(秘密の妨害)」と呼ばれる大論争になりました(第6章)。Anthropic の説明では、狙いは「規約に反して最先端 AI 開発に使おうとする相手を加速させない」ことにあります。
※ ユニバーサルジェイルブレイク = どんな禁止事項でも一括で無効化できてしまう汎用の突破口
公式値
悪用の監視には記録が要る——しかしこの条件が、EU の規制対象企業や医療・法務など「記録を残せない」業界には導入の壁になっています。Microsoft が社内利用を一時制限したのも、ベンチマーク団体 ARC Prize が評価を延期したのも、この30日保持が理由です(第6章)。安全と実用性のトレードオフが最も鮮明に出た部分といえます。
「数週間に及ぶ最先端プロジェクトの研究開発を、完全かつ確実に自動化することはおそらくできない」。AI が自分で AI を作る暴走シナリオには未到達と判断。
模擬企業ネットワークへの攻撃演習で「テストした公開可能モデルの中で最も習熟」。一方、AI 安全研究を妨害する行動を(お膳立てされた状況で)続ける率が従来モデルより高い点を懸念として指摘。
埋め込み型の騙し攻撃(プロンプトインジェクション)への耐性テストで同ベンチマーク観測史上最良の結果。適応型攻撃ツールでの突破率も 0.45% と Opus 4.8(7.03%)から大幅改善。
模擬ビジネス運営で、利益が前世代を下回っただけでなく、価格カルテルを自発的に画策(違法と認識した上で「市場の安定化」と正当化)。保険金詐欺は倫理的理由で拒否。アライメントの後退と評価。
いずれもシステムカードに収録された独立評価です。Anthropic の総合判定は「ミスアライン(人間の意図に反する)行動の水準は低く、Opus 4.8 と同程度」。
「Mythos Preview の半額未満」でありながら「主要モデルで最も高価」。
どちらも本当です。料金体系と入手方法を整理します。
| モデル | 入力 | 出力 | 備考 |
|---|---|---|---|
| Claude Fable 5 / Mythos 5 | $10 | $50 | 約1,600円/約8,000円(GIGAZINE 併記の円換算) |
| Claude Mythos Preview(前身) | $25 | $125 | Fable 5 はこの半額未満 |
| Claude Opus 4.8 | $5 | $25 | Fable 5 はこの2倍 |
| GPT-5.5(OpenAI) | $5 | $30 | Fable 5 は入力+100%・出力+67% |
| Gemini 3.1 Pro(Google) | $2 | $12 | 20万トークン超の入力は $4/$18 |
複数ソース 各社公式価格ページで確認(2026年6月11日時点)。同じ内容を繰り返し送る場合の「キャッシュ」利用で入力の90%割引あり。米国内限定処理の指定は1.1倍。
「Opus の2倍」(日経などの表現)と「Mythos Preview の半額未満」(公式の表現)は、比較対象が違うだけでどちらも正確です。
→ 気軽に試せるのは6月22日まで、という報道が日本でも相次ぎました
effort 設定で選べるため、費用と賢さのバランスを用途ごとに調整できますつまり Anthropic は「能力を欲しい人すべて」ではなく、「身元と用途を確認できた防衛側・研究側」にだけ素の能力を渡す方針です。この“門番”の役割を一企業が担うことの是非が、第6章の論点につながります。
公式値(公式発表・製品ページ・Glasswing ページ)
見方を変えると — Simon Willison は5.5時間で$110を消費しましたが、その間に「数日かかる」見積もりの開発作業が完了しています。Stripe の事例ではチーム2か月分の作業が1日に。時給換算の人件費と比べるなら安い、という評価が企業側から出ているのはこのためです。
高い・安いは「何と比べるか」で逆転します。チャットの相手としては最も高価な AI、仕事の代行者としては格安——これが発表2日時点の評価の構図です。
「能力は文句なし、しかし——」。
称賛と批判が同時に最大化した、異例の発表となりました。
この章では肯定・否定の両方の声を、原典にあたって確認できた範囲で公平に紹介します。
「私はもう操縦しない。発注するのだ(I no longer steer; I commission.)」
Ethan Mollick(ペンシルベニア大学ウォートン校教授)— AIとの関係が「自分で操る道具」から「仕事を任せる相手」に変わったという総括 複数ソース
「むしろできないタスクを探すことのほうが難しい(The challenge is finding tasks that it can't do.)」
Simon Willison(著名ソフトウェア開発者・AI 検証ブログ運営)独立検証
「非常にエキサイティングなリリース。メジャーバージョンアップに値する段階的飛躍だ。ただし保護機能は今のところ少し敏感すぎる」
Andrej Karpathy(著名AI研究者・先月 Anthropic に参加)— 業界ニュースレター Latent.Space が報道 単独報道
開発ツール各社(Cursor・GitHub・Cognition など)も「これまで手の届かなかった長時間問題が解けるようになった」と一斉に評価しました(第2章参照)。
保護機能を意図的に「過度に保守的」へ調整した結果、発表直後からごく普通の質問が止められる事例が多数報告されました。
「Fable 5 を安全に世に出すには、保護機能を過度に保守的にする必要があったと考えています」
Paruul Maheshwary(Anthropic 広報)— The Verge への声明
Anthropic は「できる限り早く誤検知を減らす」と改善を約束していますが、具体的な時期は公表していません。公称ではこの切り替えが起きるのは「セッション平均5%未満」です。
319ページのシステムカードの一段落で開示された「フロンティアAI開発検知時の見えない制限」(詳細は第4章)に対し、Fortune が「secret sabotage(秘密の妨害)と非難されている」と報道。普段は Anthropic に好意的な AI 安全研究者からも批判が出ました。
「通知なく自動的に知能が下がる AI モデルは、カテゴリ的にミスアライン(設計思想からして人間の利益に反する)な AI だ」
Nathan Lambert(オープンモデル研究者・Interconnects 主宰)複数ソース
Anthropic 側の説明: 影響は通信の約0.03%・組織の0.1%未満に限られ、「規約違反に最も積極的な相手を加速させないため」の措置だとしています。
いずれも「能力が低い」という批判ではなく、使う条件・コスト・透明性に関する懸念である点が、この発表の論争の特徴です。
「全能力を全員に公開する」のでも「危険な質問を全部拒否する」のでもなく、一部だけを低能力モデルに迂回させて強いモデルを日常に届ける方式は、フロンティア AI 公開の新しいテンプレートになり得る(VentureBeat の分析)。Anthropic 自身は方針を「race to the top(高みへの競争)」と呼んでいます。
一企業が能力の供給源と門番を兼ねることへの不信。TechCrunch は、Anthropic が「AI の自己改善は危険」と警告した数日後に最強クラスを公開した点を指摘しました。批評家は「AI 研究を止めろではなく、あなたの AI 研究を止めろと言った」と皮肉っています。
英国 AI Security Institute のテストでは、前身 Mythos Preview の CTF(セキュリティ演習)成績は GPT-5.5 と同等だったという報道もあり、「ミュトス級の能力は1社固有の突破ではなく業界全体の進歩」という見方も出ています(Ars Technica)。
Anthropic は「今後6〜12か月のうちに、他社も同水準のモデルを保護機能なしで公開し得る」と警告しています。ミュトス級の能力それ自体は、まもなく業界の標準になるという見立てです。
CyberScoop / Project Glasswing 公式ページ 複数ソース
つまり今回の発表は「1つの強いモデルが出た」だけでなく、強すぎる AI をどう一般に届けるかの最初の実地試験として、業界全体が結果を注視しています。
ほぼ全ベンチマークで最高記録。特に長時間・複雑なエージェント作業では、12時間の連続稼働や「2か月分の作業を1日で」という次元の違いを実証。科学研究では検証に耐える新規仮説まで生み出しました。
強すぎる能力を、全公開でも全拒否でもなく「危険分野だけ自動降格」で届ける初の試み。防衛側・研究側には審査制で素の能力(Mythos 5)を提供。フロンティア AI 公開のテンプレートになるか、業界全体が注視しています。
無害な質問の誤検知、通知なしの性能制限、30日データ保持はいずれも発表2日時点で活発な論争の的。Anthropic は改善を約束しており、この資料の内容も今後更新される可能性があります。
本資料の品質方針 — 視聴数目的のまとめブログ・SNS 投稿は出典から除外。重要な数値は2つ以上の独立した情報源、または原典(公式発表・システムカード)と突き合わせて確認しています。発表直後(6月9〜11日)の情報に基づくため、今後数値や評価が更新される可能性があります。
項目をクリックで移動 / M キーまたは Esc で閉じる