top of page

Anthropic、Claude Opus 4.8発表 判断精度と誠実さを強化

  • 執筆者の写真: 白石 奈々
    白石 奈々
  • 7 時間前
  • 読了時間: 2分

Anthropic、Claude Opus 4.8発表 判断精度と誠実さを強化
image : Anthropic

Mythos Previewクラスモデルの一般提供も数週間以内に予告


 米Anthropicは現地時間5月28日、生成AIモデル「Claude Opus 4.8」を発表した。従来モデル「Opus 4.7」をベースに、コーディング・エージェント・推論・実務知識の各領域でベンチマーク性能を向上させた。価格はOpus 4.7と同一で、通常利用は入力100万トークンあたり5ドル、出力100万トークンあたり25ドル


誠実さと判断精度の向上が目立つ改善点

 今回の更新で最も際立つのが「誠実さ」の強化だ。AIモデルが根拠の薄い状態で自信を持って誤った主張をする問題に対し、Opus 4.8は不確実な点を自ら指摘する傾向が高まったとしている。公式評価では、Opus 4.7と比べてコードの欠陥を見過ごす確率が約4分の1に低下したとしている。アライメント評価でも、ユーザーの自律性を支援する特性や、欺瞞・悪用への協力といった不整合な行動がOpus 4.7より大幅に少なく、現時点の最高アライメントモデルであるClaude Mythos Previewに近い水準を達成したとしている。



Claude Codeに「Dynamic Workflows」を追加

 同時に発表された新機能「Dynamic Workflows」(リサーチプレビュー)は、Claude Codeで大規模なタスクを扱えるようにする仕組みだ。単一セッション内で数百の並列サブエージェントを起動・管理できるようになり、数十万行規模のコードベース移行をキックオフからマージまで一気通貫で実行できるとしている。Enterprise・Team・Maxプランで利用可能だ。


Effort Control、APIの新機能も同時提供

 さらに、claude.aiとCoworkに「Effort Control」機能が追加された。モデルセレクターの隣に設けられた新しい設定で、ユーザーがClaudeの応答にかける処理の深さを選択できる。高めの設定では精度が上がり、低めの設定では速度が上がりレート制限の消費も抑えられる。Fast Modeの価格は前世代モデルと比べて3倍安くなり、入力100万トークンあたり10ドル、出力100万トークンあたり50ドルとなる。またMessages APIにシステムエントリーをmessages配列内に挿入できる機能も追加され、エージェント実行中にプロンプトキャッシュを壊さずに指示を更新できるようになった。


 Anthropicは「Opusと同等の能力をより低コストで提供するモデルの開発・リリースにも取り組んでいる」としており、またProject Glasswingで一部組織に限定提供中のMythos Previewクラスのモデルについても、数週間以内に一般提供できる見通しを示している。



参照サイト

Anthropic

Introducing Claude Opus 4.8



TAGs


bottom of page