top of page

Anthropic、Claude Sonnet 4.6発表 長文脈推論とPC操作を強化

  • 執筆者の写真: 白石 奈々
    白石 奈々
  • 21 時間前
  • 読了時間: 2分

Anthropic、Claude Sonnet 4.6発表 長文脈とPC操作を強化
image : ‎⁨Anthropic


最大100万トークン対応と性能向上を維持し標準モデル化へ


 米Anthropicは現地時間2月17日、最新モデル「Claude Sonnet 4.6」を発表した。コーディング、コンピューター操作、長文脈推論、計画立案などの能力を総合的に強化し、β版では最大100万トークンの文脈処理に対応する。価格は前世代と同水準の入力3ドル/出力15ドル(100万トークン)に据え置かれ、既存サービスの標準モデルとして提供される。




Sonnet 4.5からの進化

 前モデル「Claude Sonnet 4.5」と比べ、特にコーディング精度とPC操作能力が向上した。スプレッドシート編集や多段階Webフォーム入力といった実務に近い操作タスクで成功率の改善が報告されている。加えて、複数入力を横断する推論力の強化により、長時間に及ぶ作業フローや複雑な手順への対応力も高まった。


ベンチマークが示す性能水準

 各種評価では旧世代を上回る結果が示され、SWE-bench VerifiedやOSWorld-Verifiedなどの指標で高水準のスコアを記録した。一方、最上位のClaude Opusと比べると高度推論など一部領域では差が残るものの、実務用途に求められる性能には大きく近づいた位置付けとなる。性能向上とコスト据え置きを両立した点は、運用コストを重視する企業利用にとって重要な要素といえる。


Claude Sonnet 4.6ベンチマーク
image : ‎⁨Anthropic


Claude Sonnet 4.6ベンチマーク
image : ‎⁨Anthropic

利用プランと実務への影響

 Sonnet 4.6はFreeおよびProプランの標準モデルとして利用でき、上位プランでは利用量拡張や優先アクセスが提供される。長文脈処理と操作能力の改善により、業務自動化からソフトウェア開発支援まで適用範囲は広がり、コスト効率を重視する現場における中核モデルとしての役割が一段と明確になりつつある。


実用重視の設計が利用範囲を拡大

 内部テストでは、旧来の上位モデルよりSonnet 4.6を選好するユーザーが多かったとされる。性能向上と価格据え置きを両立したことで、深い推論を必要としない幅広い業務領域において、“標準モデル”としての位置付けがさらに強まる可能性がある。



参照サイト

Anthropic公式サイト

Introducing Claude Sonnet 4.6


TAGs


bottom of page