サムネイル

Claude Opus 4.7 リリース速報:コーディング+13%・xhigh新搭載・Claude Codeの変化をエンジニアが解説

  • 0

こんにちは。もるふぉです。

「あれ、Claude Codeの挙動が変わった......?」

昨日(2026年4月16日)、いつも通りClaude Codeでリファクタリングを回していたら、明らかにレスポンスの質が違うことに気づいたんですよ。

調べてみたら、AnthropicがClaude Opus 4.7を正式リリースしていました。

コーディング性能+13%、ビジョン3倍以上、新しいエフォートレベル「xhigh」、/ultrareviewコマンド、タスク予算(task budget)のベータ導入。

正直、ここ数ヶ月で一番「おっ」と声が出たアップデートです。

この記事では、Claude Codeを日常的に使っているエンジニア目線で、Opus 4.7の変更点が実務にどう影響するかに焦点を当てて解説していきます。

Claude Opus 4.7とは:2ヶ月ぶりの大型アップデートで何が変わったか

Claude Opus 4.7は、2026年4月16日にAnthropicがリリースした最新のフラッグシップモデルです。

前モデルのOpus 4.6が2026年2月、その前のOpus 4.5が2025年11月リリースなので、ほぼ2ヶ月サイクルでの大型アップデートが続いています。

このペースでフラッグシップを更新してくるのは、正直すごい。

価格はOpus 4.6と同じ(入力$5/百万トークン、出力$25/百万トークン)で据え置き。

claude.ai、API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryで利用可能です。

今回のアップデートで特に注目すべきは以下の5点です。

  • ソフトウェアエンジニアリング性能がOpus 4.6比で+13%向上
  • 高解像度ビジョンが3倍以上に強化(最大3.75メガピクセル対応)
  • 新エフォートレベル「xhigh」の追加
  • Claude Code向け新機能(/ultrareview、タスク予算)
  • トークナイザーの更新(コスト影響あり)

一つずつ掘り下げていきます。

Opus 4.6との主な違い(ベンチマーク比較表)

まずは数字で見ましょう。

公開されているベンチマークをまとめると、こうなります。

ベンチマーク
Opus 4.7
Opus 4.6
改善幅
SWE-bench Verified
87.6%
80.8%
+6.8pt
SWE-bench Pro
64.3%
53.4%
+10.9pt
CursorBench
70%
58%
+12pt
コンピュータ操作 (OSWorld)
78.0%
72.7%
+5.3pt
視覚推論 (CharXiv)
82.1%
69.1%
+13.0pt
金融分析
64.4%
60.1%
+4.3pt
GPQA Diamond
94.2%
91.3%
+2.9pt

この数字、何が言いたいかというと——たった2ヶ月でSWE-bench Proが10.9ポイント伸びているということです。

「コーディングAIとして実際の現場タスクで体感できる差が出ている」というのが正直な感想で、ベンチマークでよく見る「小数点2桁の改善」とはスケール感が違います。

特にCharXivのスコアが69.1%から82.1%へと13ポイント跳ね上がっているのも要注目。

後述するビジョン強化の裏付けになっている数字で、「画像を渡しての作業指示」が実用レベルに上がったことを示しています。

Claude Opus 4.7 vs GPT-5.4・Gemini 3.1 Pro:競合モデルとの位置づけ

競合モデルとの比較も整理しておきます。

ベンチマーク
Opus 4.7
GPT-5.4
Gemini 3.1 Pro
SWE-bench Pro
64.3%
57.7%
54.2%
Terminal-Bench 2.0
69.4%
75.1%
68.5%
BrowseComp
79.3%
89.3%
85.9%
エージェントコーディング
1位
下回る
下回る
ツール使用
1位
下回る
下回る
コンピュータ操作
1位
下回る
下回る

エンジニアとしては、エージェントコーディングとツール使用で1位というのが実務的に一番響くポイントですね。

Terminal-BenchやBrowseCompではGPT-5.4が上回っているので、「全ベンチマークで圧勝」ではありません。

得意分野がはっきり分かれている印象で、Claude Codeでの長時間エージェントタスクがまさにClaude有利の領域なので、ユースケース次第で選択肢が変わる時代になってきましたね。

なお、Anthropicは「Claude Mythos Previewという未公開のさらに強力なモデルが存在する」と公言しています。

ただしMythosは50社超の企業・政府パートナー(Amazon・Microsoft・Googleなどの12社の正式ローンチパートナーと40社超の追加組織)にのみ限定提供されており、一般利用はできません。

現時点で自分たちが使えるモデルとしては、Opus 4.7が最強という位置づけです。

ここからが本題です。

Claude Codeユーザーが最初に知るべきClaude Opus 4.7の3つの新機能

Claude Opus 4.7の3つの新機能

ベンチマークの話はここまでにして、実際にClaude Codeを使う上で「今すぐ知っておくべき」新機能を3つ紹介します。

xhighエフォートレベル:Opus 4.7で5段階になった新設定

「エフォートレベルの設定、気にしたことありますか?」

自分は今回のアップデートで初めてきちんと向き合いました。

これまでClaude Codeのエフォートレベルはlowmediumhighmaxの4段階でした。

Opus 4.7では、highmaxの間にxhigh(extra high)が追加され、5段階になっています。

そして重要なのが、Claude Codeの全プランでデフォルトがxhighに変更されたということ。

つまり、何も設定を変えていなくても、Opus 4.7にアップデートした時点でエフォートレベルが上がっています。

具体的な性能差はこんな感じです。

エフォートレベル
推論トークン上限
Opus 4.7スコア目安
low
-
51%
medium
-
-
high
-
約65%
xhigh
100kトークン(目安)
71%
max
200kトークン(目安)
最高

ここが面白いところなんですが、Opus 4.7のxhigh(推論トークン上限100k目安)が、Opus 4.6のmax(同200k目安)を上回っているんです。

つまり、前モデルで最大出力を設定していたときよりも、少ないトークン消費で高い品質が得られるということ。

「コストを払わずに前の最高品質を超えた」という状況で、これは地味にすごい変化です。

設定方法はコピペでOKです。

# Claude Codeのセッション内で変更
/effort xhigh

# ターミナルから起動時に指定
claude --effort xhigh

# 環境変数で固定
export CLAUDE_CODE_EFFORT_LEVEL=xhigh

自分の使い分けとしては、こんな感じで回しています。

  • high: 単純なファイル修正、テスト追加、typo修正
  • xhigh: リファクタリング、バグ調査、設計判断を含むタスク
  • max: アーキテクチャ全体の見直し、複雑なマイグレーション

コスト意識の高い人は、デフォルトがxhighに上がった点を把握しておいてください。

意図的にhighに下げることでトークン消費を抑えられます。

次が、個人的に今回一番うれしかった機能です。

/ultrareviewコマンド:専用コードレビューセッションの使い方

「PRを出す直前に『本当にこれでよかったっけ?』と不安になる」——そういう感覚、ありませんか。

/ultrareviewは、まさにその「出す前の最終確認」を深いところまでやってくれる機能です。

通常の/reviewが「ざっと見て明らかな問題を指摘する」レベルだとすると、/ultrareviewは以下の観点で体系的にレビューしてくれます。

  • アーキテクチャ設計の妥当性
  • セキュリティ上の問題
  • パフォーマンスのボトルネック
  • 保守性(将来の変更コストが高くなる箇所)

使い方はシンプルです。コマンド1行で完了します。

# Claude Codeのセッション内で実行
/ultrareview

これだけで、現在のワークツリーの変更差分を読み取り、専用のレビューセッションが起動します。

「注意深いレビュアーが発見するバグや設計上の問題」をフラグしてくれる、という公式の説明がまさにその通りで、PRを出す前のセルフレビューとして非常に有用です。

体感として、通常の/reviewでは見逃されていたN+1クエリの警告や、エラーハンドリングの抜け漏れを拾ってくれるケースが増えました。

ただし注意点が一つ。

Pro/Maxユーザーは1請求サイクルにつき3回まで無料で使えますが、それ以上は追加課金が発生します。

毎コミットで回すような使い方ではなく、「マージ前の最終チェック」や「大規模リファクタリング後の品質確認」に使うのがベストですね。

自分はPRを作る直前に1回だけ/ultrareviewを走らせるようにしています。

そして3つ目が、エージェント運用している人には特に刺さる機能です。

タスク予算(task budget)ベータ:長時間エージェントのコスト管理

「エージェントモードを走らせたまま昼飯に行ったら、戻ってきたらトークンが爆発していた」——そういう経験ありませんか。

自分はあります。

何度もあります。

タスク予算は、まさにこの問題を解決するための機能です。

いわばエージェントへの「上限付きの仕事の依頼」で、「このくらいの範囲でやってね、それ以上はいったん確認して」と伝えられる仕組みです。

APIの公開ベータとして導入され、Claude Code内でも設定できます。

# Claude Code内でトークン上限を設定
/config task_budget 50000

この設定をすると、モデルがトークン消費の上限に近づいた時点で一時停止し、「続行しますか?」と確認を求めてくれます。

特に以下のような場面で威力を発揮します。

  • フレームワーク移行のような大規模タスク
  • 複数ファイルにまたがるリファクタリング
  • 自律的にファイルを探索・修正するエージェントタスク

これまでは「max_tokensでレスポンス単位の上限は設定できるけど、セッション全体のコストは管理できない」という課題がありました。

タスク予算はセッション全体のトークン支出にキャップを設定できるので、「朝セットして昼に結果を見る」ような使い方でも安心感があります。

まだベータなので仕様が変わる可能性はありますが、エージェント運用しているエンジニアは早めに試してみることをおすすめします。

ここまで新機能を3つ紹介しましたが、もう一つ見逃せない強化があります。

Claude Opus 4.7のビジョン機能が3倍以上に向上:エンジニアへの実務影響

Claude Opus 4.7のビジョン機能向上

今回のアップデートで数字的に最もインパクトが大きいのが、ビジョン(画像認識)機能の強化です。

対応解像度がOpus 4.6の約1.15メガピクセルから、最大3.75メガピクセル(長辺2,576ピクセル)へと3倍以上に拡大されました。

「ビジョンが3倍になりました」と言われてもピンとこないかもしれません。

でも、エンジニアの実務で考えると、これはかなり大きい変化なんですよ。

Claude Opus 4.7のビジョンをClaude Codeで活かす:UIスクリーンショット解析・ドキュメント処理

自分がClaude Codeのビジョン機能を使う場面は、主に以下の3つです。

1. UIスクリーンショットからの実装指示

デザイナーから「この画面のここを直してほしい」とスクリーンショットが送られてきた時、そのままClaude Codeに画像を渡して「このUIの問題点を指摘して修正案を出して」と指示できます。

Opus 4.6では細かいUIパーツ(8pxのパディング差やフォントウェイトの違いなど)を見落とすことがありましたが、4.7ではかなり正確に読み取れるようになりました。

つまり「スクリーンショットを貼るだけで細かいUI指摘が通る」というレベルになってきています。

2. エラー画面のスクリーンショット解析

ブラウザのコンソールエラーやスタックトレースのスクリーンショットを渡して「この問題の原因を特定して」と依頼するパターン。

高解像度対応になったことで、長いスタックトレースやログ出力も1枚のスクリーンショットでカバーできるようになりました。

「文字が小さくて読めない」「ログが途中で切れる」という理由で諦めていた使い方が、そのまま通るようになったイメージです。

3. 技術ドキュメント・スライドの解析

PDF化されたAPI仕様書やアーキテクチャ図を読み取って、実装に落とし込むタスク。

3.75メガピクセル対応によって、これまで「文字が小さすぎて読めない」と返されていた密度の高いドキュメントも処理できるようになっています。

ビジョン機能は、Claude CodeのReadツールで画像を読み込ませるだけで使えます。

特別な設定は不要なので、普段画像を渡していなかった人もぜひ試してみてください。

ただし——ここからは少し落ち着いた話になります。

Claude Opus 4.7のトークナイザー変更に注意:コストが想定外に増える可能性

トークナイザー変更の注意

ここまでいい話ばかりしてきましたが、注意すべきポイントもあります。

トークナイザーの更新です。

Opus 4.7では、テキスト処理を改善するためにトークナイザーが新しくなっています。

精度向上に寄与している一方で、副作用として同じテキストを入力してもトークン数が増えるという現象が発生します。

Opus 4.7トークナイザー変更の影響試算:1.0〜1.35倍増

Anthropicの公式情報によると、トークン増加の幅はコンテンツタイプによって異なります。

コンテンツタイプ
トークン増加倍率
英文テキスト
約1.0倍(ほぼ変化なし)
ソースコード
1.15〜1.25倍
JSON/構造化データ
1.2〜1.35倍

コードやJSON中心のプロンプトを使っている場合、最大で35%のコスト増になる可能性があります。

具体的にイメージしてみましょう。

月間100万入力トークンを使っている場合:

  • Opus 4.6時代: 100万トークン x $5 = $5.00
  • Opus 4.7(コードで1.2倍): 120万トークン x $5 = $6.00(+$1.00)
  • Opus 4.7(JSONで1.35倍): 135万トークン x $5 = $6.75(+$1.75)

単価は据え置きなのに、実質コストは上がる。

「性能は上がったのにコストも上がる」という状況なので、API課金で運用している場合は、この影響を事前に把握しておく必要があります。

Claude Opus 4.7:4.6からの移行時に確認すべきポイント

Opus 4.6からOpus 4.7に移行する際、以下の3点を確認しておくことをおすすめします。

1. トークン消費量の事前計測

移行前に本番で使っているプロンプトのトークン数を計測しておきましょう。

数行のPythonで確認できます。

import anthropic

client = anthropic.Anthropic()

# 本番プロンプトのトークン数を計測
result = client.messages.count_tokens(
    model="claude-opus-4-7",
    messages=[{"role": "user", "content": your_production_prompt}]
)
print(f"Opus 4.7 token count: {result.input_tokens}")

2. プロンプトの再テスト

Opus 4.7は「より文字通りに指示を解釈する」傾向が強くなっています。

曖昧な指示(例:「短くまとめて」)は、具体的な指示(例:「100〜150語で要約して」)に修正した方が意図通りの出力が得られます。

自分も実感しているのですが、Opus 4.6では「いい感じに解釈してくれた」曖昧な指示が、4.7では厳密に解釈されて想定外の出力になるケースがありました。

3. エフォートレベルの明示化

前述の通り、Claude Codeのデフォルトがxhighに変わっています。

Opus 4.6時代にhighで最適化していたプロンプトは、意図せずxhighで実行されてトークン消費が増えている可能性があります。

コストを維持したい場合は、明示的にhighを指定しましょう。

# 設定ファイルで固定
# ~/.claude/settings.json
{
  "model": "claude-opus-4-7",
  "effort": "high"
}

これで事前の準備は整います。

あとは実際にアップデートして使い始めるだけです。

Claude Opus 4.7をClaude Codeで使い始める手順

実際にOpus 4.7をClaude Codeで使い始める方法を解説します。

手順自体はとてもシンプルです。

Claude Code でのモデル指定と既存プロンプトの再調整

ステップ1: Claude Codeのアップデート

まずClaude Code自体を最新版にします。

コマンド1行で完了です。

claude update

ステップ2: モデルの確認・変更

Claude Codeのセッション内でモデルを確認・変更します。

# 現在のモデルを確認
/status

# Opus 4.7に切り替え
/model opus

ステップ3: エフォートレベルの確認

デフォルトがxhighに変わっているので、意図した設定になっているか確認します。

# エフォートレベルの確認・変更
/effort xhigh  # または high, max

# 環境変数で固定する場合
export CLAUDE_CODE_EFFORT_LEVEL=xhigh

ステップ4: API利用の場合のモデルID変更

APIを直接呼び出している場合は、モデルIDを変更します。

文字列置換で一括変更できますが、前述のプロンプト再テストは忘れずに行ってください。

import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model="claude-opus-4-7",  # ← ここを変更
    max_tokens=4096,
    messages=[
        {"role": "user", "content": "Your prompt here"}
    ]
)

以前のモデルIDはclaude-opus-4-6でした。

ステップ5: CLAUDE.mdの見直し

Claude CodeのCLAUDE.mdにモデル固有の指示を書いている場合、Opus 4.7の特性に合わせて見直す良い機会です。

特に見直すべきポイントは以下です。

  • 曖昧な指示を具体的に書き直す(4.7は指示をより厳密に解釈する)
  • トークン効率を意識した表現に切り替える(不要な説明を削除)
  • xhighエフォートを前提にした指示構造にする

Opus 4.7は「指示に忠実」な性格が強まっているので、CLAUDE.mdの品質がそのまま出力品質に直結します。

この機会に一度見直してみることをおすすめします。

まとめ:Claude Opus 4.7はClaude Codeユーザーにとって最大のアップデート

最後に、Opus 4.7のポイントをまとめます。

  • コーディング性能+13%: SWE-bench Proで64.3%を記録。GPT-5.4の57.7%を上回る
  • xhighエフォートレベル: 4段階から5段階へ。highとmaxの間の新設定で、Claude Codeのデフォルトに採用
  • /ultrareviewコマンド: 専用レビューセッションで設計・セキュリティ・パフォーマンスを体系的にチェック
  • タスク予算(ベータ): セッション全体のトークン支出を管理。エージェント運用に必須
  • ビジョン3倍以上: 最大3.75メガピクセル対応。UIスクリーンショットやドキュメント処理が実用レベルに
  • トークナイザー変更: 同じテキストで最大1.35倍のトークン増加。コスト管理に注意

自分はOpus 4.5の頃からClaude Codeをメインの開発ツールとして使い続けていますが、今回のOpus 4.7は「量的な改善」ではなく「質的な転換」を感じるアップデートです。

特にxhighエフォートの追加と/ultrareviewは、エンジニアのワークフローに直接影響する機能。

「AIコーディングツールを使っている」から「AIとペアプログラミングしている」へと、体験が一段上がった感覚があります。

まずはclaude updateを1行打って、アップデートしてみてください。

そのあと/ultrareviewを1回走らせるだけでいいです。

自分のコードに対するフィードバックの質の違いを、きっと実感できるはずです。

会員登録して機能を使おう

この機能を利用するには、無料の会員登録が必要です。
お気に入りの記事を保存して、あとで読み返しましょう!