Skip to content
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
4 changes: 2 additions & 2 deletions .claude-plugin/marketplace.json
Original file line number Diff line number Diff line change
Expand Up @@ -27,7 +27,7 @@
"name": "quality-architect",
"source": "./plugins/quality-architect",
"description": "Design and review software architecture against the ISO/IEC 25010:2023 product quality model (9 characteristics, 40 subcharacteristics), with a reference library of verified academic and official citations.",
"version": "0.1.3",
"version": "0.1.4",
"category": "development",
"tags": [
"iso-25010",
Expand All @@ -41,7 +41,7 @@
"name": "model-strategy",
"source": "./plugins/model-strategy",
"description": "Cost-effective model and effort selection for Claude Code: a task-classification skill that recommends the optimal model (Fable/Opus/Sonnet/Haiku) and effort level, plus pre-configured Sonnet/Haiku subagents for cheap delegation, backed by official pricing references.",
"version": "0.1.0",
"version": "0.1.1",
"category": "development",
"tags": [
"model-selection",
Expand Down
14 changes: 14 additions & 0 deletions CHANGELOG.md
Original file line number Diff line number Diff line change
Expand Up @@ -5,6 +5,20 @@

## [Unreleased]

### Added

- **quality-architect** (v0.1.4): 結合・凝集・複雑度・モジュール境界に関する指摘への「削減アクション」必須化。`references/07a-coupling-deep-dive.md` に §6.3.1「削減アクション・カタログ」(検出状況 → 下げる軸 → 具体的手順の対応表と提示書式)を追加し、`quality-review`(step 5・指摘テンプレ・§5)と `quality-architecture`(章 4'・§4)が BALANCE = FALSE の結合・複雑性を検出した際に Khononov のリバランス 3 軸(Strength↓ / Distance↓ / Volatility 隔離)に基づく具体的な削減手順の併記を要求するように。アクションは severity / verdict に影響しない(H9 維持)。
- **model-strategy** (v0.1.1): Codex CLI 対応。`SKILL.md` に実行環境判定(§0.5)と Codex での委譲代替手順(`/model`・`codex exec -m`・低 reasoning effort の別実行)、`references/07-codex.md`(GPT 系モデル価格・reasoning effort・サブスク制限の決定基準)を追加。
- **model-strategy** (v0.1.1): Fable 5 のサブスクリプション提供条件(〜2026-07-07 は週次上限 50% キャップで同梱、以降は API 単価の従量クレジット、セーフガードによる Opus 4.8 自動フォールバック)を `00-pricing.md` §4 に追加し、`01`/`02`/`03`/`SKILL.md` の判断基準を提供フェーズ別に更新。

### Changed

- **quality-architect** (v0.1.4): 両 SKILL.md に verbatim 重複していた Khononov 引用禁則(Pain 式の 2 留保・Instability 代理禁止・H9 片方向)を `07a §9` への単一ソース参照に置換し、規律の二重管理を解消。

### Fixed

- **model-strategy** (v0.1.1): `00-pricing.md` の「Fable 5 は新トークナイザで Opus 系比 30% 増 → 実効 2.6 倍」という誤記載を訂正。Fable 5 のトークナイザは Opus 4.8 と同一で、実効コストは名目通り約 2 倍(30% 増は Opus 4.7 系トークナイザ vs 旧世代モデルの比較)。

## [0.1.5] - 2026-06-15

### Changed
Expand Down
2 changes: 1 addition & 1 deletion plugins/model-strategy/.claude-plugin/plugin.json
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
{
"name": "model-strategy",
"version": "0.1.0",
"version": "0.1.1",
"description": "Cost-effective model and effort selection for Claude Code. Provides a task-classification skill (model-effort-guide) that recommends the optimal model (Fable/Opus/Sonnet/Haiku) and effort level per task, plus pre-configured subagents (sonnet-implementer / haiku-scout) for cheap delegation. Backed by a reference library with official pricing and effort documentation.",
"author": {
"name": "9uiLe"
Expand Down
2 changes: 1 addition & 1 deletion plugins/model-strategy/.codex-plugin/plugin.json
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
{
"name": "model-strategy",
"version": "0.1.0",
"version": "0.1.1",
"description": "Cost-effective model and effort selection for Claude Code workflows.",
"author": {
"name": "9uiLe",
Expand Down
3 changes: 2 additions & 1 deletion plugins/model-strategy/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -32,6 +32,7 @@ Claude Code を従量課金前提でコスパよく運用するための、Claud
| [04-large-codebase.md](./references/04-large-codebase.md) | 大規模コードベースの量制御・常駐コンテキストを平坦に保つ規定 |
| [05-repo-index.md](./references/05-repo-index.md) | ナビゲーション索引 (pull 優先)・外部 queryable 索引を第一に薄い CLAUDE.md 地図はフォールバック |
| [06-context-monitor.md](./references/06-context-monitor.md) | コンテキスト量を statusLine で可視化する同梱スクリプトと配線手順 |
| [07-codex.md](./references/07-codex.md) | Codex CLI (GPT 系モデル) の価格・reasoning effort・委譲代替の決定基準 |

## 戦略の要約

Expand All @@ -43,7 +44,7 @@ Claude Code を従量課金前提でコスパよく運用するための、Claud
| 探索・調査・定型作業 | haiku-scout | — |
| 大量の機械的一括処理 | Batches API (API 直叩き、50% off) | — |

Fable 5 は新トークナイザにより実効コストが Opus 4.8 の約 2.6 倍のため、長時間自律実行や Opus で失敗を繰り返すタスクに限定します
Fable 5 Opus 4.8 比で約 2 倍のコスト(トークナイザは同一)。サブスク同梱期間(〜2026-07-07・週次上限の 50% キャップ)は最難関の判断タスクに集中投下し、以降は従量クレジット($10/$50)前提で「長時間自律実行」「Opus で失敗を繰り返すタスク」に限定します(詳細: [00-pricing.md §4](./references/00-pricing.md))

## インストール

Expand Down
35 changes: 28 additions & 7 deletions plugins/model-strategy/references/00-pricing.md
Original file line number Diff line number Diff line change
@@ -1,21 +1,24 @@
# モデル価格とコスト構造

> **典拠**: platform.claude.com — Models Overview / Pricing (claude-api skill 経由、2026-06-04 時点キャッシュ)。最新値は `https://platform.claude.com/docs/en/pricing.md` を参照すること。
> **典拠**: platform.claude.com — Models Overview / Pricing (claude-api skill 経由、2026-06-24 時点キャッシュ) + Anthropic 公式発表 (2026-07-02 確認)。最新値は `https://platform.claude.com/docs/en/pricing.md` を参照すること。
>
> **前提に関する注記**: Claude Code がサブスクリプションから従量課金制に移行する」という点について、本書執筆時点で公式発表の確認は取れていない(=未確認の前提)。本書は API 従量課金の価格体系をベースに「移行した場合でも合理的な運用」を設計するものである
> **サブスクリプションとの関係**: Claude Code のサブスク利用でも、Fable 5 は §4 の通り **期間限定の同梱枠 → 従量課金クレジット** に移行することが公式に確定した。他モデルは引き続きサブスク枠内。本書の API 価格は「クレジット消費の単価」および「委譲でどれだけ枠消費を減らせるか」の基準として読む

## §1 価格表 (per 1M tokens)

| Model | Model ID | Context | Input | Output | Output 単価比 (Haiku=1) |
| --- | --- | --- | --- | --- | --- |
| Claude Fable 5 | `claude-fable-5` | 1M | $10.00 | $50.00 | 10x |
| Claude Opus 4.8 | `claude-opus-4-8` | 1M | $5.00 | $25.00 | 5x |
| Claude Sonnet 5 | `claude-sonnet-5` | 1M | $3.00 ($2.00 intro 〜2026-08-31) | $15.00 ($10.00 intro) | 3x |
| Claude Sonnet 4.6 | `claude-sonnet-4-6` | 1M | $3.00 | $15.00 | 3x |
| Claude Haiku 4.5 | `claude-haiku-4-5` | 200K | $1.00 | $5.00 | 1x |

### Fable 5 の実効コストに関する注意
### Fable 5 の実効コスト(旧記載の訂正)

Fable 5 は新トークナイザを採用しており、**同一コンテンツが Opus 系比で約 30% 多くトークン化される**(典拠: Model Migration Guide「Migrating to Claude Fable 5 — New tokenizer」)。名目 $10/$50 だが、Opus 系と同じ仕事量で比較すると実効 **約 $13/$65 相当**。Opus 4.8 比で実効 **約 2.6 倍**のコストになる。
**Fable 5 のトークナイザは Opus 4.8 と同一**(Opus 4.7 で導入されたもの)であり、Opus 4.7/4.8 からの移行でトークン数はほぼ不変。したがって実効コストは名目通り **Opus 4.8 比でちょうど約 2 倍**($10/$50 vs $5/$25)。

> ⚠️ 旧版の本書には「Fable 5 は新トークナイザで Opus 系比 30% 増 → 実効 2.6 倍」という記載があったが、これは **誤り**。「約 30% 増」は Opus 4.7 系トークナイザを **旧世代モデル(Opus 4.6 / Sonnet 4.6 / Haiku)と比較した場合** の話(典拠: Model Migration Guide「Migrating to Claude Fable 5 — Tokenizer」)。なお **Sonnet 5 は新トークナイザ採用で Sonnet 4.6 比 約 30% 多く**トークン化される(単価は同じでも同一作業のコストは増える。intro 価格が相殺)。

## §2 コスト構造の直感

Expand All @@ -29,9 +32,9 @@ Fable 5 は新トークナイザを採用しており、**同一コンテンツ

| 担当 | コスト |
| --- | --- |
| Fable 5 (実効) | 約 $65 |
| Fable 5 | $50 |
| Opus 4.8 | $25 |
| Sonnet 4.6 | $15 |
| Sonnet 5 / 4.6 | $15 (Sonnet 5 intro: $10) |
| Haiku 4.5 | $5 |

## §3 キャッシュ・バッチの価格 (典拠: Prompt Caching / Batch docs)
Expand All @@ -41,4 +44,22 @@ Fable 5 は新トークナイザを採用しており、**同一コンテンツ
| キャッシュ読み取り | base input の約 0.1 倍 |
| キャッシュ書き込み (5分 TTL) | base input の 1.25 倍 |
| キャッシュ書き込み (1時間 TTL) | base input の 2 倍 |
| Batches API | 全トークン 50% off (非対話・最大24h、API 直叩きのみ) |
| Batches API | 全トークン 50% off (非対話・最大24h、API 直叩きのみ。Fable 5 なら $5/$25 相当) |

## §4 Fable 5 のサブスクリプション提供条件 (2026-07-02 確認・時限情報)

Fable 5 はサブスクリプション(Pro / Max / Team / Enterprise Premium シート)での扱いが他モデルと異なる:

| 項目 | 内容 |
| --- | --- |
| 同梱期間 | **2026-07-07 まで**、週次使用上限の **50% を上限** に追加費用なしで利用可(2026-07-01 の再提供以降) |
| 50% キャップの性質 | 保証枠ではなく上限。ヘビーユースなら 7/7 より前に使い切る |
| 2026-07-08 以降 | **usage credits(従量課金クレジット)** に移行。単価は API と同じ **$10/$50 per 1M tokens**(Batch 50% off) |
| Enterprise Standard シート | 同梱枠なし。当初から credits 必須 |
| クォータ消費 | Fable 5 は思考・出力トークンが多く、**週次上限を他モデルより速く消費する** |
| セーフガード | 安全クラシファイアが一部リクエストを拒否し、**自動で Opus 4.8 にフォールバック** することがある(ルーチンなコーディングでも誤検知あり) |
| 経緯 | 2026-06-09 提供開始 → 06-12 一時停止(輸出規制対応)→ 07-01 セーフガード付きで再提供 |

**運用への含意**(詳細は `02-decision-matrix.md` §2): 同梱期間中は「Fable 5 でしか差が出ない判断タスク」に 50% 枠を集中投下し、定型・実装は Opus/Sonnet に退避して枠を温存する。7/8 以降は credits = API 単価なので、本書のコスト比較がそのまま適用される。

> ⏰ 本節は時限情報。7/7 経過後・Anthropic の追加発表後は要更新。
6 changes: 6 additions & 0 deletions plugins/model-strategy/references/01-effort-levels.md
Original file line number Diff line number Diff line change
Expand Up @@ -30,6 +30,12 @@
### Fable 5
- **`low` でも従来モデルの `xhigh`〜`max` を超える品質が出ることが多い**(公式記載)。Fable 5 を使うときほど effort を下げる余地がある
- 高 effort ではルーチン作業に対して過剰なコンテキスト収集・熟考をしがち。正しく完了するのに時間がかかりすぎる場合は effort を下げる
- **thinking は常時オン**(オフにできない)。思考トークンも output 課金されるため、同じタスクでも他モデルよりトークン消費が多くなりやすい。サブスク同梱枠(`00-pricing.md` §4)は週次上限を共有しているので、**枠温存の観点でも既定を `high` ではなく `medium`〜`high` に置き、`xhigh`/`max` は最難関のみに限定**するのが効率的
- 単発の難問なら「Fable 5 (low〜medium)」が「Opus 4.8 (xhigh)」より安く良い結果になるケースがある。迷ったら両者を同一タスクで比較して経路を固定する

### Sonnet 5
- Sonnet 帯で初めて `xhigh` に対応。`medium` ≈ Sonnet 4.6 の `high`、`high` ≈ Sonnet 4.6 の `max` に相当(公式マッピング)
- adaptive thinking がデフォルトでオン(4.6 はオフ)。thinking 分の output 課金が増えるので、定型用途は `thinking: disabled` か effort `low` を明示する

### Sonnet 4.6
- デフォルトが `high` なので、チャット的・定型的な用途では明示的に `low`/`medium` に下げないと過剰消費する
Expand Down
17 changes: 13 additions & 4 deletions plugins/model-strategy/references/02-decision-matrix.md
Original file line number Diff line number Diff line change
Expand Up @@ -21,10 +21,19 @@

### メインセッションを Fable 5 にすべきか?

Fable 5 は実効コストが Opus 4.8 の約 2.6 倍 (`00-pricing.md` §1)。次の場合のみ Fable 5 を使う:

- 長時間の自律実行(夜間ラン・大規模マイグレーション)で、失敗・やり直しのコストがモデル差額を上回る
- Opus 4.8 で 2 回失敗したタスク(やり直し 2 回 > 差額)
Fable 5 のコストは Opus 4.8 の約 2 倍(トークナイザは同一。`00-pricing.md` §1)。ただし判断はサブスク提供フェーズ(`00-pricing.md` §4)で変わる:

**同梱期間中(〜2026-07-07・週次上限の 50% キャップ)**
- 追加費用ゼロで使える一方、**週次クォータを他モデルより速く消費**し、キャップに達すると期限前でも使えなくなる
- → 50% 枠は「Fable 5 でしか差が出ないタスク」に集中投下する: アーキテクチャ設計・最難関のデバッグ/実装・大規模マイグレーションの計画
- 定型実装・探索・レビューの検証 fan-out は従来通り Opus/Sonnet/Haiku に流し、枠を温存する
- effort は `medium`〜`high` 起点(`01-effort-levels.md`: Fable 5 は low でも従来の xhigh 級)。`xhigh`/`max` 常用は枠の浪費
- セーフガードにより一部リクエストは **Opus 4.8 に自動フォールバック**される。Fable 前提のワークフローを組まない

**従量クレジット期(2026-07-08 以降、または Enterprise Standard)**
- credits は API 単価($10/$50)なので純粋なコスト判断に戻る。次の場合のみ Fable 5:
- 長時間の自律実行(夜間ラン・大規模マイグレーション)で、失敗・やり直しのコストがモデル差額を上回る
- Opus 4.8 で 2 回失敗したタスク(やり直し 2 回 > 差額)
- それ以外の日常開発は **Opus 4.8 (high) で十分**

### Sonnet に委譲できる実装の判定基準
Expand Down
3 changes: 2 additions & 1 deletion plugins/model-strategy/references/03-cost-levers.md
Original file line number Diff line number Diff line change
Expand Up @@ -36,7 +36,8 @@ Opus 4.8 / Fable 5 は「最初のターンで完全な仕様を渡して高 eff
| アンチパターン | 何が起きるか |
| --- | --- |
| 全部メインセッション(高性能モデル)でやる | 探索・定型まで最高単価で課金 |
| Fable 5 を常用する | Opus 4.8 比で実効約 2.6 倍。差が出るタスクは限られる |
| Fable 5 を常用する | Opus 4.8 比で約 2 倍 + 思考常時オンで週次クォータを速く消費(`00-pricing.md` §4)。差が出るタスクは限られる |
| Fable 5 で effort xhigh/max を常用する | low〜medium でも従来モデルの xhigh 級。枠・クレジットの浪費 |
| effort max を常用する | 過剰思考で収穫逓減(公式記載)。コストだけ増える |
| サブエージェントに小出しで指示する | 往復ごとにコンテキスト再送 |
| 探索結果の生ログをメインに持ち帰る | 以後毎ターンの input 課金が膨らむ |
Expand Down
Loading
Loading