1. はじめに
独力+AI活用で月商1億円を目指している。
ついに、Cursor Ultraの 200ドル枠 を使い切った。
画面を見ると、Ultraプランの利用状況が100%。
Auto + Composerも100%。
API側も100%。
かなり使った。
正直、ここまで使うとは思っていなかった。
ただ、それだけ本気でAI開発を回しているということでもある。
開発用PCを買い、CursorをUltraに上げ、ChatGPTも使い、その他のAIツールも使っている。
個人開発としては、かなり攻めた投資になっている。
ただ、ここで問題が出てきた。
Cursorが枯れた後、どうやって開発を続けるか。
そこで次の作戦として、ChatGPT側のCodexを補助開発者として使うことを考えている。
2. Cursorを使い切った理由
Cursorを使い切った理由は、単純にAIに任せる量が増えたからである。
最近は、かなり広い範囲をCursorに投げていた。
実装
UI改善
自動テスト追加
ビルド確認
ドキュメント更新
PR作成
既存PRの整理
残課題消化
画面導線改善
制限事項の整理
完了報告
さらに、外出中や就寝中にもCursorを動かすため、キューを多めに積む運用もしていた。
これがかなり効いた一方で、当然ながら利用枠も大きく消費した。
特に、巨大な指示を投げると消費が激しい。
「全体を見て改善して」
「P0/P1をまとめて潰して」
「サービスインに向けて自走して」
「画面全体を棚卸しして」
「大量のドキュメントを読んで判断して」
こういう指示は便利だが、AI側の負荷も大きい。
結果として、200ドル枠を使い切った。
3. Cursorが枯れたら、開発は止まるのか
結論として、止める必要はない。
ただし、作戦は変える必要がある。
Cursor Ultraのように、大きな自走タスクを連続で投げる運用は難しくなる。
そこで、ChatGPT側のCodexを使う。
Codexは、OpenAI公式ではChatGPTのコーディングエージェントとして説明されており、開発からリリースまでの支援、機能構築、リファクタリング、レビュー、テスト品質向上などの用途が示されている。(OpenAI)
また、Codexアプリは複数スレッド、worktree、Git機能を備えたコーディング用の作業環境として説明されており、ChatGPT Plus、Pro、Business、Edu、EnterpriseプランにCodexが含まれると案内されている。(OpenAI Developers)
つまり、Cursorが枯れた後の代替として、ChatGPT側のCodexを使うのは現実的である。
ただし、使い方を間違えると、Codex側の枠もすぐ溶ける。
4. Codexは「短距離走用」に使う
今の結論はこれである。
Cursor Ultra枠が尽きたら、Codexを補助開発者として使う。
ただし、巨大な自走タスクではなく、1タスク・1ブランチ・1差分で小さく使う。
Codexに向いているのは、小粒の作業だと思っている。
たとえば、
小〜中規模の不具合修正
特定ファイルの修正
既存PRのレビュー
テスト追加
型エラー修正
lintエラー修正
小さなUI改善
ドキュメントと実装の差分確認
既存コードの局所的な改善
こういうものなら、Codexに向いている。
逆に、避けたいのは以下である。
サービスインまで全部自走して
全体を見て大きく改善して
P0/P1を全部潰して
UI全体を棚卸しして実装して
巨大な仕様書を全部読んで判断して
未マージPRも残課題も全部見て優先順位を決めて
これは、Cursorでも消費が大きかった使い方である。
Codexで同じことをやると、すぐに枠を使い切る可能性が高い。
OpenAI公式のヘルプでも、Codexの利用量はプランだけでなく、タスクのサイズ、複雑さ、保持するコンテキスト量、どこで実行するかによって変わると説明されている。小さなスクリプトや単純な関数は軽く済む一方、大きなコードベースや長時間タスク、長いコンテキストを保持するセッションは利用量が大きくなる。(OpenAI Help Center)
だから、Codexは短距離走用にする。
5. ChatGPT、Codex、Cursorの役割を分ける
Cursorが枯れた後は、役割分担を変える。
今後は、以下のような形がよさそうである。
| ツール | 役割 |
|---|---|
| ChatGPT | 司令塔。方針整理、優先順位、指示文作成、レビュー観点整理 |
| Codex | 補助開発者。1タスク・1ブランチ・1差分の実装 |
| Cursor | 枠が回復したら重めの実装、自走開発、既存フロー継続 |
| 開発用PC | build、lint、E2E、Git確認、ローカル検証 |
| 確認用端末 | 実機確認、シナリオ試験、スクショ、再確認 |
ChatGPT側でやるのは、引き続き設計と判断である。
Codexにいきなり全体を任せるのではない。
ChatGPTで「次の1タスク」に切り出す。
そのうえでCodexに渡す。
これが重要である。
6. Codexに渡す作業は小さく切る
Codexに渡すときは、必ず小さく切る。
悪い指示はこうである。
初期公開に向けて重要な課題を全部見て、必要なものから実装してください。
これは広すぎる。
良い指示はこうである。
この1画面の、この1つの導線だけを直してください。
変更ファイルは最小限にしてください。
format / lint / build を実行してください。
PR化できる状態にしてください。
このくらい狭くする。
Codexに渡す単位は、以下のようにする。
1タスク
1ブランチ
1差分
1目的
1検証セット
これなら、消費も抑えやすい。
差分も見やすい。
失敗しても戻しやすい。
7. Codex向けの安全な指示テンプレート
今すぐ使うなら、Codexには以下のような指示が安全だと思う。
目的:
Cursor Ultra枠が上限に達したため、Codexでは小さい単位の実装だけを行う。
巨大な全体調査、大規模リファクタ、複数機能の同時対応は禁止。
作業対象:
開発中Webサービスの初期公開に向けたP0改善。
今回は1タスクだけ対応する。
進め方:
1. main最新を確認する
2. featureブランチを作成する
3. 対象ファイルを最小限だけ調査する
4. 修正差分を最小化する
5. 必要なテストを追加または更新する
6. format / lint / build を実行する
7. 可能なら関連E2Eまたは最小テストを実行する
8. commitする
9. PR作成可能な状態にする
禁止事項:
- main直作業は禁止
- 大規模リファクタは禁止
- 不要なUI全面刷新は禁止
- 関係ないファイルの整形は禁止
- docsだけを長時間いじる作業は禁止
- 複数P0を同時に処理しない
- 判断に迷う場合は、仮実装せずに未確認事項として報告する
完了報告:
- branch
- commit
- 変更ファイル
- 実装内容
- 実行した検証
- 未検証事項
- 次に人間が判断すべきこと
- 初期公開進捗への影響
これなら、Codexに巨大な責任を背負わせずに済む。
8. Codexにやらせないこと
Codexを使うからといって、何でも任せるわけではない。
特に、今は枠を大事に使いたい。
だから、以下は避ける。
全体ロードマップの再設計
大量ドキュメントの棚卸し
画面全体の全面改修
DBや認証まわりの大規模変更
複数PRを横断した統合判断
大規模な仕様変更
長時間の調査だけで終わる作業
「なんとなく良くして」のような曖昧指示
これらは、ChatGPT側でまず切り出す。
必要なら、人間が判断する。
その後、Codexに小さく渡す。
9. PlusとProの違いも意識する
Codexを本格的に使うなら、プラン差も意識する必要がある。
OpenAIの公式ヘルプでは、Plusは軽めの利用向け、Proはより高負荷な作業向けという説明があり、Pro $200はPlusより20倍高い利用枠を持つプランとして説明されている。(OpenAI Help Center)
ただし、これは「枠が多い」という話であり、「雑に巨大タスクを投げてもよい」という意味ではない。
どのプランでも、タスクが大きくなれば消費は増える。
だから、結局はタスク設計が重要である。
高いプランを使っても、指示が雑なら枠は溶ける。
今回、Cursor Ultraを使い切ったことで、その現実をかなり感じている。
10. 枠を使い切ったことは失敗ではない
200ドル枠を使い切ったこと自体は、失敗ではないと思っている。
それだけ開発を進めた。
それだけAIに仕事をさせた。
それだけ自分の作業時間を拡張できた。
ただし、次の課題は見えた。
AIの枠は有限である。
だから、AIに何をやらせるかを設計しなければならない。
Cursorには重めの自走
Codexには小粒の差分
ChatGPTには司令塔
人間は検収と判断
確認用端末は実機確認
この分担が必要になる。
11. 今後の開発運用
今後は、以下の運用に寄せたい。
1. ChatGPTで次の1タスクを切り出す
2. Codexに1タスクだけ渡す
3. Codexがfeatureブランチで修正する
4. format / lint / build を通す
5. 必要なら最小E2Eを実行する
6. commit / PR化できる状態にする
7. 人間が差分を確認する
8. 必要ならCursor枠回復後に大きな統合を行う
これなら、Cursorが枯れても開発を止めずに済む。
ただし、速度は落ちる可能性がある。
その分、粒度を小さくして、確実に前に進める。
12. 今回の結論
Cursor Ultraの200ドル枠を使い切った。
これはかなり大きい。
AI開発は、思った以上に枠を消費する。
特に、大きな自走指示、長いコンテキスト、大規模なコードベース、複数作業の同時依頼は、消費が大きい。
次の作戦は、ChatGPT側のCodexを補助開発者として使うこと。
ただし、Codexには巨大タスクを渡さない。
1タスク・1ブランチ・1差分。
Codexは短距離走用。
ChatGPTは司令塔。
Cursorは枠が戻ったら重めの自走。
人間は検収と判断。
AIを使うだけでは足りない。
AIの利用枠も、プロジェクト資源として管理する必要がある。
今回、200ドル枠を使い切ったことで、その感覚がかなり強くなった。
AIにも予算がある。
AIにも稼働枠がある。
AIにも向き不向きがある。
これからは、AIツールを単に使うだけでなく、どのAIに、どの粒度の仕事を渡すかまで設計していきたい。