
はじめに
最近のAIブームの勢いが凄く、今の現場でもKiroやClaude Codeなど導入されているシーンを目にします。
実際に自分もcopilotを使ってから生産性はかなり向上し、これなしではコーディングはしんどく感じるようになりました。
今回は、実際にCodexを活用して個人アプリ(React Native)を開発してみた体験をもとに、その効果と課題を共有しようと思います。
単なる感想ではなく、「本当に開発現場で使えるのか?」という視点でまとめてみました。
なぜCodexを使おうと思ったのか
まず、第一に「お金」の問題がありました。
すでに個人でChat GPTに課金をしており ここからさらに3000円のサブスクリプションを数本契約するのは、少し金銭的にしんどかったのが正直なところです。
そして、課金を検討していたときに調べたのですが CursorやClaude Code のネックな点は
- すぐ利用制限に到達する
これでした。
当然ながら開発が進むに連れ、機能追加するために横断するファイルは増えていき、その分トークンを消費します。
これをセッションごとにやっていたらすぐ制限に達してしまうのは見えていて、自分の財布が持ちません笑
そこで、Chat GPT Plusに課金していれば使用することのできるのCodexを検証してみることにしました。
ファイル横断・検索能力はかなり優秀
一番驚いたのは、リポジトリ横断でのコンテキストの理解力です。
- ファイル通しの依存関係を考慮した修正提案
- コードを修正したときの影響範囲の調査
- 過去の実装意図を踏まえたコード変更
- ディレクトリ構造を踏まえた改善案
- 新しいセッションでもすでにアーキテクチャを考慮した設計になっていれば、その方針に従ってコードを実装できる
特に、UseCase・Repository・Presentationなどレイヤーが分かれた構造でも、的確に修正箇所を特定できたのは強みでした。
大規模リポジトリであればあるほど、この性能に対する恩恵が大きいと感じております。
コストパフォーマンスが非常に高い
開発スピード向上という観点では、体感で10倍以上の効率化を感じました。
(機能追加など実装ボリュームが増えるとその効率化はどんどん高くなります。)
さらに、
- 追加課金の不安がない
- ※Chat GPT Plus/Pro のCodexを使う場合。APIは別途料金かかる。
- 利用制限が比較的緩い
- 5時間ごとに数十〜百数十メッセージ程度の枠。
- 横断修正を一度で提案してくれる
という点で、コストパフォーマンスは非常に高いです。
「個人でも日常的に使えるAIツール」という印象でした。
弱点:ペンディング機能がない
一方で、明確な弱点もあります。
Cursorのような変更差分を明確に確認するペンディング機能が弱く、変更内容を逐一確認する必要があります。
特に大きな差分では、
- どこまで変更されたのか
- 余計な修正が入っていないか
を目視確認する負荷が発生します。
※ 一応 **Codex Diff **という差分表示ビュー名は作成してくれるので、差分チェック自体はできます。
現状、Cursorみたいに変更内容をチェック→承認 といった流れはできないですね。
VSCode拡張機能の課題とアプリ併用
VSCode拡張機能版も試しましたが、下記制約がありました。
- ファイル添付機能が弱い
- 画像のみ対応(当時)
- 複数ファイルをまとめて投げづらい
そのため、アプリ版を併用する形で運用していました。
※現在は改善されています。
実際に使って感じたこと
Codexは、設計の相談相手に近い存在だと感じました。
- 命名の整理
- レイヤー責務の再確認
- リファクタの方向性検討
特にアーキテクチャを意識したプロジェクトでは効果が高いです。
一方で、設計思想が曖昧な状態では、AIも曖昧な提案をします。
つまり、
設計力があるほど、AIの効果は最大化される
というのが自分の結論です。
おわりに
Codexは、下記 強みがあると感じました。
- ファイル横断能力が高い
- コストパフォーマンスが優秀
- 実務でも十分使えるレベル
一方で、
- 差分確認機能は弱い
- 安全性チェックは人間側が担う必要がある
という課題もあります。
AIツールはかなり優秀ですが、その生成物を信じ切るまでには精度がまだわずかに足りないかという印象です。
しかし、設計思想を持ったエンジニアが使えば、開発体験を一段引き上げてくれる強力な武器になります。
今後も、設計とAIをどう組み合わせるかを模索していきたいと思います。