Cline + DeepSeek R1 + Cody で格安AIコーディング

Cline は DeepSeek V3 と組み合わせるとコストが抑えられるというのは有名な話ですが、私のユースケースではひたすら読み書きを繰り返した末ソースコードを破壊するという愉快なことになるので、仕方なく Claude 3.5 Sonnet を使用していました。
そんな中、突如として DeepSeek R1 がリリースされます。
🚀 DeepSeek-R1 is here!
— DeepSeek (@deepseek_ai) January 20, 2025
⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!
🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!
🐋 1/n pic.twitter.com/7BlpWAPu6y
o1-mini と同等以上の性能とのことで、これならAIエージェントとして十分に機能するのでは?と考え実際に試してみました。
DeepSeek V3 と R1 の出力比較
どちらも最初のトークンが出力されるまでのレイテンシは非常に大きいです。
R1 はミスなく正しいコードを生成し、Vitest によるテストも通っています。
一方で V3 は出力が遅く、生成したコードが壊れていて、本来ユーザーに対して応答する状況で Cline への応答をしています。
V3 よりAPIコストが高いですが、他社APIより非常に安価でこのクオリティであれば、十分常用に適していると感じました。
生成されたコードの品質チェック
DeepSeek R1 はAPIコストが低いとはいえ、あらゆることを任せるとどうしてもコストが大きくなります。
そこで、コーディングやデバッグ以外を Cody に任せます。
無料でコード補完やチャットを利用でき、月$9で無制限にチャットできます。
使えるモデルには Claude 3.5 Sonnet も含まれており、品質は申し分ないです。
今回は Cody をコードの品質チェックに用います。
Testing Library を用いてコンポーネントのテストを実装したので、ベストプラクティスに則ってるかを確認してもらいます。
検証が通りました。
DeepSeek R1 は十分な品質のコードを生成するようです。