先に要点
翻訳をAIに頼むとき、「どのモデルが一番安いのか」と「どのモデルが一番コスパがいいのか」は少し違います。
API料金だけ見れば小型モデルが安いですが、誤訳の修正、用語統一、UI確認、レビュー工数まで含めると、少し高いモデルや翻訳専用APIの方が結果的に安いことがあります。
この記事では2026年4月19日時点の公式料金・公式ドキュメントを確認しながら、OpenAI、Google Gemini、Anthropic、DeepL、Google Cloud Translation、Azure AI Translator、Amazon Translateなどを、翻訳用途に絞って中立に整理します。
なお、ここでいう翻訳は「翻訳会社へ依頼する人力翻訳」ではなく、APIやAIチャットへ翻訳を依頼する場合の話です。
人間レビューが必要な文書では、AIモデルの料金よりレビュー体制の方が重要になります。
結論:大量翻訳の第一候補は小型LLMか翻訳専用API
翻訳のコスパで見ると、いきなり最上位モデルを使う必要はあまりありません。
まずは次のように考えると分かりやすいです。
| 用途 | 候補 | 理由 |
|---|---|---|
| UI文言・ヘルプ・技術文書の下訳 | Gemini 2.5 Flash-Lite / Gemini 3.1 Flash-Lite / GPT-5 mini | 低価格で、指示に従った整形や用語指定も頼みやすい |
| とにかく安く大量に回す | GPT-5 nano / Gemini 2.5 Flash-Lite Batch | 公開料金上はかなり安いが、品質確認の仕組みが必要 |
| 欧州語の自然さ・定型翻訳 | DeepL / Google Cloud Translation | 翻訳専用APIとして安定し、用語集や文書翻訳機能も使いやすい |
| ニュアンス重視のマーケ・説明文 | GPT-5.4 mini / Claude Haiku 4.5 / Claude Sonnet 4.6 | 単純翻訳より、意図説明や表現調整まで任せやすい |
| 法務・医療・金融・契約 | AIは下訳まで。人間レビュー必須 | 誤訳コストが高く、モデル料金だけで判断できない |
個人的な実務感では、アプリやWebサイトの多言語化なら、最初はGemini 2.5 Flash-Lite、Gemini 3.1 Flash-Lite、GPT-5 miniあたりで試し、品質が足りない箇所だけ上位モデルや人間レビューへ回すのが現実的です。
一方、欧州語中心の定型翻訳や既存のCATツール連携があるなら、DeepLを候補から外す必要はありません。
料金だけで見ると何が安いのか
LLMはトークン課金、翻訳専用APIは文字数課金が多いため、単純な横並びはできません。
ただし、公開料金を見ると、軽量LLMはかなり安くなっています。
| サービス・モデル | 公式料金の目安 | 翻訳用途での見方 |
|---|---|---|
| GPT-5 nano | 入力 $0.05 / 100万トークン、出力 $0.40 / 100万トークン | 非常に安い。短文・下訳・品質チェック前提なら候補 |
| GPT-5 mini | 入力 $0.25 / 100万トークン、出力 $2.00 / 100万トークン | 安さと品質のバランスが良い。実務の初回候補 |
| GPT-5.4 mini | 入力 $0.75 / 100万トークン、出力 $4.50 / 100万トークン | GPT-5 miniより高いが、複雑な指示や整形込みなら候補 |
| Gemini 2.5 Flash-Lite | 標準で入力 $0.10、出力 $0.40 / 100万トークン | 安い。大量翻訳・軽い整形・多言語展開で試しやすい |
| Gemini 3.1 Flash-Lite Preview | 標準で入力 $0.25、出力 $1.50 / 100万トークン | Google公式が翻訳・単純データ処理向けと説明。Previewの変更リスクあり |
| Claude Haiku 4.5 | 入力 $1.00、出力 $5.00 / 100万トークン | 安さだけなら不利だが、自然な文体や安全寄りの応答を重視するなら候補 |
| Google Cloud Translation NMT | 50万文字/月まで無料枠、その後 $20 / 100万文字 | 翻訳専用API。文字数課金で見積もりやすい |
| Google Cloud Translation LLM | TextTranslationは入力 $10、出力 $10 / 100万文字 | LLM型翻訳だが文字数課金。NMTと近いコスト感で使える |
| DeepL API | Freeは50万文字/月まで。Pro系は月額固定 + 従量課金 | 品質、用語集、文書翻訳、データ削除を重視する企業向け候補 |
注意したいのは、LLMのトークン課金と翻訳APIの文字数課金はそのまま比較できないことです。
日本語、英語、中国語、ドイツ語ではトークン数の出方が変わりますし、LLMではプロンプト、用語集、出力JSON、レビュー指示も課金対象になります。
それでも、単純な下訳であれば、軽量LLMのAPI料金は翻訳専用APIよりかなり安く見える場面があります。
ただし、翻訳専用APIはタグ処理、用語集、文書翻訳、安定したレスポンス、既存CATツール連携で勝つことがあります。
翻訳でコスパを決めるのはモデル料金だけではない
翻訳の総コストは、だいたい次の合計です。
総コスト = API料金 + プロンプト設計 + 用語集管理 + 差分確認 + 人間レビュー + UI確認 + 事故対応
たとえば、API料金が半分でも、誤訳レビューが倍に増えるなら安くありません。
逆に、少し高いモデルでも、用語の揺れが減り、JSONやプレースホルダーを壊さず、レビューが短くなるなら総コストは下がります。
翻訳で特に効くのは、次の4点です。
- 用語集を渡せるか
- 変数やHTMLタグを壊さないか
- 長い文脈を読んで訳語を統一できるか
- レビューしやすい形式で返せるか
アプリのlocaleファイルなら、翻訳そのものより「キーを維持する」「未翻訳キーだけ処理する」「差分を小さくする」ことが重要です。
この作業の流れは、Claude Codeで覚えておきたいコマンドと翻訳ワークフローでも扱っています。
大手プロバイダー別の見方
OpenAI:GPT-5 miniとGPT-5 nanoがコスパ候補
OpenAIの公開料金では、GPT-5 nanoが入力 $0.05、出力 $0.40 / 100万トークン、GPT-5 miniが入力 $0.25、出力 $2.00 / 100万トークンです。
翻訳だけならGPT-5.4やGPT-5.4 Proを毎回使う必要は薄いです。
OpenAI系の強みは、単純翻訳だけでなく、次のような周辺作業まで同じプロンプトで扱いやすいことです。
- 翻訳キーを維持する
- 用語集に従って訳語を固定する
- 翻訳後に不自然な箇所をリスト化する
- JSONやMarkdownを壊していないか確認する
- 文体を「UI向け」「ヘルプ向け」「マーケ向け」に調整する
大量の下訳ならGPT-5 nano、安定性も欲しいならGPT-5 mini、複雑な文体調整まで入れるならGPT-5.4 mini、という段階分けが現実的です。
Gemini:Flash-Liteが大量翻訳向けにかなり強い
GoogleのGemini API料金を見ると、Gemini 2.5 Flash-Liteは標準で入力 $0.10、出力 $0.40 / 100万トークンです。
Gemini 3.1 Flash-Lite Previewは、Google公式ページで「high-volume agentic tasks, translation, and simple data processing」向けと説明され、標準で入力 $0.25、出力 $1.50 / 100万トークンです。
翻訳用途だけで見ると、Geminiはかなり有力です。
特に、次のような場面で候補になります。
- 大量のUI文言を複数言語へ展開する
- 翻訳と簡単な分類・整形を同時に行う
- Google CloudやVertex AIをすでに使っている
- BatchやFlexのような安い処理枠を使える
Previewモデルは仕様や制限が変わる可能性があるため、本番の基幹翻訳にいきなり固定するのは少し慎重に見たいです。
安定性を優先するなら、一般提供モデルやGoogle Cloud Translationも比較します。
Claude:安さより文体・長文・安全側のレビュー
Anthropicの公開料金では、Claude Haiku 4.5が入力 $1.00、出力 $5.00 / 100万トークン、Claude Sonnet 4.6が入力 $3.00、出力 $15.00 / 100万トークン、Claude Opus 4.7が入力 $5.00、出力 $25.00 / 100万トークンです。
単純な大量翻訳の料金だけなら、ClaudeはGemini Flash-LiteやGPT-5 miniより不利です。
それでもClaudeが候補になるのは、次のような場合です。
- 長い背景説明を踏まえて訳語を決めたい
- 日本語の自然さや説明文のトーンを重視したい
- 下訳ではなく、読みやすいローカライズ文へ寄せたい
- 翻訳後のレビューコメントも一緒に出させたい
ただし、Opus 4.7のような上位モデルを大量翻訳の常用にするのは、かなり贅沢です。
重要ページだけSonnetやOpusへ上げ、普段は軽量モデルで下訳する使い分けが現実的です。
DeepL:欧州語・用語集・文書翻訳で強い
DeepLはLLMチャットというより、翻訳に特化したサービスとして強い候補です。
公式ページでは、翻訳品質、用語集、HTML/XML処理、文書翻訳、言語検出、フォーマル/インフォーマルの調整、APIクライアントライブラリなどが案内されています。
また、DeepL APIプランでは、Freeで月50万文字まで翻訳できること、Pro系では翻訳後にテキストを即時削除するデータセキュリティや、月額固定 + 従量課金のモデルが説明されています。
DeepLが向くのは次のような場面です。
- 欧州言語の自然さを重視する
- 翻訳会社やCATツールの運用とつなげたい
- 用語集や文書翻訳を安定して使いたい
- AIチャットではなく、翻訳APIとして扱いたい
一方で、LLMほど自由に「この文章を短く」「このUIに合うように」「このJSON形式で不足キーだけ」といった複合指示を扱えるとは限りません。
翻訳エンジンとしての安定性を買うか、LLMの柔軟性を買うかで選びます。
Google Cloud Translation:専用APIで見積もりやすい
Google Cloud Translationは、文字数課金で見積もりやすい翻訳専用APIです。
公式料金では、NMTのText translationは月50万文字まで無料枠があり、その後は $20 / 100万文字です。TextTranslationのLLMは入力 $10、出力 $10 / 100万文字で、Googleの説明ではNMTとコストが同等になるとされています。
Google Cloudをすでに使っている会社なら、請求、権限、監査、API管理をそろえやすいのが強みです。
大量の定型翻訳では、LLMチャットより運用しやすい場合があります。
Azure AI TranslatorとAmazon Translate:クラウド標準化で候補
Microsoft Azure AI TranslatorやAmazon Translateも、大手クラウドの翻訳専用サービスです。
Azure AI Translatorは無料枠や従量課金、カスタム翻訳、ドキュメント翻訳、コミットメントティアなどを提供しています。Amazon TranslateはAWS環境で翻訳を組み込みたい場合に候補になります。
これらは「翻訳品質が常にLLMより上」というより、クラウド基盤、権限管理、監査、既存システム連携のしやすさで選ばれることがあります。
Azure中心の会社ならAzure AI Translator、AWS中心ならAmazon Translateを比較に入れる、という見方で十分です。
目的別のおすすめ
| 目的 | 第一候補 | 補足 |
|---|---|---|
| アプリのlocale JSONを翻訳 | GPT-5 mini / Gemini Flash-Lite | キー維持、プレースホルダー維持、差分確認まで頼む |
| 大量のブログ下訳 | Gemini 2.5 Flash-Lite / GPT-5 nano | 品質チェックを別工程にする |
| ヘルプ記事・技術文書 | GPT-5 mini / Gemini 3.1 Flash-Lite | 用語集と禁止訳を渡す |
| 欧州語の自然な翻訳 | DeepL / Google Cloud Translation | 用語集、文書翻訳、CAT連携を見たい |
| マーケティングコピー | Claude Haiku 4.5 / GPT-5.4 mini | 翻訳ではなくローカライズとして頼む |
| 機密文書 | 企業契約済みのAPI・専用環境 | 料金よりデータ保持、ログ、契約を優先する |
翻訳プロンプトの基本形
LLMに翻訳を頼むなら、次のように制約を明示します。
あなたはプロダクト翻訳者です。
以下の英語UI文言を日本語へ翻訳してください。
条件:
- JSONキーは変更しない
- {name}, {count}, %s などのプレースホルダーは変更しない
- HTMLタグは追加・削除しない
- productName, API, workspace は翻訳しない
- 文体は短く、画面上のボタンやエラー文として自然にする
- 不自然な原文や訳せない箇所は notes に理由を書く
出力:
{
"translations": { ... },
"notes": []
}
翻訳で一番怖いのは、ぱっと見は自然なのに、変数やタグを壊していることです。
人間が読むレビューだけでなく、JSONパース、未翻訳キー、余分なキー、プレースホルダー差分を機械的に確認する仕組みを入れると、安いモデルでもかなり使いやすくなります。
よくある失敗
最安モデルだけで本番文言を決める
安いモデルは強力ですが、短いUI文言ほど文脈がないと誤訳します。
Save、Apply、Issue、Plan、Workspace のような単語は、画面やサービス内容によって訳が変わります。
最安モデルは下訳や大量処理に使い、重要画面だけ上位モデルや人間レビューへ回す方が安全です。
翻訳APIとLLMを同じものとして比較する
翻訳専用APIは、速く安定して同じように訳すことが得意です。
LLMは、文脈を読み、文体を変え、形式を整え、レビューコメントを出すことが得意です。
どちらが上かではなく、役割が違います。
UI文言やlocaleファイルではLLM、定型的な大量翻訳や既存翻訳ワークフローでは専用API、という使い分けが自然です。
レビュー工数を見積もらない
翻訳は、API料金よりレビュー工数の方が高くなりやすいです。
たとえば、1万文字の翻訳API料金が数十円から数百円でも、レビューに1時間かかれば人件費の方が大きくなります。
コスパを見るなら、API単価だけでなく、レビュー時間、差し戻し回数、リリース後の修正リスクを見ます。
まとめ
翻訳依頼に最もコスパのいいAIモデルを1つだけ選ぶなら、現時点ではGemini 2.5 Flash-Lite、Gemini 3.1 Flash-Lite、GPT-5 mini、GPT-5 nanoが有力候補です。
ただし、Gemini 3.1 Flash-LiteはPreviewなので、本番固定では提供状況と制限を確認した方が安全です。
大量の下訳やUI文言なら、小型LLMで十分な場面が増えています。
一方で、欧州語の自然さ、文書翻訳、用語集、CATツール連携、データ削除を重視するならDeepL、Google Cloudや既存クラウド運用を重視するならGoogle Cloud Translation、Azure AI Translator、Amazon Translateも比較対象になります。
結局、翻訳のコスパは「1文字いくら」「1トークンいくら」だけでは決まりません。
安いモデルで下訳し、用語集と機械チェックで事故を減らし、重要文書だけ人間レビューや上位モデルへ回す。これが、いま一番現実的なAI翻訳の使い方だと思います。
参考リンク
- OpenAI API Docs: Pricing
- OpenAI API Docs: GPT-5 mini
- OpenAI API Docs: GPT-5.4 mini
- Anthropic Docs: Claude pricing
- Gemini API Docs: Pricing
- Google Cloud: Cloud Translation pricing
- DeepL Help Center: DeepL API plans
- DeepL: DeepL API
- Microsoft Azure: Azure AI Translator pricing
- AWS: Amazon Translate pricing