AI翻訳にコスパのいいモデル比較｜GPT・Gemini・Claude・DeepL

Q: Q. 翻訳メモリは LLM でも使えますか？

A. 直接の 翻訳メモリ 機能は LLM にはありませんが、過去の翻訳ペアをコンテキストに渡す ことで似た効果を出せます。本格的な TM(Translation Memory)が必要なら、Trados、MemoQ などの専用ツールと連携します。

Q: Q. 翻訳結果の品質はどう評価しますか？

A. BLEU、chrF、COMET のような自動指標もありますが、最終的には人手レビューが必要です。サンプル抜き取りチェック、往復翻訳(英→日→英で意味が保たれるか)、A/B 比較 などが現実的な手法です。

Q: Q. 機密文書を翻訳に使えますか？

A. 一般の Web 版(DeepL 無料、Google 翻訳)は学習データに使われる可能性があります。Pro/Enterprise 版 + データ取扱契約 を結ぶか、ローカル LLM(Llama 3 など)で社内完結する構成が必要です。

Q: Q. 翻訳プロンプトのコツは？

A. 元言語と対象言語の明示、目的(マーケティング、技術文書、契約書)を伝える、トーン指定(です・ます調、専門的、カジュアル)、参照すべき用語集の提供、出力形式の指定、です。これだけで品質が大幅に改善します。

先に要点

大量の下訳やUI文言なら、現時点では Gemini 2.5 Flash-Lite、Gemini 3.1 Flash-Lite、GPT-5 nano、GPT-5 mini がコスパ候補です。
品質とレビュー工数まで含めると、最安モデルが最安運用になるとは限りません。
定型的な翻訳を大量に回すなら、Google Cloud TranslationやDeepLのような翻訳専用APIも比較対象になります。
契約書、医療、金融、広告コピー、ブランド文言は、AI翻訳だけで完了にせず人間レビューを前提にします。
機密情報を含む翻訳では、料金より先にデータ保持、学習利用、ログ管理、契約条件を確認します。

翻訳をAIに頼むとき、「どのモデルが一番安いのか」と「どのモデルが一番コスパがいいのか」は少し違います。
API料金だけ見れば小型モデルが安いですが、誤訳の修正、用語統一、UI確認、レビュー工数まで含めると、少し高いモデルや翻訳専用APIの方が結果的に安いことがあります。

この記事では2026年4月19日時点の公式料金・公式ドキュメントを確認しながら、OpenAI、Google Gemini、Anthropic、DeepL、Google Cloud Translation、Azure AI Translator、Amazon Translateなどを、翻訳用途に絞って中立に整理します。

なお、ここでいう翻訳は「翻訳会社へ依頼する人力翻訳」ではなく、APIやAIチャットへ翻訳を依頼する場合の話です。
人間レビューが必要な文書では、AIモデルの料金よりレビュー体制の方が重要になります。

結論：大量翻訳の第一候補は小型LLMか翻訳専用API

翻訳のコスパで見ると、いきなり最上位モデルを使う必要はあまりありません。
まずは次のように考えると分かりやすいです。

用途	候補	理由
UI文言・ヘルプ・技術文書の下訳	Gemini 2.5 Flash-Lite / Gemini 3.1 Flash-Lite / GPT-5 mini	低価格で、指示に従った整形や用語指定も頼みやすい
とにかく安く大量に回す	GPT-5 nano / Gemini 2.5 Flash-Lite Batch	公開料金上はかなり安いが、品質確認の仕組みが必要
欧州語の自然さ・定型翻訳	DeepL / Google Cloud Translation	翻訳専用APIとして安定し、用語集や文書翻訳機能も使いやすい
ニュアンス重視のマーケ・説明文	GPT-5.4 mini / Claude Haiku 4.5 / Claude Sonnet 4.6	単純翻訳より、意図説明や表現調整まで任せやすい
法務・医療・金融・契約	AIは下訳まで。人間レビュー必須	誤訳コストが高く、モデル料金だけで判断できない

個人的な実務感では、アプリやWebサイトの多言語化なら、最初はGemini 2.5 Flash-Lite、Gemini 3.1 Flash-Lite、GPT-5 miniあたりで試し、品質が足りない箇所だけ上位モデルや人間レビューへ回すのが現実的です。
一方、欧州語中心の定型翻訳や既存のCATツール連携があるなら、DeepLを候補から外す必要はありません。

料金だけで見ると何が安いのか

LLMはトークン課金、翻訳専用APIは文字数課金が多いため、単純な横並びはできません。
ただし、公開料金を見ると、軽量LLMはかなり安くなっています。

サービス・モデル	公式料金の目安	翻訳用途での見方
GPT-5 nano	入力 $0.05 / 100万トークン、出力 $0.40 / 100万トークン	非常に安い。短文・下訳・品質チェック前提なら候補
GPT-5 mini	入力 $0.25 / 100万トークン、出力 $2.00 / 100万トークン	安さと品質のバランスが良い。実務の初回候補
GPT-5.4 mini	入力 $0.75 / 100万トークン、出力 $4.50 / 100万トークン	GPT-5 miniより高いが、複雑な指示や整形込みなら候補
Gemini 2.5 Flash-Lite	標準で入力 $0.10、出力 $0.40 / 100万トークン	安い。大量翻訳・軽い整形・多言語展開で試しやすい
Gemini 3.1 Flash-Lite	標準で入力 $0.25、出力 $1.50 / 100万トークン	Google公式が翻訳・単純データ処理向けと説明。2026年5月にGA(一般提供)化
Claude Haiku 4.5	入力 $1.00、出力 $5.00 / 100万トークン	安さだけなら不利だが、自然な文体や安全寄りの応答を重視するなら候補
Google Cloud Translation NMT	50万文字/月まで無料枠、その後 $20 / 100万文字	翻訳専用API。文字数課金で見積もりやすい
Google Cloud Translation LLM	TextTranslationは入力 $10、出力 $10 / 100万文字	LLM型翻訳だが文字数課金。NMTと近いコスト感で使える
DeepL API	Freeは50万文字/月まで。Pro系は月額固定 + 従量課金	品質、用語集、文書翻訳、データ削除を重視する企業向け候補

注意したいのは、LLMのトークン課金と翻訳APIの文字数課金はそのまま比較できないことです。
日本語、英語、中国語、ドイツ語ではトークン数の出方が変わりますし、LLMではプロンプト、用語集、出力JSON、レビュー指示も課金対象になります。

それでも、単純な下訳であれば、軽量LLMのAPI料金は翻訳専用APIよりかなり安く見える場面があります。
ただし、翻訳専用APIはタグ処理、用語集、文書翻訳、安定したレスポンス、既存CATツール連携で勝つことがあります。

翻訳でコスパを決めるのはモデル料金だけではない

翻訳の総コストは、だいたい次の合計です。

総コスト = API料金 + プロンプト設計 + 用語集管理 + 差分確認 + 人間レビュー + UI確認 + 事故対応

たとえば、API料金が半分でも、誤訳レビューが倍に増えるなら安くありません。
逆に、少し高いモデルでも、用語の揺れが減り、JSONやプレースホルダーを壊さず、レビューが短くなるなら総コストは下がります。

翻訳で特に効くのは、次の4点です。

用語集を渡せるか
変数やHTMLタグを壊さないか
長い文脈を読んで訳語を統一できるか
レビューしやすい形式で返せるか

アプリのlocaleファイルなら、翻訳そのものより「キーを維持する」「未翻訳キーだけ処理する」「差分を小さくする」ことが重要です。
この作業の流れは、Claude Codeで覚えておきたいコマンドと翻訳ワークフローでも扱っています。

大手プロバイダー別の見方

OpenAI：GPT-5 miniとGPT-5 nanoがコスパ候補

OpenAIの公開料金では、GPT-5 nanoが入力 $0.05、出力 $0.40 / 100万トークン、GPT-5 miniが入力 $0.25、出力 $2.00 / 100万トークンです。
翻訳だけならGPT-5.4やGPT-5.4 Proを毎回使う必要は薄いです。

OpenAI系の強みは、単純翻訳だけでなく、次のような周辺作業まで同じプロンプトで扱いやすいことです。

翻訳キーを維持する
用語集に従って訳語を固定する
翻訳後に不自然な箇所をリスト化する
JSONやMarkdownを壊していないか確認する
文体を「UI向け」「ヘルプ向け」「マーケ向け」に調整する

大量の下訳ならGPT-5 nano、安定性も欲しいならGPT-5 mini、複雑な文体調整まで入れるならGPT-5.4 mini、という段階分けが現実的です。

Gemini：Flash-Liteが大量翻訳向けにかなり強い

GoogleのGemini API料金を見ると、Gemini 2.5 Flash-Liteは標準で入力 $0.10、出力 $0.40 / 100万トークンです。
Gemini 3.1 Flash-Lite は、Google公式ページで「high-volume agentic tasks, translation, and simple data processing」向けと説明され、標準で入力 $0.25、出力 $1.50 / 100万トークンです。

翻訳用途だけで見ると、Geminiはかなり有力です。
特に、次のような場面で候補になります。

大量のUI文言を複数言語へ展開する
翻訳と簡単な分類・整形を同時に行う
Google CloudやVertex AIをすでに使っている
BatchやFlexのような安い処理枠を使える

Gemini 3.1 Flash-Lite はかつての Preview 版が2026年5月に一般提供(GA)化されました。基幹翻訳に固定する前に、最新の提供状況と制限を公式で確認しておくと安全です。
安定性を優先するなら、一般提供モデルやGoogle Cloud Translationも比較します。

Claude：安さより文体・長文・安全側のレビュー

Anthropicの公開料金では、Claude Haiku 4.5が入力 $1.00、出力 $5.00 / 100万トークン、Claude Sonnet 4.6が入力 $3.00、出力 $15.00 / 100万トークン、Claude Opus 4.7が入力 $5.00、出力 $25.00 / 100万トークンです。
単純な大量翻訳の料金だけなら、ClaudeはGemini Flash-LiteやGPT-5 miniより不利です。

それでもClaudeが候補になるのは、次のような場合です。

長い背景説明を踏まえて訳語を決めたい
日本語の自然さや説明文のトーンを重視したい
下訳ではなく、読みやすいローカライズ文へ寄せたい
翻訳後のレビューコメントも一緒に出させたい

ただし、Opus 4.7のような上位モデルを大量翻訳の常用にするのは、かなり贅沢です。
重要ページだけSonnetやOpusへ上げ、普段は軽量モデルで下訳する使い分けが現実的です。

DeepL：欧州語・用語集・文書翻訳で強い

DeepLはLLMチャットというより、翻訳に特化したサービスとして強い候補です。
公式ページでは、翻訳品質、用語集、HTML/XML処理、文書翻訳、言語検出、フォーマル/インフォーマルの調整、APIクライアントライブラリなどが案内されています。

また、DeepL APIプランでは、Freeで月50万文字まで翻訳できること、Pro系では翻訳後にテキストを即時削除するデータセキュリティや、月額固定 + 従量課金のモデルが説明されています。

DeepLが向くのは次のような場面です。

欧州言語の自然さを重視する
翻訳会社やCATツールの運用とつなげたい
用語集や文書翻訳を安定して使いたい
AIチャットではなく、翻訳APIとして扱いたい

一方で、LLMほど自由に「この文章を短く」「このUIに合うように」「このJSON形式で不足キーだけ」といった複合指示を扱えるとは限りません。
翻訳エンジンとしての安定性を買うか、LLMの柔軟性を買うかで選びます。

Google Cloud Translation：専用APIで見積もりやすい

Google Cloud Translationは、文字数課金で見積もりやすい翻訳専用APIです。
公式料金では、NMTのText translationは月50万文字まで無料枠があり、その後は $20 / 100万文字です。TextTranslationのLLMは入力 $10、出力 $10 / 100万文字で、Googleの説明ではNMTとコストが同等になるとされています。

Google Cloudをすでに使っている会社なら、請求、権限、監査、API管理をそろえやすいのが強みです。
大量の定型翻訳では、LLMチャットより運用しやすい場合があります。

Azure AI TranslatorとAmazon Translate：クラウド標準化で候補

Microsoft Azure AI TranslatorやAmazon Translateも、大手クラウドの翻訳専用サービスです。
Azure AI Translatorは無料枠や従量課金、カスタム翻訳、ドキュメント翻訳、コミットメントティアなどを提供しています。Amazon TranslateはAWS環境で翻訳を組み込みたい場合に候補になります。

これらは「翻訳品質が常にLLMより上」というより、クラウド基盤、権限管理、監査、既存システム連携のしやすさで選ばれることがあります。
Azure中心の会社ならAzure AI Translator、AWS中心ならAmazon Translateを比較に入れる、という見方で十分です。

目的別のおすすめ

目的	第一候補	補足
アプリのlocale JSONを翻訳	GPT-5 mini / Gemini Flash-Lite	キー維持、プレースホルダー維持、差分確認まで頼む
大量のブログ下訳	Gemini 2.5 Flash-Lite / GPT-5 nano	品質チェックを別工程にする
ヘルプ記事・技術文書	GPT-5 mini / Gemini 3.1 Flash-Lite	用語集と禁止訳を渡す
欧州語の自然な翻訳	DeepL / Google Cloud Translation	用語集、文書翻訳、CAT連携を見たい
マーケティングコピー	Claude Haiku 4.5 / GPT-5.4 mini	翻訳ではなくローカライズとして頼む
機密文書	企業契約済みのAPI・専用環境	料金よりデータ保持、ログ、契約を優先する

翻訳プロンプトの基本形

LLMに翻訳を頼むなら、次のように制約を明示します。

あなたはプロダクト翻訳者です。
以下の英語UI文言を日本語へ翻訳してください。

条件:
- JSONキーは変更しない
- {name}, {count}, %s などのプレースホルダーは変更しない
- HTMLタグは追加・削除しない
- productName, API, workspace は翻訳しない
- 文体は短く、画面上のボタンやエラー文として自然にする
- 不自然な原文や訳せない箇所は notes に理由を書く

出力:
{
  "translations": { ... },
  "notes": []
}

翻訳で一番怖いのは、ぱっと見は自然なのに、変数やタグを壊していることです。
人間が読むレビューだけでなく、JSONパース、未翻訳キー、余分なキー、プレースホルダー差分を機械的に確認する仕組みを入れると、安いモデルでもかなり使いやすくなります。

よくある失敗

最安モデルだけで本番文言を決める

安いモデルは強力ですが、短いUI文言ほど文脈がないと誤訳します。
Save、Apply、Issue、Plan、Workspace のような単語は、画面やサービス内容によって訳が変わります。

最安モデルは下訳や大量処理に使い、重要画面だけ上位モデルや人間レビューへ回す方が安全です。

翻訳APIとLLMを同じものとして比較する

翻訳専用APIは、速く安定して同じように訳すことが得意です。
LLMは、文脈を読み、文体を変え、形式を整え、レビューコメントを出すことが得意です。

どちらが上かではなく、役割が違います。
UI文言やlocaleファイルではLLM、定型的な大量翻訳や既存翻訳ワークフローでは専用API、という使い分けが自然です。

レビュー工数を見積もらない

翻訳は、API料金よりレビュー工数の方が高くなりやすいです。
たとえば、1万文字の翻訳API料金が数十円から数百円でも、レビューに1時間かかれば人件費の方が大きくなります。

コスパを見るなら、API単価だけでなく、レビュー時間、差し戻し回数、リリース後の修正リスクを見ます。

翻訳向け低コストAIモデルのよくある質問

Q. DeepL と LLM(GPT/Claude)はどちらを使うべきですか？

A. 定型翻訳、ビジネス文書、UI文言、契約書ドラフトなら DeepL が品質と速度で安定しています。ニュアンスのある創作、対話型の翻訳、文脈を含む長文は LLM が有利です。両方併用も普通です。

Q. Google 翻訳と Google Cloud Translation はどう違いますか？

A. Google 翻訳は無料の Web 版/個人向け、Cloud Translation は API 経由で利用する有償サービスです。Cloud Translation は SLA、ログ、データ取扱いの契約が明確で、業務利用に向きます。

Q. 1万文字あたりの料金はどれくらいですか？

A. 2025年時点の目安は、DeepL API Pro が月20ドル + 100万文字あたり25ドル、Gemini 2.5 Flash-Lite が入力約0.10ドル/100万トークン、GPT-5 nano が約0.05ドル/100万トークン、と桁違いに安いです。LLM の方が圧倒的に安価な時代になっています。

Q. 翻訳メモリは LLM でも使えますか？

A. 直接の 翻訳メモリ 機能は LLM にはありませんが、過去の翻訳ペアをコンテキストに渡す ことで似た効果を出せます。本格的な TM(Translation Memory)が必要なら、Trados、MemoQ などの専用ツールと連携します。

Q. 翻訳結果の品質はどう評価しますか？

A. BLEU、chrF、COMET のような自動指標もありますが、最終的には人手レビューが必要です。サンプル抜き取りチェック、往復翻訳(英→日→英で意味が保たれるか)、A/B 比較 などが現実的な手法です。

Q. 機密文書を翻訳に使えますか？

A. 一般の Web 版(DeepL 無料、Google 翻訳)は学習データに使われる可能性があります。Pro/Enterprise 版 + データ取扱契約 を結ぶか、ローカル LLM(Llama 3 など)で社内完結する構成が必要です。

Q. 翻訳プロンプトのコツは？

A. 元言語と対象言語の明示、目的(マーケティング、技術文書、契約書)を伝える、トーン指定(です・ます調、専門的、カジュアル)、参照すべき用語集の提供、出力形式の指定、です。これだけで品質が大幅に改善します。

まとめ

翻訳依頼に最もコスパのいいAIモデルを1つだけ選ぶなら、現時点ではGemini 2.5 Flash-Lite、Gemini 3.1 Flash-Lite、GPT-5 mini、GPT-5 nanoが有力候補です。
ただし、Gemini 3.1 Flash-Lite は2026年5月にGA化されました。本番固定の前に、最新の提供状況と制限を公式で確認しておくと安全です。

大量の下訳やUI文言なら、小型LLMで十分な場面が増えています。
一方で、欧州語の自然さ、文書翻訳、用語集、CATツール連携、データ削除を重視するならDeepL、Google Cloudや既存クラウド運用を重視するならGoogle Cloud Translation、Azure AI Translator、Amazon Translateも比較対象になります。

結局、翻訳のコスパは「1文字いくら」「1トークンいくら」だけでは決まりません。
安いモデルで下訳し、用語集と機械チェックで事故を減らし、重要文書だけ人間レビューや上位モデルへ回す。これが、いま一番現実的なAI翻訳の使い方だと思います。

参考リンク

OpenAI API Docs: Pricing
OpenAI API Docs: GPT-5 mini
OpenAI API Docs: GPT-5.4 mini
Anthropic Docs: Claude pricing
Gemini API Docs: Pricing
Google Cloud: Cloud Translation pricing
DeepL Help Center: DeepL API plans
DeepL: DeepL API
Microsoft Azure: Azure AI Translator pricing
AWS: Amazon Translate pricing

翻訳依頼にコスパのいいAIモデルはどれか：GPT・Gemini・Claude・DeepLを中立比較