先に要点
- Claude Code では、公式の Voice dictation を使うと、キーボードをほぼ使わず音声で指示を入れられます。
- ただし実態は 音声をそのまま理解する会話モード ではなく、音声を文字起こししてプロンプト欄へ入れる仕組み です。
- Claude.ai アカウントでのログインが必須 で、API key、Amazon Bedrock、Google Vertex AI、Microsoft Foundryでは使えません。
- SSH やリモート環境では使えず、ローカルのマイクアクセスが必要 です。WSLでは WSLg が必要です。
Claude Code って音声だけで指示できるの? ずっとしゃべって作業を進められる? と気になる人は多いです。
結論から言うと、Claude Code には公式の音声入力があります。ですが、イメージは 音声会話モード というより、ターミナルに向けた音声入力 です。
この記事では、2026年4月25日時点の Anthropic 公式ドキュメントを確認しながら、Claude Codeで音声だけで指示する方法、前提条件、できないこと、実務で使いやすい設定まで整理します。
Claude Code自体の全体像から知りたい場合は、Claude Code CLIの使い方とは?できること・強み・VS Codeとの違いを整理 もつながります。
Claude Codeで音声だけで指示することはできる?
できます。
Anthropic の Claude Code Docs では、Voice dictation として公式に案内されています。
ただし、ここでいう 音声だけで指示 は、次の意味です。
- マイクで話す
- Claude Code が音声を文字起こしする
- 文字起こし結果がプロンプト欄に入る
- そのまま送信して処理する
つまり、音声を入力手段として使う のであって、モバイルの音声会話のように 話すとすぐ会話が続く 形とは少し違います。
音声でしゃべった内容は、最終的にテキスト入力として Claude Code に渡されます。
何を使うのか
使うのは公式の /voice コマンドです。
Anthropic のドキュメントでは、Voice dictation は
- hold-to-record
- tap-to-record
の2つの使い方が案内されています。
ざっくり言うと、
- hold: 押している間だけ録音
- tap: 1回押して録音開始、もう1回で送信
です。
まず必要な条件
ここはかなり大事です。
Claude Codeの音声入力は、使える環境が少し限られます。
1. Claude Codeのバージョン条件
公式では、
- Voice dictation 全体: v2.1.69 以降
- tap mode: v2.1.116 以降
が必要です。
確認コマンドはこれです。
claude --version
2. Claude.ai アカウントでログインしていること
ここがいちばん見落とされやすいです。
Anthropic の公式ドキュメントでは、音声の speech-to-text サービスは Claude.ai アカウントで認証している場合のみ 使えると明記されています。
つまり、次の構成では使えません。
Claude Code は使えているのに音声だけ動かない ときは、ここで引っかかっていることがあります。
3. ローカルのマイクアクセスが必要
音声入力はローカルのマイクを使います。
そのため、公式では次のような環境では使えないと案内されています。
- SSH セッション
- Claude Code on the web
- VS Code Remote
- Dev Containers
- Codespaces
要するに、マイクがある自分の端末で Claude Code が動いていること が前提です。
4. 音声はローカル処理ではない
Anthropic のドキュメントでは、Voice dictation は録音した音声を Anthropic のサーバーへ送って transcription すると説明されています。
つまり、完全ローカルでの音声認識ではありません。
ここは、社内規定や機密情報の扱いを気にするチームだと重要です。
音声で扱う内容の範囲は、文字入力と同じくらい慎重に考えた方が安全です。
実際の使い方
1. /voice を実行する
まず Claude Code 上でこれを実行します。
/voice
初回はマイクチェックが走ります。
macOS ではターミナルアプリに対するマイク権限の許可ダイアログが出ます。
2. 録音モードを決める
公式では次のコマンドが案内されています。
/voice hold
/voice tap
/voice off
意味はこうです。
| コマンド | 動き |
|---|---|
/voice |
現在のモードのままオン/オフ切り替え |
/voice hold |
押している間だけ録音するモード |
/voice tap |
1回で開始、もう1回で送信するモード |
/voice off |
音声入力を無効化 |
hold モードの使い方
hold モードは push-to-talk です。
デフォルトでは Space を押している間だけ録音されます。
流れはこうです。
Spaceを長押しする- 録音が始まる
- 話す
Spaceを離す- 文字起こし結果が入力欄へ入る
この方式は、短い指示を少しずつ入れたい ときに向いています。
たとえば、
- このテスト失敗を見て
- この関数を整理して
- さっきの変更を元に戻して
のような小さな指示を区切って入れやすいです。
ただし公式でも説明されている通り、hold モードは key-repeat を見て押下を判定するため、少しウォームアップがあります。
Space を押した瞬間に録音、という感覚ではありません。
tap モードの使い方
tap モードは、長押しが要らない方式です。
流れはこうです。
- 入力欄が空の状態で
Spaceを1回押す - 録音開始
- 話す
Spaceをもう1回押す- 文字起こしして自動送信
これは、手を離して長めにしゃべりたい 人にかなり向いています。
音声だけで指示したい という感覚に近いのは、実務上は tap モードの方です。
特に、
- 今からやってほしいことをまとめて話す
- 設計の意図を一息で説明する
- バグの状況を流れで伝える
といった場面では tap の方が楽です。
日本語で使うには?
Claude Code の音声入力は、language 設定に従います。
公式 docs では、日本語も dictation 対応言語に含まれています。
設定は /config からでもできますし、設定ファイルでも入れられます。
{
"language": "japanese"
}
英語のままだと、日本語の文字起こしが崩れやすくなります。
日本語で話すなら、先に language を日本語へ合わせておく方が安定します。
設定ファイルで常時オンにできる?
できます。
設定ドキュメントでは、voiceEnabled が案内されています。
{
"language": "japanese",
"voiceEnabled": true
}
また、最近の Voice dictation ページでは、voice オブジェクトで mode を指定する例も案内されています。
{
"language": "japanese",
"voice": {
"enabled": true,
"mode": "tap"
}
}
環境やバージョン差分が気になる場合は、まず /voice tap か /voice hold で確認してから settings に落とす方が安全です。
キー変更はできる?
できます。
公式では voice:pushToTalk を ~/.claude/keybindings.json で変更できると説明されています。
たとえば meta+k に変える例はこうです。
{
"bindings": [
{
"context": "Chat",
"bindings": {
"meta+k": "voice:pushToTalk",
"space": null
}
}
]
}
hold モードでは、文字キー単体より modifier 付きの方が扱いやすいです。
公式でも、modifier 組み合わせの方がウォームアップを避けやすいと案内されています。
できないこと・勘違いしやすいこと
Claude Desktop版ではできる?できない?
ここも混同しやすいところです。
結論を分けて書くと、次の通りです。
Claude Desktop for Mac
できます。
ただし、Claude Code の /voice とは別系統で、Claude Desktop on Mac の Quick entry 機能として音声 dictation が案内されています。
Claude Help Center では、Quick entry で
- チャット開始
- スクリーンショット共有
- アプリウィンドウ共有
- voice dictation
ができると説明されています。
音声入力は Caps Lock で開始し、もう一度押して止め、文字起こし結果を送る流れです。
つまり Mac の Claude Desktop では、
- 音声でテキスト入力する ことはできる
- ただし Claude Code の
/voiceとは別機能 - あくまで Desktop アプリ側の quick entry 機能
という理解がいちばん正確です。
Claude Desktop for Windows
できません。
少なくとも現在の Claude Help Center では、Quick entry は macOS 限定 と案内されており、Windows users can still access Claude Desktop, but without the quick entry features と明記されています。
なので、Windows の Claude Desktop で Mac と同じ quick entry の音声 dictation を期待するとズレます。
フルの voice mode は?
ここも大事です。
Claude の voice mode は現在のヘルプでは Claude(web)と Claude Mobile 向けとして案内されています。
そのため、公式情報ベースで整理すると、
- Claude Code:
/voiceで dictation - Claude Desktop for Mac: Quick entry で dictation
- Claude Desktop for Windows: quick entry の音声入力なし
- Claude web / mobile: voice mode あり
と見るのが分かりやすいです。
1. API key運用では使えない
これは本当に重要です。
Claude Code を会社の API key で使っているから、そのまま音声もいけるだろう は通りません。
公式では、speech-to-text は Claude.ai account requirement があると明記されています。
そのため、CLI 自体は使えても Voice dictation だけ無効、という状態が普通に起こります。
2. SSH先のClaude Codeへ話しかける形では使えない
サーバーへ SSH して、その中の Claude Code に音声で話す という使い方は、公式には不可です。
マイクがローカルにあり、Claude Code がリモートで動いているためです。
この制約は VS Code Remote や Codespaces でも同じです。
3. 完全な音声会話UIではない
Voice dictation は、あくまで入力欄へ文字を入れる仕組みです。
なので、モバイルアプリのように 音声で会話し続ける 感覚とは違います。
Claude Code はそもそもターミナルの作業型ツールなので、ここは設計思想の違いとして理解した方が混乱しにくいです。
4. 音声内容はサーバー側で文字起こしされる
公式 docs にある通り、録音音声は Anthropic のサーバーへ送られます。
会議中の機密情報や顧客名をそのまま話すかどうかは、チームのポリシーに合わせて判断した方がよいです。
うまく動かないときの見どころ
公式の troubleshooting に沿うと、まず見るべきは次です。
Voice mode requires a Claude.ai account
Claude.ai ログインではなく、API key や他プロバイダ認証になっているMicrophone access is denied
ターミナルアプリにマイク権限がない- hold で何も起きない
key-repeat が無効で、長押し判定できていない - 日本語が崩れる
languageが英語のまま - Linuxで録音できない
arecordやrecが必要
特に、音声入力そのものがない のではなく、ログイン条件で止まっている パターンは多いです。
実務ならどの設定が使いやすいか
手早く試したい人
まずはこれです。
/voice tap
そのうえで日本語設定を入れます。
{
"language": "japanese"
}
これがいちばん しゃべって指示する 感覚に近いです。
短い指示を何度も入れたい人
/voice hold の方が合います。
レビューしながら小刻みに直したいときや、ちょい足し指示が多いときは hold が扱いやすいです。
日本語で長めに説明したい人
tap モード + 日本語設定 + modifier キーの組み合わせがかなり楽です。
Space 長押しより、meta+k のような再バインドの方がストレスが少ないことがあります。
まとめ
Claude Codeで音声だけで指示することはできます。
ただし中身は 音声会話モード ではなく、Voice dictation で音声をテキスト化してプロンプトへ入れる仕組み です。
押さえるべき条件は次の4つです。
/voiceを使う- Claude.ai アカウントでログインする
- ローカル端末のマイク権限を許可する
- SSH や Remote 環境では使えない
実際に使うなら、まずは /voice tap + 日本語設定 から試すのが分かりやすいです。
音声だけでざっくり指示して、必要なところだけキーボードで補う くらいの使い方が、いちばん現実的で安定します。
この記事と一緒に読みたい
- Claude Code CLIの使い方とは?できること・強み・VS Codeとの違いを整理
- Claude Codeで覚えておきたいコマンドと翻訳ワークフロー|/compact・/clear・多言語化のコツ
- Claudeはどこで使うのがいい?ブラウザ・デスクトップ・VS Code・CLI・APIの違いとおすすめ
参考リンク
- Claude Code Docs: Voice dictation
- Claude Code Docs: Configuration
- Anthropic Docs: Claude Code overview
- Claude Help Center: Use quick entry with Claude Desktop on Mac
- Claude Help Center: Using voice mode