AI ソフトウェア 公開日 2026.04.25 更新日 2026.04.25

Claude Codeで音声だけで指示するには?Voice dictationの使い方とできないこと

Claude Codeで音声だけで指示する方法を、Anthropic公式のVoice dictationを前提に、設定手順、tap/holdの違い、使えない条件まで整理します。

先に要点

  • Claude Code では、公式の Voice dictation を使うと、キーボードをほぼ使わず音声で指示を入れられます。
  • ただし実態は 音声をそのまま理解する会話モード ではなく、音声を文字起こししてプロンプト欄へ入れる仕組み です。
  • Claude.ai アカウントでのログインが必須 で、API key、Amazon Bedrock、Google Vertex AI、Microsoft Foundryでは使えません。
  • SSH やリモート環境では使えず、ローカルのマイクアクセスが必要 です。WSLでは WSLg が必要です。

Claude Code って音声だけで指示できるの? ずっとしゃべって作業を進められる? と気になる人は多いです。
結論から言うと、Claude Code には公式の音声入力があります。ですが、イメージ音声会話モード というより、ターミナルに向けた音声入力 です。

この記事では、2026年4月25日時点の Anthropic 公式ドキュメントを確認しながら、Claude Codeで音声だけで指示する方法、前提条件、できないこと、実務で使いやすい設定まで整理します。
Claude Code自体の全体像から知りたい場合は、Claude Code CLIの使い方とは?できること・強み・VS Codeとの違いを整理 もつながります。

Claude Codeで音声だけで指示することはできる?

できます。
AnthropicClaude Code Docs では、Voice dictation として公式に案内されています。

ただし、ここでいう 音声だけで指示 は、次の意味です。

  • マイクで話す
  • Claude Code が音声を文字起こしする
  • 文字起こし結果がプロンプト欄に入る
  • そのまま送信して処理する

つまり、音声を入力手段として使う のであって、モバイルの音声会話のように 話すとすぐ会話が続く 形とは少し違います。
音声でしゃべった内容は、最終的にテキスト入力として Claude Code に渡されます。

何を使うのか

使うのは公式の /voice コマンドです。

Anthropic のドキュメントでは、Voice dictation は

  • hold-to-record
  • tap-to-record

の2つの使い方が案内されています。

ざっくり言うと、

  • hold: 押している間だけ録音
  • tap: 1回押して録音開始、もう1回で送信

です。

まず必要な条件

ここはかなり大事です。
Claude Codeの音声入力は、使える環境が少し限られます。

1. Claude Codeのバージョン条件

公式では、

  • Voice dictation 全体: v2.1.69 以降
  • tap mode: v2.1.116 以降

が必要です。

確認コマンドはこれです。

claude --version

2. Claude.ai アカウントでログインしていること

ここがいちばん見落とされやすいです。
Anthropic の公式ドキュメントでは、音声の speech-to-text サービスは Claude.ai アカウントで認証している場合のみ 使えると明記されています。

つまり、次の構成では使えません。

Claude Code は使えているのに音声だけ動かない ときは、ここで引っかかっていることがあります。

3. ローカルのマイクアクセスが必要

音声入力はローカルのマイクを使います。
そのため、公式では次のような環境では使えないと案内されています。

要するに、マイクがある自分の端末で Claude Code が動いていること が前提です。

4. 音声はローカル処理ではない

Anthropic のドキュメントでは、Voice dictation は録音した音声を Anthropic のサーバーへ送って transcription すると説明されています。
つまり、完全ローカルでの音声認識ではありません

ここは、社内規定や機密情報の扱いを気にするチームだと重要です。
音声で扱う内容の範囲は、文字入力と同じくらい慎重に考えた方が安全です。

実際の使い方

1. /voice を実行する

まず Claude Code 上でこれを実行します。

/voice

初回はマイクチェックが走ります。
macOS ではターミナルアプリに対するマイク権限の許可ダイアログが出ます。

2. 録音モードを決める

公式では次のコマンドが案内されています。

/voice hold
/voice tap
/voice off

意味はこうです。

コマンド 動き
/voice 現在のモードのままオン/オフ切り替え
/voice hold 押している間だけ録音するモード
/voice tap 1回で開始、もう1回で送信するモード
/voice off 音声入力を無効化

hold モードの使い方

hold モードは push-to-talk です。
デフォルトでは Space を押している間だけ録音されます。

流れはこうです。

  1. Space を長押しする
  2. 録音が始まる
  3. 話す
  4. Space を離す
  5. 文字起こし結果が入力欄へ入る

この方式は、短い指示を少しずつ入れたい ときに向いています。
たとえば、

  • このテスト失敗を見て
  • この関数を整理して
  • さっきの変更を元に戻して

のような小さな指示を区切って入れやすいです。

ただし公式でも説明されている通り、hold モードは key-repeat を見て押下を判定するため、少しウォームアップがあります。
Space を押した瞬間に録音、という感覚ではありません。

tap モードの使い方

tap モードは、長押しが要らない方式です。

流れはこうです。

  1. 入力欄が空の状態で Space を1回押す
  2. 録音開始
  3. 話す
  4. Space をもう1回押す
  5. 文字起こしして自動送信

これは、手を離して長めにしゃべりたい 人にかなり向いています。
音声だけで指示したい という感覚に近いのは、実務上は tap モードの方です。

特に、

  • 今からやってほしいことをまとめて話す
  • 設計の意図を一息で説明する
  • バグの状況を流れで伝える

といった場面では tap の方が楽です。

日本語で使うには?

Claude Code の音声入力は、language 設定に従います。
公式 docs では、日本語も dictation 対応言語に含まれています。

設定は /config からでもできますし、設定ファイルでも入れられます。

{
  "language": "japanese"
}

英語のままだと、日本語の文字起こしが崩れやすくなります。
日本語で話すなら、先に language を日本語へ合わせておく方が安定します。

設定ファイルで常時オンにできる?

できます。
設定ドキュメントでは、voiceEnabled が案内されています。

{
  "language": "japanese",
  "voiceEnabled": true
}

また、最近の Voice dictation ページでは、voice オブジェクトで mode を指定する例も案内されています。

{
  "language": "japanese",
  "voice": {
    "enabled": true,
    "mode": "tap"
  }
}

環境やバージョン差分が気になる場合は、まず /voice tap/voice hold で確認してから settings に落とす方が安全です。

キー変更はできる?

できます。
公式では voice:pushToTalk~/.claude/keybindings.json で変更できると説明されています。

たとえば meta+k に変える例はこうです。

{
  "bindings": [
    {
      "context": "Chat",
      "bindings": {
        "meta+k": "voice:pushToTalk",
        "space": null
      }
    }
  ]
}

hold モードでは、文字キー単体より modifier 付きの方が扱いやすいです。
公式でも、modifier 組み合わせの方がウォームアップを避けやすいと案内されています。

できないこと・勘違いしやすいこと

Claude Desktop版ではできる?できない?

ここも混同しやすいところです。
結論を分けて書くと、次の通りです。

Claude Desktop for Mac

できます。
ただし、Claude Code の /voice とは別系統で、Claude Desktop on Mac の Quick entry 機能として音声 dictation が案内されています。

Claude Help Center では、Quick entry で

  • チャット開始
  • スクリーンショット共有
  • アプリウィンドウ共有
  • voice dictation

ができると説明されています。
音声入力は Caps Lock で開始し、もう一度押して止め、文字起こし結果を送る流れです。

つまり Mac の Claude Desktop では、

  • 音声でテキスト入力する ことはできる
  • ただし Claude Code の /voice とは別機能
  • あくまで Desktop アプリ側の quick entry 機能

という理解がいちばん正確です。

Claude Desktop for Windows

できません。
少なくとも現在の Claude Help Center では、Quick entry は macOS 限定 と案内されており、Windows users can still access Claude Desktop, but without the quick entry features と明記されています。

なので、Windows の Claude DesktopMac と同じ quick entry の音声 dictation を期待するとズレます。

フルの voice mode は?

ここも大事です。
Claude の voice mode は現在のヘルプでは Claude(web)と Claude Mobile 向けとして案内されています。

そのため、公式情報ベースで整理すると、

  • Claude Code: /voice で dictation
  • Claude Desktop for Mac: Quick entry で dictation
  • Claude Desktop for Windows: quick entry の音声入力なし
  • Claude web / mobile: voice mode あり

と見るのが分かりやすいです。

1. API key運用では使えない

これは本当に重要です。
Claude Code を会社の API key で使っているから、そのまま音声もいけるだろう は通りません。

公式では、speech-to-text は Claude.ai account requirement があると明記されています。
そのため、CLI 自体は使えても Voice dictation だけ無効、という状態が普通に起こります。

2. SSH先のClaude Codeへ話しかける形では使えない

サーバーへ SSH して、その中の Claude Code に音声で話す という使い方は、公式には不可です。
マイクがローカルにあり、Claude Code がリモートで動いているためです。

この制約は VS Code Remote や Codespaces でも同じです。

3. 完全な音声会話UIではない

Voice dictation は、あくまで入力欄へ文字を入れる仕組みです。
なので、モバイルアプリのように 音声で会話し続ける 感覚とは違います。

Claude Code はそもそもターミナルの作業型ツールなので、ここは設計思想の違いとして理解した方が混乱しにくいです。

4. 音声内容はサーバー側で文字起こしされる

公式 docs にある通り、録音音声は Anthropic のサーバーへ送られます。
会議中の機密情報や顧客名をそのまま話すかどうかは、チームのポリシーに合わせて判断した方がよいです。

うまく動かないときの見どころ

公式の troubleshooting に沿うと、まず見るべきは次です。

  • Voice mode requires a Claude.ai account
    Claude.ai ログインではなく、API key や他プロバイダ認証になっている
  • Microphone access is denied
    ターミナルアプリにマイク権限がない
  • hold で何も起きない
    key-repeat が無効で、長押し判定できていない
  • 日本語が崩れる
    language が英語のまま
  • Linuxで録音できない
    arecordrec が必要

特に、音声入力そのものがない のではなく、ログイン条件で止まっている パターンは多いです。

実務ならどの設定が使いやすいか

手早く試したい人

まずはこれです。

/voice tap

そのうえで日本語設定を入れます。

{
  "language": "japanese"
}

これがいちばん しゃべって指示する 感覚に近いです。

短い指示を何度も入れたい人

/voice hold の方が合います。
レビューしながら小刻みに直したいときや、ちょい足し指示が多いときは hold が扱いやすいです。

日本語で長めに説明したい人

tap モード + 日本語設定 + modifier キーの組み合わせがかなり楽です。
Space 長押しより、meta+k のような再バインドの方がストレスが少ないことがあります。

まとめ

Claude Codeで音声だけで指示することはできます。
ただし中身は 音声会話モード ではなく、Voice dictation で音声をテキスト化してプロンプトへ入れる仕組み です。

押さえるべき条件は次の4つです。

  • /voice を使う
  • Claude.ai アカウントでログインする
  • ローカル端末のマイク権限を許可する
  • SSH や Remote 環境では使えない

実際に使うなら、まずは /voice tap + 日本語設定 から試すのが分かりやすいです。
音声だけでざっくり指示して、必要なところだけキーボードで補う くらいの使い方が、いちばん現実的で安定します。

この記事と一緒に読みたい

  1. Claude Code CLIの使い方とは?できること・強み・VS Codeとの違いを整理
  2. Claude Codeで覚えておきたいコマンドと翻訳ワークフロー|/compact・/clear・多言語化のコツ
  3. Claudeはどこで使うのがいい?ブラウザ・デスクトップ・VS Code・CLI・APIの違いとおすすめ

参考リンク

あとで見返すならここで保存

読み終わったあとに残しておきたい記事は、お気に入りからまとめて辿れます。