トークンとは？AIの料金とコンテキスト上限で出てくる単位を解説

トークン

トークンは、AIモデルが文章やコードを処理するときの細かい単位です。
人間には 文字 や 単語 の方が分かりやすいですが、LLM はそのまま文字列を扱うのではなく、内部でトークンに分けて入力や出力を処理します。

たとえば、短い単語が1トークンになることもあれば、長い単語が複数トークンに分かれることもあります。
空白、句読点、記号、コードの記法もトークン数に影響します。

まず押さえたいポイント

トークンは、AIに長い仕様書を渡す、複数ファイルのコードを読ませる、長い会話を続ける、長文で出力させる、といった場面で重要になります。
入力が増えればそのぶん処理量も増え、API利用では料金にも影響します。

また、会話型ツールでは、今の依頼文だけでなく、過去の会話履歴、添付ファイル、検索結果、ツール出力もトークンとして積み上がることがあります。
そのため、今回の質問は短いのに重い というときは、見えていない履歴や文脈が効いていることがあります。

トークンは 文字数とほぼ同じ と思われがちですが、実際には違います。
英語は比較的まとまりやすい一方、日本語やコード、記号の多い文章ではトークン数が増えやすいことがあります。

また、長いコンテキストに入るなら全部渡した方がよい という考え方も危険です。
入るかどうかと、渡すべきかどうかは別です。不要なログ、古い仕様、関係ない履歴まで入れると、精度もコストも悪くなりやすいです。

実務では、トークンを節約するために次を意識するとかなり違います。