- Markdown版ドキュメントは、HTMLページの代わりではなく、本文・見出し・リンク・コード例を取り出しやすくする補助版です。
- HTMLは人間向けの表示、ナビゲーション、広告、装飾、JavaScriptを含むため、AIや開発支援ツールに渡すと本文以外の情報が混ざりやすくなります。
- llms.txt や llms-full.txt と組み合わせると、AIに読ませたい重要ページを案内しやすくなりますが、本文品質の代わりにはなりません。
Webサイトの情報は、ふつうHTMLで公開します。
人間がブラウザで読むなら、HTMLはとても自然です。見出し、画像、表、ナビゲーション、パンくず、関連記事、デザイン、スマホ対応までまとめて扱えます。
一方で、AI検索、AIアシスタント、開発支援ツールにドキュメントを読ませる場面では、HTMLだけだと少し扱いにくいことがあります。
本文以外のメニュー、広告、フッター、スクリプト、装飾用の要素まで混ざり、どこが本文で、どこが補助情報なのか を取り出す手間が増えるからです。
この記事では、Markdown版ドキュメントを用意する意味を、HTMLとの役割分担、AI検索時代の読みやすさ、llms.txt との関係、実務での注意点に分けて整理します。
llms.txtそのものの役割を先に確認したい場合は、llms.txtとは?AI検索時代のWebサイト運用で何を指定するファイルなのか もあわせて読むとつながりやすいです。
Markdown版ドキュメントとは何か
Markdown版ドキュメントとは、HTMLページと同じ内容、またはAIや開発者が参照しやすい内容を、Markdown形式で公開したものです。
たとえば、通常のページが次のURLにあるとします。
https://example.com/docs/install
それに対して、Markdown版を次のようなURLで用意する運用があります。
https://example.com/docs/install.md
https://example.com/docs/install/index.html.md
必ずこのURL形式にしなければならないわけではありません。
ただ、llms.txtの提案では、HTMLドキュメントと対応するMarkdown版を置く考え方が示されています。
重要なのは、Markdown版が HTMLを捨てるための形式 ではないことです。
HTMLは人間が読むための表現として残し、Markdown版はAI、エディタ、開発支援ツール、検索補助が本文を取り出しやすくするための補助版として考えます。
HTMLだけでは何が伝わりにくいのか
HTMLはWebページを表現するための形式です。
そのため、ページ本文以外にも多くの情報を含みます。
- グローバルナビゲーション
- サイドバー
- パンくず
- 関連記事
- フッター
- 広告枠
- JavaScript用の属性
- CSS用のラッパー要素
- アクセス解析タグ
- モーダルやアコーディオン用の非表示要素
人間のブラウザ体験では、これらは役に立ちます。
しかし、AIやプログラムが本文を取り出すときには、ノイズになることがあります。
| HTMLに含まれやすいもの | 人間にとっての役割 | AIやツールに渡すときの注意点 |
|---|---|---|
| ナビゲーション | サイト内を移動しやすい | 本文より先に大量のリンクが混ざることがある |
| 装飾用HTML | 見た目を整える | 本文構造とは関係ないタグが増える |
| JavaScript | 動的なUIを作る | 取得方法によって本文が見えないことがある |
| 関連記事 | 回遊を助ける | 本文と関連リンクの境界が曖昧になることがある |
| 非表示要素 | UI制御に使う | 読者に見えない情報が混ざることがある |
Google Search Central も、AI機能向けに特別なファイルを必須とはしていませんが、重要な内容をテキストとして利用できる状態にすること、構造化データが見える本文と一致していることを重視しています。
Markdown版は、その考え方と矛盾しない補助策です。
MarkdownがAIや開発支援ツールに渡しやすい理由
Markdown は、見出し、箇条書き、リンク、コードブロックなどを普通のテキストで表現できます。
CommonMarkでも、Markdownは構造化された文書を書くためのプレーンテキスト形式として説明されています。
Markdown版が扱いやすい理由は、次のように整理できます。
- 本文がテキストとして読みやすい
- 見出し階層が
#や##で分かりやすい - コードブロックがそのまま取り出しやすい
- リンク先とアンカーテキストが近い
- HTMLタグやCSSクラスを読まなくてよい
- Gitやエディタで差分管理しやすい
- AIに渡す前の整形コストを減らしやすい
特に技術ドキュメントでは、コード例、設定例、コマンド、API仕様、注意点が重要です。
Markdownはそれらを本文の近くに置きやすく、HTMLの装飾に埋もれにくい形式です。
## インストール
次のコマンドで依存パッケージを入れます。
```bash
npm install
設定ファイルは config/app.php を確認します。
このような内容は、人間にもAIにもかなり読み取りやすいです。
HTMLに変換する前の原稿に近い形なので、余計なUI要素が混ざりにくいのも利点です。
## HTMLとMarkdown版の役割を分ける
Markdown版を用意するときに大事なのは、HTMLと対立させないことです。
それぞれの役割は違います。
<div class="article-note-grid">
<section class="article-note-card">
<h3>HTML</h3>
<p>人間がブラウザで読む本体です。デザイン、画像、表、レスポンシブ表示、ナビゲーション、関連記事などを含めて体験を作ります。</p>
</section>
<section class="article-note-card">
<h3>Markdown版</h3>
<p>本文、見出し、リンク、コード例、注意点をテキストとして渡しやすくする補助版です。AI、エディタ、開発支援ツールとの相性がよい形式です。</p>
</section>
</div>
HTMLを正規ページとして公開し、Markdown版は `同じ内容を読みやすく取り出すための別形式` として扱うのが現実的です。
検索向けの正規URLはHTMLに寄せ、Markdown版は必要に応じて llms.txt から案内する形にすると、役割が混ざりにくくなります。
## llms.txtとの関係
llms.txt は、AIアシスタントやLLMに向けて、サイトの概要や重要ページを案内するMarkdownファイルです。
llms.txt自体にすべての本文を詰め込むのではなく、重要なMarkdown版ドキュメントへのリンク集として使う考え方があります。
たとえば、次のような分け方です。
```md
# Example Docs
> Example Docs は、Example API の開発者向けドキュメントです。
## Core docs
- [Quick start](https://example.com/docs/quickstart.md): 最短で導入する手順
- [Authentication](https://example.com/docs/authentication.md): API認証の方式と注意点
- [Webhook](https://example.com/docs/webhook.md): Webhookの署名検証と再送仕様
## Optional
- [Changelog](https://example.com/docs/changelog.md): バージョンごとの変更点
この構成だと、llms.txt は 入口、Markdown版ドキュメントは 本文 という役割になります。
軽量な案内と詳細な本文を分けられるため、コンテキストが限られるAIツールでも扱いやすくなります。
このサイトでも、軽量な /llms.txt と、記事・用語集本文まで含めた /llms-full.txt を分けています。
ただし、llms-full.txt のような大きなファイルは、すべてのAIツールで常に読み切れるとは限りません。必要ならカテゴリ別、製品別、記事種別別に分ける方が扱いやすくなります。
どんなサイトで用意すると効果があるか
Markdown版ドキュメントは、すべてのサイトで必須ではありません。
特に効果が出やすいのは、次のようなサイトです。
反対に、デザインや写真の見せ方が主役のページ、フォーム操作が中心のページ、会員限定ページ、社内情報を含むページでは、無理にMarkdown版を公開しない方がよいこともあります。
Markdown版は AIに読ませると便利な公開情報 に絞るのが基本です。
公開して困る情報、社内限定の手順、顧客情報、未公開仕様、管理画面URLなどは入れてはいけません。
運用で気をつけること
Markdown版ドキュメントは便利ですが、作って終わりではありません。
HTML版と内容がずれると、むしろ混乱の原因になります。
確認したいポイントは次のとおりです。
- HTML版とMarkdown版の内容が大きくずれていないか
- 公開日、更新日、対象バージョンが分かるか
- canonicalや検索インデックスの扱いを決めているか
- llms.txtから重要なMarkdown版へリンクできているか
- Markdown版に下書きや社内情報が混ざっていないか
- コードブロックの言語指定が分かりやすいか
- 画像だけで説明している内容をテキストでも補っているか
特に注意したいのは、HTML版とMarkdown版の二重管理です。
手作業で別々に更新すると、いつか必ずズレます。可能なら、同じ本文データからHTMLとMarkdownを生成する、またはMarkdown原稿をHTMLへ変換するなど、元データを一箇所に寄せる方が安全です。
よくある誤解
Markdown版を置けばAI検索に必ず引用される?
保証はありません。
Markdown版はAIやツールに本文を渡しやすくする補助ですが、引用されるかどうかは本文品質、クロール可否、内部リンク、サイト全体の信頼性、検索意図との一致にも左右されます。
AI検索に引用されやすい記事の書き方は、AI検索に引用されやすい技術記事の書き方とは?一次情報・見出し・用語集を整える基本 で整理しています。
HTMLはもう不要になる?
不要にはなりません。
HTMLは人間に向けた正規の閲覧体験として重要です。Markdown版は、HTMLの代替というより、本文を取り出しやすくする別形式です。
Markdown版にはHTMLと同じ内容を全部入れるべき?
必ずしも全部入れる必要はありません。
ナビゲーション、関連記事、広告、UI説明のような要素は省き、本文、見出し、コード例、注意点、重要リンクを中心にする方が読みやすいです。
Markdownなら何を書いても機械が正しく理解する?
そうではありません。 Markdownでも、見出しが曖昧、リンクが壊れている、古い情報が混ざる、コード例に説明がない、という状態では伝わりにくくなります。形式よりも、本文の整理と運用が大事です。
Markdown版ドキュメントのよくある質問
Q. Markdown 版はどこに置けば良いですか?
A. URL に .md を追加するパターン(/articles/xxx.md)、別ディレクトリ(/docs/、/md/)、専用エンドポイント、などがあります。Anthropic は .md 拡張子で並列提供、Vercel は _md ルート、と各社で異なります。
Q. 自動生成はどう実装しますか?
A. CMS の API を経由して HTML → Markdown 変換(Turndown、html-to-md)、または Markdown ソースから両方生成(Astro、Hugo)、のどちらかです。Markdown ソース ベースの方が品質が安定します。
Q. AI 以外にも Markdown 版の利用先はありますか?
A. あります。チームの内部参照、Slack / Discord での共有、他サイトでの引用、オフライン閲覧、バージョン管理での差分追跡、などで便利です。AI 専用ではありません。
Q. HTML と Markdown で内容が違っても良いですか?
A. 違っても OK ですが、同じ情報の本質 を保ちます。広告、ナビゲーション、関連記事は Markdown 版で省略可能、本文の事実関係は揃える、が原則です。
Q. 構造化データを使えば Markdown 版は不要ですか?
A. 完全に代替できません。構造化データは メタ情報 を伝える、Markdown 版は 本文を機械可読に提供 する、と役割が違います。両方併用が理想です。
Q. 古い記事も Markdown 化すべきですか?
A. 重要記事から優先で十分です。PV 上位 100記事、AI 引用されてほしい記事、公式仕様や API リファレンス を優先。全記事一律は工数が見合わないことがあります。
Q. CDN キャッシュは効きますか?
A. 効きます。Markdown 版もキャッシュ対象に含める のが推奨です。AI クローラーからのアクセスが増えても、サーバー負荷を抑えられます。
まとめ
Markdown版ドキュメントを用意する意味は、HTMLを置き換えることではありません。
HTMLは人間が読むための本体として残しつつ、Markdown版で本文、見出し、リンク、コード例を取り出しやすくすることに価値があります。
HTMLだけだと、ナビゲーション、装飾、JavaScript、関連記事、非表示要素などが混ざり、AIや開発支援ツールに渡すときに本文が見えにくくなることがあります。
Markdown版を用意すると、重要な情報をプレーンテキストに近い形で渡しやすくなります。
ただし、Markdown版は魔法のSEO施策でも、AI検索に必ず引用される保証でもありません。
本文品質、内部リンク、用語集、構造化データ、robots.txt、llms.txt とあわせて、公開してよい情報を読みやすく保つ運用として考えるのが堅実です。
参考
- llmstxt.org: The /llms.txt file
- CommonMark: CommonMark Spec
- CommonMark: Markdown Reference
- Google Search Central: AI features and your website
- Google Search Central: Structured data guidelines