sitemap.xml は、検索エンジンにサイト内のURL一覧や更新情報を伝えるためのXML形式のサイトマップです。
一般的には https://example.com/sitemap.xml のようなURLで公開し、Google Search Console や robots.txt から検索エンジンへ伝えます。
まず押さえたいポイント
- 検索エンジンに見つけてほしい公開URLを一覧で伝える
- 基本は
locに正規URLを書く - 正確に管理できるなら
lastmodに最終更新日時を書く - 検索順位を直接上げるものではない
- sitemap.xml に入れたURLが必ずインデックスされるわけではない
- noindex、ログイン必須、管理画面、404、重複URLは入れない方がよい
robots.txtやIndexNowとの違い
robots.txt は、クローラーに対してクロールしてよい範囲や避けてほしいパスを伝えるファイルです。
sitemap.xml は、検索エンジンに見つけてほしいURL一覧を伝えるファイルです。
また、IndexNow はページの追加、更新、削除が起きたときに、検索エンジンへ早めに知らせる通知プロトコルです。
実務では、sitemap.xml でサイト全体のURL一覧を渡し、robots.txt でサイトマップの場所を伝え、必要なら IndexNow で更新通知を補う、という役割分担が分かりやすいです。
注意点
sitemap.xml に古いURL、リダイレクト元URL、下書きURL、noindexページが残ると、検索エンジンに渡したい情報がぶれます。
また、本文が変わっていないのに lastmod を毎回現在時刻にする運用も避けた方がよいです。
詳しくは、sitemap.xmlとは?検索エンジンにURL一覧を伝える基本 で整理しています。