「インデックス カバレッジ」の問題の解決方法とは?(体験談)
サーチコンソールで「インデックス カバレッジ」の問題が発生した時の体験談です。
サーチコンソールで「インデックス カバレッジ」の表示
▼サーチコンソールで「インデックス カバレッジ」の表示
▼ページを開いた時のサイト上のメッセージ
新たに検出された問題:
サーバーエラー(5xx)エラー:2
該当URL
インデックス カバレッジとは?
新Search ConsoleのIndex Coverageレポートに出てくる「インデックスされているが関心が低い」ページとは?
ヘルプページ(現在は英語のみ)では次のように説明されています。
Indexed, low interest: The page was indexed, but appears very rarely in Search results. It might be omitted from other Search Console reports.
訳します。
インデックスされている、関心が低い: ページがインデックスされていますが、検索結果にはめったに表示されません。Search Console のその他のレポートでも省略されることがあります。
品質が低いページに付けられるラベルでは?というのが、真っ先に思い浮かんだのではないでしょうか。
品質が低いというのは確かに理由としては考えられるかもしれません。しかし必ずしもそれに限ったわけではないようです。
ほかに考えられる理由としてはたとえば、「情報が極めて古い」「検索結果に出るようなクエリがない」といったものを僕は思い付きました(あくまでも僕の想像にしか過ぎませんが)。関心が低いというのは、“Google”の関心が低いということではなく、“ユーザー”の関心が低いという意味なのかなとも疑っています。
残念ながら、どんなページが「low interest」として認識されるのかの理由までは、ヘルプページには記載されていません。
新しい Search Console が正式にリリースされたあとに、Google の人に直接聞いてみるのが良さそうです。いずれにしても、検索結果に出ることが極めて稀なページが「Indexed, Low interest」としてマークされるとのことです。
いわば、Google 検索においては存在しないも同然のページですね。
(海外SEO情報ブログより)
■インデックス カバレッジ レポート – Search Console ヘルプ
このレポートを使用すると、どのページがインデックス登録されているかや、インデックス登録できなかったページの修正方法を確認できます。グラフの各バーは、Google が認識している URL の合計数を各ステータス(有効、エラーなど)別に表しています。
確認すべき点
通常は、サイトが拡大するにつれて、有効なインデックス登録済みページの数が徐々に増えていく状態になる必要があります。インデックス登録エラーの急激な増加が見られる場合: テンプレートに変更を加えた際にエラーが混入したか、送信したサイトマップに記載されている URL のクロールがブロックされている(robots.txt や noindex によるブロック、ログインを求めるページによる保護など)ことが原因でエラーが発生している可能性があります。
インデックス登録済みページの総数が減少しており、対応するエラーがない場合: robots.txt、「noindex」、認証機能などによって既存のページへのアクセスがブロックされている可能性があります。ブロックされていない場合は、該当ページの数で並べ替えを行って除外の理由を確認し、減少を引き起こしている原因を調べます。
インデックス登録されるはずの大量のページがインデックス登録されていない場合: 除外された URL を調べて手がかりを探します。数多くのページが robots.txt や noindex によってブロックされている可能性があります。
こうした URL はどのようにして検出されるか: Google はさまざまな方法で URL を検出しますが、最も一般的なのは、クロール済みのページからリンクをたどる方法と、サイトマップを使用する方法です。こうして検出された中には間違ったリンクが含まれている場合があります(サイトで 404 エラーが発生する原因となります)。また、以前存在していたページが消滅していることもあります。Google では、一度認識した URL のクロールをしばらくの間試みます。これは通常の動作です。URL がクロールされないようにするには、インデックス登録をブロックしたり、アクセスをブロックしたりするか、301 リダイレクト(該当する場合)を使用できます。
(Search Console ヘルプより)
エラーとは?
エラー:2エラー: ページはインデックスに登録されていません。詳細およびエラーの修正方法については、下記の各エラータイプの説明をご覧ください。最初にこうした問題に集中する必要があります。
■エラーとは?
エラー
エラーがあるページはインデックスに登録されません。
■サーバーエラー(5xx)とは?
サーバーエラー(5xx): ページをリクエストしたときに、サーバーから 500 レベルのエラーを返されました。
5xx Server Error サーバエラー
サーバがリクエストの処理に失敗した。500 Internal Server Error
サーバ内部エラー。サーバ内部にエラーが発生した場合に返される。
例として、CGIとして動作させているプログラムに文法エラーがあったり、設定に誤りがあった場合などに返される。
501 Not Implemented
実装されていない。実装されていないメソッドを使用した。
例として、WebDAVが実装されていないサーバに対してWebDAVで使用するメソッド(MOVEやCOPY)を使用した場合に返される。
502 Bad Gateway
不正なゲートウェイ。ゲートウェイ・プロキシサーバは不正な要求を受け取り、これを拒否した。
503 Service Unavailable
サービス利用不可。サービスが一時的に過負荷やメンテナンスで使用不可能である。
例として、アクセスが殺到して処理不能に陥った場合に返される。
504 Gateway Timeout
ゲートウェイタイムアウト。ゲートウェイ・プロキシサーバはURIから推測されるサーバからの適切なレスポンスがなくタイムアウトした。
505 HTTP Version Not Supported
サポートしていないHTTPバージョン。リクエストがサポートされていないHTTPバージョンである場合に返される。
506 Variant Also Negotiates
Transparent Content Negotiation in HTTPで定義されている拡張ステータスコード。
507 Insufficient Storage
容量不足。WebDAVの拡張ステータスコード。リクエストを処理するために必要なストレージの容量が足りない場合に返される。
508 Loop Detected
ループを検出。WebDAVの拡張ステータスコード。
509 Bandwidth Limit Exceeded
帯域幅制限超過。そのサーバに設定されている帯域幅(転送量)を使い切った場合に返される。
510 Not Extended
拡張できない。An HTTP Extension Frameworkで定義されている拡張ステータスコード。
(ウィキペディアより)
インデックスカバレッジへの対応(体験談)
該当のページを開くと
「システムエラーが発生しました。大変お手数ですが、サイト管理者までご連絡ください。」
という表示がありました。各項目の説明はこのような感じです。
https://support.google.com/webmasters/answer/7440203?hl=ja
■エラーとは?
エラー
エラーがあるページはインデックスに登録されません。
■サーバーエラー(5xx)とは?
サーバーエラー(5xx): ページをリクエストしたときに、サーバーから 500 レベルのエラーを返されました。
■500 レベルのエラー とは?
5xx Server Error サーバエラー
サーバがリクエストの処理に失敗した。
恐らく、表示する必要のないページ(システムエラーが発生しました。)なのにインデックスされた為のエラーのようです。
ですので
該当のページをインデックスされないようにすれば解決できると思いました。
知人のWEB制作者にも確認しましたが
との事。
ネットでも探しましたが、同様の状態の方がいました。
https://www.bscre8.com/bslife/2018/02/02/search_console_error_mail/
該当サイトのソースとにらめっこしていると、大体の理由がわかりました。
該当サイトではカスタマイズをしており、javascript 内の記述で テーマディレクトリそのもの (/wp-content/themes/{テーマ名}) で終わる部分があります。<script type=”text/javascript”>
var tempUrl = ‘/wp-content/themes/{テーマ名}’;
</script>
1
2
3
<script type=”text/javascript”>
var tempUrl = ‘/wp-content/themes/{テーマ名}’;
</script>このような記述があるのです・・・。
しかしこの記述を削除してしまうと、カスタマイズした機能が動作しなくなります。
ううむ、これは一筋縄ではいかないのでは・・・という思いが頭をよぎりました。あれ、でも WordPress の robots.txt は /wp-content/themes/ ごと disallow して問題ないんじゃなかったですっけ・・・。そう思い robots.txt を確認したところ、/wp-content/them”a”s/ となっておりました・・・。
themes のスペルミスです。拍子抜けしました・・・。
robots.txt を以下のように修正しました。
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes(B’s Life! より)
とのことですので、やはりDisallowの対応で良いと思いました。
▼Disallowの対応を提案。
▼Disallowの対応をする。
▼確認依頼を出す
https://**** の所有者様
弊社では、貴サイトの インデックス カバレッジ に関する問題の修正について確認を開始いたしました。具体的には、2 ページに現在影響を及ぼしている「サーバーエラー(5xx)」について確認しております。
テストが完了しましたら、結果をお送りいたします。以下のリンクにアクセスして、テストの進捗状況をご確認いただくこともできます。
検証: 開始
開始日: 2018/03/16
▼2018/3/19対応「Fetch as Google」
・・・「システムエラー」の表示が消え、正しいページが表示されたので
Googleにクロールして貰うよう「Fetch as Google」で送信。
▼「サーバーエラー(5xx)」の該当ページが2P⇒1Pになる。
SEOコンサルタントの感想
あくまでこのサイトの場合ですが、これで解決しました。
インデックス カバレッジ に関する問題の修正はDisallowの対応で良いと思います。
SEOまんが
【SEO動画】「まんがでわかるSEO」SEOコンサルタント勝子/プロローグ『SEOコンサルタント登場』
【SEO動画】「まんがでわかるSEO」SEOコンサルタント勝子/第1話『SEO・内部対策をしよう!』
SEO関連著書
【本の情報】
■出版社:宝島社
■タイトル:『DeNAと万引きメディアの大罪』
■ページ: 240ページ
■著者:別冊宝島編集部 (編集)
※白石竜次は寄稿
「世界一わかりやすいSEO対策最初に読む本」