nofollowはインデックス防止には使えない
SEO上級者なら必須の知識「HTTPステータスコードを検索エンジンがどう扱うか」【SEO情報まとめ】[Web担当者Forum]
インデックスを防ぐためにnofollowを利用できる
こんな認識をしていたら、「このページはグーグルで検索されないようにしている」と思っていたページが検索対象になってしまう。
リンクの a タグに nofollow 属性を付けていたとしても、リンク先ページのURLはインデックスされる可能性がある。
nofollow はリンク先ページに評価を渡さないようにする仕組みであって、クロールやインデックスを防ぐ仕組みではないからだ。nofollowの付いていないリンクが1箇所でもあれば、または、さまざまなルートでグーグルがそのURLを認識すれば、クロールされインデックスされる。
同様に、robots.txtでURLをクロール禁止に指定していたとしても、グーグルがそのURLをインデックスする可能性は残る(ただしインデックスされるのはURLだけなのでコンテンツの情報はインデックスに含まれないが)。
インデックスを確実に防ぐには、次の2点を両方とも満たす必要がある:
グーグルがそのURLをクロールできるようにする(robots.txtでクロール除外しない)
グーグルにnoindexを伝える(次のどちらか)
robots metaタグでnoindex を指定する
HTTPヘッダーの x-robots-tag で noindex を返すグーグルのゲイリー・イリェーシュ氏も、これに関する質問をTwitterでされ、「昔からずっとその挙動だし、ドキュメントにも明確に書いてある」と答えている。
the URLs might still get indexed. that's been the case since forever we just spelled it out more clearly
— Gary 鯨理/경리 Illyes (@methode) July 5, 2021
SEOコンサルタントのまとめ
リンクの a タグに nofollow 属性を付けていたとしても、リンク先ページのURLはインデックスされる可能性がある。