コサイン類似度(Cosine Similarity)はAI検索SEOにとってどのくらい重要なのか?
「検索エンジン」「生成AI」のトラフィックを実データで比較。SEOの進むべき道はどこに?【SEO情報まとめ】[Web担当者Forum]
次の質問がReddit(レディット)のSEO掲示板に投稿された。
***********************
コサイン類似度を使っている人はいますか?
最近SEO界隈でコサイン類似度という言葉をよく目にするのですが、実際に使っている人はいるのでしょうか?
***********************「コサイン類似度(Cosine Similarity)」は、ごく簡単に説明すると、こんな感じだ:
***********************
2つのベクトルがなす角度のコサイン値を使って、それらの「方向の近さ」、言い換えると「類似度(どのくらい似ているか)」を測る指標。
***********************LLMの言語理解にも応用される技術。LLMで生成される単語や文のベクトル表現(埋め込み/embeddings)同士の意味的な近さを測るために広く使われている。AI文脈でのSEOで最近よく言及されるようになってきた
この件に関してジョン・ミューラー氏が次のようにコメントした:
***********************
正直に言えば、そうした話がどこから来ているのか、そして推奨している人たちがそれを使って何をしようとしているのかを理解する価値はない:
大量のコンテンツをばらまいているだけなら、類似度の最適化をどれだけやっても役には立たない(問題は好かれていない大量コンテンツであって、内容が似すぎていることではない)。
大量にコンテンツを配信していないのであれば、完全に無視して構わない。
***********************
ミューラー氏のアドバイスを一言で言えば「コサイン類似度などを意識する必要はまったくない」である。勘違いしてほしくないが、コサイン類似度とAI検索の関係を探求するのは決して悪いことではない。SEOの専門家として調査するのも、純粋な知的好奇心からの取り組みでも。実際、筆者も興味津々のトピックだ。
SEOコンサルタントのまとめ
【「コサイン類似度(Cosine Similarity)」は?】[Web担当者Forum]
「2つのベクトルがなす角度のコサイン値を使って、それらの「方向の近さ」、言い換えると「類似度(どのくらい似ているか)」を測る指標。」
【コサイン類似度について】[Web担当者Forum]
■ジョン・ミューラー氏
大量のコンテンツをばらまいているだけなら、類似度の最適化をどれだけやっても役には立たない(問題は好かれていない大量コンテンツであって、内容が似すぎていることではない)。
大量にコンテンツを配信していないのであれば、完全に無視して構わない。