Google、自然言語処理技術のBERTをアップデート「BERT」とは?
検索をこれまで以上に理解する
【Google翻訳】
Google検索で15年間働いて学んだことが1つありますが、それは人々の好奇心が無限であることです。毎日数十億件の検索があり、それらのクエリの15%はこれまで見たことがないクエリです。そのため、予測できないクエリの結果を返す方法を構築しました。あなたや私のような人が検索に来たとき、クエリを作成するための最良の方法について常に確信があるとは限りません。使用する適切な単語や綴り方がわからない場合があります。多くの場合、学習を求めて検索にアクセスします。必ずしも最初から知識があるわけではありません。
検索の中核は、言語を理解することです。クエリの単語のつづりや組み合わせに関係なく、検索対象を把握し、ウェブから有用な情報を表示することが私たちの仕事です。長年にわたって言語理解能力の向上を続けてきましたが、特に複雑なクエリや会話型のクエリの場合、まだ適切に機能しないことがあります。実際、それが人々が「キーワード」をよく使用する理由の1つであり、私たちが理解すると思うが実際には質問をする方法ではない単語の文字列を入力します。
機械学習により可能になった言語理解科学の研究チームの最新の進歩により、クエリの理解方法が大幅に改善され、過去5年間で最大の飛躍を遂げました。検索の歴史で最大の飛躍。
BERTモデルを検索に適用する
昨年、私たちはトランスフォーマーからの双方向エンコーダー表現と呼ばれる自然言語処理(NLP)の事前トレーニングのためのニューラルネットワークベースの技術を導入し、オープンソース化しました。このテクノロジーにより、誰でも独自の最先端の質問応答システムをトレーニングできます。このブレークスルーは、トランスフォーマーに関するGoogleの調査の結果でした。つまり、1つずつ順番にではなく、文の他のすべての単語に関連して単語を処理するモデルです。したがって、BERTモデルは、前後の単語を調べることで単語の完全なコンテキストを考慮することができます。これは、検索クエリの背後にある意図を理解するのに特に役立ちます。
しかし、これを可能にするのはソフトウェアの進歩だけではありません。新しいハードウェアも必要でした。 BERTを使用して構築できるモデルの一部は非常に複雑であるため、従来のハードウェアを使用してできることの限界を押し上げるため、初めて最新のCloud TPUを使用して検索結果を提供し、より関連性の高い情報を迅速に取得します。
クエリをクラックする
それは多くの技術的な詳細ですが、それはあなたにとって何を意味しますか?検索でのランキングスニペットと注目スニペットの両方にBERTモデルを適用することで、有益な情報を見つけるのに役立つはるかに良い仕事をすることができます。実際、結果のランキングに関しては、BERTは検索が米国の英語での検索の10分の1をよりよく理解するのに役立ちます。これは今後、より多くの言語とロケールに反映されます。特に、より長い会話型のクエリ、または「for」や「to」などの前置詞が意味に重要な検索の場合、検索はクエリ内の単語のコンテキストを理解できます。あなたにとって自然な方法で検索できます。
これらの改善を開始するために、変更が実際に役立つことを確認するために多くのテストを行いました。以下は、検索の背後にある意図を理解するBERTの能力を示す評価プロセスを示した例の一部です。
「2019年ブラジルへの旅行者はビザが必要」という検索結果です。「to」という単語とクエリ内の他の単語との関係は、意味を理解する上で特に重要です。それはブラジル人が米国に旅行することであり、その逆ではありません。以前は、当社のアルゴリズムはこの接続の重要性を理解していなかったため、ブラジルに旅行する米国市民に関する結果を返しました。 BERTを使用すると、Searchはこのニュアンスを把握し、「to」という非常に一般的な単語が実際にここで重要になることを知ることができ、このクエリに対してより関連性の高い結果を提供できます。
Google、自然言語処理技術のBERTを検索システムに導入。英語検索の10%に影響あり
Google は「BERT」と呼ぶ自然言語処理技術を検索システムに採用したことを発表しました。
BERT の採用により検索クエリをより正確に理解することができます。BERT とは
BERT とは “Bidirectional Encoder Representations from Transformers” の頭文字を取ったものです。
自然言語処理 (NLP: Natural Language Processing)の技術です。自然言語とは、ものすごく簡単に言うと普段僕たちが自然に使っている言葉です。
コンピュータは人間のようには自然言語を正しく理解できません。
そのため、検索するとき、多くの人は人と話すようにではなく検索エンジン用にクエリを入力します。
たとえば、パスポートの有効期限が切れて更新したいときに手続方法を調べる際に、「パスポート 期限切れ 更新」のように片言の日本語みたいに検索するかもしれません(※ちなみにパスポートは更新できません。新規に取得します)。
普段使っている言葉で検索しても検索エンジンには正しく理解してもらえず、求めていた結果が出てきづらいことを僕たちは経験的に知っているからです。BERT による自然言語処理が生み出す検索結果
BERT 採用以前では的確な結果を出せなかったけれど、BERT 採用後には的確な結果を返すことができるようになったクエリの例を公式アナウンスはいくつか挙げています。
そのうちの 1 つを紹介します。2019 brazil traveler to usa need a visaこれは、「2019 年に米国へ行くブラジルの旅行者はビザが必要かどうか」を問うクエリです。
“to usa”(米国へ) の “to” が非常に重要なのですが、従来のクエリ解釈では、“to” を無視してしまい、米国市民がブラジルに行くときにビザが必要かどうかの情報を提供するページを返してしまっていたのだそうです。
旅行の主体と向きが逆になってしまっています。
BERT でクエリを解釈すると適切な結果が返されるようになったとのことです。
BERT 対応
さて、気になるのは BERT が検索システムに導入されたことでどんな対応が必要になるかでしょう。
一言で言えば特別な対応は不要です。
しいて挙げるとしたら、ユーザーのためにコンテンツを作ることです。自然言語によるクエリ理解が向上したのですから、そのクエリに対する的確な情報を提供できていれば、Google があなたのページを上位表示してくれます。
「SEO のためのライティング」なんていうものが存在することがそもそも不自然だったわけです。
「BERT 対応のコンテンツ制作」みたいなサービスが今後生まれてくるかもしれません。
もしそういったサービスが出てきたら、生暖かく見守ってあげましょう。😉もう 1 つ挙げるとしたら、わかりやすい文章を書いてください。
この記事は結局何を言いたいんだろう? とユーザーを困惑させてはいけません。
人間のユーザーが理解できないコンテンツは BERT も理解できません。Google 検索が進化すればするほど、ユーザーのためのコンテンツ作りがより重みを増してきます。
SEOコンサルタントのまとめ
「BERT」のアップデートにより自然言語によるクエリの理解が向上したとのことで、
アメリカでは10%の影響が出たようです。
これにより何かしなければいけない事はありませんが、自然言語にマッチしたコンテンツは上がる可能性がありますね。