Googleは現在、BERTを使用してストーリーとファクトチェックを照合しています
【Google翻訳】
Googleは、オートコンプリート、ニュース、事実確認、ナレッジパネル、ニュース速報の検出などに多くの変更を加えました。Googleは、この1年間に同社がGoogle検索に対して行った多くの変更と更新を発表し、要約しました。 この発表では、BERTと言語処理によるGoogle検索、Googleニュース、オートコンプリート、ファクトチェックの変更について説明します。
大まかに言えば、Googleは、できるだけ関連性があるだけでなく、可能な限り信頼できる検索結果を提供することを目指しています。 また、YMYLのように、あなたのお金や人生のセクターのように、信頼性はGoogleにとってより大きな関心事です。特に、アメリカ大統領選挙が間近に迫っていて、パンデミックの際には健康が最大の関心事です。
変化したこと?
Googleフェローであり、Google検索のバイスプレジデントであるパンドゥナヤック氏は、本日の発表は、新製品や新機能のリリースではなく、Googleが長年にわたって行ってきた継続的な変更に関するものであると述べました。 ここでは最近の微調整と、昨年から強調された会社の変更点を示します。
●選挙を中心としたオートコンプリートポリシーの変更。具体的には、保守性が高く、この分野では少ないか多いかが示されます。
●Google BERTは、事実のチェックとストーリーをより適切に一致させるために、ニュース記事全体で使用されています。
●ファクトチェックラベルは、2020年に40億回以上表示されています。
●GoogleはWikipediaと密接に連携して、Googleがナレッジパネルで使用する可能性のある破壊行為を検出して削除します。
●Googleは、40分以上ではなく、数分でニュース速報クエリを検出できるようになりました。BERTおよび完全なカバレッジ。
Googleは現在、言語AIモデルの1つであるBERTを活用して、Googleニュースの全カバレッジエリアの記事がウェブ上の事実に関して信頼できるかどうかをよりよく理解しています。 したがって、ある意味でGoogleは、記事とファクトチェックデータベースとの関係を確認して、ファクトチェックとストーリーをより適切に一致させることができます。 ある意味で、ファクトチェックがストーリーのメイントピックに関連しているかどうかを理解するのに役立ちます。
Pandu氏は次のように述べています。「ニュース記事と利用可能なファクトチェックのマッチングを改善するために、BERT言語理解モデルを使用したアップデートも開始しました。 これらのシステムは、ファクトチェックの申し立てがストーリーの中心的なトピックに関連しているかどうかをよりよく理解し、それらのファクトチェックをフルカバレッジでより目立つように表示できます。ニュースは、さまざまなソースからストーリーが報告される方法の完全な図を提供します 。 たった1回タップするだけで、フルカバレッジを使用すると、さまざまなソース、ビデオ、ローカルニュースレポート、FAQ、ソーシャルコメンタリーからのトップヘッドライン、および時間の経過とともに流れてきたストーリーのタイムラインを表示できます。」
速報。
グーグル社は、ニュース速報から数分以内に速報ニュースのクエリを検出できるようになったと語った。 以前は、Googleに40分以上かかる可能性がありました。 過去のこの種のニュース速報クエリは、不正確な情報を表面化することがあります。 そのため、Googleはニュース速報クエリをより迅速に検出できるため、それらのクエリに対してどのタイプのサイトを表示したいか、この場合はE-A-Tに一致するより信頼できる結果を得ることができます。
ニュース速報トピックに関するGoogleからのより正確で信頼できる情報を期待する必要があります。
オートコンプリートポリシーの変更。
GoogleのTrust&Safetyのシニアディレクター、David Graff氏は、選挙に関して、また他のいくつかの分野についても、オートコンプリートで提示される提案について、より保守的なアプローチを取ると述べています。 Googleは、不正確な提案を表示するよりも、オートコンプリートで提案を表示しません。そのため、選挙やその他のいくつかの分野では、Googleは候補数を増やすより少なく表示する場合があります。
パンドゥー氏は、Googleは「選挙に関連するオートコンプリートポリシーを拡張しており、候補者や政党に対する、または反対する主張として解釈される可能性がある予測を削除する」と説明しました。 「また、投票方法、要件、投票場所のステータスに関する声明など、選挙への参加に関する主張と解釈される可能性のある予測や、選挙の安全性などの選挙プロセスの完全性または正当性も削除します。 、” 彼が説明した。 David Graffの1つの例は、[テキサス州から郵送で投票できます]のようなクエリがtrueかどうかにかかわらず表示されない可能性があることです。重要な注意点の1つは、「予測が表示されるかどうかにかかわらず、何でも検索して結果を見つけることができる」ということです。
ファクトチェックラベルは40億回表示されました。
グーグルは、これまでのところ2020年にファクトチェックラベルが検索で40億回以上表示されたと述べています。 グーグルは、これは2019年にグーグルがこのファクトチェックラベルを表示した回数を超えていると語った。Googleは過去数年にわたってニュース、検索、画像、その他の分野にわたってファクトチェックラベルを拡大しました。
ナレッジグラフとウィキペディア。
グーグルはウィキペディア内での破壊行為を検出して減らすためにウィキペディアと一緒に多くの投資を行ってきました。 GoogleはWikipediaのナレッジパネルと注目のスニペットを頻繁に調達しているため、GoogleはそれらのWikipediaのエントリが信頼性が高く正確であることを保証するインセンティブを持っています。 ほとんどの問題は数分以内にウィキペディア内で修正されるとグーグルは言った。
「ウィキペディアのシステムを補完するために、不正確な可能性のある情報がナレッジパネルに表示されるのを防ぐために、保護と検出システムを追加しました。 まれに、ウィキペディアでの破壊行為の事例がすり抜けることがあります。 ウィキペディアからの編集のごく一部のみが破壊行為の可能性があるため、システムを改善して、これらのケースの99%を検出できるようになりました。 これらの問題が発生した場合は、迅速に対応して問題に対処できるポリシーがあります。 ウィキペディアコミュニティをさらにサポートするために、コンテンツの品質に焦点を当てたいくつかのエディターツールをホストするWikiLoopプログラムを昨年作成しました。 これには、WikiLoop DoubleCheckが含まれます。これは、Wikipediaエディターとユーザーがページ上の変更を追跡し、潜在的な問題にフラグを付けるために使用できる多数のツールの1つです。 私たちは、コミュニティのメンバーが新しい洞察を明らかにするために使用できる独自の検出システムからのデータを提供しています」とGoogleは書いています。検索品質評価者とガイドライン。
グーグルは、ベンチマークと基準の多くはその検索品質評価者ガイドラインに記載されていると説明した。 Googleは、検索結果の目標、より高いレベルの信頼できる信頼できるソースを必要とするクエリのタイプ、および必要としないクエリを明確に文書化しています。 実際、Panduは、クエリがYMYLカテゴリに関連しているかどうかを理解するために、Googleがクエリ分類子をトレーニングしていると説明しました(これはわかっています)。 新しい問題が発生した場合、Googleのシステムは彼が言ったクエリを処理する準備ができています。
特に健康と選挙の分野で信頼できるものを理解する。 Googleは、検索品質評価者のガイドラインを直接信頼できる高品質のものとして定義する必要がありました。 Googleは品質評価者のガイドラインからのフィードバックを使用してこれを機械学習モデルにフィードし、このフィードバックをエンジニアに送り返して検索全体を改善します。 繰り返しになりますが、Googleはこれらの評価者を検索で直接使用することはなく、これらの評価は個々のクエリまたはサイトの検索ランキングに直接影響を与えません。
Googleには世界中に10,000人を超える評価者がおり、すべての検索者の代表的な見解を得るために、すべての州に1人の評価者がいます。 これらの評価者は、品質評価者のガイドラインに基づいて検索結果を評価します。 評価者は横並びの実験を見て、Googleは60,000を超える並列実験と約400,000の検索品質テストを行い、過去4年間で100万回を超えました。これは1日あたり約1,000テストです。
なぜ気にするのか。
Googleでは、検索の品質、関連性、信頼性、正確性を向上させるために、Google検索を常に調整しています。 つまり、最高の品質、より関連性が高く、信頼性が高く正確なコンテンツとユーザーエクスペリエンスを確保するために、常にWebサイトを改善する必要があります。
Google検索で今日何も変わっていることはありませんが、長期的にこれらの変化について考え、Webサイトを改善し続けてください。