Googleが検索トラフィックのルーティングアーキテクチャを大改造, へき地の解消がねらい

USC(南カリフォルニア大学)の研究者たちが、Googleの検索サービスの構造が大きく変わったことを、たまたま発見した。それによって、とくにGoogleのデータセンターから遠い地域での検索が、高速化されている。

研究者たちは、サーバの所在…それがどこのデータセンターにあるか…を突き止める、という一般的な研究の過程で、たまたまそのことに気づいた。彼らの方法では、サーバとクライアントとの関係も分かるので、偶然にもGoogleのサーバ配置構造の大きな変化に気づくことができた。Googleがこのような大規模な変更を定期的に行っていることは、ありえないだろう。

彼らの発見によると、Googleは過去10か月で、検索サービスをサーブするサーバの所在位置をこれまでの約7倍に増やしている。その変動の様相を示す上のGIF画像では、黒い円がGoogleのデータセンター、そして赤い三角形が、Googleが検索トラフィックをリレーしているほかのサイトだ。

研究者たちは、こう述べている:

2012年10月から2013年7月末にかけて、Googleの検索インフラストラクチャを支えるサーバの位置が200弱から1400強に増加し、ISPの数は100強から850あまりへと増加した。

USCのチームによると、Googleはこの変更を、既存のインフラの機構改革によって行っている。たとえばこれまでYouTubeのビデオなどのコンテンツをホストしていたクライアントネットワークを再利用して、検索や広告サーブの高速化のために使用している。

研究チームのリーダーでUSCの院生Matt Calderはこう述べている: “これらのクライアントネットワークはこれまでYouTubeビデオの配布に使われていたが、Googleは突然それらの負荷を増大し、同社のコンテンツホスティングインフラストラクチャを、検索インフラストラクチャとしても使うようになった”。

それまで検索のクェリは(一般的なルーティングにより)直接Googleのデータセンターに行っていたので、遠隔地では遅延が生ずる可能性があった。新しいアーキテクチャではクェリはまず地域のネットワークへ行き、そこからGoogleのデータセンターへリレーされる。地域ノードとGoogleのデータセンターは恒常的に接続されているので、遅延は生じない。その結果スピードが向上し、パケットロスも減少する。

研究者たちは、次のように説明している:

データ接続は通常、最速に達するまでに“ウォームアップ”を必要とするが、クライアントネットワークとGoogleのデータセンター間の恒常的接続ではウォームアップによって生ずる遅延がそれほど大きくない。またインターネット上のコンテンツは小さなパケットに分割されて送信されるので、パケットロスとその回復のために遅延が生ずることもある。Googleとユーザとのあいだにクライアントネットワークが入ることにより、パケットロスの検出と回復もより迅速になる。

Google検索のこの新しいアーキテクチャは、AkamaiやLimelight NetworksのようなCDN(content delivery network)のアーキテクチャに似ている。ストリーミングビデオサービスなどはCDNを利用することによって、遅延を減らしている。

Google検索の、この新しい世界秩序は、どれだけ遅延を減らせたのか? 研究の報告書を書いたEthan Katz-Bassettによると、チームは今パフォーマンスの向上を定量化するための作業を進めているので、現時点ではGoogleが行った変更の効果を評価できない。しかし、その効果は地域差が大きいだろう。という。これまでに調べた例の中には、遅延が1/5減ったケースもある。

“ニュージーランドのあるマシンは、それまでオーストラリアのシドニーからサーブされていたが、それがニュージーランドのフロントエンドに接続されたため、遅延は約20%減った”、と彼は言う。

“全体を概観すれば、これまでサービス状態の悪かった世界中の多くの地域で、パフォーマンスが向上したはずだ”、と彼は付け加える。“たとえば、これらの新しいサーバを使うようになったネットワークの50%は、Googleのネットワーク上の古いサーバから1600キロメートル以上も離れていた。今ではそれらの半分が、地元ISPのサーバから50キロメートル以内にある”。

新たなインフラストラクチャによってユーザは検索の結果をより速く取得し、Googleはより多くの広告を配布できる。しかしISPたちも、このウィンウィンの仲間に入る。サーブするローカルトラフィックが増えて操業コストが下がるからだ。GoogleがローカルなISPに頼れば頼るほど、GoogleからISPへの支払いも増えるのだ。

Katz-Bassettの見方によると、Googleは今後の検索クェリの増加に備えて、そのためのインフラを全世界的に強化しようとしているのではなく、世界中の既存のユーザに対するサービスの質の向上を目指しているだけだ。“容量が増えるわけではなくて、一部のパフォーマンスが上がるだけだからね”。

Googleはこの研究について無反応なので、この変更の動機や時期的理由についてはよく分からない。Katz-Bassettの推測では、検索トラフィックを今回のようにルート変えすることが、これまでは何らかの理由により、技術的・工学的に難しかったのだろう、という。ルート変更には、Time Warner Cableのような既存のクライアントネットワークを利用しているから、新しいビジネスパートナーシップの構築、というレベルでの問題はなかったと思われる。

また、Googleのパフォーマンス向上計画がいろいろある中で、今回はこれが優先されたのだろう、とKatz-Bassettは言っている。

彼は曰く: “新しい技術課題も発生している。あるクライアントを、どのサーバに付け替えたらベストのパフォーマンスが得られるのか? それを決める・調べる、という課題だ。これまでは、リクエストがフロントエンドに来たら、そのあとはGoogleがすべてのパスをコントロールしていた。これからはGoogleのネットワークの外部にいる各地のフロントエンドが、トラフィックを公共的なインターネットにリレーして、Googleのデータセンターに渡すことになる。そこには、渋滞や可利用帯域の大きさなどいろんな問題がからんでくるし、非常に大きなシステムを管理しなければならなくなる”。

USCチームは彼らの発見を、昨日スペインで行われたSIGCOMM Internet Measurement Conferenceで発表した。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


“Hummingbird”が来た―Google、最大級の検索アルゴリズムのアップデートを密かに実施ずみ

最近直接の質問に対するGoogleの回答が改善されたような気がしないだろうか? 実はそれは気のせいではない。Googleは最近Hummingbirdという新しい検索アルゴリズムに切り替えた。Hummingbirdは複雑な質問を正しく解釈できるようにすることを主眼に開発されたという。

Googleは今日開かれた風変わりなイベントで新アルゴリズムの存在を初めて公表した。招待者はGoogle本社に着くと(驚いたことに)バスに乗せられてラリー・ペイジとサーゲイ・ブリンがGoogleを創業したガレージに連れて行かれた。そこでHimmingbirdの他に比較処理のためのKnowledge Graphも紹介された。これは「オリーブ油とバターとどっちが健康によい?」というような比較の質問に正しく答えられるようにするシステムだという。またiOS版ではGoogle Nowにプッシュ通知が追加された。

参加者からHummingbirdが具体的にどう作動するのかという質問が多数出たが、Googleは技術的詳細を明らかにすることは避けた。ただしGoogleによればHummingbirdは2009年のCaffeineアップデート以来の大規模なアルゴリズムの変更だということだ(Caffeineはスピードアップとソーシャルネットワークの情報を検索結果に含めることが主眼だった)。Himmingbirdは検索の90%に何らかの影響を与えるという。

Googleは技術的詳細についてはほとんど触れなかったが、「このアップデートでは自然言語の質問文(単語を並べた検索ではなく)を高速に解析し、それに応じた適切なコンテンツとランクを判断して回答を提供するアルゴリズムが実装されている」と繰り返し強調した。

これが検索結果にいったいどんな影響を与えるのかとSEO専門家は色めきたつだろうが、少し落ち着いた方がよい。実はこのアップデートは何週間も前にすでに実施ずみだという。だから現在表示順位等に大きな変動が感じられないなら、近い将来ドラスティックが変化が起きることはないだろう。何か変化があるにしてもHummingbirdアップデートのせいではある可能性は低い。

[原文へ]

(翻訳:滑川海彦 Facebook Google+


Google、Google+のハッシュタグを検索してページ右上隅に表示―企業、ブランドには大きなインセンティブ

Google+は今年5月からハッシュタグのサポートを始めた。今日(米国時間9/25)、GoogleはGoogle検索の結果にGoogle+のハッシュタグを含めると発表した。今やGoogleのほとんどすべてのサービスにGoogle+が統合されていることを考えれば、この動きは驚きではない。

ハッシュタグのサポートは現在アメリカとカナダの英語版サイトで有効となっている。

ユーザーがGoogle検索窓に、たとえば#AmericasCupと入力すると、そのハッシュタグを使ったGoogle+投稿がサイドバーにリストアップされる。GoogleはTwitter、Facebookのハッシュタグは直接検索しないが、Google+の検索結果の下にTwitterとFacebookへのリンクが表示されるのでこれらのソーシャルでもユーザーは同じハッシュタグを用いて簡単に検索ができる。

Google+投稿へのリンクにはサムネール、+1、コメントの数が表示される。ただし検索結果から直接投稿にコメントすることはできない。+1やコメントのためにはまずリンクをたどってGoogle+を訪問する必要がある。

新機能が一般ユーザーにどの程度利用されるかは不明だ。多くのユーザーにとってハッシュタグの検索といえばTwitterを意味するだろう。

しかしコンテンツ所有者にとってこの機能は決定的に重要だ。企業やブランドがGoogle+に投稿する際にはハッシュタグを付加することが必須になる。検索結果ページの右上隅というのは、いわば「地価最高」の場所だ。ハッシュタグを利用すればこの場所にリンクが表示される可能性があるのだったら使わない手はない。企業、ブランドがGoogle+を利用する大きなインセンティブとなりそうだ。

[原文へ]

(翻訳:滑川海彦 Facebook Google+


Googleの検索で辞書定義の結果出力が充実(例文、同義語、語源など)

Google Search(Googleの検索サービス)にささやかだけどクールなアップデートが加わった。Googleの検索で言葉の辞書上の定義を知りたいときは、“define xxxx”のようなクェリを入力するが*、今回のアップデートでその結果の情報量がとても増えた。今回のアップデートの目的は、Googleによると、“言葉の単なる定義以上の情報を提供すること”、だそうだ。〔*: 日本語のクェリでは、“xxxx 定義”でもよいが、Googleがリコメンドするのは“xxxxとは”。〕

最近の辞書ボックスには、その言葉を含むセンテンスの例や、シノニム(同義語)などがある。ときには、語源(フローチャートやテキストを使用)やその言葉の利用頻度の変遷なども知ることができる。利用データは同社の Ngram Viewer for Google Booksから得ている。

辞書ボックスには翻訳機能もあり、60か国語に対応している。ただし、文例は翻訳してくれない。

クェリは今でも手書き入力する人が圧倒的に多いと思うが、音声で“What’s the definition of fortuitous?”とか“What are synonyms for fortuitous?”のようにクェリしてもよい。結果も、音声で出る。

前と同じく、マイクロフォンボタンをタップすると、その単語の発音が聴ける。

これらの新しい辞書定義機能は、デスクトップとモバイルで利用できる。最初は例によって合衆国とイギリスだけだが、そのほかの国と言語に関しては提供開始の明確なスケジュールがまだないようだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


Google検索がパーソナルになった。自分のフライト情報、レストラン予約、写真、等々が検索可能に(ただし米国のみ)

Googleは今日(米国時間8/14)、検索で個人的情報を見つけやすくする新機能を発表した。同検索エンジンは、次のフライト(「私のフライトは定刻に出発するのか?」)やホテル、OpenTableの予約、荷物の配達(「私の荷物はいつ届くのか?」)、買ったもの、予定などの情報を探してくれる。Google+と同じように、通常のGoogle検索を使って自分の写真を「海辺での自分の写真を検索」等のクエリで見つけることができるようになった。

これらの機能はすべて「オプトアウト」で、米国で英語を使っている全ユーザーに今後数日間のうちに提供される。Google Glassを除く全プラットフォームで利用可能で、もちろん音声認識も利用できる。

Gmailの検索フィールドのトライアルGoogle Nowを使っている人は、この数ヶ月間に、検索でこれらのカードがポップアップしたのを見たことがあるだろう。Googleの広報担当者が私に話したところによると、今日公開された新機能はGmailの検索フィールドトライアルの一部であり、トライアルは今後も最新機能に触れたい人たちのための実験台として続けられる。いずれはフィールドトライアル機能の多くをGoogle検索に取り込む計画だ。

写真(以前はGoogle+でのみ利用可能でアップロードした写真を分析する)を除き、Googleはこの情報をすべてGmailの受信メールから取得する。

プライバシーの懸念やこうした情報の繊細さを踏まえると、Googleが本機能をオプトアウトにした決断は興味深い。Googleが指摘するように、個人情報はすべて暗号化されて通信され、Googleにログインしている時のみ表示される。いつでも完全に遮断するか(検索設定に新たに「プライベートな検索結果」セクションが追加された)、検索結果ページの地球儀アイコンをクリックしてセッションごとにオフにすることができる。

Googleが答えられるようになった質問のリストはここにある。以下にいくつか例を示す。

  • フライト:“Is my flight on time?” と質問すれば、これから乗るフライトの最新情報がわかる。
  • 予約:“my reservations” でディナーの予定を見たり、“my hotel” でホテルの名前と住所が得られる。ワンクリックで、車や公共交通の経路が表示されるので何ステップも節約できる。
  • 買い物:“my purchases” で現在注文してある商品の配達状況がわかるので、ママへのプレゼントが予定通り届くかどうかを確認できる。
  • 予定:“What are my plans for tomorrow?” で、明日のフライト、ホテル、レストラン、イベントの予定が表示される — 旅行中に非常に便利な機能だ。
  • 写真:“Show me my photos from Thailand”と打てば、Google+にアップロードした写真を見られる。さらには、“my photos of sunsets” とすれば、過去何年かに撮影した自慢の夕暮れの写真を探してくれる。

Google担当者が私に語ったところによると、質問の認識はかなり柔軟性が高く、これらのクエリは新機能を確実に使用するが、類似の言い回しを使うこともできる。

原文へ


Google、検索結果にカレンダーからの検索内容も表示する機能を追加(フィールドトライアル利用者向け)

gmail_search_field_trialGoogleからのアナウンスによるとGmailおよびGoogle.comでのフィールドトライアルに参加する利用者について、Googleの検索結果ページに、自分のカレンダーからの検索結果なども表示するようにしたのだそうだ。[what is on my calendar today]や[when am i meeting rip]などといった検索ができるようになる。

ちなみに、フィールドトライアル自体はしばらく前から行なっているものだ。検索にパーソナライズしたものも表示したいと考えている人は誰でも参加できるようになっている。

Googleは最近、トライアルの参加者に対して直近のフライト予定やレストランないしホテルの予約情報、イベント情報なども表示するようにしている。これはGmailの受信箱を検索して、OpenTable、Ticketmaster、Eventbriteなどからのメール情報を検索結果に表示していたわけだ。こうした情報の一部は、Google Nowでも利用されているものだ。

Google Search部門のシニア・バイスプレジデントであるAmit Singhalによると、そもそも最も必要な情報というのは公開ウェブの検索からは得られず、メールなどの情報もあわせて検索する必要があることも多いということが、このフィールドトライアルをスタートするきっかけとなったようだ。

こうした機能を一般向けに公開するのではなく、「フィールドトライアル」といった形で出してくるのは当然のことだろう。すなわち、機能の実現にあたってはGmailの受信箱やカレンダーを検索して、それをGoogle.comサイト上に表示するという処理が必要になる。利用者のプライベートな情報を検索して利用するということに不快感を感じる利用者もいるからだ。

ちなみに今回の機能追加も含め、フィールドトライアルは現在アメリカ国内で英語モードで利用している、gmail.comのアドレスを所有している人が対象だ。尚、Google Apps内の情報については今回の追加オプション機能は適用されない。

google_search_field_trial_calendar

原文へ

(翻訳:Maeda, H)