ディープラーニングと検索エンジン最適化の新たな時代

thinker


編集部記:Nathan Sikesは、Crunch Networkのコントリビューターである。
Nathan Sikesは、
FoxtailmarketingのプロダクトのVPを務め、実践的なSEOとデジタルマーケテイング手法の調査と導入に注力している。

ディープラーニング、あるいは深層構造ラーニングのコンセプトは、ここ数ヶ月で頻繁に話題に上るようになった。世界に名だたる複数の大手検索関連企業がこの分野に力を入れ、進歩が見られるからだ。Google、Facebook、MicrosoftにBaidu(中国の検索エンジン)は、このテクノロジーに投資することでアプリケーションの進化を加速し、更には比較的新しい人工知能(AI)技術の活用も進んでいる。

この記事では、ディープラーニング技術とそれが今日のオンライン世界における検索エンジン最適化(SEO)にどのような影響を及ぼすかについて述べたい。ディープラーニングとは何か、そしてその歴史を簡単に振り返り、AI技術で私たちの身の回りのデジタル世界を創造し、より良くしようとしている主要プレイヤーの動きを見ていこうと思う。

本物の人工知能を探し求めて

ディープラーニングの影響を本当に理解するには、それが何であり、どこから来たかを知る必要があるだろう。ディープラーニングの起源を一つの場所や人に特定することはできないが、この分野に詳しい人なら、現代ディープラーニングの父はGeoffrey Hintonであると同意するだろう。現在彼は、Googleとトロント大学で活動している。Hintonは、1980年代にBackpropagation の開発に貢献し、最近ではNeural Computation and Adaptive Perception Program(ニューラルコンピューティングと適応知覚プログラム)で研究し、変化を求めていた分野を点火することとなった。「過去2、30年間Hintonは、ニューラルネットワークとディープラーニングの最前線を牽引してきました」とKai Yuは話す。彼は、Baiduのディープラーニング研究機関でディレクターを務めている。「私たちはこのような早いスピードで市場に影響を与える機械学習や人工知能を経験したことがありません。驚くべきことです」と続けた。

多くの企業はディープラーニングがこれからの時代を形作ると捉えている。また、この新しい商業サイエンスを有効に活用するのに多額の資金やリソースも必要ないことを知っている。

Hintonの功績は、現在人工ニューラルネットワークとディープラーニングの研究に取り組んでいるほとんどの大手企業に見ることができる。現在Facebookで働くYann LeCunは、1980年代にHintonと共にBackpropagationを開発していた。Baiduのチーフサイエンティストを務めるAndrew Ngは、GoogleのDeep Learning Projectを立ち上げ、Hintonとそこで何年も共に働いた。これら数人のエンジニアは、それぞれ競合する企業で働いているが、力を注いで追い求めているものは同じだ。本物の行動学習をする人工知能の開発だ。

10年以上前、ビジネスの世界はディープラーニングの分野に背を向けた。チップの処理能力の限界と人工ニューラルネットワークで用いるデータセットは、Hintonと彼の同士が掲げた仮説を実行不可能なものとし、時代が追い付いていなかった。

2015年に先送りすると、ポテンシャルのあるアプリケーションで溢れる全く新しい環境がある。これに気がついたのは何も大手企業だけではない。Clarifaiのような小さな組織も、拡張された学習能力を広告やコンテンツのキュレーションのための調整やフィルタリングに使用している。他にもMoz(SEO企業)のような企業も、カスタマーにより優れたプロダクトとサービスを提供するこの技術が、これからの時代を形作ると捉えている。「Mozのような企業も機械学習技術を部分的に一定のレベルは使用しています。ディープラーニングは全く活用していませんし、多くのニューラルネットワークの技術も使用していません。しかしその方向に向かうことはあると思います」とMozのブログでRand Fishkinは説明している。

多くの企業はディープラーニングがこれから時代を形作ると捉えている。また、この新しい商業サイエンスを有効に活用するのに多額の資金やリソースも必要ないことを知っている。IBMのWatson Analyticsは、500MBまでアップロードでき、ディープラーニング用のリアルタイムのアプリケーションを無料で試すことができるフリーミアムサービスを提供している。Google Adwordsや他の販売に関連する数値をツールに入力することで、スタートアップ企業でも、データの中に関連性や予測するのに役立つ情報が得られるだろう。Watson Analytics以外にも、他社が開発していて、活用しているテクノロジーを見てみよう。

Google Research:Googleは、Forbesの「2015年、最も価値あるブランド企業」のリストの三位に入った。ただ、誰もが彼らは検索で一位であることに異論はないだろう。Googleは、この10年で機械学習能力で多くの進化を果たした。彼らは、画像、動画、言語の理解を深めるための開発に力を入れている。

Googleは調査、買収(2014年に買収したDeepMindなど)やImagenet Large Scale Visual Recognition Challenge(単語と画像を紐付けるデータベース)とのパートナーシップなどを通して、ディープラーニングの新しい分野での検証と適応に注力してきた。最近Googleは、初めて見る画像を説明するためのキャプションを自動で付ける機能を公表した。Googleの検索アルゴリズムにこのような画像認識と検索機能が実装された場合を想像してみよう。

そんなに遠い未来のことではないだろう。Geoffrey Hintonは、Redditの「Ask Me Anything(何でも聞いて)」のセッションで「次の5年で最も面白い分野は動画とテキストの内容の理解だと思います。次の5年内に、例えばYouTubeの動画から、何が起きている内容かを説明する機能が出来ていなければ、がっかりします」と説明している。

Facebook FAIR:世界で最も人気のSNSは、検索でも強いプレイヤーに成長した。今後もこの分野においてマーケットシェアを拡大していくだろう。Facebook AI Research (FAIR)はFacebookが人工知能とディープラーニングを未来のソーシャル、購買活動とメディアへの応用に注力していることを表すものだ。事実、彼らの顔認識ソフトウェア、Torch(ディープラーニングのための開発環境)のオープンソースモジュールへの貢献、最近ではMike Schroepfer (FacebookのCIO) がFacebook AIが 動画内の登場人物の動きを認識できるようになったことを発表したことを考えると、Facebookは、ディープラーニングによる学習能力を最も活用している企業であると言えるかもしれない。

Microsoft Project Oxford:最近発表したhow-old.netの顔認証プロジェクトで Microsoftの技術を多くの人が知ることとなった。しかしほとんどの人はこのプロジェクトは、Microsoftの機械学習研究チームによって製作されたことを知らない。Microsoftのブログによると「数人の開発者が、ウェブページと機械学習APIを統合し、リアルタイムでアナリティクスをストリームするこのソリューションを全て構築するのに、一日しかからなかった」と伝えた。これは始まりに過ぎない。このようなプロジェクトの他にも、近い内にProject OxfordとCortana(Microsoftの「パーソナルアシスタント」)がWindows 10とInternet Explorerの代替ソフトであるEdgeに実装されるだろう。

WolframAlpha:WolframAlphaは抜群の知名度があるとは(まだ)言えないが、ここ数年の人工知能の分野の有力なプレイヤーである。彼らの究極の目標は、何もかもコンピュターで処理できるようにすることだ。まずは、専門的な知識と能力が要求される分野に注力している。彼らは最近、画像認識、新たな問題の作成、言語認識と更にはFacebookの分析まで開発対象を拡大した。

何故これが重要なのか?

もし人工知能が検索に統合されたらどうなるかと想像する時期を超え、それがいつ行われるかという時期に到達した。上記の企業は、それの実現に向けて業界を引っ張っている。これらの情報を鑑みた上で、ディープラーニングが次の5年間で検索にどのような影響を及ぼすのだろうかという予想をいくつか記載する。

新しいSEOの基準:あなたがオンラインのマーケターでこれらの技術に心躍らないのなら、この分野はあなたに合っていないのかもしれない。このタイプの人工知能を搭載した検索エンジンで、マーケターは画像優位のSNS、動画共有サイト、スライドでのプレゼンテーションプラットフォームといった新しいチャネルを有効に使うことができるようになる。また、検索者に役立つ画像や動画を提供し「信頼」を得ることもできるだろう。

画像でカスタマーのイマジネーションを喚起したり、注意を引くことが今後更に重要になってくると、検索を用いる企業は気が付いている。

スパムサイトの死:Googleは長い間スパムサイトとの戦いを繰り広げてきた。スパム手法を用いるサイトのランキングを下げるための専用アルゴリズム Penguinまで開発した。私の予想では、姑息なリダイレクト、中身が薄く価値の無いスパム手法を用いるウェブサイトは大幅に減少すると考えている。これにより、より安全で整ったウェブが出現するだろう。

デバイスとの連携の改善:Googleのモバイルゲドンのアップデートが、このタイプのアップデートの最後ではないはずだ。Facebook(Oculus)、Microsoft(Hololens)のような企業が仮想現実のヘッドセットを押し出すのなら、どのような端末にどのようなウェブサイトを表示させるべきか学習し優先順位を付けることができる、賢い検索エンジンが必要になる。

隠れ場所がなくなる:検索エンジンの企業の人工知能が賢くなり完璧に近づくほど、ユーザーをトラックする機能も高まるだろう。Verizon、AT&TやFacebookが最近リリースした、次世代の「スーパークッキー」のような技術が誕生し、オンラインでユーザーが隠れることが困難になる。

画像コンテンツの重要性が増す:ミレニアル世代は、彼らより上の世代より遥かに広告を見ない。 Simply Measured(ソーシャルメディアのアナリティクス企業)によると、Facebook上の全てのブランド投稿の62%、エンゲージメントの投稿の77%は写真だった。通常のテキストだけの投稿は少ない。更にHubspotの調査では、魅力的な画像要素とグラフィックスをブログ投稿やソーシャルメディアのコンテンツに加えることで、最大94%の閲覧数の増加と37%のエンゲージメントの増加が得られるそうだ。

画像でカスタマーのイマジネーションを喚起したり、注意を引くことが今後更に重要になってくると、検索を用いる企業は気が付いている。そのようなコンテンツが近い内に優先されるようになるだろう。

[原文へ]

(翻訳:Nozomi Okuma /Website/ twitter

画像:NeydtStock/Shutterstock

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。