オンラインショップ向けのパーソナライゼーション・ツールDynamic Yieldが2200万ドルを調達

recommendations

ショップのWebサイトなどを顧客別にパーソナライズすることができるツールのDynamic Yieldは現地時間20日、シリーズCで2200万ドルを調達したと発表した。

CEOのLiad Agmonによれば、彼がDynamic Yieldを2011年に立ち上げた理由は、既存のパーソナライゼーション・ツールは「さまざまな問題に対して個別のソリューションを提供する」ものが多かったからだという。

一方、Dynamic Yieldではあらゆる問題に対処できる総合ツールを提供している。このツールが提供する機能には、A/Bテスト、メッセージング、パーソナライズされた商品リコメンデーション、そして、モバイルアプリやモバイルWeb、Eメール、オンライン広告などから取得したデータによって「顧客情報を全方位から把握できる」機能などがある。

一見ささいに思えることであっても、それを顧客ごとにパーソナライズすることで収益を増加させることができるとAgmonは話す。彼が私に見せてくれた例では、Webサイトのヘッダー画像を顧客の性別にあわせて入れ替えるだけでショップの収益が増加したことが分かる ― 彼が言うように、「1回目のデートと同じで、第一印象が重要だ」ということだ。

Dynamic Yieldによれば、Eコマース、メディア、ゲーミング、旅行業界が同社の主要顧客だ。Under Armour、Rolling Stone、Sephora、CWなどが同社のツールを利用している。それらの顧客企業が抱えるユーザーは5億人を超すという。

本調達ラウンドを合わせ、同社がこれまでに調達した金額は合計で3600万ドル以上である。このラウンドでリード投資家を務めたのはVertexとClalTechだ。その他にも、新規投資家のBaidu、Global Founders Capital、そして既存投資家のBessemer Venture Partners、Marker LLP、Innovation Endevorsなども本ラウンドに参加している。また、Vertexに所属するAviad Arielと、ClalTechに所属するDaniel Shinarの2名がDynamic Yieldの取締役に就任する予定だ。

Baiduの資本参加は特筆すべき点だろう。これについてAgmonは、今回のラウンドによってBaiduとDynamic Yieldの関係がより一層深まったと話している ― 結局のところ、パーソナライズされたWeb体験を提供することでオンライン広告の効果がより高まるということだ。

「近年、Web、モバイル、そしてEメールのパーソナライゼーションはマーケッターにとって欠かせない武器となっています」。そう語るのは、Baidu USAのバイスプレジデント兼ジェネラル・マネージャーであるAlex Chengだ。「トラフィック獲得は重要である一方で、顧客は商品を購入する前にその商品のことを調べ、さまざまなインターフェイスを通してブランドとの交流を深めています。それゆえに、Webとモバイルにおけるシームレスで包括的なカスタマー・エクスペリエンスこそが、ビジネスのROIを左右する重要な要素となっているのです。私たちはDynamic Yieldが創りあげたテクノロジーに感銘を受けており、同社のプラットフォームはすべての広告主にメリットを与えるものだと信じています」。

[原文]

(翻訳: 木村 拓哉 /Website /Facebook /Twitter

人工知能に潜む5つのバイアス

robot-blinders-alt

【編集部注】著者のKristian HammondはNarrative ScienceでR&Dに従事する主任科学者兼共同創業者である。Krisはまた、ノースウェスタン大学のコンピュータサイエンスの教授でもある。

私たちは何かと、マシン、特にスマートマシンを、冷静に計算しバイアス(偏り、偏見)がないものと考える傾向がある。私たちは、自動運転車は、運転手と無作為な歩行者の間の生死の決定に対して、好みを持っていないと考えている。また私たちは、信用調査を実施するスマートシステムは、収入やFICOスコアなどの真にインパクトのある指標以外は無視しているものと信頼している。そして私たちは、学習システムは、バイアスのないアルゴリズムによって動作しているのだから、常に真理に基づいた地点に達するものだと考えている。

機械の厳格な視点の外側は感情的であるはずはないと考える人もいる。また機械は人間のバイアスから自由であるはずだと思う人もいる。そしてその中間として、機械は客観的だという見方がある。

もちろん、そんなことは全くない。現実には、純粋にバイアスのない知的システムは非常に少ないだけでなく、バイアスにも複数の源泉がある。これらのバイアス源には、システムを訓練するために使用するデータバイアス、「現場」でのインタラクションを介したバイアス、偏向出現バイアス、類似性バイアス、そして相反する目標に対するバイアスが挙げられる。これらの源泉のほとんどは意識されることがない。しかし、インテリジェントシステムを構築して展開する際には、意識しながら設計し、可能なら潜在的な問題を避けるためにも、そうしたバイアス源を理解することが不可欠だ。

データ駆動型バイアス

自ら学習するシステムの場合、出力は受け取ったデータによって決まる。これは別に新しい洞察ではなく、文字通り何100万ものデータによって駆動されるシステムを私たちが見る際に、忘れられがちなことである。圧倒的な量のデータは、任意の人間のバイアスを圧倒するだろうというのがこれまでの考えだった。しかしトレーニングセット自身が歪んでいたときには、結果も同じように歪んでしまうのだ。

最近では、この種のバイアスは、ディープラーニング通した画像認識システムに見ることができる。ニコンのアジア人の顔に対する混乱や、HPの顔認識ソフトウェアにおける肌色認識の問題といったものは、どちらも歪んだトレーニングセットからの学習の産物であるように思える。どちらも修正可能であり、かつ意図的ではないが、これらはデータのバイアスに注意を払わない場合に発生する可能性のある問題を示している。

顔認識以外にも、現実世界に影響を及ぼす厄介な例が他にもある。仮釈放者、犯罪パターン、または従業員候補者の再犯率の予測のためのルールセットを構築するために使用される学習システムは、潜在的に負の影響を与える。歪んだデータを用いてトレーニングを受けた場合、あるいはデータはバランスが取れていても意思決定にバイアスがかかっていた場合には、バイアスも永続化する。

インタラクションを介したバイアス

サンプルセットを一括して調べて学習するシステムもある一方で、インタラクションを通じて学習する種類のシステムも存在する。この場合には、システムとインタラクションを行うユーザーのバイアスによって、システムのバイアスが引き起こされる。このバイアスの顕著な例は、ユーザーとのやりとりから学ぶように設計されたTwitterベースのチャットボットであるMicrosoftのTayだ。残念なことにTayは、Tayに人種差別主義者と女性差別を教え込んだユーザコミュニティの影響を受けた。要約して言えば、コミュニティはTayに対して攻撃的な発言を繰り返しツイートし、その結果、Tayはそれらの攻撃的発言を反応のための材料として使うようになったのだ。

Tayがひとかどの人種差別主義者になって、Microsoftがシャットダウンするまでには、わずか24時間しかかからなかった。Tayの人種差別的暴言はTwitterの中に限られていたが、それは実世界への影響の可能性を示唆しているものだ。人間のパートナーと共同で意思決定を行い、そして学ぶインテリジェントなシステムを構築する際には、更に問題のある状況で、同様に悪いトレーニング問題が発生する可能性がある。

ではその代わりに、インテリジェントなシステムに、時間をかけて指導する人たちとパートナーシップを結ばせればどうだろうか?融資の可否を決定する、あるいは仮釈放の可否を決定するマシンに対する、私たちの不信を考えて欲しい。Tayが教えてくれたことは、そのようなシステムが、それらを訓練する人々の意見を反映して、良くも悪くも、その環境と人びとの偏見を学ぶことである。

偏向出現バイアス

ときには、パーソナライゼーションを目的としたシステムによる意思決定が、私たちの周りにバイアスの「バブル」を作り出すことがある。このバイアスが働いている様子を見るためには、現在のFacebook以上に相応しい場所はない。Facebookのトップページで、ユーザーは友人たちの投稿を見て、彼らと情報を共有することができる。

残念ながら、データフィードの分析を使用して他のコンテンツを提示するアルゴリズムは、ユーザーが既に見た好みのセットに一致するコンテンツを提供する。この効果は、ユーザーがコンテンツを開いたり、 「いいね!」したり、共有したりするにつれて増幅される。その結果得られるのは、ユーザが既に「信じていること」に向かって歪められた情報の流れである。

それは確かにパーソナライズされ、しばしば安心もさせるものだが、それはもはや私たちがニュースと考えるようなものではない。これは情報のバブルであり、「確証バイアス」(仮説や信念を検証する際にそれを補強する情報ばかりを集め、それに反する情報を無視または集めようとしない傾向)のアルゴリズムバージョンなのだ。システムが自動的にそれを実行してくれるので、ユーザは自分の信念と矛盾する情報から自分で身を守る必要はない。

理想的な世界では、インテリジェントなシステムとそのアルゴリズムは客観的なものだろう

ニュースの世界に対しては、こうした情報のバイアスの影響は厄介だ。しかし、企業における意思決定を支援する方法としてソーシャルメディアモデルを考えた場合、情報バブルの出現をサポートするシステムは、私たちの思考を歪める可能性がある。自分のように考える人々からの情報しか得ていないナレッジワーカーは、対照的な視点を決して見ることはなく、選択肢は無視して拒否する傾向がある。

類似性バイアス

時にバイアスは、単に設計されたように動作するシステムの生産物そのものである。例えばGoogleニュースは、ユーザーの問い合わせに合致するストーリーを、関連するストーリーとセットで提供するように設計されている。これはまさに設計された通りの結果で、とても上手く働いている。もちろん、得られた結果は、お互いの確認と裏付けをする傾向のある、類似したストーリーのセットになる。つまり、Facebookで見たパーソナライズバブルと似ている、情報のバブルを得ることになる。

ここには確かにこのモデルによって強調される、ニュースの役割とその拡散に関連する問題が存在している — 最も明白な問題は情報へのバランスのとれたアプローチだ。「編集制御」の不在は、幅広い状況を調べることになる。類似性は、情報の世界では強力なメトリクスだが、それは決して唯一のものではない。異なる視点は、意思決定のための強力なサポートを提供する。問い合わせや既存の文書に「類似する」結果しか提供しない情報システムは、独自のバブルを生成する。

例えイノベーションと創造の視点に対する、縮小、反対、矛盾であっても、類似性バイアスは、特に企業では受け入れられる傾向にあるものの一つだ。

相反する目標バイアス

時には、特定のビジネス目的のために設計されたシステムが、全く予期されなかったバイアスを持つことがある。

たとえば、求職者に対して仕事の説明を提供するように設計されたシステムを想像してみて欲しい。ユーザーが仕事の説明をクリックすると、システムによって収益が発生する。当然、アルゴリズムの目標は、最高のクリック数を得るジョブ記述を提供することになる。

結局のところ、人びとは自分のセルフイメージに合った仕事をクリックする傾向があり、そのイメージは単に選択肢を示すだけでステレオタイプの方向に強化することができる。例えば、「看護」と「医療技術者」というラベルが付けられた仕事を提示された女性は、最初の方に向かう傾向がある。仕事が彼らのために最適という理由ではなく、ステレオタイプがイメージされて、自分自身をそのイメージに重ねるからである。

ステレオタイプの脅威が行動に及ぼす影響は、仕事に結びついたステレオタイプ(例えば、性別、人種、民族)に関する個人の知識に合致する仕事の提示が、より多くのクリックに結びつくことである。その結果、クリックスルーの行動に基づく学習コンポーネントを持つサイトは、ステレオタイプをより強化する機会を提示する方向に変化する傾向がある。

マシンのバイアスは人間のバイアスだ

理想的な世界では、インテリジェントなシステムとそのアルゴリズムは客観的なものだろう。残念なことに、これらのシステムは私たちによって構築され、その結果、私たちのバイアスを反映してしまう。バイアス自体と問題の源泉を理解することで、わたしたちはシステムを積極的に設計してバイアスを回避することができる。

おそらく、完全に客観的なシステムやツールを作成することはできないだろう、しかしそれらは、少なくとも私たち自身よりはバイアスが少なくなるだろう。そうなれば、おそらく選挙が私たちに不意打ちを食らわすこともないだろうし、通貨はクラッシュしないだろうし、パーソナライズされたニュースのバブルの外の人たちと、コミュニケーションを行うことができるだろう。

[ 原文へ ]
(翻訳:Sako)

セマンティックとナレッジグラフが変える検索の未来

単純なウェブ検索で始まったGoogleもデバイスの多様化か検索サービス利用シーンの増加、そしてソーシャルメディア上の様々な情報を取り入れて急激に進化を遂げつつあります。今回はそんなGoogleの検索サービスの進化をナレッジグラフに代表される検索に影響を与える要素と交えて深く掘り下げてみた大変興味深い記事をサーチエンジンランドから紹介します。検索マーケッターに限らず、未来のウェブを知る上で誰でも読んでみたい内容です。 — SEO Japan

様々なサービスが、ナレッジグラフのようなアセットを持っているが、その中でも、グーグルは、ナレッジグラフの検索を巧みに活用している。ナレッジグラフがSERPを変えていくにつれ、グーグルは、セマンティックテクノロジーの採用を進め、徐々にリンクをベースとした従来のSERPを置き変えつつある。検索業界をリードする同社は、未来の検索を導く役割を担っているのだ。

グーグルナウが良い例である。グーグルナウは、シリの目的を果たしており、また、シリが生まれたDARPA PALプログラムに近い。現在、アップルはシリに対する取り組みをステップアップさせており、先週行われたワールドワイド・ディベロッパーズ・カンファレンスで、シリに新たに男性と女性の声が加わった点、ツイッター検索が統合された点、ウィキペディアが組み込まれた点、そして、ビングのウェブ検索がアプリに導入された点を発表していた。グーグルが進む方向に、その他の企業も進んでいくのだ。

ナレッジカルーセル

最近、グーグルは、ナレッジカルーセルを始めとする、付随する検索および関連する検索、想定した答え、新しいタイプの情報カード等、視覚的な情報の表示の形式に関して、多くの実験を積極的に行い、ユーザーエンゲージメントをテストしている。例えば、グーグルは、先日、ローカル検索向けのナレッジグラフカルーセルをリリースしていた。さらに、ナレッジグラフを拡大して、1000を超える食品に栄養素の情報を加えている。グーグルが指摘していたように、これはほんの序の口である。

Enhanced Knowledge Crousel-TTDISD

面白いことに、「ナレッジグラフ」は商標化されていない。ビングは、「スナップショット」(現在はサファリに拡大されている)、フェイスブックは、エンティティグラフ、そして、ヤフー!は「ヤフー!ナレッジグラフ」を持っている。この専門的なフレーズは急速に普及しつつある。

グーグルナウは、ナレッジグラフを効果的に活用しており、ユーザーに対して、検索の質問への具体的な答えを提供している。「OK、グーグル」と伝え、質問を投げ掛けるだけでいい。グーグルナウは、リアルタイムで質問に対する答えを提供する「スタートレック」のコンピュータに急速に肉薄している。グーグルナウの機能は素晴らしく、また、その進化と発展を目にするだけでワクワクする。

セマンティックテクノロジーを採用する検索

このグラフ検索 – セマンティックウェブのような人工知能タイプのアプリによって提供される答えは、どのくらい現在の検索に影響を与えているのだろうか?また、意図したオーディエンスが、情報を「発見することが出来る」ようにするには、情報をどのように形式化すればいいのだろうか?

基本的に答えはシンプルである。この複雑なテクノロジー、そして、SemTechBizで、グーグルがウェブ上でアイテムをランク付けするために用いているメカニズムが議題に上った際に、グーグルのジェイソン・ダグラスが言及した、216点の奇妙な“シグナル”を理解すればいい。この答えは、SEOのアナリストにとって、別の疑問を提起することになる – 自分の会社、または、代理でSEOを行っている会社を、ナレッジグラフに反映させるにはどうすればいいのか?

控えめに言ってもこれは割と面倒なタスクである。そのため、誰でも理解することが出来るメトリクスを見ていこう。まず、キーワードよりも、コンセプトやエンティティが優先されつつある。信じ難いだろうか?以下に比較的新しいグーグルトレンドのトップチャートを掲載する。このチャートは、現在、(キーワードではなく)エンティティによってグループ分けされている。

Top Charts

このエンティティは、Dbpediaとフリーベースとして始まった、グーグルのナレッジグラフから引き出されている。この2つのサービスは、セマンティックウェブコミュニティによって管理されている、リンクトデータ(リンクが張られたデータ)のクラウドの中心に存在し、また、schema.orgのエンティティのインスタンスを用いて拡大されている。

2011年版のリンクトデータクラウドのイメージを以下に掲載する(参照資料と共に)。ご覧のようにDBPediaが中心に陣取っている(DBPediaは、恐らく、ウィキデータに取って代わると考えられている)。この図表は、若干古いが、情報を通して過去を振り返ってみると、このテクノロジーの爆発的な成長が色濃く表れていることが分かる。

検索エンジンは、このリンクが張られた、構造化されたデータを、例えば、魅力的で視覚的な各種フォーマットを介して、表示を改善するため、クエリに直接答えを出すため、娯楽等の領域におけるファインダビリティに改善するため等、多くの方法で活用することが出来る。これは、取り込まれた、もしくは、有効な認証済みの構造化データにおいて、直接的な検索を活用することで、魅力的なユーザーエクスペリエンスを生み出すために用いられるメカニズムの一部に過ぎない。

イベントやエンターテイメント等のカテゴリから、グーグルショッピングやeコマース自体に至るまで、ユーザーのインタラクションやエンゲージメントの増加のために、このようなエンティティグラフを活用する考えは、ますます拡大を続け、また、検索エンジンに利用されていくだろう。グーグルでトレンドになっている別のセクションを取り上げた画像を以下に経済する。今回、私は「shopping」の選択肢を採用した。

Top Trends Shopping Ecommerce

また、会社のページ、または、会社のエンティティ(さらには、グーグルナウを完全に活用したいなら、個人においても)で、グーグル+を活用することがますます重要になりつつある。

グーグル+もまたグーグルが活用する優れたメカニズムである。このソーシャルネットワークを利用しない状態では、ナレッジグラフでビジビリティを確立することは、事実上不可能である。

「検索」する行為よりも「見つける」行為が重要視されている点は明白である。昔の10本の青いリンクが提供される検索は、フラストレーションの溜まる作業になるが、代わりに、自分専用のアシスタントが、個人のコンピュータ(スマートフォン)として、どこまでもついてきてくれる贅沢を考えると、思わずワクワクする。この問題は、解決されたわけではないが、徐々に解決に近づきつつある。

しかし、検索結果での、個人的な答え(グーグルナウでは、カードとして提供される)、そして、グーグルナウ経由の情報の提示は、それぞれのユーザーに合わせて行われるため、ある程度ユーザーに犠牲を強いることになる。スマートフォンが、持ち運ぶセンサーとして、様々な役割を果たし、多くのアクティビティ/行動を記録する点を忘れないでもらいたい(このデータは、後に適切な情報を、適切なタイミングで提供するために用いられる可能性がある)。

個人的には、メリットはリスクを大幅に上回り、また、素晴らしい時代になったと思う(例えば、私は方向音痴であり、見知らぬ土地では、コンピュータのナビに依存している)。しかし、とりわけPRISMのリーク問題の後、プライバシーの侵害を警戒する人達が現れていることも事実である。

検索ではグラフの右に出る者はなし

大規模なソーシャルエンジンや通常の検索エンジンは、ソーシャルネットワークの形式であれ、ナレジグラフであれ、エンティティグラフであれ、関連するエンティティ等のグラフを用意している。グラフはユビキタスであり、大抵、ビッグデータとグラフ分析に関して、多くの興味深い分析データのベースを構築している。

SEOの観点から考えると、検索エンジンが、内部の構造化されたナレッジグラフとして取り入れ、その後、好みに合わせて問い合せを行うことが可能な、HTMLまたは構造化マークアップの“作成”については、議論の余地が多く残されていると思う。しかし、例えば、グラフのデータベースに問い合せを行い、ユーザーのクエリに対する答えを生成するため、セマンティックウェブクエリ言語(SPARQL(リレーショナルデータベースに対するSQLに似ている)を利用するアプローチが存在する点は、注目に値する。

SemTechBizカンファレンスで、ヤフー!のナレッジグラフが話題に上がった時、ヤフー!のエンティティグラフのトピックが、次の順序で表れることが明らかになった: ニュース、ファイナンス、スポーツ等。スナップショットを持つビングは、リンクトインを売りにしており、よりソーシャルな色が濃い。リンクトイン自体が、ユーザー自身のネットワークのグラフを閲覧する優れた手段を用意している。そこで、私のリンクトインのグラフの例を作ってみた(自分のグラフを見たいなら、ここをクリック)。.

Linkedin Graph

ハッシュタグ & トピックベースの検索

ハッシュタグは、どのトピックベースの検索が役に立つのか、そして、どのリンクトデータが引き出されるのかを把握する上で、注目を集め始めている。グーグルは、以前、グーグル+でのハッシュタグのオートコンプリート機能の発表を行っていた。また、先日のI/Oカンファレンスでは、グーグル+の投稿が、自動的に分類されるトップ3のハッシュタグでタグ付けされると新たに発表していた。フェイスブックもまた、2013年6月12日に、ハッシュタグを加えて、公開されている会話の整理を促すと発表している。

従って、ハッシュタグもまたユビキタス化している – ツイッター、ピンタレスト、グーグル+等々。リンクトデータとハッシュタグ、そして、自動的にアノテーションを付ける、セマンティックウェブの関係を詳しく知りたい方はここをクリックしよう。

現実の難題に話を戻す。自分の会社、または、SEOの取り組みを代理で行っている会社を、ナレッジグラフに掲載してもらうには、どうすればいいのだろうか?適切なマークアップとschema/エンティティおよびアトリビュートをサイトに用意している点をどのように確認すればいいのだろうか?

グーグルはマークアップの利用を求めている

グーグルは、マークアップをサイトに加える方針を大きくプッシュしている。最近の取り組みの例を幾つか紹介していくが、この点からも、グーグルが構造化マークアップを積極的に求めており、有益で信頼に値するナレッジグラフを拡大すようとする姿勢が窺える。

structured markup helper recent tools

また、グーグルが、構造化マークアップ、そして、ナレッジグラフの領域に関連すると考えている情報にも注意してもらいたい。

Related Information

上の画像にリストアップされているように、構造化マークアップに関連するアイテムとして、次のアイテムが挙げられている:

  • マイクロデータ
  • グーグルの基礎(そのまま)
  • グーグル+のページ
  • リッチスニペット
  • サイトマップ

重要なポイント

このトピックに関しては、もっと徹底した調査が必要だが、以下に重要なポイントを挙げていく:

  • ページが適切にマークアップされている点、そして、適切なエンティティを活用している点を確認する。
  • グーグルやセマンティックウェブコミュニティ等が提供する適切なリソースに真剣に目を通し、活用する。
  • セマンティックウェブの会合やSEOの会合は基本的に無料であり、様々な地域で開催されている。meetup.comにアクセスし、「Semantic Web」と入力しよう。

リソースに余裕があるなら、セマンティックウェブおよびSEOのエキスパート、あるいは、専門家が作ったツールを採用して、ナレッジグラフおよび検索エンジンでのビジビリティを確保する。

この記事の中で述べられている意見はゲストライターの意見であり、必ずしもサーチ・エンジン・ランドを代表しているわけではない。


この記事は、Search Engine Landに掲載された「Search, Answers & Knowledge Graphs Galore」を翻訳した内容です。

未来というか既に現実の話でもあったわけですが、しかしGoogle検索もいよいよ本格的にキーワードではなくエンティティ(日本語で書くと意味不明になるので、テーマやジャンルというイメージの方がわかりやすいかもです)レベルでセマンティック化しつつあるようです。キーワード単位で考えるSEOの時代は終わり、、、というわけではないと思いますが、検索エンジンが大きく変化していくのに合わせて検索マーケッターもその変化に対応していく必要はありそうですね。 — SEO Japan [G+]