AppleのSiriがアメリカと世界のプロ野球雑学博士になった

485131631_4705a29f2c_b

プロ野球の今年のシーズンの開幕に合わせて、Appleは野球のデータや雑学知識をたっぷりとSiriの脳に詰め込んだ。

そこで今のSiriはベーブルースの生涯打率を知ってるし、2008年の、フィリーズが優勝したワールドシリーズのときのラインナップだけでなく、なんと1934年のワールドシリーズについても知ってる。

Siriは、全世界の29のプロ野球リーグについても勉強した。今ではMLBだけでなく、Cape Cod LeagueやNippon Pro Baseball(日本野球機構)のことも質問できる。これらのリーグは、選手個人のデータはないが、試合結果の記録はある。

Siriそのものの重要なアップデートではないけど、野球シーズンの再来を祝うにふさわしい仕掛けだ。また、Siriの高度な自然言語処理能力を誇示する、良い機会でもある。

“how many home runs did Babe Ruth have during his career”(ベーブルースは生涯に何本ホームランを打ったか?)のような問に対して、これまでのSiriならたぶん、あのいまいましい”here’s what I found on the web”(Webにはこんなものがありました)を返しただろう。でも今度からは正しい答を返すから、Siriをより一層、人間らしく感じるだろう。

この機能はすでに使える状態なので、Siriを困らせて楽しみたい人は、ぜひトライしてみよう。

  1. img_2321.png

  2. img_2323.png

  3. img_2324.png

  4. img_2322.png

 

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

Google Docsの編集や書式化の指示を音声(“口頭命令”)でできる

約6か月前にGoogleは、Google Docsに、音声によるテキスト入力(“口述入力”)を導入した。そして今日同社は、それをさらに一歩進めて、編集や書式化の指示も音声でできるようにした。

つまりこれからは、”select all”(すべて選択)、”align center”(センタリング)、”bold”(太字)、”got to end of line”(行末へ)、”increase font size”(文字を大きく)などの口頭によるコマンドを、Google Docsは(願わくば)理解でき実行できる。使えるコマンドの完全なリストが、ここにある。音声で”voice commands help”と言ってもよい。

Dragon NaturallySpeakingのようなデスクトップソフトウェアを使ったことのある人は、音声によるコマンド入力をよくご存知だろう。ぼく自身は、キーボードをタイプする方がはやいと思っているので、音声コマンドをそんなに便利とは思わないけど、手に怪我をしていてキーボードが使えない人でもGoogle Docsで仕事ができることは、ありがたいだろう。

voice_editing

 

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

テキストの目的効果パフォーマンスを分析するTextioが$8Mを調達、TwitterやMicrosoftもユーザだ

textioscreenshot

TextioのCEO Kieran Snyderは大学で、定量的言語学研究を専攻した。だから彼女と協同ファウンダのJensen HarrisがMicrosoftを去って新しい会社を始めたとき、それが言語を軸とする企業になったのも、当然の成り行きだった。

かくして、一定の状況における、テキスト中の語句のパフォーマンスを分析するスタートアップTextioが誕生した。同社は今日(米国時間12/16)、Emergence Capitalが率いるラウンドで800万ドルを調達したことを発表した。Cowboy VenturesとBloomberg Beta、およびUpside Partnershipがこのラウンドに参加した。

Snyderは語る: “テキスト中の語句の処理は相当長らくディスラプトされていない、と前から感じていた。コンピュータ処理のユーザインタフェイスはコマンドラインからGUIに変わったけれども、処理の中身が変わっていない。インターネットがやってきて、ソーシャルとか共有の時代になった。そのことをベースに、AIとその関連技術が、テキストに対する次の大きなディスラプターになるだろう。ドキュメントのパフォーマンスが発表前に分かれば、それを直してから発表できるようになる”。

Textioの最初のツールは、人材獲得、たとえばジョブポスティング(job postings, 求人票, 求人広告)のためのドキュメントが対象だ。それらのドキュメントのパフォーマンスとは、良い人材がたくさん集まるかどうかだ。言葉を適切に選び、良いレイアウトをすれば、多くの求職者の関心を集めることができる。そこで同社のサービスは、ドキュメントに対する予測的分析を行う。たとえばそのツールでは、要点が箇条書きになっているジョブポスティングは、文章だけのよりもパフォーマンスが良い、という結果が出ている。

もちろん、テキストのパフォーマンスは、メールや履歴書など、そのほかのドキュメントでも重要だし、Textioのツールが十分に使える分野だ。いろんな文書に対して、テキストの効果を採点する技術を応用できることが、投資家にとって、同社の魅力だ。

そして、もうひとつ、投資家にとって価値があるのは、同社の顧客だ。Textioはすでに、Twitter, Atlassian, Starbucks, Square, それにMicrosoftなどが利用している。自然言語処理(Natural Language Processing, NLP)の技術は…出来の良いものであれば…応用範囲がきわめて広いから、投資家という蜂たちにとっては、蜜の豊富な花なのだ。

Textioの予測的分析技術は、6万あまりの語句(語とフレーズ)を認識する。Snyderによれば、そのデータ集合は継続的な運用を通じてコンスタントに変化している。この技術はたとえば、語の並びを分析する(“このフレーズは動詞が重い(難解である)”とか)。ドキュメントの構文関連の特性も分析する。それらの分析結果を合わせて、現状のドキュメントを採点し、そのドキュメントが目的をどれぐらい達成しそうか、を評価する。

Textioは言語学の専門家が使うわけではないから、使いやすさが重要だ。だからドキュメントの評価を文章ではなく高輝度表示やドロップダウンボックスを利用して行う。ユーザはNLPの専門家でもないから、このツールの舞台裏で統計学が活躍していることも、ユーザはあまり感じていないようだ、とSnyderは言っている。

もちろん、NLPは昔も今もコンペティタが多い分野だ。大物ではIBMのWatsonがテキストの分析もやるし、そのAPIを上手に使えばTextioと同じようなことができるだろう。しかしSnyderがTextioの強みとして挙げるのは、技術の、コンテンツタイプ別のチューンナップだ。たとえば上述の、人材獲得用ドキュメントの場合のように。

[原文へ]。
(翻訳:iwatani(a.k.a. hiwa)。

ぼくが悪いのか、それとも、Appleの自動修正機能が最近だめになったのか?

9314297413_c1cb06caff_o

この経験は、誰にでもある。iPhoneでタイプしていると、自動修正によってチャットの内容が完全に変わってしまう。

“ducks”は”dicks”になり*1、”f**ks”(fucks)は”ducks”になる。blonde girlsがblindになり*2、食料品やケーキなどをオーダーするシンプルなメッセージが突然ホラーストーリーになる。〔*1: 「女の子たち」が「ぽこちん」になり; *2: 「金髪の女の子」が「盲目」になり〕,

みんなジョークは言うけど、日常的にあらゆる目的で使うテキストメッセージで、単語のスペルを修正するアルゴリズムが狂ったら、ひどいことになる。

だからこそ、Appleの自動修正機能が最近おかしい、ということを、こうやってわざわざ記事にしたのだ。

Appleの悪名高きスペル修正ツールは、iOSだけでなく、最近はOS Xでもおかしくなってきた。本誌編集部でAppleの自動修正アプリに足元を掬われているのは、ぼく一人ではない。

自分の説が統計的に正しい、と言う気はないが、最近まで役に立っていたツールが、このところ、ユーザの言葉の選択を頑固に否定するようになった、とまわりのみんなが言っている。自動修正機能に、彼が正しいと信ずるおかしな言葉を推奨されることが多すぎて困っている人は、ほかにもいるかな?

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

複雑膨大すぎてGoogle検索では対応できない法律文書にWatsonのNLPを適用するROSS Intelligence

 

今の法律関連の情報や裁判の判例などは複雑膨大だから、いくつかのキーワードで検索したぐらいでは、役に立つ情報がなかなか見つからない。

そこでY Combinatorから孵化したROSS Intelligenceは、IBMの人工知能システムWatsonの自然言語処理(NLP, natural language processin)の能力を利用して、法律文書をふるいにかけようとしている。

ドキュメントをキーワードで検索するのではなく、ふつうの英語で“Can an automatic stay be lifted if a plaintiff in another case requests it?”(原告が別の訴訟でそれをリクエストしたら債権執行の自動的停止を解除できるか?)と言えば、 複数の引用を確実性の等級をつけて出力する。ただし私自身はまだ試していないので、Lexis-Nexisとの比較などを、ここで述べることはできない。

カナダの弁護士で、長年法律の研究家でもあった協同ファウンダのAndrew Arrudaは、こう言う: “Watsonは、自然言語のような非定型データをうまく扱えると思うね。市場自体に、そういうニーズの高まりがあった。過去の判例や裁判官の判断などを、膨大な文書から迅速適切に取り出せるようになれば、われわれの‘法律産業’も変わるね。変化を前向きに受け入れる法律事務所も、今や多い。それはクライアントからのコスト圧力が、ますます強いからだ”。

あの悪名高き、法律事務所の課金対象時間(billable hour)は、1時間400ドルにもなることがあったが、数年前からすたれ始めている。それと同時に、文書作成などはインドなどにアウトソーシングされるようになっている。
ROSSによると、このようなコスト圧力の結果として、法律調査ソフトウェアの市場は年商84億ドルの規模に成長しており、そのユーザ(お客さん)である弁護士は、合衆国とカナダだけでも130万人近くいる。

“毎日、何千もの新しい法律が発布されている”、とArrudaは語る。“でもごく最近までは、法律に対するコンピュータの自然言語処理能力はきわめて表面的だった。ROSSは、ドキュメントの中にもっとも適切な小部分を見つけて取り出すために、人間の読み方や、関連テキストの見つけ方、状況に合った答えの見つけ方など、人間のやり方を律儀に模倣している”。

ROSSが得意とするのは、倒産や破産の分野だが、彼らは今そこに、いろんなサードパーティの素材も加えつつある。Arrudaと、そのほかの協同ファウンダJimoh Ovbiagele、Akash Venkat、Shuai Wang、Pargles Dall’Oglioなどは、神経科学とコンピュータ科学を専攻した人たちだ。

このサービスは、非公開ベータの今は無料で、何名かの法律の専門家たちがベータに参加している。

“Watsonをロースクールに入学させたね”、と人から言われるよ、とArrudaは語る。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa