英文のメールやメッセージの語調をチェックしてくれるGrammarlyのトーンデテクター

数カ月前から、文法チェッカーのGrammarly(グラマリー)は、そのコアである文法やスペルのチェックツールを超えて、そのほかの機能、例えば文章の明瞭度チェックなどを加えてきた。米国時間9月24日、その傾向をさらに拡大して、文章の語調(怒り、友好、冷淡、親切などのトーン)をチェックするトーンデテクター(Tone Detector)をローンチした。自分はこんな気持ちを込めたつもりだけど、本当に込もっているだろうか。フレンドリーで気さくな人と思われたいんだけど、非礼になったら困るなとか。

同社によると、そのトーンデテクターは、既存のルールと、テキストのトーン(語調)に貢献しているシグナルを探す機械学習のアルゴリズムを使っている。

全体としてこれはかなり便利な機能のようだ。これから書いて送るメールのトーンがとても重要というときには特に役に立つだろう。私が知ってるある立派な人物は、いつもメールのトーンだけがおかしくて、毎回私が彼の犬をいじめて叱られているようなメールを送ってくるのだ。そこで彼が40種類のトーンをサポートしているこのツールを使ってくれれば、きっと役に立つだろう。主なトーンは、「感謝している」「確信している」「儀礼的である」「くだけている」「思慮深い」「愛がある」「悲しい」などだ。書いてるメールが120文字を超えたら、この機能が自動的に働く。

Grammarly Tone Detector Example 2

トーンデテクターのベータバージョンはGrammarlyのChromeエクステンションで利用できるが、SafariとFirefoxも近くサポートされる。対応しているメーラーはGmailやYahooなどメジャーなメールサービスのみだが、もうすぐ、どんなテキスト欄(テキストフィールド)でも使えるようになる。

2019 09 24 0909

関連記事:文法チェックのGrammarlyが文法以外の提案もするアシスタントに

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

企画書や台本などの書記作品を二次元線形でなく自由な構造として扱うワープロScrivenerがVup

書くという技芸は古代からあるが、コンピューターを利用して書くための優れたアプリケーションはまだまだ不十分だ。その数少ない秀作のひとつがScrivenerだが、今日(米国時間11/20)はそのメジャーアップデートがあった。

Scrivenerは、プロとホビイストのどちらが使ってもよい。いろんなオプションが揃っているので、映画の脚本を書く、小説を書く、などなどいろんな書き仕事に便利だ。またそのインタフェイスには、書いてる人が気を散らさずに書くことに集中できるための工夫が凝らされている。

カスタム化は、ほとんど無限に自由だ。使い方によっては、Scrivenerは書くだけでなくプランニングのツールとしても優れている。たとえばコルクボード(ピンボード)機能を使うと、シーンや章の着想をメモカードに書いておいて、それらを自由に並べ替えできる。

また、書いたものをほかのアプリケーションやデバイスのフォーマットへエクスポートすることも、自由にできる。

今度のScrivener 3で、インタフェイスが新しくなり、コードは64ビットに対応、そしてMac OSのTouch Barのサポートが拡大された。新しいツールとしては、プロジェクト中のドキュメントを見つけるQuick Search、インデクスカードの色付きスレッド(ストーリーラインの追跡用など)、Inspectorからドキュメントを素早く見るためのBookmarksなどが加わった(従来のProject Notes, References, Favoritesをリプレース)。

そしてDialogue Focus機能は、プロジェクト内の会話の部分(台詞部分)を素早く取り出せる。ツールバーにはドラフトとセッションの進捗が表示される。

Epub 3と、改良されたKindleエクスポートもある。

Scrivener 3は、アップグレードユーザーには25ドル、新規ユーザーなら45ドルだ。30日の無料試用もある。30日とは、あくまでも実際に使った日の計だ。

ニューバージョンは今はMacOS用のみだが、“もうすぐ”Windows版も出る。

Scrivener 3について詳しく知りたい人はここへどうぞ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Deepgramがディープラーニングを利用する機械書き起こしサービスを無料で公開、データの獲得をねらう

オーディオデータを機械学習で処理するDeepgramが今日(米国時間10/10)、同社の機械書き起こしサービスを無料で公開した。これからはTrintのようなサービスにお金を払って自動化書き起こしという汚い仕事をやらせなくてもすむわけだ。無料化の秘密は、“データの取得”にある。

機械書き起こしは、完成された技術ではない。というか、機械何々はどれも未完成だ。それでも最近は、機械何々を完成させるためのデータを得ようと、各社が競っている。Deepgramのやり方は、書き起こしサービスを無料にして多くの人にオーディオデータをアップロードしてもらい、そのお礼に検索可能なテキストを渡すことだ。

前述のように、このやり方はそれほどユニークではない。誰もが、データを求めている。Image Captchasも、ラベルをつけた画像データを一般消費者に送ってもらって機械学習のモデルに利用することが目的だ。

Deepgramの書き起こしツールは、ディープラーニングを利用している(驚き!)…今やおなじみの、畳み込み型/再帰型のニューラルネットワークだ。無料バージョンでは何もかも一般化されるが、有料バージョンでは企業名や製品名、業界の専門用語などで訓練をカスタム化できる。

一週間前にやった1時間のインタビューで、このサービスをテストしてみた。レストランの騒音の中で二人の人間が対話をしている。書き起こしの質は、完全にはほど遠い。でも、今市場に出回っているサービスに比べて、極端に悪いというわけではない。

記憶している語句で検索することもできたし、三回目の結果の中に、探していた特定の箇所が見つかった。それをここに引用すると相手が怒りそうだからやめるが、記事を書くためには十分なコンテキストが得られた、と言えよう。音声による検索には5分ほどかかったが、テキストと違って音声による“語”には、似たような音(おん)が多いので、必要以上のマッチを見つけるのだろう。それでも、人間がやってくれる書き起こしサービスに比べると安い(無料!)し、今後少しずつ良くなっていくだろう。

Deepgramの協同ファウンダーでCEOのScott Stephensonはこう説明する: “音声認識の自動化は、まだ完成された技術ではない。特定のデータセットに対しては有能だが、ノイズが多いとだめだ。うちのサービスの結果も、良くないね”。

Deepgramは、機械書き起こしのAPIも無料で提供している。でも、有料サイトに100万分(ふん)の音声データをアップロードしたら、目の玉の飛び出る料金になるだろうから、その500テラバイトのファイルはDeepgramにトロルした方がよいかもね。

書き起こしはまだまだ人力には勝てないが、人工的に合成した音声なら機械学習にも勝つチャンスがあるかもしれない。テキストから音声を生成するWaveNetLyrebirdのようなプロジェクトを利用して、Deepgramのような機械翻訳システムを、機械が間違えやすい語で訓練すれば、その能力もアップするだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

本が本でなくなる日

Hachette vs. Amazonの戦争があり、Kindle Unlimitedが登場、そんな中で、出版者であることと、ライターであること、そして読者であることの意味が、今非常に悩ましく問われようとしている。Laura MillerがSalonに書いた優れた記事は、“自費出版本の熱心な読者たちは、アメリカ中のぬかるみ*の中を歩きまわることに合意した”、と言っている。それは、今やAmazonが、誰でも壁に糞を投げつけてよいと言っているので、われわれ読者はそれらの糞が壁に張り付くか床に落ちるかを確認しなければならない、という意味だ。〔*: slush pile, 愚作の持ち込み原稿の山。〕

でも、現実はこうだ: われわれが知っていた本の姿は、変わりつつある。本は、雑誌や新聞と同じ運命をたどりつつある。 散文テキストの分厚い塊は価値を失いつつあり、人びとがそれに対して払う価格も下がっていく。たとえばKindle Unlimitedがスタートしたとき9歳の息子に、好きな本を何でもダウンロードして読みな、と言った。彼はHarry Potterなどの長編フィクションには見向きもせず、すぐさまMinecraft関連の大作をダウンロードしたが、それはしかし私が見ればRedditのMinecraftギャグを本の形に集めたようなものだ。“それは本じゃないよ”、と彼に言ったが、今や、それが、本なのだ。

Amazonは積極的に、われわれの本に対する考え方を変えようとしている。前世紀には、出版社は限られた数の作品を、“安い”製品を作ることが善とされる経済システムの中で生産し、配布した。紙とボール紙で作られた本(ハードカバーの本、ペーパーバックでない本)は、高級品のように売られた。売れ残りは砕かれてパルプになり、新本として売られることはなかった。そして、古書市場というニッチの市場ができあがった。

そして今や、eブックの登場により、ハードカバーの本の価値は大幅に減価した。しかも、大手出版5社は、本をおかしな、新しい方法で売るはめになった。その形は、サンドイッチに似ている。彼らは大量の本を売るが、それらはAmazonのUnlimitedのMinecraftストアで売られるような本だ…セレブの伝記、料理本、政治的暴言集、などなど。それらの厚いパンにはさまれた薄い具の部分が文学書だが、その売上の大半はStephen Kingなど少数の人気作家に依存している(とよいのだけど)。昔の文学書ジャンルの、厚いハムだった部分は、今や干からびた薄いカルパッチョだ。

出版人たちは、口癖のように、自分たちは大きな付加価値を提供している、と言う。それには同意しよう。彼らのところには、偉大なる編集者と、優れたアーチストと、有能なPR部員がいる。歴史的には、大手出版社は文化の司祭であり、言葉の大法官だった。人類の知的生活に仕える執事でもあった。でも彼らの強大な権力も、必勝とは言えない。最近友人が立派な本を有名出版社から出して、1年で750部売れた。ぼくはIndiegogoとAmazonを利用して、自分のインディー本を同じ期間に数千部売った。ぼくも、出版社と心中すべきだっただろうか? 全国の書店まわりをやって、サイン会もして、Jon StewartがホストするDaily Showで自分の本を宣伝すべきだったか? それもいいけど、ぼくは死なずに生き延びたい。

Amazonは、金目当てでHachetteやそのほかの取次と喧嘩しているのではない。Amazonは、有料コンテンツを配布するための新しい市場を自分が支配するために、彼らを蹴落としたいのだ。もちろん、そのコンテンツの要(かなめ)が、eブックだ。

今では、ブログというものがある。ブログ記事と本は、本質的に異なっている。本は長いし、完璧な編集作業を要するし、製作に長時間かかる。良い本を作るためには、時間をかけるか、またはエキスパートたちのチームに良い仕事をさせるか、だ。でもインディーのライターには、コピーエディタ(原稿整理編集者)を雇うほどのお金がない。だからインディー作品のクォリティには、今後も疑問符がつく。

でも、ブログはどうか。これまでは、とにかく早く書いて早くお金をもらうライターといえば、ジャーナリストだけだった…自称ジャーナリストも含めて。でも今では、MediumやWordPressなどのソフトの上で出版が行われるので、平均的なライターたちが早く書いてわりと早めにお金をもらえる。彼らには、コンサルタントなどの副業もある。対して、大手出版社や大手マスコミだけを相手にしているジャーナリストは、今や泥の中でもがいている。誰しも、昔からやってきたことしか、できない。コピーエディタがしっかり手を入れた記事、事実をチェックされて、ジャーナリズムの黄金律と呼ばれるThe New York Timesに載った500語の力作を、懐かしむのもよい。ぼくもTimesに記事が載ったことがあるが、でもあそこの人たちは、たしかに優秀だけど、ここTechCrunchやTMZやBuzzfeedやJoeの釣りブログなどで仕事をしている人たちと比べて、とくに良いとか悪いということはない。違いは、NYTはかつて強力であり、その記憶の残像のおかげで世界中の寄稿者のネットワークが維持されていることだ。でも、ぼくたちみんなは、TMZもEngadgetもBuzzfeedも、短編記事でマネタイズしてきた。NYTがそれをやって生き延びることは、まずできない。

そして、かくして出版産業は衰退していく。なんとか生きていけるインディーのライター1000人に対して、大きく稼ぐ者が数十名、そして大手出版は対応を誤る。音楽産業のように派手な無様(ぶざま)さにならないのは、大手出版による、印刷物による、堅牢な本の顧客が、ある程度は残るからだ。でも、彼らが時代に取り残されることは、間違いない。Kindle Unlimitedはインディーライターが好きな読者層を獲得し、Amazonはインディーの本を値引きしてでも売るが、大手出版5社は逆に彼らに対し大手いじめ屋になる。そして、Bezosが勝つ。

ぼくはライターであり、書くことが好きだ。書いたものは、読んでほしい。Laura Millerがぬかるみと呼んだライターや作品も、そこらにたしかにある。でも、それはかまわない。ここ10年ほどは、ブログにも色とりどりのぬかるみやジャングルがあった。しかし今では大手インターネットメディアの傘下に入ったものと、多数の小さなインディーに両極している。インディーの出版にも、同じことがやがて起きるだろう。それは避けられないことだし、Amazonはそういった動きのすべてから稼ぐつもりでいる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))