Apple(アップル)が、カメラシステムに新機能を導入した。それは写真に写っている名刺に書かれた電話番号や、メモでいっぱいのホワイトボードなどから、テキストを自動的に認識して文字に変換する機能だ。Live Text(ライブテキスト)と呼ばれるこの機能は、ユーザーの指示や特別な作業を必要とせず、アイコンをタップするだけですぐに利用することができる。
WWDCのバーチャルステージでCraig Federighi(クレイグ・フェデリギ)氏が発表したLive Textは、iOS 15でiPhoneに搭載される予定だ。彼はミーティング後のホワイトボードや、レストランの看板を背景にしたスナップショットなどのいくつかの写真を使って、デモンストレーションを行った。
右下にあるLive Textボタンをタップすると、写真の中に検出されたテキストに控えめなアンダーラインが引かれ、それをスワイプすることでテキストを選択してコピーすることができる。ホワイトボードの場合は箇条書きを含む複数センテンスのメモを集め、またレストランの看板の場合は電話番号を取り出して電話をかけたり、保存したりすることができた。
この機能は、Googleが長年開発してきたLens(レンズ)アプリに多く見られる機能を連想させるもので、Pixel 4は2019年の時点でさらに堅牢なスキャン機能を追加している。それに比べると新システムを導入したiPhoneでは、撮影した各写真でほぼ自動的にテキストが取り込まれるという違いがある。つまりスキャナーモードに入ったり、別のアプリを起動する必要はない。
これは誰にとってもうれしい機能だが、特に視覚障害のある人には役立つかもしれない。普通なら読むことが困難な文章も、写真撮影をすることで、耳で聴いたり、テキストを保存することが可能になる。
この処理はすべてスマートフォン上で行われるようなので、情報がどこかのデータセンターに送られるという心配はない。また、これは処理がかなり速いということでもある。とはいえ、実際に試してみるまでは、それが瞬時に終わるものなのか、それとも他の機械学習機能のように、撮影してから終了までに数秒から数分かかるものなのかは分からない。
【訳注】当初対応するのは英語、中国語(簡体字、繁体字)、フランス語、イタリア語、ドイツ語、スペイン語、ポルトガル語となっている。
関連記事
・アップルが過去10年の間、業界をリードした理由がわかる1通のメール
・アップルがmacOS 12 Montereyを発表、PCとタブレットのギャップを埋める
・アップルが動画や音楽をバーチャル共同視聴できる新機能「SharePlay」をiOS 15で導入
カテゴリー:ソフトウェア
タグ:Apple、WWDC 2021、WWDC、iOS、iOS 15、OCR
[原文へ]
(文:Devin Coldewey、翻訳:sako)