表記揺れの影響を受けず不動産物件を特定できる「不動産共通ID」ベータ版が4月公開、APIとして提供

表記揺れの影響を受けず物件を特定できる「不動産共通ID」ベータ版が4月公開、APIとして提供

Geolonia(ジオロニア)不動産テック協会は3月15日、国内の土地や建物等の不動産情報に対して付与する共通ID(不動産共通ID)ベータ版を4月15日に提供すると発表した。不動産共通IDはAPIとして提供し、無償利用が可能。正式サービス時には正規化された住所や物件名を逆引き取得できる有料の上位プランも提供予定。

また「不動産共通ID β版利用 先行エントリーフォーム」において、事前利用登録の受付を開始した。

不動産共通IDは、Geoloniaが2020年8月にオープンデータとして公開した日本全国の「住所マスターデータ」(Geolonia 住所データ。ライセンスはCC BY 4.0)を基に、不動産取引における企業間での情報連携やデータ連携などの実現を目的として不動産テック協会が整備するID。

不動産事業において統一されていない住所や物件名の表記に対して、同一の物件を示す情報に共通のIDと付与することで、表記揺れに影響されることなく物件の特定が容易となるインフラ環境を構築、不動産情報のデータ連携にかかるコストの大幅削減を図る。

表記揺れの影響を受けず物件を特定できる「不動産共通ID」ベータ版が4月公開、APIとして提供

不動産共通IDはなぜ必要なのか?

現在、不動産に関する情報は不動産事業者各社において、「住所」「物件名」などで物件を特定して管理されている。しかし、その表記方法が統一されていないため、同一物件の住所でも「三丁目」と「3丁目」といった表記ゆれや誤入力が発生しており、同一物件であるという特定が難しく、様々な企業が持つ不動産情報の連携が困難という課題がある。こうした課題を乗り越え、生活や企業活動のうえで有用・必須な不動産情報の利用可能性を広げるため、不動産テック協会とGeoloniaは共同で「不動産共通ID」プロジェクトを2020年7月よりスタートした。

不動産共通IDの整備は、行政においても長年の課題であり、不動産業界だけでなく、物流業界や行政などにも幅広く応用できるインフラとなるという。企業ごとに管理方法や管理表記の違う不動産情報に対して、同一物件を示す情報に共通のIDを付与することで、表記ゆれがある住所と物件名が入力されても同じIDが得られる技術により、物件の特定が容易となるインフラ環境を構築する。

不動産共通IDで物件を特定することで、物流の誤配送を防ぎ再送コストを削減できるほか、在宅情報との組み合わせにより在宅の家のみに配送する、夜間光街画像との組み合わせで空き家を特定するといった活用が可能という。また、特定物件に対して複数の工務店・施工会社が行った修繕をひとつに集約し、建物の修繕履歴を一元管理することも可能になるとしている。

表記揺れの影響を受けず物件を特定できる「不動産共通ID」ベータ版が4月公開、APIとして提供

2019年9月設立のGeoloniaは、位置情報基盤を通じて、社会が抱える様々な課題を解決できる企業を目指すスタートアップ。IoT、スマートシティーなど、国、自治体、企業のDXが進むにつれて重要な「地図」「地理空間情報」「ロケーションデータ」の分野で、ウェブ地図提供事業、位置情報開発支援事業、ロケーションプラットフォーム事業を展開している。

不動産テック協会は、現在100社超(そのうち不動産テック企業72社)が属する、日本最大の不動産テック企業の団体。加盟企業には、仲介や管理業務、価格査定、ローン・保証など、多岐にわたる不動産業務の効率化や収益化のために、テクノロジーを活用しサービス提供する企業が加盟している。各社ごとに保有する不動産情報は、数千~数億に及ぶという。

関連記事
京都市の通り名も対応、月額2000円の開発者向けクラウド郵便番号・住所検索APIサービス「ケンオール」公開
Googleが感染症の数理モデルとAIを組み合わせた都道府県別の新型コロナ感染予測を公開、慶応大監修
オープンソースによる総務省「住民記録システム標準仕様書」準拠のシステム開発が開始
LIFULL・ゼンリンなどが不動産ID発行システム試用版の公開に向け開発・運営協議会を設立
新型コロナ研究データを集めた「COVID-19データポータルJAPAN」が公開、国立情報学研究所と国立遺伝学研究所が管理
Geoloniaと不動産テック協会が日本全国の住所マスターデータをオープンデータとして公開
コード・フォー・ジャパンが飲食店情報をオープン化する「OPEN EATS JAPAN」プロジェクトを開始
「東京都 新型コロナウイルス感染症 支援情報ナビ」のソースコードが公開

カテゴリー:パブリック / ダイバーシティ
タグ:オープンデータジオコーディング(用語)Geolonia(企業)不動産 / 不動産テック(用語)不動産テック協会(組織)物流 / ロジスティクス(用語)日本(国・地域)

Googleが感染症の数理モデルとAIを組み合わせた都道府県別の新型コロナ感染予測を公開、慶応大監修

Googleが都道府県別の新型コロナ感染予測(日本版)を公開、慶應義塾大学監修

Google(グーグル)は11月17日、新型コロナウイルス感染症(COVID-19)の感染予測(日本版)を公開した。感染症の数理モデルとAIを組み合わせることで、対象期間である将来28日間に予測される死亡者数、感染確認者数、入院・療養等患者数などを都道府県別に表示する。全国の予測値は都道府県の予測値を足し合わせている。

これらの情報はダッシュボードで閲覧できるほか、Google Cloudのデータ分析用ツールBigQueryや、CSVファイルとして利用可能。利用の際はユーザーガイドを必ず参照するよう呼びかけており、予測データをダウンロードまたは使用するには、Googleの利用規約に同意する必要がある。

日本版モデルの開発にあたっては、使用データの包括性、予測結果と国内感染状況との整合性、さらに、モデルの設計および予測データの検証において慶應義塾大学 医療政策・管理学教室 教授 宮田裕章氏および研究室が監修した。

またこのモデルは、医療機関や公的機関をはじめとするCOVID-19の影響を受ける組織が、今後に向けてより適切な対処を検討・準備する上で参考情報のひとつとして利用されることを目的に公開している。例えば感染者数の予測値をデータポイントのひとつとして参照することで、医療機関における医療資材やスタッフ、スケジュールなどのリソースプラニングや、検査実施計画の立案、感染拡大の兆候が見られる地域の早期発見などに活用できるという。

Google Cloudは2020年8月、Harvard Global Health Institute(ハーバード グローバル ヘルス研究所)と協力し、予測モデル(COVID-19 Public Forecasts )を米国で公開。同サービスは予測開始日から将来 14日間における米国内のCOVID-19陽性者数や死亡者数などの予測を提供するもので、日本のデータでトレーニングし十分な精度検証ができたことから、今回日本版の提供を開始したという。日本での提供は米国についで2ヵ国目となる(現在、米国と日本で提供中)。

米国で提供しているCOVID-19 Public Forecastsは、AIと膨大な疫学的データを組み合わせ、さらに、時系列の予測を扱う斬新な機械学習のアプローチを採用することで実現。米国向け初期モデルは今年8月に初公開され、現在も無償で予測情報を提供している。この情報はジョンズ ホプキンス大学、Descartes Lab、米国国勢調査局などの一般公開データを基にしており、Harvard Global Health Instituteの監修のもとで更新を続けている。

今回の日本版では、新たに95%予測区間やデータセットの追加に加え、予測対象期間を拡張した他、モデルの強化による予測精度の改善を行った。

米国版モデルを日本に対応させるにあたって行った調整

まず、感染の態様や広がり方(ダイナミクス)の基本条件は、米国版モデルでも日本版モデルでも同じ(例えば、感染は離れた場所よりも近隣の地域で広がりやすい)といった前提のもとに開発。その上で、日本版モデルでは、日本のデータセットのみを利用してトレーニングを行っており、使用したデータには厚生労働省が発表している新型コロナウイルス感染症陽性者数および死亡者数などのオープンデータ、Googleが特定の場所(食料品店、公園など)を訪れた人の数の変化を地域別にまとめた「コミュニティ モビリティ レポート」、平成27年国勢調査結果などが含まれている。

これら陽性者数や入院・療養等患者数、死亡者数、また人々の移動状況について国内のデータを使用しているため、予測結果には国内の感染状況やそれに対する人々の反応、さらに生活環境といった日本独自の状況が反映されているとしている。

予測モデルの精度検証では、特定の日付までのデータでトレーニングを行った後、その先28日間の予測データを出力させ、実測値と予測値を比較した。例えば10月1日までのデータでトレーニングを行った場合は、10月2日から30日までの予測値を出力させ、そのデータを同期間の実測値と比較している。検証の結果、一般的な疫学的コンパートメント モデルや検証用の米国データで十分な精度を示した簡易版モデルと比較して、この予測モデルの精度が優れていることを確認した。さらに28日間の予測以外の各種指標についても米国向けモデルと変わらない精度であることを確認した。

関連記事
ニュースアプリNewsDigestが居住地域の新型コロナ新規感染者数・事例を確認できる「第三波アラート」提供
GoogleがGoogle Travelで新型コロナ関連の健康・安全情報を提供へ
オープンソースによる総務省「住民記録システム標準仕様書」準拠のシステム開発が開始
新型コロナ研究データを集めた「COVID-19データポータルJAPAN」が公開、国立情報学研究所と国立遺伝学研究所が管理
コード・フォー・ジャパンが飲食店情報をオープン化する「OPEN EATS JAPAN」プロジェクトを開始
Geoloniaと不動産テック協会が日本全国の住所マスターデータをオープンデータとして公開

カテゴリー: 人工知能・AI
タグ: オープンデータGoogle / グーグル(企業)慶應義塾大学(組織)COVID-19(用語)新型コロナウイルス(用語)日本(国・地域)

Geoloniaと不動産テック協会が日本全国の住所マスターデータをオープンデータとして公開

Geolonia ジオロニア 不動産テック協会 日本全国の住所マスターデータ オープンデータ

Geolonia(ジオロニア)不動産テック協会は8月5日、日本全国の住所マスターデータ「Geolonia 住所データ」を誰でも無料で利用できるオープンデータとして公開した。不動産テック協会は、同データを不動産ID整備に向けて活用するという。

Geolonia ジオロニア 不動産テック協会 日本全国の住所マスターデータ オープンデータ

Geolonia 住所データは、ユーザーが持つ顧客データベースなどに含まれる住所データの正規化に活用できるほか、住所から緯度・経度への変換 (ジオコーディング)、各種GISソフトウェアなどで利用できる。利用に際して条件はなく、誰でも無料で利用可能。ライセンスは、「CC BY 4.0」。GitHubリポジトリに同梱されているデータ生成用のスクリプトのライセンスは「MIT ライセンス」となっている。

日本の住所は、「丁目」「番地」「号」という表記が一般的だが、「大和大路通正面下る大和大路2」といった京都の通り名に代表される特殊な表記も多く、ひとつのルールで標準化することができないという。また、「3丁目」「三丁目」と数字や漢字で表記が異なるなど、日本の住所はルールというよりも自然言語に近い文法であり、コンピュータで処理するデータとしては非常に扱いにくい状態となっている。

こうした日本全国の住所を正しい表記で網羅したデータが住所マスターデータとなる。住所マスターデータには日本の住所が町丁目まで網羅されているほか、代表点の緯度経度も含まれており、利用者は住所マスターデータを使うことで自身が持つ顧客情報などを位置情報の観点で分析可能となる。

また、従来の住所マスターデータは金額が数百万円と高価なため、個人・中小企業の利用には向いていなかった。さらに、ジオコーディングを行うには事実上Googleしか選択肢がない状態にあり、Googleのデータを利用した場合はストレージへの保存ができない、他の地図への再利用が禁じられているなど利用に制限がかかっている状態にある。

そこで今回、オープンデータとして住所マスターデータを公開することで、利用者は自身が持つ住所データを有効活用できるようにした。

同データは国土交通省のWebサイトからダウンロードできる「国土数値情報」に基づいているものの、「国土数値情報」の更新が1年に1回であるのに対して、Geoloniaは月単位のアップデートも独自に実施している。更新は、「国土交通省位置参照情報ダウンロードサイト」「郵便番号データダウンロード – 日本郵便」を元に行っているという。

不動産テック協会は、このデータを用いて不動産IDを整備することで、不動産取引における企業間での情報連携やデータ連携などを実現するとしている。また、Geoloniaはデータ公開によって地図コミュニティに貢献するとともに、地図を用いた技術開発の基盤データとしてこのデータを活用するという。

不動産テック協会は、不動産とテクノロジーの融合を促進し、不動産にかかる事業ならびに不動産業の健全な発展を図り、国民経済と国民生活の向上・公共の福祉の増進に寄与するための活動を展開。

Geoloniaは、WebGLを利用した自由度の高い地図と、顧客が持つ位置情報を検索・解析するためのAPIを提供するホスティングサービスを公開している。

関連記事
コード・フォー・ジャパンが飲食店情報をオープン化する「OPEN EATS JAPAN」プロジェクトを開始

Googleが膨大な数の「ヘタクソな絵」を公開した、AI研究者にとっては面白いネタの宝庫だ

昨年の11月に、Googleはファンキーな機械学習実験のいくつかを発表した。中でも目立っていたのがQuick, Draw!だこれは、あなたが何かをスケッチすると、画像認識システムがそれが何かを推測するゲームだ。そして今Googleはこのゲームのプレイヤーたちが残した膨大な結果を、AI研究者たちが利用できるように、オープンデータとしてリリースした。

さて、この膨大な(5000万にも及ぶ)帽子、靴、そして猫のヘタクソな絵の集まりをただ眺めていくのは、とても退屈そうだ。だが安心して欲しい。それがこの記事の本題ではない。

ここでの本題はメタデータに関するものだ。これらの絵はさまざまな国から来たもので、例えばドイツと韓国ではネコの捉え方がどう異なっているのかを見るのは楽しい。あるいは椅子とか!

へえ。

よく見てみよう。そこには注目に値するパターンが存在する。明らかに、韓国語とロシア語の人たちは、椅子を斜めにまたは横方向から描く傾向があった。何故か?それこそが、このデータを用いてこの先作られる機械学習システムが、発見することを期待されていることだ。

実際、興味深い違いがたくさん存在する。Googleの投稿が指摘しているように、スニーカータイプのシューズへの大きなバイアスがかかっていたため、システムはハイヒールやサンダルの認識に問題があるだろう。そして、ネコはどうだろう?確かに人びとが、ネコたちを描く際に選んだサブ(ネコ)カテゴリが存在している。実際私が1回これを試した時には、ネコの全身を描いた。私は珍しく丁寧な例外なのだろうか?ああ、もし私が、ヒントを見い出すための機械学習システムの作り方を知っていたなら。

Googleは、彼らの新しいファセットツールを使用して、セット内の膨大なデータを視覚化することを勧めている。そして、そこがこの全体の中でも、本当に興味深いところだ。このように膨大なデータセットを持っている場合、たとえ全体レベルからでも、粗いパターンや追求する価値のあるアイデアを見つけられるようにするために、どのようにそれらを並べ替えて、観察することができるだろうか?そして、体系的なバイアスや、改善のチャンスのようなものは、どのように見つけ出すことができるのだろうか?

今回の5千万枚の絵は単なる始まりに過ぎない。他の7億5000万枚以上の絵がこの先徐々にリリースされる予定だ。そしておそらく、他のプロジェクトの興味深いデータもリリースされることだろう。最新情報のために、Google Researchブログ(もちろんTechCrunchにも)注目していて欲しい。

[ 原文へ ]
(翻訳:Sako)