機械学習でイノシシの出没確率を予測、森林総研と岩手県立大学が岩手県におけるイノシシ出没ハザードマップを作成

機械学習でイノシシの出没を予測、森林研究・整備機構森林総合研究所と岩手県立大学がイノシシ出没ハザードマップを作成

2017年~2019年の出没データを用いて作成したイノシシの出没予測図。この図をハザードマップとして用いることが可能。図中の細線は市町村界を示す

森林研究・整備機構森林総合研究所(⼤⻄尚樹氏)と岩手県立大学(今⽥⽇菜⼦氏、⼀ノ澤友⾹氏)の研究グループは2月15日、岩手県で分布域を拡大しているイノシシの出没を機械学習で予測するハザードマップを作成したと発表した。この手法は地域を限定しないため、他の地域にも応用が可能だという。

研究グループは、2007年以降の岩手県内のイノシシの出没データ(目撃・被害・捕獲情報をまとめたもの)を基に、種の分布モデル(種の分布を推定する手法)を用いた機械学習法により、出没予測図を製作した。また予測には、標高、植生、土地利用、人口、年間最大積雪深の5つの環境データ(国⼟地理院や政府が公開しているオープンデータを採用)を用いたが、このすべてを組み合わせて予測図を作ったところ、標高、植生、土地利用の3つを用いた場合がもっとも信頼度の高い予測図となった。

そして、最初の目撃例からの拡大期にあたる2007年から2017年の出没データを用いた予測図と、拡大を終え定着期に入り大きく出没件数が増えた2018年から2019年の出没データを用いた予測図とを比較したところ、予測確率が高い地域ほど出没が多いことがわかった。つまり、データ量が多いほど予測確率は高くなるということで、2019年までの全データを用いた出没予想図は、今後のイノシシ出没ハザードマップとして活用できるという。

岩手県内のイノシシの分布拡大の変遷。図中の□は5kmメッシュを示し、メッシュごとの目撃件数を色分けした

岩手県内のイノシシの分布拡大の変遷。図中の□は5kmメッシュを示し、メッシュごとの目撃件数を色分けした

2007年~2017年の出没データから作成した出没予測図に、2018年~2019年に実際に出没した5kmメッシュ(□)を重ねたもの

2007年~2017年の出没データから作成した出没予測図に、2018年~2019年に実際に出没した5kmメッシュ(□)を重ねたもの

この手法は地域を限定しないため、東北以外のイノシシの分布が拡大している地域でも、これを使って独自のハザードマップを作ることが可能だ。また、シカ、サル、クマなどの他の哺乳類にも応用が期待できるという。ただし、これはあくまで目撃や被害をもとにした「出没確率」であって、「生息確率」ではないため、人が関与しない場所で生息している可能性もあるとのことだ。

デジタル庁、新型コロナワクチン接種状況のダッシュボードとオープンデータをリニューアル

デジタル庁、新型コロナワクチン接種状況のダッシュボードとオープンデータをリニューアル

デジタル庁は1月24日、新型コロナウイルス感染症のワクチン接種状況に関するダッシュボードオープンデータを、3回目の接種状況を加えてリニューアル公開した。2022年1月24日現在、医療従事者のデータは公開準備中という。

データに関するライセンスは、「クリエイティブ・コモンズ・ライセンス 表示 4.0」(CC BY 4.0)としている。また利用の際のクレジットは「デジタル庁」と記載する必要がある(「デジタル庁コピーライトポリシー」参照)。

このダッシュボードは、ワクチン接種記録システム(VRS)に記録された新型コロナワクチンの接種状況を、全国および都道府県単位で、グラフを用いて視覚的に把握できるというもの。これに関連するデータファイルは、オープンデータとして公開され、プログラムなどに利用できるよう、NDJSON(改行区切りJSON)形式またはCSV形式で提供される。

オープンデータの概要

  • 都道府県別接種回数詳細
    形式:改行区切りJSON (NDJSON)
    内容:ワクチンの接種回数を都道府県別に集計した統計データ
  • 接種日別接種回数サマリー
    形式:CSV
    内容:ワクチンの接種回数を接種日別に集計した統計データ
  • 都道府県別累積接種回数サマリー
    形式:CSV
    内容:ワクチンの累積接種回数を都道府県別に集計した統計データ

詳細は下記リンクをご覧いただきたい。
https://info.vrs.digital.go.jp/opendata/

総務省、統計リテラシー向上を目的にデータサイエンス・オンライン講座「誰でも使える統計オープンデータ」開講

総務省、統計リテラシー向上を目的にデータサイエンス・オンライン講座「誰でも使える統計オープンデータ」開講

総務省は1月11日、統計リテラシー向上を目的として、データサイエンス力の高い人材を育成するためのデータサイエンス・オンライン講座「誰でも使える統計オープンデータ」を開講した。おもに社会人と大学生を対象に、統計オープンデータを活用してデータ分析の手法を解説する。

登録料および受講料は無料。申し込みは、講座紹介サイトから行え、3月7日まで誰でも受講登録できる。

同講座では、政府統計の総合窓口「e-Stat」、総務省および統計センターが提供する地図で見る統計(統計GIS。jSTAT MAP)、APIなどを使って統計オープンデータを活用したデータ解析手法が学べる。また週ごとに確認テストがあり、最終課題を経て修了証が発行される。

「誰でも使える統計オープンデータ」概要

  • 開講日:2022年1月11日
  • 学習時間:1回10分程度、週に5〜7回ほど、4週間
  • 前提条件:表計算ソフトMicrosoft Excelの基本的な操作ができること(簡単な計算や関数、グラフ作成などができればExcel以外でも問題ないが、講義はExcelを用いた説明となる)
  • 課題:各週の確認テストと最終課題の実施
  • 講師:⻄内啓⽒(統計家)、⼩⾕祐⼀朗⽒(不動産販売価格予測サイト「GEEO」開発者)、総務省統計局および統計センター職員

各週のテーマと内容

  • 第1週「e-Statを使ったデータ分析」:e-Statの統計データを活⽤したデータ分析の事例を学ぶ(e-Statの機能紹介、活⽤事例紹介など)
  • 第2週「公的統計データの使い⽅」:公的統計データの基本事項や読み⽅を学ぶ(公的統計の種類と体系、労働⼒調査・家計調査の基礎知識、利⽤の際のポイントなど)
  • 第3週「統計GISの活⽤」:統計データと地図を組み合わせた統計GISの活⽤⽅法を学ぶ(jSTAT MAPの機能紹介、簡単にできるレポート作成、活⽤事例紹介など)
  • 第4週「統計オープンデータの⾼度利⽤」:統計API機能の仕組みや具体的な活⽤事例など、統計オープンデータの⾼度な活⽤⽅法を学ぶ(統計APIの仕組み、統計オープンデータの活⽤事例、講座のまとめなど)

総務省がプログラミング未経験者も参加できる地理空間情報学習研修を無料開催、災害発生時を想定し課題解決を目指す

総務省がプログラミング未経験者も参加できる地理空間情報学習研修を無料開催、災害発生時を想定し課題解決サービスの開発目指す

ハッカソンやアイデアソンの運営を行うHackCampは、総務省の委託事業「令和3年度地理空間情報を活用可能な人材の裾野拡大に向けた人材育成プログラムに関する調査研究の請負」の一環として「Geospatial Hackers Program 2021」をオンライン開催する(受講無料)。

これは、防災・観光・地域活性化などの有用なデータを可視化する技術「地理空間情報」の担い手育成を目的とした研修プログラム。自治体職員・NPO・市民団体・学生などプログラミング未経験者向け「初学者コース」と、プログラミング経験者向けの「技術者コース」とがある。動画教材を使い、実践的な学習をオンラインで行うというものだが、具体的な流れは、動画を使った自習(ハンズオン講習会の準備)、地理空間技術者によるハンズオン講習会、サービスプロトタイプ作りのための実践研修となっている。

講師は、実際に災害支援に参加した専門家である、高知県立大学の神原咲子特任教授(初学者コース)、静岡県建設政策課チーム(技術者コース)が担当する。実際に、「隣県で災害が発生した」という想定で被災地の課題解決に役立つサービスをチームで開発し、デモデーで優れたアイデアが表彰される。

「Geospatial Hackers Program 2021」概要

初学者コース

  • 対象者:プログラミング未経験者。自治体職員、NPO、市民団体、学生など。MS Officeが使える程度のコンピューターの知識が必要
  • 学習目標
    ・地理空間技術の概念とデータの種類を知る
    ・地理空間情報でできることを知る
    ・オープンデータを自分の力で地図に表現できる
    ・チームで1つのサービスを開発する
  • ハンズオン講習会日程と内容
    ・2022年1月8日9:30〜12:30
    ・オープンソースのデスクトップGISソフト「QGIS」×オープンデータで避難所地図を作ろう

技術者コース

  • 対象者:プログラミング経験者。地理空間情報技術が未経験のエンジニアやプログラマー。シビックテックに興味のある技術者
  • 学習目標
    ・オープンソースのデスクトップGISソフト「QGIS」を操作・活用できる
    ・ウェブ地図ソフト「leaflet」を活用したウェブ地図が制作できる
    ・点群データの概要と基本的な活用ができる
    ・アイデアを地図サービスに展開するプロセスを習得する
  • ハンズオン講習会日程と内容
    ・2022年1月9日9:30〜14:30
    ・Leafletを利用した、地震ハザードステーションJ-SHISによる地震情報の可視化
    ・静岡県による3次元の地理空間情報「VIRTUAL SHIZUOKA」の点群データを使ってみよう!

実践研修は東日本エリアと西日本エリアに分かれて行われる。

東日本エリア日程と内容

  • 初学者向け
    ・2022年1月22日9:30〜17:00(Day1 / インプット・アイデア出し)
    ・2022年1月23日9:30〜17:00(Day2 / プレゼンテーション・参加者投票)
  • 技術者向け
    ・2022年2月5日9:30〜17:00(Day1 / インプット・アイデア出し)
    ・2022年2月12日9:30〜11:30(自由参加・中間報告)
    ・2022年2月19日9:30〜17:00(Day2 / プレゼンテーション・参加者投票)

西日本エリア日程と内容

  • 初学者向け
    ・2022年1月29日9:30〜17:00(Day1 / インプット・アイデア出し)
    ・2022年1月30日9:30〜17:00(Day2 / プレゼンテーション・参加者投票)
  • 技術者向け
    ・2022年2月6日9:30〜17:00(Day1 / インプット・アイデア出し)
    ・2022年2月13日9:30〜11:30(自由参加・中間報告)
    ・2022年2月20日9:30〜17:00(Day2 / プレゼンテーション・参加者投票)

デモデー「Geospatial Hackers Program Demo Day」は2022年3月5日(予定。オンライン開催)となっており、各実践研修における参加者投票で、1位を獲得したアイデアについて発表・表彰を行う。

詳細はこちらから:https://ghp.connpass.com/

参加申し込みはこちらから:https://forms.gle/ctttEWi9FeDLqwc6A

東京都のオープンデータを活用する2021年度「都知事杯オープンデータ・ハッカソン」開催決定、参加者を募集中

日本IBMが量子コンピューター活用のハッカソン「IBM Quantum Challenge Fall 2021」をオンライン開催、高校生以上参加可能

起業サポートや新規事業支援などを展開するボーンレックスは11月5日、東京都の委託により2021年度「都知事杯オープンデータ・ハッカソン」の開催を発表し、参加者(個人または団体)の募集を開始した。東京都のオープンデータを活用したサービスやシステム、アプリケーション開発の成果を競い合う5日間のハッカソンだ。

東京都では、行政が保有するデータを積極的に公開し、シビックテックや民間企業による都民の利便性向上のための新サービス開発を促す取り組みを進めており、このイベントはそれを加速させるためのもの。東京都のオープンデータを使い、都民の生活の質を向上させるサービスのプロトタイピングを5日間で行う。新たなサービス開発を志す方、自身の技術力を試したいエンジニア・デザイナーなど、チームまたは個人で参加でき、当日、参加者同士でチームを組むことも可能。5つのプロジェクトが選抜され、そのうち1プロジェクトに都知事杯が贈呈される。

「都知事杯オープンデータ・ハッカソン」概要

  • スケジュール
    ハッカソン:2021年12月中旬の5日間
    First Stage:2022年1月中旬にプロジェクトのプレゼンテーション
    Final Stage:2022年1月下旬に最優秀プロジェクトに都知事杯を贈呈
  • 応募対象
    東京都のオープンデータを活用したサービス開発を目指す個人または団体
  • 応募条件
    ・東京都が抱える行政課題の解決に資するサービス案を検討していること
    ・東京都のオープンデータを活用予定であること
    ・予定されている日程に参加できること
  • 応募期間
    2021年11月5日〜12月8日

応募方法、詳細は公式サイトおよび「都知事杯オープンデータ・ハッカソン 令和3年度募集要項」(PDF)を参照。参加申し込みフォームは「都知事杯オープンデータ・ハッカソン参加者応募フォーム」を利用する。

東京都のオープンデータを活用する2021年度「都知事杯オープンデータ・ハッカソン」開催決定、参加者を募集中

日本IBMが量子コンピューター活用のハッカソン「IBM Quantum Challenge Fall 2021」をオンライン開催、高校生以上参加可能

起業サポートや新規事業支援などを展開するボーンレックスは11月5日、東京都の委託により2021年度「都知事杯オープンデータ・ハッカソン」の開催を発表し、参加者(個人または団体)の募集を開始した。東京都のオープンデータを活用したサービスやシステム、アプリケーション開発の成果を競い合う5日間のハッカソンだ。

東京都では、行政が保有するデータを積極的に公開し、シビックテックや民間企業による都民の利便性向上のための新サービス開発を促す取り組みを進めており、このイベントはそれを加速させるためのもの。東京都のオープンデータを使い、都民の生活の質を向上させるサービスのプロトタイピングを5日間で行う。新たなサービス開発を志す方、自身の技術力を試したいエンジニア・デザイナーなど、チームまたは個人で参加でき、当日、参加者同士でチームを組むことも可能。5つのプロジェクトが選抜され、そのうち1プロジェクトに都知事杯が贈呈される。

「都知事杯オープンデータ・ハッカソン」概要

  • スケジュール
    ハッカソン:2021年12月中旬の5日間
    First Stage:2022年1月中旬にプロジェクトのプレゼンテーション
    Final Stage:2022年1月下旬に最優秀プロジェクトに都知事杯を贈呈
  • 応募対象
    東京都のオープンデータを活用したサービス開発を目指す個人または団体
  • 応募条件
    ・東京都が抱える行政課題の解決に資するサービス案を検討していること
    ・東京都のオープンデータを活用予定であること
    ・予定されている日程に参加できること
  • 応募期間
    2021年11月5日〜12月8日

応募方法、詳細は公式サイトおよび「都知事杯オープンデータ・ハッカソン 令和3年度募集要項」(PDF)を参照。参加申し込みフォームは「都知事杯オープンデータ・ハッカソン参加者応募フォーム」を利用する。

アーティサンが公共交通データ形式GTFS対応のバス経路検索サービス「バス予報 乗換案内」の提供開始

アーティサンが公共交通データ形式GTFS対応のバス経路検索サービス「バス予報 乗換案内」の提供を開始

アーティサンは10月12日、地方公共交通のためのデータ形式GTFS(General Transit Feed Specification。標準的なバス情報フォーマット)に対応した路線検索サービス「バス予報 乗換案内」の提供を開始した。これは、地方の交通系事業者や自治体からの依頼を受け、運行データをもとに路線バスの経路検索サービスを構築するという事業だ。GTFSに対応しているため、他社サービスとも連携して、地域のニーズに細かく迅速に対応できる。

特徴は次の3つ。

  • GTFSに完全対応:日本でも普及が進む公共交通データ形式GTFSに対応。GTFS形式のデータを直接インポートできるため、短期間で経路検索サービスの利用が開始できる。またバスロケーションシステム、デジタルサイネージ、Googleマップ、乗換案内などの他システムとのデータの共有が可能
  • 独自の乗り継ぎ経路やランドマーク情報の設定が可能:移動時間、移動距離、乗換回数、徒歩時間などの重み付けを調整して地域固有のニーズに細かく対応。観光地や施設などのランドマーク情報も設定できる
  • 柔軟な提供形態と拡張性:システム開発やサービス提供を行う事業者は自社システムに経路検索のアルゴリズムを組み込めるため、開発コストを削減し、短期間で機能追加が可能となるという。短期の実証実験や簡素な経路検索サービスにも柔軟に対応できる

バス予報 乗換案内利⽤の第1弾としては、アーティサン「バス予報」を導⼊済みの⼗和⽥観光電鉄サイトにおいて、バス予報 乗換案内を利用した経路検索サービスの利用が11月1日から可能になる。同社は、「簡素でも良いので低コストで運用できる検索サービスを提供したいと考えておりました」と話しており、「最適経路の試行および路線変更やダイヤ編成などにも有効」と感じているとのことだ。

ZOZO研究所が分布シフト研究促進に向けファッションの流行変化を検証するデータセット・実装基盤をオープンソースで公開

ZOZO研究所が分布シフト研究促進に向けファッションの流行変化を検証するデータセット・実装基盤をオープンソースとして公開

ZOZOテクノロジーズの研究開発組織「ZOZO研究所」は9月2日、同所研究員が研究において使用している大規模データセット「Shift15M」および実装基盤をオープンソースとして公開したと発表した。データセットおよび実用基盤をGitHub上に公開し、データセットの概要説明を同研究所上に掲載している。

また、同データセットを使用した研究結果をまとめた研究論文「SHIFT15M: Multiobjective Large-Scale Fashion Dataset with Distributional Shifts」をarXivに公開している。

ZOZO研究所は、「ファッションを数値化する」をミッションに掲げるZOZOグループの研究機関。ZOZOグループが保有するファッションに関する情報資産を基に、ファッションを科学的に解明するための研究開発を行っている。

同データセットは、ZOZO研究所が2020年公開した「Open Bandit Dataset」に続くオープンデータプロジェクトの第2弾。同データセットを公開することで、データの分布シフトが起こることによって生じる新たな課題を見出し、解決策を探るための研究開発を促進する一助となることを目指しているという。

Shift15M

Shift15Mは、ファッションアプリ「IQON」に投稿されたコーディネートを基に構成された大規模データセット(IQONは2020年4月にサービスを終了。公開データは商品やユーザーの特定が不可能なよう十分に匿名化しており、利用規約とプライバシーに配慮している)。

同データセットは、IQONのサービス提供期間である2010年から2020年までに投稿されたコーディネート約255万件のほか、これらのコーディネートを構成する約1500万件のアイテムに関する特徴量、アイテムカテゴリに関するデータやコーディネート投稿への「いいね」数などの関連データも含む。

データセットの詳細

  • アイテムの特徴量
  • コーディネートに含まれるアイテムの情報
  • アイテムやコーディネートの付加情報(投稿日時、「いいね」の数、ジャンル・カテゴリー、統計情報、学習のための教師信号など人間が付与したラベル)

データに収録されるアイテム数の詳細

  • コーディネートの数:2,555,147
  • コーディネートを構成するアイテム数(重複あり):15,218,721
  • コーディネートを構成するアイテム数(重複なし):2,335,598

あわせて公開する実装基盤では、コーディネートデータの年ごとに異なる傾向を認識し、その変化によって生じるデータ分布のシフトを再現実験で確認することが可能という。これによって、年々変化するファッションの流行をより正確にとらえ、研究のさらなる発展に役立てられるとしている。また、回帰問題、分類問題、集合マッチングなど、データ分布のシフトが生じる条件のもとで様々なタスクを検証するためのコードが整備されている。

分布シフト研究の発展を支える新たな研究基盤

ZOZO研究所による研究開発の1つに、ファッションの流行が変化しても、継続的に認識精度を高く保つことができるAI技術の実現を目的とするものがあるという。

ファッションに関連するデータは、流行の変化による影響を受け、分布シフトと呼ばれる数理的現象が生じると考えられている。分布シフトは、流行・時間などの変化に伴って入力データの分布が変化することで生じ、ファッションに限らず多くの分野に共通して現れる現象とされる。この分布シフトによって、AIの認識精度が低下することから、近年注目を集めているそうだ。ZOZO研究所が分布シフト研究促進に向けファッションの流行変化を検証するデータセット・実装基盤をオープンソースとして公開

ただ分布シフトの検証は、AI技術の実用性にかかわる重要なテーマである一方、検証に用いる実用的なデータセットの不足により、学術界における当該分野の研究の進展はこれまで制限されてきたという。

そこで、分布シフト研究の発展を支える新たな研究基盤として、ZOZO研究所が保有する実データで構成された大規模データセット「Shift15M」と実装基盤を公開することを決定した。

同データセットと実装基盤は、ファッションに限らず幅広い分野での活用が可能としている。分布シフトの再現実験と典型的なタスクにおける効果検証や比較検証など、目的に合わせて利用できる。

江戸時代のくずし字をAIにより文字認識し現代の書体に変換(翻刻)するアプリ「みを」をCODHが無料公開

江戸時代のくずし字をAIにより文字認識し現代の書体に変換(翻刻)するアプリ「みを」をCODHが無料公開

データサイエンス共同利用基盤施設(ROIS-DS)人文学オープンデータ共同利用センター(CODH)は8月30日、江戸時代の版本に書かれているくずし字を現代の書体に変換(翻刻)するアプリ「みを」(miwo)を無料公開した(Android版iOS版)。開発者は、カラーヌワット・タリン氏。共同開発者は北本朝展氏とMikel Bober-Irizar氏。共同研究者はAlex Lamb氏、Siyu Han氏。

AIくずし字認識については、CODH開発の「KKuroNetくずし字認識サービス(AI OCR)」および「Kaggleくずし字認識コンペ」1位のtascj氏が開発したくずし字認識モデルを用いている。また両AIモデルの学習には、同センターが開発し国文学研究資料館が公開している「日本古典籍くずし字データセット」を利用。Flutterを活用したクロスプラットフォーム開発により、Android・iOS対応アプリを作成した。

みをでは、カメラでくずし字を撮影し、画面下中央の「認識ボタン」をタップすると、ほぼ瞬時にして画像の個々のくずし字の上に、対応する現代の書体が緑色で示される。画面下のスライダーを動かすと、翻刻されたレイヤーを部分的に隠せるので、原文との比較がしやすくなる。まだ完ぺきではないとCODHも言っているように、実際に使ってみると、たまに文字が抜けたり違っていたりもするが、まったくくずし字が読めない人間にすれば、かなりの助けになる。

原文または翻刻された文字をタップすると両方の対応する文字にマーカーが付く。また画面右上の四角形のアイコンをタップすると、認識したすべての文字が四角形で囲まれる。四角形は色分けされ、どの文字がどれに対応しているのかがわかるようになる。

またCODHのくずし字データセットと連携し、認識結果に疑問を抱いた際には、くずし字の用例を確認できる。

江戸時代のくずし字をAIにより文字認識し現代の書体に変換(翻刻)するアプリ「みを」をCODHが無料公開

CODHによれば、くずし字が読める人は、日本の人口のわずか0.01%程度(数千人程度)だという。歴史的資料は大量にあるものの、くずし字を読める人が少ないために翻刻には大変な時間がかかるのが現状だ。そこで、AIを使った翻刻システムを開発しようと考えたとのこと。アプリ名の「みを」は、「源氏物語」の第14帖「みをつくし」に由来する。航路を示す標識「澪標」を意味するが、「人々の水先案内となるように、「みを」アプリがくずし字資料の海を旅する案内となることを目指しています」とCODHは話している。

デジタルツイン関連技術・サービスを展開する企業をまとめた「デジタルツイン 業界カオスマップ」2021年8月版

  1. デジタルツイン関連技術・サービスを展開する企業をまとめた「デジタルツイン 業界カオスマップ」2021年8月版公開

デジタルツインプラットフォームの開発・提供を行うSymmetry Dimensions(シンメトリー・ディメンションズ)は8月19日、2021年8月版「デジタルツイン 業界カオスマップ」を発表した。

2014年10月設立のSymmetry Dimensionsは、空間・都市向けデジタルツイン構築およびプラットフォーム開発を行う企業。空間や都市における人流・交通・IoT・BIM/CIMなど様々な種類のデータをプラットフォーム上で統合・解析することで、誰もが簡単にデジタルツイン上での仮説・検証・計画を行うことを可能にするとしている。

デジタルツインとは、物理空間に存在する場所や事象について、IoTデバイスなどを用いてデータ化しデジタル空間上に再現することで、分析・予測などを可能にする技術。データを活用した業務の最適化を行う方法として、製造業や建設業、スマートシティなど様々な分野での活用に注目が集まっているという。

同社は、2021年8月版「デジタルツイン 業界カオスマップ」とともに、デジタルツインの市場動向およびテクノロジーのうち、特にトレンドとなっている注目すべき重要なキーワードを解説している。

「オープンデータ」の加速

デジタルツインやスマートシティを構築する基盤として、世界中の国や自治体でオープンデータ化の取り組みが加速している。米国政府機関や州・都市などが保有する公共データを一元的に管理提供する「Data.gov」では、2009年の発足当初47件だったデータが、現在では6570倍の約31万件に増大。日本国内では2021年3月に公開された国土交通省の3D都市モデル「Project PLATEAU」(プロジェクト・プラトー)、静岡県の3D点群(Pointcloud)データベース「Virtual Shizuoka」など、3Dデータを中心としてオープンデータ化が進んでいる。

「製造」「建設」業界が先行するデジタルツイン

従来から3Dデータを利用していた製造・建設業界は、デジタルツイン化への対応も早く、これらのニーズに応じたデジタルツイン構築やサービス提供を行う企業が増加している。また、製造業界では自社開発でシステム化を進める企業が多く見られる一方、建設業界では外部テクノロジー企業との協業によるシステム化を進める傾向にある。建設業界においては、今後もスタートアップをはじめとした様々な企業からデジタルツイン開発への参入が活発になるとしている。

業界を横断した「汎用型」プラットフォーム(Cross-Industry)

スマートシティに代表される都市型デジタルツイン領域では、業界を横断した汎用型のデジタルツインプラットフォームが登場。これは、IoTセンサーの普及による現実空間のデータ収集が増大したこと、iPhoneをはじめ身近な製品がLiDARセンサーを採用するなど現実世界をデータ化する流れが加速していることで、従来は3Dデータを使用していなかった企業においてもデジタルツインの構築・利用が可能になってきたためという。

「マルチエクスペリエンス」

デジタルツインの活用では、企業や組織のあらゆる関係者が、場所を問わず、より迅速に現在の状況を把握・共有し、次の行動につながる意思決定を行う必要があるという。Symmetry Dimensionsは、そのためウェブブラウザー・スマートフォン・xR(拡張現実、複合現実)を組み合わせたマルチエクスぺリンス化が加速するとしている。ウェブブラウザーを基点としたクラウドベースのデジタルツインプロダクトは今後さらに増大するという。

デジタルとフィジカルの双方向での共有・連携

現実空間の位置情報に基づき、永続的に情報を保存し、ユーザー間での共有を可能にする技術である「AR Cloud」の進化と、コロナ禍により、あらゆる業務の「デジタルファースト」のプロセスが加速し、デジタルツインと物理空間の双方向でのデータ共有・連携が進むという。これによりデジタルツイン上で行われた意思決定の迅速な現場への反映と、最適化された従業員エクスペリエンスを提供をするようになるとしている。

Geoloniaがオリジナルの地図を作成できる「Geolonia Maps」正式版を開始、1000アクセスまで無料・10万アクセスまで3万円

Geoloniaがオリジナルの地図を作成できる「Geolonia Maps」正式版を開始、1000アクセスまで無料・10万アクセスまで3万円

Geolonia(ジオロニア)は8月5日、地図作成サービス「Geolonia Maps」の正式提供開始を発表した。従来のベータ版からのアップデートを行っており、デザインやインターフェイスの見直しを行い利便性を向上、正式リリースに伴う有料課金機能を新たに搭載した。ユーザーが持つ住所データをアップロードして地図を作成する機能も近日中に提供予定。

利用料金は、1000アクセスまでは無料、10万アクセスまでは3万円。オープンソースコミュニティ向けには地図を無料で提供しており、地図をGitHub Pagesで利用する場合はアクセス数に関わらず無料となる。ライセンスについては、作成した地図は画像としてダウンロードする、印刷して配布するといった再利用が可能。

また、Geolonia Mapsでは利用に際してCookieを取得しておらず、地図上でのユーザーの行動をトラッキングすることはない。

数万件単位の位置情報データを手軽に扱えるダッシュボードを提供

Geolonia Mapsは、オリジナルの地図を自由に作成できるサービス。地図データは、オープン地図サービス「OpenStreetMap」や日本政府が公開するオープンデータを組み合わせて整備することで、低コストで利用上の制約が少ない、自由度の高い地図プラットフォームを実現した。

一般的に、地図で表示する位置情報データはファイルサイズが数百MBから数GB近い大容量ファイルとなる。位置情報データの需要が高まる昨今、今後はさらに多くの位置情報データが流通し、取り扱うファイル容量がさらに膨大になることが予見される。また、地図に位置情報を表示するためには専用のデータベースが必要であり、カスタマイズには高度な専門知識が必要となる。

そこでGeolonia Mapsでは、数万件単位の位置情報データを手軽に扱える「Geolonia Maps ダッシュボード」を提供し、専用データベースを持つことなく地図を作成できるようにした。

Geoloniaがオリジナルの地図を作成できる「Geolonia Maps」正式版を開始、1000アクセスまで無料・10万アクセスまで3万円

Geolonia Maps ダッシュボード

HTMLの編集で自由にカスタマイズ可能、独自開発のAPIを利用することで地図アプリの開発まで行える

地図の基本的なデザインは、HTMLの編集で自由にカスタマイズできるほか、JavaScript APIを利用することで、自社の店舗一覧、お気に入りの飲食店リスト、観光地の見どころスポットなど、テーマに沿った地図をオリジナルのデザインで作成できる。チュートリアルなど利用方法・作成方法に関するドキュメントの公開も行っている。

Geolonia Maps ダッシュボード

地図のカスタマイズ例

Geolonia Mapsの地図表示については、画像を配信するラスタータイル形式ではなく、データ形式で配信するベクトルタイル形式を採用。地図のレンダリングをサーバーではなくクライアントサイドで行うことで、ラスタータイル形式に比べて高速に動作する上、柔軟なデザインカスタマイズが可能という。地図データの分析や加工、表示方法の変更が簡単に行えることから、デザイン性に優れた地図を作成しやすいそうだ。

またアプリケーション開発者は、Geolonia独自開発のAPIを利用し簡単に地図アプリケーションを開発することも可能。緯度・経度情報に対して住所を返す逆ジオコーダーや、不動産に対してIDを発行する「不動産共通ID」、表記揺れの多い日本の住所表記を正規化する住所正規化APIなど、多彩なAPIサービスを利用できる。

関連記事
位置情報関連ソリューション提供のGeoloniaがMedical DOCの「新型コロナワクチンマップ」開発に貢献
表記揺れの影響を受けず不動産物件を特定できる「不動産共通ID」ベータ版が4月公開、APIとして提供
Geoloniaと不動産テック協会が日本全国の住所マスターデータをオープンデータとして公開

カテゴリー:ネットサービス
タグ:オープンデータ(用語)位置情報(用語)ジオコーディング(用語)Geolonia(企業)地図(用語)不動産 / 不動産テック(用語)日本(国・地域)

必要な場所にデータを移動させるオープンソースのデータコネクタープラットフォームAirbyteが28.3億円調達

現在、企業が直面している大きな課題の1つは、関連するデータを見つけることではなく、必要な場所にデータを移動させることだ。この課題を解決するために、オープンソースのデータ統合プラットフォームを構築しているアーリーステージのスタートアップがAirbyte(エアバイト)である。同社は、先の520万ドル(約5億7000万円)のシードラウンドを発表してからわずか2カ月後である米国時間5月25日に、2600万ドル(約28億3000万円)のシリーズAを発表した。

このラウンドを主導したのはBenchmarkで、8VC、Accel、SV Angel、Y Combinator、および複数の技術業界の著名人が投資に参加した。同社はこれまでに3100万ドル(約33億7000万円)以上を調達しているが、そのすべてが2021年に入ってからのものだ。

共同創業者でCEOのMichel Tricot(マイケル・トリコット)氏は、TechCrunchの取材に対して「当社が開発しているのはデータベース、ファイル、APIなどのどこに置かれたデータでも、データウェアハウスやデータレイクなどのお好みの場所に移動させるための、オープンソースのデータ統合プラットフォームです」と語る。このために、さまざまなデータタイプへのコネクターの開発が行われている。同社は、コネクターを開発するためのオープンソースのプラットフォームとSDKを提供し、自身でもコネクターを開発しつつ、コミュニティに対して独自のコネクタの追加を呼びかけている。

スタートアップを取り巻く状況は急速に変化している。今回の資金調達に加えて、2021年5月初めには「Connected Development Kit」(CDK、コネクター開発キット)をリリースした。共同創業者であるJohn Lafleur(ジョン・ラフルール)氏は「このフレームワークを使うことで、カスタムコネクターを2〜3日ではなく、2時間で開発することができます」という。現時点で、プラットフォームの70個のコネクターのうちの約20%がコミュニティから提供されたものだが、CDKがコミュニティに普及するにつれて、その割合は増加するだろうと2人の創業者は期待している。

関連記事:データサイエンティストが社内全体とデータを共有するプロセスをシンプルにするHexが6.1億円調達

Airbyteは2020年創業されたばかりだが、同社は2021年を、急速に成長しているコミュニティを拡大するために費やす予定だ。現時点でコミュニティメンバーは1200人、アクティブユーザーは500人に達している。当面はオープンソースのプロジェクトを継続しながら、将来はホステッドバージョンを開発しそこから収益を得る予定である。

今回の投資を主導しているBenchmarkのゼネラルパートナーであるChetan Puttagunta(チェタン・プッタグンタ)氏は、BenchmarkにはこれまでRed Hat(レッドハット)をはじめ、Elastic(エラスティック)、MongoDB(モンゴDB)、Acquia(アクイア)などのオープンソースのスタートアップへ、初期の投資家として投資を行ってきた歴史があると語った。

プッタグンタ氏がAirbyteにアプローチしたのは、コミュニティで多くの開発者が短期間に活躍しているのを見たからだという。「開発者コミュニティへの関わり合いという観点から、私たちは彼らに声をかけました。Airbyteがあちこちで見られるようになり、データを統合するためのデファクトスタンダードとして急速に普及していくのを目にしたのです。設立からわずか数カ月の会社としては、驚くべき成果でした」。

急激な成長によって、社員数は短期間で2倍の14名となった。ダイバーシティとインクルージョンに関しては、創業者が自ら会社のハンドブックを書き起こしており、その中には詳細な定義や目標などが含まれているが、これは初期段階の会社ではあまり見られることはない。

トリコット氏は「私たちは、ダイバーシティ、インクルージョン、帰属意識を継続的に向上させようとしています。決してこれで終わりと考えることはありません。常に改善の余地があるのです」と語る。

関連記事
オープンソースのデータ統合プラットフォームのAirbyteが5.6億円を調達
オープンソースのデータパイプラインプラットフォーム「Airbyte」

カテゴリー:ソフトウェア
タグ:Airbyte資金調達オープンソースオープンデータデータウェアハウス

画像クレジット:ipopba/Getty Images

原文へ

(文:Ron Miller、翻訳:sako)