Weitere ähnliche Inhalte
Ähnlich wie 関西オープンデータExpo’15 ハンズオンB (20)
Kürzlich hochgeladen (12)
関西オープンデータExpo’15 ハンズオンB
- 3. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
オープンデータとは?
(1) 機械判読に適したデータ形式
コンピュータが⾃動的にデータを再利⽤するためには、コンピュータが、当該データの論理的な構造を識別
(判読)でき、構造中の値(表の中に⼊っている数値、テキスト等)が処理できるようになっていることが必
要となります。機械判読が容易なデータ形式には、いくつかの段階がありますが、画像ファイルやPDF等の形式
ですと、コンピュータプログラムがその中のデータを識別することは困難となり、⼆次利⽤をするためには、
⼈⼿による再⼊⼒が必要となります。東⽇本⼤震災発⽣時には、⾏政の保有する避難所情報などの震災関連情
報を地図データ等を利⽤して広く周知させようとしても、データの形式の問題で⼈⼿によって再⼊⼒しなけれ
ばならないなど、情報の集約や⼆次利⽤に多くの時間と⼿間が必要とされるケースが散⾒されました。また、
機械判読が困難なデータ形式では、スマートフォンのアプリ等で⾃動処理することは非常に困難となり、⺠間
による⾃発的な公共サービスの創造は期待しにくいものとなります。
(2) ⼆次利⽤が可能な利⽤ルール
⼆次利⽤が可能な利⽤ルールについては、第三者がデータを⼀部改変して利⽤すること、すなわちデータの
⼆次利⽤を、データ所有者が予め許諾していることを明⽰することが必要となります。例えば、著作物には著
作権が発⽣しますが、⼆次利⽤を広く認めるには、その著作権の不⾏使を予め宣⾔しておくことが求められま
す。他⽅、現在の各府省のホームページの利⽤条件を⾒てみると、無断での改変を禁じているものが多く、広
く⼆次利⽤を認めるものとはなっていません。また、数値データ等、著作物に該当しないデータについて、著
作権の対象であるような包括的な表現となっている場合もあります。
引⽤元:総務省ホームページ『オープンデータと⾔える条件』
総務省ホームページで定義されたオープンデータと⾔える条件。
公共クラウド Division 営業Group 営業企画支援Team 3
- 4. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
オープンデータとは?
『政府や⾃治体のデータを⼆次利⽤可能な
オープンライセンスで公開し、
市⺠や企業が誰でも⾃由に利⽤できるデータ』
公共クラウド Division 営業Group 営業企画支援Team 4
- 5. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
データ作成にあたって、考慮すべき点
三原則を満たした、「利用可能」なデータを公開する必要があります。
★ どんな形式でも良いのでデータをオープンライセンスで公開 PDFなど
★★ データを構造化データとして公開 Excel、Wordなど
★★★ 非独占の形式を使いましょう CSV、TEXTなど
★★★★ 物事を示すのにURIを使用し、データにリンクすることを可能に URLのようなもの
★★★★★ データのコンテキストを提供するために他のデータへリンク RDF
出展:http://5stardata.info/
公共クラウド Division 営業Group 営業企画支援Team 5
- 6. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
データ作成にあたって、考慮すべき点
(1) 機械判読に適したデータ形式
コンピュータが⾃動的にデータを再利用するためには、コンピュータが、当該データの論理的な構造を識別
(判読)でき、構造中の値(表の中に⼊っている数値、テキスト等)が処理できるようになっていることが必
要となります。機械判読が容易なデータ形式には、いくつかの段階がありますが、画像ファイルやPDF等の形
式ですと、コンピュータプログラムがその中のデータを識別することは困難となり、⼆次利用をするためには、
⼈⼿による再⼊⼒が必要となります。東⽇本大震災発⽣時には、⾏政の保有する避難所情報などの震災関連情
報を地図データ等を利用して広く周知させようとしても、データの形式の問題で⼈⼿によって再⼊⼒しなけれ
ばならないなど、情報の集約や⼆次利用に多くの時間と⼿間が必要とされるケースが散⾒されました。また、
機械判読が困難なデータ形式では、スマートフォンのアプリ等で⾃動処理することは非常に困難となり、⺠間
による⾃発的な公共サービスの創造は期待しにくいものとなります。
引用元:総務省ホームページ『オープンデータと⾔える条件』
データ作成にあたって、再確認すべきこと
データセットのあり方を検討する必要がある
公共クラウド Division 営業Group 営業企画支援Team 6
- 9. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
実際に決めなくてはいけないこと達
(1) サイトのドメイン
(2) データ利用規約
(3) 内部用データ公開ルール
(4) アカウントごとの組織/タグのヒモ付
(5) データポータルサイトアカウントルール
(6) データセットと庁内組織のヒモ付
(7) データにひもづけるメタデータ
(8) サイトのメンテナンスルール
(9) 職員研修のありかた
公共クラウド Division 営業Group 営業企画支援Team 9
他にも、そもそもどんなデータを出すか?どんな形式で提供するか、
などなど・・・・
- 11. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
各サイト分割の意味について
市本体サイト O/Dポータルサイト
情報公開の精神にもとづいて、市⺠向
け情報を「⼈が⾒やすい」形式で提供
するサイト
市にストックされている情報を、ニー
ズに応じて「機会判読可能な」形式で
提供するサイト
2つのサイトは、バナ2つのサイトは、バナ
ーで相互リンク。
必要に応じて、それぞ
れの末端ページをリン
ク。
・市政情報の即時配信
・様式類の取得
・情報のアーカイブ
・利用者別の情報構造
・統計情報等の時系列
・位置情報等の面情報
・画像などの素材情報
・市⺠要求ごとの情報
配信情報の特徴配信情報の特徴 配信情報の特徴配信情報の特徴
⽇々の更新による定常的
状配信・情報公開によっ
て運営
データ要求時、もしく
は更新時期ごとの定期
的更新
24種類のジャムを売り場に並べたときと、6種類のジャムを売り場に並べたときでは、
前者は、後者の売り上げの10分の1しかなかった。
— 「選択の科学(シーナ・アイエンガー)」より
公共クラウド Division 営業Group 営業企画支援Team
市町村
本体サイト
11
- 12. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
サイト分割のメリット/デメリット
難問は分割せよ
— 「方法叙説(デカルト)」より
統合サイトの場合統合サイトの場合統合サイトの場合統合サイトの場合 分割サイトの場合分割サイトの場合分割サイトの場合分割サイトの場合
両サイトとも閲覧不能になる恐れがありま
す
アクセス集中への
強度は?
双方のサイトについての影響は少なく、ス
ムーズにデータ習得が可能
データのみ、あるいはページのみの検索を
実施するには問題があります
サイト内検索の
利便性は?
必要なデータを、組織、グループ、タグの3
軸で次週に検索が可能です
サイト内に掲載していることなどから、別途
別ページやコンテンツを作るなどして管理
する必要があります
データの網羅性は? 専用サイトして運用するため、よりコンパク
トに検索性の高い運用が可能です
1サイトで管理でき、相対的に平易。運用上
データの仕分け等が発生するため、1デー
タの2重掲載が前提となる可能性が高い
運⽤負荷は?
2サイトをそれぞれ管理する必要あり、2つ
の運用ルールが必要。
オープンデータ専門サイトのため、データ
の仕分け等は不要となり、管理は容易。
CMSサービスに依存して決定。
データ配信などへの転用は高コストの畏れ
将来の拡張は? APIによる配信なども前提に設計しており、
データ利用を容易にする仕組みとして構築
いけてない 雰囲気的に? いけてる
公共クラウド Division 営業Group 営業企画支援Team 12
- 15. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
運用フロー作成前に決定しなくてはいけない事項
どうでもよいことは流⾏に従い、
重大なことは道徳に従い、芸術のことは⾃分に従う。
— 小津 安⼆郎
公共クラウド Division 営業Group 営業企画支援Team
公開データの洗い出し公開データの洗い出し
市が持っている各種の⾏政データから、特にオープンデ
ータとして公開対象になりうるものをリストアップし、
各担当部局に対して提供を依頼する。
データ提供の利用ルールデータ提供の利用ルール
公開するそれぞれのオープンデータに対して、その改変
や著作権の及ぶ範囲など、適用すべき利用ルールを選定
する。
データセット・組織扱いデータセット・組織扱い
公開・非公開の制御はデータセット
ご指定され、非公開のものは、デー
タセットが属する組織に所属するユ
ーザのみが閲覧できる。組織とデー
タセットを公開対象のデータセット
ごとにまとめる。
データの登録・管理規則データの登録・管理規則
データを登録する担当者とその⼿順
を明確にし、規則として明文化する
。アカウントの発⾏申請⼿順や、デ
ータの登録承認⼿続きを決定。また
、組織ごとに、管理者ユーザを定め
る。
グループやタグの決定グループやタグの決定
グループやタグは、利便性を向上さ
せるための項目である。グループや
タグとして何を設定するか、また、
各オープンデータをどのグループや
タグに所属させるかを決定する。
そもそもの公開に関わる箇所そもそもの公開に関わる箇所
公開後の運用及び担当の業務に関わる箇所公開後の運用及び担当の業務に関わる箇所
参考:オープンデータ流通推進コンソーシアム「オープンデータガイド〜オープンデータのためのルール・技術の⼿引き〜第1版」付録 11章
15
- 16. Copyright 2015 Smartvalue Co.,Ltd All rights reserved. 16
想定運用フローについて
公共クラウド Division 営業Group 営業企画支援Team
公
開
内部の運用外部からの要因
データ公開のの
是非を判断
データサイトへ
のデータ登録
非掲載の連絡
市⺠/企業/政府
からの声
確認と
承認
データの作成
必要に
応じて
協議
デ
タ
登
録
の
デ
ー
タ
登
録
の
起
案
公開記録の保
管
公開情報の
更新
データ要求から公開までの流れ
凡例凡例
市⺠(外部)
要求
管理部門の
必要作業
原課での
必要作業
掲載可の判断
- 17. Copyright 2015 Smartvalue Co.,Ltd All rights reserved. 17
⾏政にかかるコストの課題を解決するために
規矩作法
守りつくして、破るとも、離るるとても、本を忘れるな。
— 千利休
ポータルサイトへの情報登録フローは6ステップポータルサイトへの情報登録フローは6ステップ
必要に応じ
リンク付与
公開タグ付与
グループ
付与
データ
アップロード
ログイン
使⽤するツール例
CKAN
いくくるウェブ
など
データ更新作業に掛かるステップは、CMS作業同等データ更新作業に掛かるステップは、CMS作業同等
既に多くの⾃治体様で導⼊されているCMSによる通常のホームページ更新フローと同様、もしくはあ
いのりする形での運用体制の敷設が可能です。
=+
既存の業務フローへと歩み
寄る形でのデータ公開フロ
ーを早期に確⽴してしまう
ことが最重要課題
公共クラウド Division 営業Group 営業企画支援Team
市町村
本体サイト
- 20. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
オープンデータ化
【表形式データに関する指針】
①1つのファイル=1種類の表で構成する
→1つのファイルに複数の表がある場合は、分割して2つのファイルにする。
②表のヘッダ(項目名)は1⾏で構成する
→ヘッダ(項目名)の内容を統合して1⾏にまとめる。
③データ以外の情報は記⼊しない
→データへの注釈は省く。
④セル同士の結合はしない
→1⾏単位でのデータであるため、結合は禁⽌。
⑤データの値がない場合を除き、セルは空⽩(省略)にしない
→データの値がない場合は、空⽩にする。
⑥年の値は、⻄暦表記を記⼊する
→和暦のみでなく、⻄暦も記⼊する
⑦データの単位(物理単位や貨幣単位等)はヘッダ(項目名)に記⼊する
→各データのセルに単位を記⼊はしない
参考:オープンデータ流通推進コンソーシアム「オープンデータガイド〜オープンデータのためのルール・技術の⼿引き〜第1
版」p.96-106
公共クラウド Division 営業Group 営業企画支援Team 20
- 21. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
【オープンデータ化されたCSVデータのタグ定義】
■基本情報 →施設に関する基本情報で、記⼊必須項目です。
・施設名:施設の名称
・郵便番号:施設の郵便番号(ハイフンあり)
・住所:施設の住所とは別に、「府」「市」「区」のカテゴリ分けも
→アプリの施設検索時に活用されやすくなります。
・電話番号:施設の電話番号(ハイフンあり)
・FAX番号:施設のFAX番号(ハイフンあり)
・緯度:施設の緯度
・経度:施設の経度
・ホームページURL:施設の公式ホームページ
■付帯情報 →施設に関する付帯情報で、記⼊は必須ではありません。
・施設情報:施設に関する説明
・カテゴリ:施設のカテゴライズ
・画像URL:施設に関する写真
・サムネイル画像URL:サムネイル用の施設の写真
・創設⽇:施設の創設⽇
・創設者:施設の創設者
■その他情報 →データセットの内容によって変更される情報です。
・営業開始時間 ・営業終了時間 ・対象年齢 ・定員 など
施設情報テンプレート
公共クラウド Division 営業Group 営業企画支援Team 21
- 22. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
【テンプレート⾒本】
■Excelデータ →編集時はこちらから。
■CSVデータ →保存時はCSV形式で。
例えば、施設情報テンプレート
基本情報
(記⼊必須)
付帯情報 その他の情報
基本情報
(記⼊必須)
付帯情報 その他の情報
公共クラウド Division 営業Group 営業企画支援Team 22
- 23. Copyright 2015 Smartvalue Co.,Ltd All rights reserved. 23
データ公開にあたり、整備すべきルール
公共クラウド Division 営業Group 営業企画支援Team
既存の情報発信業務と同様に、一定のルールの決定が必要です
データ公開にあたり、その位置
づけや利用に関する規約を制定
し、データポータルサイトへ併
せて掲出する必要があります
通常のホームページ更新等と同様
に、「どこの」「どのような」責
任のもとにデータを公開するのか
の⼿順を決定する必要があります
通常のホームページ運用と同様に
、各データの更新にあたっての権
限の付与及びその権限の付与範囲
の管理が必要です
データ利用規約 データ運用ルール アカウント管理
『オープンデータ流通推進コン
ソーシアム「オープンデータガ
イド〜オープンデータのための
ルール・技術の⼿引き〜第1版」
P57 』を参照の上、必要な情報
などを検討下さい。
データの作成・更新は通常の場合
、原課での対応が望ましいと思わ
れます。サイト運用時に設定され
たルールなどを基本に、所管課及
び管理部門との役割分担をご設定
下さい。
ポータルサイト用のアカウントの
払い出し及びその管理について、
管理を担当する部門の実態に沿っ
た形でご決定下さい。
データ所管課ごとに2つ程度のア
カウント発⾏と、年度ごとのPW
変更程度での開始が望ましいと思
われます。
- 26. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
オープンデータ化
公共クラウド Division 営業Group 営業企画支援Team
表形式データに関する指針
1つのファイル=1種類の表で構成する
1つのファイルに複数の表がある場合は、分
割して2つのファイルにする。
表のヘッダ(項目名)は1⾏で構成する
ヘッダ(項目名)の内容を統合して1⾏にま
とめる
データ以外の情報は記⼊しない データへの注釈は省く
セル同士の結合はしない 1⾏単位でのデータであるため、結合は禁⽌
データの値がない場合を除き、セルは
空⽩(省略)にしない
データの値がない場合は、空⽩にする
年の値は、⻄暦表記を記⼊する 和暦のみでなく、⻄暦も記⼊する
データの単位(物理単位や貨幣単位等)は
ヘッダ(項目名)に記⼊する
各データのセルに単位を記⼊はしない
①
②
③
④
⑤
⑥
⑦
参考:オープンデータ流通推進コンソーシアム「オープンデータガイド〜オープンデータのためのルール・技術の⼿引き〜第1版」p.96-106
26
- 27. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
オープンデータ化に向けた作業での実際
公共クラウド Division 営業Group 営業企画支援Team
今回頂いたデータにおける問題点の例
27
1つのファイル=1種類の表で構成する
1つのファイルに
複数の表がある場合
は、分割して2つの
ファイルにする。
①
セル同士の結合はしない
1⾏単位でのデータ
であるため、結合
は禁⽌。
④
データの単位(物理単位や貨幣単位等)は
ヘッダ(項目名)に記⼊する
各データのセルに単
位を記⼊はしない
⑦
学
校
名
電
話
番
号
等
住
所
等
施
設
名
称
施設名称など施設名称など
施設名称など施設名称など
- 28. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
・施設名:施設の名称
・郵便番号:施設の郵便番号
・住所:施設の住所とは別に、「府」
「市」「区」のカテゴリ分けも
→アプリの施設検索時に活用されやす
くなります。
・電話番号:施設の電話番号
・FAX番号:施設のFAX番号
・緯度:施設の緯度
・経度:施設の経度
・ホームページURL:施設の公式ホー
ムページ
・施設情報:施設に関する説明
・カテゴリ:施設のカテゴライズ
・画像URL:施設に関する写真
・サムネイル画像URL:サムネイル用
の施設の写真
・創設⽇:施設の創設⽇
・創設者:施設の創設者
営業開始時間・営業終了時間・対象年
齢・定員など
データ公開時に使用するテンプレート案
公共クラウド Division 営業Group 営業企画支援Team
オープンデータ化された施設情報のCSVデータのタグ定義
基本情報 付帯情報 その他
施設に関する基本情報で、記⼊必
須項目です。また、アプリなどに
活用した際、施設検索など基本機
能に関わるデータ群です。
施設に関する付帯情報で、記⼊は
必須ではありませんが、データと
しては保持しておいた方が利活用
の幅が広がるデータです。
データセットの内容によって変更
される情報です。公開するデータ
セットに応じて⾃由に設定いただ
くことを想定しています。
28
- 29. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
施設情報テンプレート
公共クラウド Division 営業Group 営業企画支援Team
施設に関する基本情報で、記⼊必須項目です 施設に関する付帯情報で、記
⼊は必須ではありません
データセットの内容によって変更
される情報です
基本情報基本情報 付帯情報付帯情報 その他その他
テンプレート⾒本にみる対応
データ作成時におけるExcelの表記データ作成時におけるExcelの表記
公開時には、CSV形式にて保存します
基本情報基本情報 付帯情報付帯情報 その他その他
データ作成ルールに注意し、保存時に形式を指定するだけ
29
- 30. Copyright 2015 Smartvalue Co.,Ltd All rights reserved. 30公共クラウド Division 営業Group 営業企画支援Team
その他の留意点など
メタデータの表記
表記すべき内容
・タイトル
・組織名
・公表者(部局)
・作成者
・更新頻度
・タグ
・リリース⽇
・URL
・ファイルサイズ
・最終更新⽇
・使用⾔語
・補足
データの作成・更新は通常の場
合、原課での対応が望ましいと
思われます。
また、公開されたデータに関す
る問合せの一次窓口や、データ
以外の公開情報に関しての更新
責任のある部署を決定する必要
があります。
通常のサイトの更新作業同様の
プロセスに加え、新たに、デー
タの作成プロセスが業務に加わ
ります。
市⺠や企業などの求めてに応じ
て提供するデータの作成ルール
の徹底のためにも、職員研修を
⾏い、「オープンデータとは」
の部分からの啓蒙が必要です。
また、新たに導⼊されるサイト
管理のシステムについても同様
で、運用のフローについての研
修が必要となります。
データに付帯する情報やルールなどの整備
メタデータ サイトのメンテナンス 職員への研修等
公開されたデータについて「⼈が
みてどのようなデータかわかる」
ための情報の記述方法については
、運用ルールとしてご決定頂く必
要があります
オープンデータ公開の意義を職員
間で正しく共有した上で、業務と
しての管理、義務としてのデータ
公開のルールを策定する必要があ
ります
業務としての管理、義務としての
データ公開のルールを確認し、研
修の上、年度ごとに更新していく
必要があります。
- 31. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
庁内調整が多く、
実際に進めるとなると、
説得し続けるタフさが必要
31公共クラウド Division 営業Group 営業企画支援Team
- 33. Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
CKANについての概説
CKANとは
CKAN は、Web ベースのデータ管理・配信システムであり、Open
Knowledge Foundationにより無償で提供されている。
CKANは、data.gov (米国)、data.gov.uk (英国)、publicdata.eu (EU)、
data.gov.au (オーストラリア)、DATA.GO.JP(政府データカタログサイ
ト試⾏版)、datameti.go.jp (Open DATA METI)等、オープンデータを
配信する多くの政府系組織で利用されている。
詳細は「オープンデータガイド〜オープンデータのためのルール・技術
の⼿引き〜第1版」付録 11章を参照(別紙)のこと。
、
参考:オープンデータ流通推進コンソーシアム「オープンデータガイド〜オープンデータのためのルール・技術の⼿引き〜第1版」付録 11章
CKANを用いたデータ公開にあたってのフローCKANを用いたデータ公開にあたってのフロー
データセットの
登録
データセットの
作成
組織へのアカウン
ト連結と通知
管理者による
組織の登録
管理者による管理者による
ユーザアカウント
登録
デ
ー
タ
の
公
開
管
理
ユ
ー
ザ
(職
員
)
初回及び年度管
理のみの作業
⽇常の運用にお
いての作業
33公共クラウド Division 営業Group 営業企画支援Team