Weitere ähnliche Inhalte
Ähnlich wie SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回「行間を読むっていろいろと大切」 (11)
Mehr von Yasushi Hara (20)
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回「行間を読むっていろいろと大切」
- 2. 告知
• GRIPS SciREX センターではインターンを募集中です
• ○イノベーションプロセスの解明を進めるためのデータベース設計・構築
• 政策分析・影響評価領域では、科学技術の変遷および政策の変遷を把握し、それらの
情報をマッピングすることで、科学技術およびその政策が新製品や新サービスとして
具現化されるイノベーションにどのような影響を与えたのか定量的に解析することを
目指しています.
• 本研究では、(1) JST 研究開発戦略センター研究開発戦略センターがこれまでに実施し
てきた科学技術課題の調査, (2) NISTEP 科学技術動向研究センターが実施してきた科学
技術予測調査, (3) 特許および論文書誌情報データベース (PATSTAT, Web of Knowledge,
Scopus など), (4) 新製品や新サービスに関わるプレスリリース情報等のデータベース
を接合することにより, 個々の科学技術がどのようなアウトプットを生み出したのか,
その際, 政策的な資源投入あるいは制度変更がどのような影響を与えたのかを明らか
にします.
• インターン生には (A) データベースの接合および名寄せ手法の開発・検討, (B) 定例
ミーティングへの参加等の業務に関わって頂きます.
• 詳しくはこちら:
• http://scirex.grips.ac.jp/center/ja/326
2015/7/25 2
- 4. WS シリーズの目的
• 目的
• 特許や論文のデータを使うことで解析できる範囲を知るために、まず分析手法を
学ぶ
• 手法
• パソコンを用いたハンズオンセミナー方式 (手を動かして覚える!)
• 時間:
• 土曜日の夕方に90分-120分程度
• 一ヶ月に一回程度 (第一期; 5-6回)
• 場所:
• 国立 (一橋大学イノベーション研究センター) または
• 六本木 (政策研究大学院大学科学技術イノベーション政策研究センター)
• 参加希望の方は, ya-hara@grips.ac.jp または @harayasushi (twitter) までご
連絡ください.
2015/7/25 4
- 5. WSシリーズのスケジュール
• [2015/1/29] 第0回: 「数字が教えてくれないこと」 @一橋イノベーション研究センター
• [2015/3/8] 第1回: 「数字が教えてくれること」 @一橋イノベーション研究センター
• 特許や論文データはなぜイノベーション指標として活用されているのだろう
• [2015/4/18]第2回: 「巨人の肩の上に立つ」 @GRIPS SciREX センター
• 論文データベース (Web of Knowledge, Scopus, Scival etc…) を用いた分析
• [2015/5/14] IRCセミナー @関西学院大学イノベーション研究センター
• [2015/5/16] 第3回: 「select() すると幸せになれる理由」 @一橋イノベーション研究センター
• IIP データベース/patR データベースを用いた日本特許分析
• [2015/6/27] 第4回: 「科学とイノベーションの関係」@一橋イノベーション研究センター
/GRIPS SciREX センター
• 組織学会@一橋大学のため第四週におこないます
• サイエンスリンケージデータベースを用いた特許/論文の連結分析
• [2015/7/25]第5回: 「行間を読むっていろいろと大切」@一橋イノベーション研究センター
/GRIPS SciREX センター
• 書誌テキスト分析 (KHcoder) を使って分析できること
• [2015/8/8] 第6回 : 「まとめネットワーク分析ソフトウェアの使い方とまとめ」
• 科学とイノベーションのあれこれは書誌情報からどこまでわかるのだろう
2015/7/25 5
- 9. ケーススタディ:
小室さんと華原さんのトークを分析してみよう
• TK MUSIC CRAMP
• 1995年から1998年まで放送してた音楽番組
• 1995年度は小室さんが
• 1996年度はSMAPの中居くんが
• 1997年度は華原さんが司会を担当
• 二人の会話を共起グラフ分析して、二人がどのくらいラブラブ
だったのか、どのくらい冷めちゃったのか可視化できるかやっ
てみよう
• 分析対象
• 1996/3/6 オンエアのトーク
• 1998/3/25 オンエアのトーク
2015/7/25 9
- 21. 抽出語のチェック (1996年)
感動詞 形容詞
うん 65難しい 9
あの 21嬉しい 8
なんか 20高い 4
え 19悪い 3
あ 16楽しい 3
うーん 14欲しい 3
まあ 14厳しい 2
ありがとう 13厚い 2
はい 12小さい 2
ああ 6羨ましい 2
ごめんなさ
い 6太い 2
じゃあ 5大きい 2
そうですね 5優しい 2
ほら 4淋しい 2
名詞
自分 38
感じ 28
音楽 19
テレビ 18
本当 10
ビデオ 7
未来 7
カラオケ 6
ウマ 5
チャンネル 5
ドラマ 5
最初 5
エンディング 4
ゲスト 4
テープ 4
ヘリコプター 4
言葉 4
立場 4
コーラス 3
人名
小室 52
朋 31
朋美 14
よね 4
哲哉 4
遠藤 2
中山 2
美穂 2
シン 1
森高 1
渡辺 1
美里 1
2015/7/25 21
- 22. 抽出語のチェック (1998年)
感動詞 列1 形容詞 列2 名詞 列3 人名 列4
うん 34嬉しい 6感じ 19小室 39
あ 27難しい 6テレビ 12朋 35
なんか 15可愛い 4音楽 12華原 10
まあ 15遠い 3自分 11朋美 9
はい 14多い 3久し振り 9美紀 6
ああ 9大きい 3時代 8大介 4
ありがとう 6面白い 3弟子 8舞 4
あの 5優しい 3ギャグ 7原 3
と 4恐い 2調子 7西川 3
なるほど 4欲しい 2番組 7大輔 3
え 3良い 2コーナー 5哲哉 3
ほら 3眩しい 2マネージャー 5
ううん 2可愛らしい 1外国 5
じゃあ 2懐かしい 1最初 5
そうですね 2楽しい 1武器 5
そうね 2強い 1名前 5
ねぇ 2激しい 1ジュース 4
あら 1若い 1センス 4
あれ 1数少ない 1ピアノ 4
うーん 1短い 1社長 4
こんばんは 1遅い 1本当 4
ごめん 1長い 1アルバム 3
ごめんなさい 1美味しい 1オレンジ 3
さぁ 1眠い 1ゲスト 3
じゃ 1淋しい 1ステップ 3
すいません 1 スプレー 3
ねえ 1 ハプニング 3
何だ 1 フランス語 32015/7/25 22
- 27. NISTEP 調査レポート 222
• タイトル
• 「日本人のノーベル賞受賞が国民の 科学技術に関する意識に与える影
響 -2012 年のノーベル医学生理学賞受賞の影響-」
• アブストラクト
• “2012 年 10 月 8 日、スウェーデンのカロリンスカ研究所は、京都大学
の山中伸弥教授に 2012 年 のノーベル医学生理学賞を授与することを
発表した。本調査は、日本人によるノーベル医学生理 学賞受賞が国民
の科学技術に関連する意識に与えた影響について把握するため、2012
年 11 月、 2013 年 1 月及び 3 月にインターネット調査を実施した。そ
の結果、国民、特に女性の科学技術の 話題に対する関心や子どもの研
究者の仕事に対する関心などの高まりが見られた。”
2015/7/25 27
- 28. 調査方法
• 20~69 歳を対象とした一般成人
に関する調査、及び同居してい
る子どもがいる 20~59 歳を対
象とした子どもに関する調査に
ついて、それぞれ 3 回(2012 年
11 月、2013 年 1 月及び 3 月)、
イ ンターネットを利用したアン
ケート調査を実施した。
• なお、子どもに関する調査は、
1 回目の調査の 回答者に対して
2 回目及び 3 回目の対象者とし
た追跡調査である。
• 有効回答数
• ①11 月調査 一般成人に関する調
査 855 人(男性 426 人、女性 429
人) 子どもに関する調査 717 人
(男性 434 人、女性 283 人)
• ②1 月調査 一般成人に関する調査
840 人(男性 419 人、女性 421
人) 子どもに関する調査 618 人
(男性 385 人、女性 233 人)
• ③3 月調査 一般成人に関する調査
840 人(男性 419 人、女性 421
人) 子どもに関する調査 543 人
(男性 344 人、女性 199 人)
2015/7/25 28
- 29. ノーベル賞受賞の認知度
• 30 代~60 代は、3 月調査時点
で概ね 97%の人が山中伸弥教
授のノーベル賞受賞について
知っているのに対し、20 代は
3 回の調査とも概ね 90%で、
他の年代と比べ関心が低 かっ
た
2015/7/25 29
- 32. iPS 細胞に関する研究に対する考え
• 「早く医療に実用化してほし
い」が 3 回の調査とも概ね 80%
で最も高く、実用化に対する 期
待が非常に高い(図 d)。
• 次いで「日本が世界の研究を
リードしていってほしい」が概
ね 40%と時間の経過とともに上
昇傾向にある。これは、臨床研
究や実用化で欧米に後れをとる
ことなく世界をリードして日 本
の発展に繋げてほしいという思
いが強まってきたことの表れで
あろう。
2015/7/25 32
- 35. 自由記述欄からの調査: “子どもたちが理
科や科学に興味を持つために必要なこと”
• 、「実験」(199 回)、「授業」(73
回)、「体験」(68 回)、 「学校」(52
回)、「自然」(40 回)といった子ども
たちが理科や科学に興味を持つための手
段に関 連する言葉が多く出現している。
それに次いで、「思う」(159 回)、「持
つ」(112 回)、「増やす」 (34 回)、
「考える」(31 回)といった一般的な動
詞が多く出現していた。
• 変わったところでは、「でんじろう」
(14 回)が比較的多く出現している。こ
れはサイエンスプロ デューサーとして科
学実験等の企画・開発や各地でサイエン
スショーや実験教室を行うなど子ど もた
ちに科学の楽しさを伝える活動をしてい
る「でんじろう先生」の愛称で有名な米
村傅治郎氏 を表す言葉である。
2015/7/25 35
- 37. References
• 早川, 雄司 茶山, 秀一 (2013)日本人のノーベル賞受賞が国民の科
学技術に関する意識に与える影響 -2012年のノーベル医学生理
学賞受賞の影響-, http://hdl.handle.net/11035/2406
2015/7/25 37
- 40. やること
1. KHCoder をインストールする
2. NISTEP定点調査自由記述簡易検索用データベースをダウンロード
する
3. KHCoder に定点調査の自由記述データを読み込む
4. データ分析前の処理をする
5. 頻出語の取り出しを行う
6. 共起ネットワークを書く
7. 外部変数を読み込み属性情報を付与する
8. 属性情報ごとの特徴を抽出する
9. 対応分析を行う
2015/7/25 40
- 41. 1. KHCoder をインストールする
• KHCoder とは?
• テキスト型データの計量的な内容分析(計量
テキスト分析)もしくはテキストマイニング
のためのフリーソフトウェアである。各種の
検索を行えるほか、どんな言葉が多く出現し
ていたのかを頻度表から見ることができる。
さらに多変量解析によって、一緒に出現する
ことが多い言葉のグループや、同じ言葉を含
む文書のグループを見ることで、データ中に
含まれるコンセプトを探索できる。
• また一部の文書群に注目した場合に、その文
書群に特に多く出現する言葉をリストアップ
することで、その文書群の特徴を探索できる。
あるいは分析者が指定した基準によって、文
書の分類を自動的に行うこともできる。 (引用:
https://ja.wikipedia.org/wiki/KH_Coder)
2015/7/25 41
- 43. 1. KHCoder をインストールする
• ダウンロードしたファイル
(khcoder-2b32h-f.exe) を選択
し, クリックする
• Unzip を選択し, ファイルを展
開する
2015/7/25 43
- 46. 1. Khcoder をインストールする
• Tips: Mackintosh な場合
• 結構めんどくさい
• 有償版のインストールパッケー
ジが提供されている.
• https://khcoder.stores.jp/#!/items
/536a53268a561084140001dd
2015/7/25 46
- 48. NISTEP 定点調査
• 内容
• 「科学技術の状況に係る総合的意識調査(以下、NISTEP定点調査)」は、
研究費の使いやすさ、基礎研究の多様性など通常の研究開発統計から
は把握しにくい、日本の科学技術 やイノベーションの状況について、
産学官の研究者や有識者への意識調査から明らかにすることを目的に
した調査
• 同一の回答者に、毎年、同一のアンケート調査を実施する点である。
回答者には前年度の本人の回答結果を示し、前年度と異なる回答をし
た質問については回答の変更理由を、前年度と同じ回答であっても補
足などがある場合には意見等の記入を依頼
2015/7/25 48
- 53. 2-2. NISTEP定点調査自由記述簡易検索用
データベース をダウンロードする
• 自由記述欄の質問内容
• Q1-9. 大学・公的研究機関において、優秀な博士課程後期学生や若手研
究者の育成や確保を行うために、今後どのような取り組みが必要です
か。ご意見をご自由にお書き下さい(必須項目ではありませ ん)。特に
第4期科学技術基本計画の進展や期間中に顕在化してきた課題を踏まえ
た記述をお願いします。
• 2011, 2013, 2014 年度に回答を得ている.
• どうも自分たちに関係があるっぽい質問内容なので、こいつを
分析してみましょう。
2015/7/25 53
- 58. 3. KHCoder に定点調査の自由記述データ
を読み込む
• もし
• テキストエディタを持っていない
• うまく正規表現で処理できなかった
場合には以下のデータをお使いください。
https://www.dropbox.com/s/xfy4cgemhglb724/q19.txt?dl=0
2015/7/25 58
- 73. 7.外部変数として属性情報を読み込む
• 属性情報
• データ年
• 連番
• 問番号
• 所属機関
• 大学
• 研究機関
• 職位
• 性別
• 男性
• 女性
• 大学グループ
• 日本国内 での論文シェアで分類
• 5%以上の大学: 第 1 グループ
• 1%以上~5%未満の大学: 第 2 グ
ループ
• 0.5%以 上~1%未満の大学は第
3 グループ
• 0.05%以上~0.5%未満の大学は
第 4 グループ
2015/7/25 73
- 81. 8. 属性情報ごとの特徴を抽出する
• Hypothesis
• たぶん、学長のいうことと、教授のいうことと、助手のいうことは違
うに違いない
• たぶん、学部によって考えてることも違うに違いない
• たぶん、性別も影響しているに違いない
⇒属性情報と組み合わせて分析することで、グループごとの特徴を明ら
かにする
2015/7/25 81
- 97. References
• 樋口 耕一 (2014)『社会調査
のための計量テキスト分析
―内容分析の継承と発展を
目指して』,ナカニシヤ出版
• KHcoder のTwitter
• https://twitter.com/khcoder
2015/7/25 97
- 98. 次回予告
• ネットワーク分析ソフトの使い方
• NetDraw とか Sci2 とか R とか・・・
• まとめ
• 第二期の企画会議
• ひとりで喋るのは面倒なので、NISTEPやJSTや他大学の猛者たちを連れ
てきて喋ってもらいたいです
• そもそも、何をやりましょう
• PDW方式?
• もっとわかりやすい方向?
2015/7/25 98
- 99. Acknowledgement
• 文部科学省 SciREX 「政策のための科学」事業
• 政策研究大学院大学 科学技術イノベーション政策研究センター
• 一橋大学「政策のための科学」基盤的研究・人材育成拠点事業(領
域開拓拠点)イノベーションマネジメント・政策プログラム(Innovation
Management and Policy Program:IMPP)
• 独立行政法人科学技術振興機構社会技術研究開発センターによる
「科学技術イノベーション政策のための科学研究開発プログラム」:
• 「イノベーションの科学的源泉とその経済効果」
• 「科学技術イノベーション政策の経済成長分析評価プロジェクト」
992015/7/25