Suche senden
Hochladen
R入門(dplyrでデータ加工)-TokyoR42
•
21 gefällt mir
•
19,191 views
Atsushi Hayakawa
Folgen
R入門(dplyrでデータ加工)-TokyoR42
Weniger lesen
Mehr lesen
Technologie
Melden
Teilen
Melden
Teilen
1 von 39
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Empfohlen
Tokyor36
Tokyor36
TokorosawaYoshio
2016年6月版データマエショリスト入門
2016年6月版データマエショリスト入門
Yuya Matsumura
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
Nagi Teramo
Intoroduction of Pandas with Python
Intoroduction of Pandas with Python
Atsushi Hayakawa
Tokyo r28 1
Tokyo r28 1
Takashi Minoda
Tokyo r33 beginner
Tokyo r33 beginner
Takashi Minoda
10分で分かるr言語入門ver2.9 14 0920
10分で分かるr言語入門ver2.9 14 0920
Nobuaki Oshiro
Tokyo r47 beginner_2
Tokyo r47 beginner_2
Takashi Minoda
Empfohlen
Tokyor36
Tokyor36
TokorosawaYoshio
2016年6月版データマエショリスト入門
2016年6月版データマエショリスト入門
Yuya Matsumura
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
Nagi Teramo
Intoroduction of Pandas with Python
Intoroduction of Pandas with Python
Atsushi Hayakawa
Tokyo r28 1
Tokyo r28 1
Takashi Minoda
Tokyo r33 beginner
Tokyo r33 beginner
Takashi Minoda
10分で分かるr言語入門ver2.9 14 0920
10分で分かるr言語入門ver2.9 14 0920
Nobuaki Oshiro
Tokyo r47 beginner_2
Tokyo r47 beginner_2
Takashi Minoda
2017年3月版データマエショリスト入門
2017年3月版データマエショリスト入門
Yuya Matsumura
2017年3月版データマエショリスト入門(誤植修正版)
2017年3月版データマエショリスト入門(誤植修正版)
Yuya Matsumura
Gensim
Gensim
saireya _
Tokyo r50 beginner_2
Tokyo r50 beginner_2
Takashi Minoda
10分で分かるr言語入門ver2.10 14 1101
10分で分かるr言語入門ver2.10 14 1101
Nobuaki Oshiro
R による文書分類入門
R による文書分類入門
Takeshi Arabiki
10分で分かるr言語入門ver2 upload用
10分で分かるr言語入門ver2 upload用
Nobuaki Oshiro
Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014
Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014
Takashi J OZAKI
R6パッケージの紹介―機能と実装
R6パッケージの紹介―機能と実装
__nakamichi__
Rあんなときこんなとき(tokyo r#12)
Rあんなときこんなとき(tokyo r#12)
Shintaro Fukushima
Tokyor60 r data_science_part1
Tokyor60 r data_science_part1
Yohei Sato
HiroshimaR4_LT_sakaue
HiroshimaR4_LT_sakaue
SAKAUE, Tatsuya
R -> Python
R -> Python
Kazufumi Ohkawa
入門機械学習1,2章
入門機械学習1,2章
Kazufumi Ohkawa
プログラマのための文書推薦入門
プログラマのための文書推薦入門
y-uti
10分で分かるr言語入門ver2.14 15 0905
10分で分かるr言語入門ver2.14 15 0905
Nobuaki Oshiro
Feature Selection with R / in JP
Feature Selection with R / in JP
Sercan Ahi
Tokyo r38
Tokyo r38
Takashi Minoda
入門機械学習6章
入門機械学習6章
Kazufumi Ohkawa
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析・データマイニング R言語入門
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析・データマイニング R言語入門
Koichi Hamada
Rで潜在ランク分析
Rで潜在ランク分析
Hiroshi Shimizu
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor
Takashi Kitano
Weitere ähnliche Inhalte
Was ist angesagt?
2017年3月版データマエショリスト入門
2017年3月版データマエショリスト入門
Yuya Matsumura
2017年3月版データマエショリスト入門(誤植修正版)
2017年3月版データマエショリスト入門(誤植修正版)
Yuya Matsumura
Gensim
Gensim
saireya _
Tokyo r50 beginner_2
Tokyo r50 beginner_2
Takashi Minoda
10分で分かるr言語入門ver2.10 14 1101
10分で分かるr言語入門ver2.10 14 1101
Nobuaki Oshiro
R による文書分類入門
R による文書分類入門
Takeshi Arabiki
10分で分かるr言語入門ver2 upload用
10分で分かるr言語入門ver2 upload用
Nobuaki Oshiro
Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014
Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014
Takashi J OZAKI
R6パッケージの紹介―機能と実装
R6パッケージの紹介―機能と実装
__nakamichi__
Rあんなときこんなとき(tokyo r#12)
Rあんなときこんなとき(tokyo r#12)
Shintaro Fukushima
Tokyor60 r data_science_part1
Tokyor60 r data_science_part1
Yohei Sato
HiroshimaR4_LT_sakaue
HiroshimaR4_LT_sakaue
SAKAUE, Tatsuya
R -> Python
R -> Python
Kazufumi Ohkawa
入門機械学習1,2章
入門機械学習1,2章
Kazufumi Ohkawa
プログラマのための文書推薦入門
プログラマのための文書推薦入門
y-uti
10分で分かるr言語入門ver2.14 15 0905
10分で分かるr言語入門ver2.14 15 0905
Nobuaki Oshiro
Feature Selection with R / in JP
Feature Selection with R / in JP
Sercan Ahi
Tokyo r38
Tokyo r38
Takashi Minoda
入門機械学習6章
入門機械学習6章
Kazufumi Ohkawa
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析・データマイニング R言語入門
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析・データマイニング R言語入門
Koichi Hamada
Was ist angesagt?
(20)
2017年3月版データマエショリスト入門
2017年3月版データマエショリスト入門
2017年3月版データマエショリスト入門(誤植修正版)
2017年3月版データマエショリスト入門(誤植修正版)
Gensim
Gensim
Tokyo r50 beginner_2
Tokyo r50 beginner_2
10分で分かるr言語入門ver2.10 14 1101
10分で分かるr言語入門ver2.10 14 1101
R による文書分類入門
R による文書分類入門
10分で分かるr言語入門ver2 upload用
10分で分かるr言語入門ver2 upload用
Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014
Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014
R6パッケージの紹介―機能と実装
R6パッケージの紹介―機能と実装
Rあんなときこんなとき(tokyo r#12)
Rあんなときこんなとき(tokyo r#12)
Tokyor60 r data_science_part1
Tokyor60 r data_science_part1
HiroshimaR4_LT_sakaue
HiroshimaR4_LT_sakaue
R -> Python
R -> Python
入門機械学習1,2章
入門機械学習1,2章
プログラマのための文書推薦入門
プログラマのための文書推薦入門
10分で分かるr言語入門ver2.14 15 0905
10分で分かるr言語入門ver2.14 15 0905
Feature Selection with R / in JP
Feature Selection with R / in JP
Tokyo r38
Tokyo r38
入門機械学習6章
入門機械学習6章
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析・データマイニング R言語入門
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析・データマイニング R言語入門
Andere mochten auch
Rで潜在ランク分析
Rで潜在ランク分析
Hiroshi Shimizu
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor
Takashi Kitano
Rcppのすすめ
Rcppのすすめ
Masaki Tsuda
20150303ぞくパタLT-ゆるふわ構造学習
20150303ぞくパタLT-ゆるふわ構造学習
Toru Imai
Dummiesパッケージ
Dummiesパッケージ
weda654
20170923 excelユーザーのためのr入門
20170923 excelユーザーのためのr入門
Takashi Kitano
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
Shuyo Nakatani
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53th
Akifumi Eguchi
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
Satoshi Kitajima
R を起動するその前に
R を起動するその前に
Kosei ABE
TokyoR42_around_chaining
TokyoR42_around_chaining
TokorosawaYoshio
Rで代数統計 TokyoR #42 LT
Rで代数統計 TokyoR #42 LT
Toru Imai
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1
Nagi Teramo
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
Atsushi Hayakawa
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)
yutannihilation
Tokyor42 ggplot2
Tokyor42 ggplot2
Yohei Sato
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18
Yohei Sato
Tokyo r30 anova
Tokyo r30 anova
Takashi Minoda
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Yohei Sato
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
Nagi Teramo
Andere mochten auch
(20)
Rで潜在ランク分析
Rで潜在ランク分析
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor
Rcppのすすめ
Rcppのすすめ
20150303ぞくパタLT-ゆるふわ構造学習
20150303ぞくパタLT-ゆるふわ構造学習
Dummiesパッケージ
Dummiesパッケージ
20170923 excelユーザーのためのr入門
20170923 excelユーザーのためのr入門
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53th
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
R を起動するその前に
R を起動するその前に
TokyoR42_around_chaining
TokyoR42_around_chaining
Rで代数統計 TokyoR #42 LT
Rで代数統計 TokyoR #42 LT
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)
Tokyor42 ggplot2
Tokyor42 ggplot2
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18
Tokyo r30 anova
Tokyo r30 anova
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
Ähnlich wie R入門(dplyrでデータ加工)-TokyoR42
for関数を使った繰り返し処理によるヒストグラムの一括出力
for関数を使った繰り返し処理によるヒストグラムの一括出力
imuyaoti
genuine-highlighter: マクロを認識するClojure向けのシンタックスハイライター
genuine-highlighter: マクロを認識するClojure向けのシンタックスハイライター
sohta
R言語勉強会#5.pdf
R言語勉強会#5.pdf
Takuya Kubo
Rユーザのためのspark入門
Rユーザのためのspark入門
Shintaro Fukushima
ALPSチュートリアル(4) Python入門
ALPSチュートリアル(4) Python入門
Computational Materials Science Initiative
Why dont you_create_new_spark_jl
Why dont you_create_new_spark_jl
Shintaro Fukushima
Chainerの使い方と自然言語処理への応用
Chainerの使い方と自然言語処理への応用
Seiya Tokui
Tokyo r27
Tokyo r27
Takashi Minoda
CMSI計算科学技術特論A(3) OpenMPの基礎
CMSI計算科学技術特論A(3) OpenMPの基礎
Computational Materials Science Initiative
R language definition3.1_3.2
R language definition3.1_3.2
Yoshiteru Kamiyama
[輪講] 第1章
[輪講] 第1章
Takenobu Sasatani
LET2011: Rによる教育データ分析入門
LET2011: Rによる教育データ分析入門
Yuichiro Kobayashi
さくっとはじめるテキストマイニング(R言語) スタートアップ編
さくっとはじめるテキストマイニング(R言語) スタートアップ編
Yutaka Shimada
Yamadai.Rデモンストレーションセッション
Yamadai.Rデモンストレーションセッション
考司 小杉
Introduction of Python
Introduction of Python
Tomoya Nakayama
「ビジネス活用事例で学ぶ データサイエンス入門」輪読会#5資料
「ビジネス活用事例で学ぶ データサイエンス入門」輪読会#5資料
Shintaro Nomura
多次元配列の効率的利用法の検討
多次元配列の効率的利用法の検討
Yu Sato
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
Etsuji Nakai
RのffとbigmemoryとRevoScaleRとを比較してみた
RのffとbigmemoryとRevoScaleRとを比較してみた
Kazuya Wada
RのffでGLMしてみたけど...
RのffでGLMしてみたけど...
Kazuya Wada
Ähnlich wie R入門(dplyrでデータ加工)-TokyoR42
(20)
for関数を使った繰り返し処理によるヒストグラムの一括出力
for関数を使った繰り返し処理によるヒストグラムの一括出力
genuine-highlighter: マクロを認識するClojure向けのシンタックスハイライター
genuine-highlighter: マクロを認識するClojure向けのシンタックスハイライター
R言語勉強会#5.pdf
R言語勉強会#5.pdf
Rユーザのためのspark入門
Rユーザのためのspark入門
ALPSチュートリアル(4) Python入門
ALPSチュートリアル(4) Python入門
Why dont you_create_new_spark_jl
Why dont you_create_new_spark_jl
Chainerの使い方と自然言語処理への応用
Chainerの使い方と自然言語処理への応用
Tokyo r27
Tokyo r27
CMSI計算科学技術特論A(3) OpenMPの基礎
CMSI計算科学技術特論A(3) OpenMPの基礎
R language definition3.1_3.2
R language definition3.1_3.2
[輪講] 第1章
[輪講] 第1章
LET2011: Rによる教育データ分析入門
LET2011: Rによる教育データ分析入門
さくっとはじめるテキストマイニング(R言語) スタートアップ編
さくっとはじめるテキストマイニング(R言語) スタートアップ編
Yamadai.Rデモンストレーションセッション
Yamadai.Rデモンストレーションセッション
Introduction of Python
Introduction of Python
「ビジネス活用事例で学ぶ データサイエンス入門」輪読会#5資料
「ビジネス活用事例で学ぶ データサイエンス入門」輪読会#5資料
多次元配列の効率的利用法の検討
多次元配列の効率的利用法の検討
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
RのffとbigmemoryとRevoScaleRとを比較してみた
RのffとbigmemoryとRevoScaleRとを比較してみた
RのffでGLMしてみたけど...
RのffでGLMしてみたけど...
Mehr von Atsushi Hayakawa
tidyverse.orgの翻訳
tidyverse.orgの翻訳
Atsushi Hayakawa
Zepp play soccerで測ってみた
Zepp play soccerで測ってみた
Atsushi Hayakawa
dataclassとtypehintを使ってますか?
dataclassとtypehintを使ってますか?
Atsushi Hayakawa
トライアスロンとgepuro task views V2.0 Japan.R 2018
トライアスロンとgepuro task views V2.0 Japan.R 2018
Atsushi Hayakawa
バンクーバー旅行記
バンクーバー旅行記
Atsushi Hayakawa
Analyze The Community Of Tokyo.R
Analyze The Community Of Tokyo.R
Atsushi Hayakawa
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
Atsushi Hayakawa
トライアスロンと僕 - Japan.R 2017
トライアスロンと僕 - Japan.R 2017
Atsushi Hayakawa
simputatoinで欠損値補完 - Tokyo.R #65
simputatoinで欠損値補完 - Tokyo.R #65
Atsushi Hayakawa
useR!2017 in Brussels
useR!2017 in Brussels
Atsushi Hayakawa
Japan.R 2016の運営
Japan.R 2016の運営
Atsushi Hayakawa
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Atsushi Hayakawa
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Atsushi Hayakawa
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Atsushi Hayakawa
最近のクラウドストレージの事情と私情
最近のクラウドストレージの事情と私情
Atsushi Hayakawa
gepuro task views
gepuro task views
Atsushi Hayakawa
nginxのログを非スケーラブルに省メモリな方法で蓄積する
nginxのログを非スケーラブルに省メモリな方法で蓄積する
Atsushi Hayakawa
implyを用いたアクセスログの可視化
implyを用いたアクセスログの可視化
Atsushi Hayakawa
イケてる分析基盤をつくる
イケてる分析基盤をつくる
Atsushi Hayakawa
らずぱいラジコン
らずぱいラジコン
Atsushi Hayakawa
Mehr von Atsushi Hayakawa
(20)
tidyverse.orgの翻訳
tidyverse.orgの翻訳
Zepp play soccerで測ってみた
Zepp play soccerで測ってみた
dataclassとtypehintを使ってますか?
dataclassとtypehintを使ってますか?
トライアスロンとgepuro task views V2.0 Japan.R 2018
トライアスロンとgepuro task views V2.0 Japan.R 2018
バンクーバー旅行記
バンクーバー旅行記
Analyze The Community Of Tokyo.R
Analyze The Community Of Tokyo.R
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
トライアスロンと僕 - Japan.R 2017
トライアスロンと僕 - Japan.R 2017
simputatoinで欠損値補完 - Tokyo.R #65
simputatoinで欠損値補完 - Tokyo.R #65
useR!2017 in Brussels
useR!2017 in Brussels
Japan.R 2016の運営
Japan.R 2016の運営
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Splatoon界での壮絶な戦い&Japan.Rの宣伝
最近のクラウドストレージの事情と私情
最近のクラウドストレージの事情と私情
gepuro task views
gepuro task views
nginxのログを非スケーラブルに省メモリな方法で蓄積する
nginxのログを非スケーラブルに省メモリな方法で蓄積する
implyを用いたアクセスログの可視化
implyを用いたアクセスログの可視化
イケてる分析基盤をつくる
イケてる分析基盤をつくる
らずぱいラジコン
らずぱいラジコン
Kürzlich hochgeladen
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
Kürzlich hochgeladen
(8)
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
R入門(dplyrでデータ加工)-TokyoR42
1.
R入門(dplyrでデータ加工) 第42回R勉強会@東京(#TokyoR) @gepuro
2.
自己紹介 早川 敦士 @gepuro
電気通信大学大学院 修士2年 専門:信頼性工学 言語:R言語、Python 特技:花火打ち揚げ
3.
ハッカーズバーでバイトしてます http://hackersbar.net/
4.
告知 2014年12月6日に Japan.Rを開催します。
5.
分析ツール ● R○
無料,非エンジニアでも扱いやすい言語 ● Python ○ Numpy, Scipy, Scikit-learnなどの科学計算ライブラリ が充実。エンジニアに親しまれやすい ● Julia ○ 2012年登場,玄人向け, 開発段階 ● Excel ○ ほとんどの人が使える。ピボットテーブル便利 ● など Japan.Rでパネルディスカッションを 予定してます。
6.
R言語(あーるげんご)はオープンソース・ フリーソフトウェアの統計解析向けの プログラミング言語及びその開発実行環境
である。 wikipediaより
7.
R言語の使い方に困ったら ● Rjpwiki
○ http://www.okada.jp.org/RWiki/ ● RPubs ○ https://rpubs.com/ ● seekR ○ http://seekr.jp/ ● R-tips ○ http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html ● JIN’S Page ○ http://www1.doshisha.ac.jp/~mjin/R/
8.
分析作業の流れ データベース データ加工
モデリング・可視化
9.
分析作業の流れ データ取得 SQL
クローリング データ加工 モデリング・可視化
10.
分析作業の流れ データベース データ加工
モデリング・可視化 マージ 型変換 集計 縦横変換 データフレーム
11.
分析作業の流れ データベース データ加工
散布図 決定木分析 重回帰分析ヒストグラム モデリング・可視化
12.
分析作業の流れ 今日はここを扱う データベース
データ加工 モデリング・可視化 マージ 型変換 集計 縦横変換 データフレーム
13.
変数 > hako
<- 1 > hako [1] 1 > hako * 2 [1] 2
14.
配列 > hakos
<- c(1,2,3) > hakos [1] 1 2 3 > hakos + hakos [1] 2 4 6 > hakos * 10 [1] 10 20 30
15.
配列その2 > hakos
[1] 1 2 3 > hakos[1] [1] 1 > hakos[2] [1] 2
16.
for for(i in
1:10){ print(i) }
17.
if a <-
2 if(a %% 2 == 0){ print("偶数") }else{ print("奇数") }
18.
データフレーム > df
<- data.frame(a=1:3, b=4:6) > df a b 1 1 4 2 2 5 3 3 6
19.
データフレームその2 > df$c
<- df$a + df$b > df a b c 1 1 4 5 2 2 5 7 3 3 6 9
20.
データフレームその3 > df
a b c 1 1 4 5 2 2 5 7 3 3 6 9 > df[1,] a b c 1 1 4 5 > df[,1] [1] 1 2 3 行にアクセス 列にアクセス
21.
データ読み込み 通常の方法 >
train <- read.csv("data/train.csv") 高速読み込み > library(data.table) > train <- fread("data/train.csv")
22.
データの集計 データ処理のパッケージを読み込み >
library(dplyr) サンプルデータの読み込み > data(iris)
23.
dplyrで集計 > iris
%>% + group_by(Species) %>% + summarise(SLM= mean(Sepal.Length)) Source: local data frame [3 x 2] Species SLM 1 setosa 5.006 2 versicolor 5.936 3 virginica 6.588
24.
irisというデータセットを利用する > iris
%>% + group_by(Species) %>% + summarise(SLM= mean(Sepal.Length)) Source: local data frame [3 x 2] Species SLM 1 setosa 5.006 2 versicolor 5.936 3 virginica 6.588
25.
左から来たものを右へ受け流す > iris
%>% + group_by(Species) %>% + summarise(SLM= mean(Sepal.Length)) Source: local data frame [3 x 2] Species SLM 1 setosa 5.006 2 versicolor 5.936 3 virginica 6.588
26.
Speciesという列ごとに処理する > iris
%>% + group_by(Species) %>% + summarise(SLM= mean(Sepal.Length)) Source: local data frame [3 x 2] Species SLM 1 setosa 5.006 2 versicolor 5.936 3 virginica 6.588
27.
集計する > iris
%>% + group_by(Species) %>% + summarise(SLM= mean(Sepal.Length)) Source: local data frame [3 x 2] Species SLM 1 setosa 5.006 2 versicolor 5.936 3 virginica 6.588
28.
dplyrで集計 パターン2 > iris
%>% + mutate(Sepal.LW = Sepal.Length + Sepal.Width) %>% + select(Sepal.Length, Sepal.Width, Sepal.LW) %>% + head(., n=3) Sepal.Length Sepal.Width Sepal.LW 1 5.1 3.5 8.6 2 4.9 3.0 7.9 3 4.7 3.2 7.9
29.
列を追加する > iris
%>% + mutate(Sepal.LW = Sepal.Length + Sepal.Width) %>% + select(Sepal.Length, Sepal.Width, Sepal.LW) %>% + head(., n=3) Sepal.Length Sepal.Width Sepal.LW 1 5.1 3.5 8.6 2 4.9 3.0 7.9 3 4.7 3.2 7.9
30.
列を選択する > iris
%>% + mutate(Sepal.LW = Sepal.Length + Sepal.Width) %>% + select(Sepal.Length, Sepal.Width, Sepal.LW) %>% + head(., n=3) Sepal.Length Sepal.Width Sepal.LW 1 5.1 3.5 8.6 2 4.9 3.0 7.9 3 4.7 3.2 7.9
31.
先頭の3行を表示 > iris
%>% + mutate(Sepal.LW = Sepal.Length + Sepal.Width) %>% + select(Sepal.Length, Sepal.Width, Sepal.LW) %>% + head(., n=3) Sepal.Length Sepal.Width Sepal.LW 1 5.1 3.5 8.6 2 4.9 3.0 7.9 3 4.7 3.2 7.9
32.
dplyrで集計 パターン3 > iris
%>% + filter(Species=="setosa") %>% + head(., n=3) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa
33.
データを条件で抽出する > iris
%>% + filter(Species=="setosa") %>% + head(., n=3) Sepal.Length Sepal.Width Petal.Length Petal. Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa
34.
dplyrで集計 パターン4 > iris
%>% + arrange(Sepal.Length) %>% + head(., n=3) Sepal.Length Sepal.Width Petal.Length Petal. Width Species 1 4.3 3.0 1.1 0.1 setosa 2 4.4 2.9 1.4 0.2 setosa 3 4.4 3.0 1.3 0.2 setosa
35.
並び替え > iris
%>% + arrange(Sepal.Length) %>% + head(., n=3) Sepal.Length Sepal.Width Petal.Length Petal. Width Species 1 4.3 3.0 1.1 0.1 setosa 2 4.4 2.9 1.4 0.2 setosa 3 4.4 3.0 1.3 0.2 setosa desc()で降順にする
36.
縦に結合 > iris1
<- iris[1:50,] > iris2 <- iris[51:100,] > rbind_list(iris1, iris2) %>% + dim(.) [1] 100 5
37.
マージ ● 内部結合
○ inner_join(df1, df2, by=c(“列名”)) ● 左結合 ○ left_join(df1, df2, by=c(“列名”))
38.
縦横の変換 reshape2 —
柔軟なデータ変形ツール http://meme.biology.tohoku.ac. jp/students/iwasaki/rstats/reshape2. html を参考
39.
告知 2014年12月6日に Japan.Rを開催します。
LTを募集してます。 6人ぐらい?
Jetzt herunterladen