Submit Search
Upload
Amazon Redshiftを使ったデータ分析
•
7 likes
•
2,218 views
T
Tomohiro Yamaguchi
Follow
第七回 中国地方DB勉強会 in 松江、発表資料
Read less
Read more
Data & Analytics
Report
Share
Report
Share
1 of 32
Download now
Download to read offline
Recommended
Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004
Satoru Ishikawa
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
Amazon Web Services Japan
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
Recruit Technologies
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
Recruit Lifestyle Co., Ltd.
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
Recruit Technologies
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
Recruit Lifestyle Co., Ltd.
ビッグデータ
ビッグデータ
Shigeru Kishikawa
Social GAME における AI 活用事例 [第 4 回 Google Cloud INSIDE Games & Apps]
Social GAME における AI 活用事例 [第 4 回 Google Cloud INSIDE Games & Apps]
Google Cloud Platform - Japan
Recommended
Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004
Satoru Ishikawa
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
Amazon Web Services Japan
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
Recruit Technologies
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
Recruit Lifestyle Co., Ltd.
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
Recruit Technologies
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
Recruit Lifestyle Co., Ltd.
ビッグデータ
ビッグデータ
Shigeru Kishikawa
Social GAME における AI 活用事例 [第 4 回 Google Cloud INSIDE Games & Apps]
Social GAME における AI 活用事例 [第 4 回 Google Cloud INSIDE Games & Apps]
Google Cloud Platform - Japan
DX認定制度システム開発裏話:技術編
DX認定制度システム開発裏話:技術編
Arichika TANIGUCHI
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡
Recruit Lifestyle Co., Ltd.
LINE Developer Community: Microsoft AI を楽しく使おう
LINE Developer Community: Microsoft AI を楽しく使おう
Ayako Omori
リクルート式Hadoopの使い方
リクルート式Hadoopの使い方
Recruit Technologies
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
Ayako Omori
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
Yugo Shimizu
Microsoft Intelligent Data Platform -データ活用のための最新技術-
Microsoft Intelligent Data Platform -データ活用のための最新技術-
Daiyu Hatakeyama
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Daiyu Hatakeyama
データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤
Google Cloud Platform - Japan
For Power BI Beginners
For Power BI Beginners
Tomoyuki Oota
Gtfsデータリポジトリ紹介 iodd発表資料
Gtfsデータリポジトリ紹介 iodd発表資料
Shimpei Matsuura
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
Naoto Tamiya
Power BI 概要と最近のこと 2018/12
Power BI 概要と最近のこと 2018/12
Takeshi Kagata
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
Hortonworks Japan
そのデータ、活かせていますか?
そのデータ、活かせていますか?
Miho Yamamoto
ビッグデータ処理データベースの全体像と使い分け 2018年version
ビッグデータ処理データベースの全体像と使い分け 2018年version
Tetsutaro Watanabe
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
Recruit Lifestyle Co., Ltd.
Power BI 概要と最近のこと / Power BI と AI
Power BI 概要と最近のこと / Power BI と AI
Takeshi Kagata
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
CData Software Japan
楽天がHadoopを使う理由
楽天がHadoopを使う理由
Rakuten Group, Inc.
Amazon Redshiftの開発者がこれだけは知っておきたい10のTIPS / 第18回 AWS User Group - Japan
Amazon Redshiftの開発者がこれだけは知っておきたい10のTIPS / 第18回 AWS User Group - Japan
Koichi Fujikawa
AWS Black Belt Tech シリーズ 2015 - Amazon Redshift
AWS Black Belt Tech シリーズ 2015 - Amazon Redshift
Amazon Web Services Japan
More Related Content
What's hot
DX認定制度システム開発裏話:技術編
DX認定制度システム開発裏話:技術編
Arichika TANIGUCHI
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡
Recruit Lifestyle Co., Ltd.
LINE Developer Community: Microsoft AI を楽しく使おう
LINE Developer Community: Microsoft AI を楽しく使おう
Ayako Omori
リクルート式Hadoopの使い方
リクルート式Hadoopの使い方
Recruit Technologies
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
Ayako Omori
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
Yugo Shimizu
Microsoft Intelligent Data Platform -データ活用のための最新技術-
Microsoft Intelligent Data Platform -データ活用のための最新技術-
Daiyu Hatakeyama
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Daiyu Hatakeyama
データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤
Google Cloud Platform - Japan
For Power BI Beginners
For Power BI Beginners
Tomoyuki Oota
Gtfsデータリポジトリ紹介 iodd発表資料
Gtfsデータリポジトリ紹介 iodd発表資料
Shimpei Matsuura
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
Naoto Tamiya
Power BI 概要と最近のこと 2018/12
Power BI 概要と最近のこと 2018/12
Takeshi Kagata
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
Hortonworks Japan
そのデータ、活かせていますか?
そのデータ、活かせていますか?
Miho Yamamoto
ビッグデータ処理データベースの全体像と使い分け 2018年version
ビッグデータ処理データベースの全体像と使い分け 2018年version
Tetsutaro Watanabe
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
Recruit Lifestyle Co., Ltd.
Power BI 概要と最近のこと / Power BI と AI
Power BI 概要と最近のこと / Power BI と AI
Takeshi Kagata
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
CData Software Japan
楽天がHadoopを使う理由
楽天がHadoopを使う理由
Rakuten Group, Inc.
What's hot
(20)
DX認定制度システム開発裏話:技術編
DX認定制度システム開発裏話:技術編
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡
LINE Developer Community: Microsoft AI を楽しく使おう
LINE Developer Community: Microsoft AI を楽しく使おう
リクルート式Hadoopの使い方
リクルート式Hadoopの使い方
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
Microsoft Intelligent Data Platform -データ活用のための最新技術-
Microsoft Intelligent Data Platform -データ活用のための最新技術-
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤
For Power BI Beginners
For Power BI Beginners
Gtfsデータリポジトリ紹介 iodd発表資料
Gtfsデータリポジトリ紹介 iodd発表資料
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
Power BI 概要と最近のこと 2018/12
Power BI 概要と最近のこと 2018/12
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
そのデータ、活かせていますか?
そのデータ、活かせていますか?
ビッグデータ処理データベースの全体像と使い分け 2018年version
ビッグデータ処理データベースの全体像と使い分け 2018年version
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
Power BI 概要と最近のこと / Power BI と AI
Power BI 概要と最近のこと / Power BI と AI
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
楽天がHadoopを使う理由
楽天がHadoopを使う理由
Viewers also liked
Amazon Redshiftの開発者がこれだけは知っておきたい10のTIPS / 第18回 AWS User Group - Japan
Amazon Redshiftの開発者がこれだけは知っておきたい10のTIPS / 第18回 AWS User Group - Japan
Koichi Fujikawa
AWS Black Belt Tech シリーズ 2015 - Amazon Redshift
AWS Black Belt Tech シリーズ 2015 - Amazon Redshift
Amazon Web Services Japan
Chugokudb study-20150131
Chugokudb study-20150131
Toshi Harada
AWS Casual 02: ふつうのRedshiftパフォーマンスチューニング
AWS Casual 02: ふつうのRedshiftパフォーマンスチューニング
Minero Aoki
Amazon redshiftのご紹介
Amazon redshiftのご紹介
Amazon Web Services Japan
ASTERIA WARP運用Tips「RDB連携時のトラブルシューティング 」
ASTERIA WARP運用Tips「RDB連携時のトラブルシューティング 」
ASTERIA User Group
Webで役立つRDBの使い方
Webで役立つRDBの使い方
Soudai Sone
DynamoDB MyNA・JPUG合同DB勉強会 in 東京
DynamoDB MyNA・JPUG合同DB勉強会 in 東京
Yuko Mori
最近始めたあなたも今日から語れるようになるMySQLの{概要と最新情報}入門@
最近始めたあなたも今日から語れるようになるMySQLの{概要と最新情報}入門@
sakaik
Viewを使って開発を楽にする話
Viewを使って開発を楽にする話
Isamu Watanabe
すぐ始めれるクラウド
すぐ始めれるクラウド
Soudai Sone
中国地方Db勉強会
中国地方Db勉強会
Daisuke Kasuya
20151205 中国地方db勉強会 dbm_fs
20151205 中国地方db勉強会 dbm_fs
Takahiro Iwase
No sql with mysql cluster (MyNA・JPUG合同DB勉強会)
No sql with mysql cluster (MyNA・JPUG合同DB勉強会)
Shinya Sugiyama
オープンデータ超入門
オープンデータ超入門
和宏 石崎
意外と知らないFilemakerの世界
意外と知らないFilemakerの世界
Tatsuo_Ohtani
便利なHerokuと active recordの 速度改善tips
便利なHerokuと active recordの 速度改善tips
豊明 尾古
意外と知らないFilemakerの世界
意外と知らないFilemakerの世界
Tatsuo_Ohtani
Chugoku db 17th-postgresql-9.6
Chugoku db 17th-postgresql-9.6
Toshi Harada
Chugoku db 17th-lt-kly
Chugoku db 17th-lt-kly
Toshi Harada
Viewers also liked
(20)
Amazon Redshiftの開発者がこれだけは知っておきたい10のTIPS / 第18回 AWS User Group - Japan
Amazon Redshiftの開発者がこれだけは知っておきたい10のTIPS / 第18回 AWS User Group - Japan
AWS Black Belt Tech シリーズ 2015 - Amazon Redshift
AWS Black Belt Tech シリーズ 2015 - Amazon Redshift
Chugokudb study-20150131
Chugokudb study-20150131
AWS Casual 02: ふつうのRedshiftパフォーマンスチューニング
AWS Casual 02: ふつうのRedshiftパフォーマンスチューニング
Amazon redshiftのご紹介
Amazon redshiftのご紹介
ASTERIA WARP運用Tips「RDB連携時のトラブルシューティング 」
ASTERIA WARP運用Tips「RDB連携時のトラブルシューティング 」
Webで役立つRDBの使い方
Webで役立つRDBの使い方
DynamoDB MyNA・JPUG合同DB勉強会 in 東京
DynamoDB MyNA・JPUG合同DB勉強会 in 東京
最近始めたあなたも今日から語れるようになるMySQLの{概要と最新情報}入門@
最近始めたあなたも今日から語れるようになるMySQLの{概要と最新情報}入門@
Viewを使って開発を楽にする話
Viewを使って開発を楽にする話
すぐ始めれるクラウド
すぐ始めれるクラウド
中国地方Db勉強会
中国地方Db勉強会
20151205 中国地方db勉強会 dbm_fs
20151205 中国地方db勉強会 dbm_fs
No sql with mysql cluster (MyNA・JPUG合同DB勉強会)
No sql with mysql cluster (MyNA・JPUG合同DB勉強会)
オープンデータ超入門
オープンデータ超入門
意外と知らないFilemakerの世界
意外と知らないFilemakerの世界
便利なHerokuと active recordの 速度改善tips
便利なHerokuと active recordの 速度改善tips
意外と知らないFilemakerの世界
意外と知らないFilemakerの世界
Chugoku db 17th-postgresql-9.6
Chugoku db 17th-postgresql-9.6
Chugoku db 17th-lt-kly
Chugoku db 17th-lt-kly
Similar to Amazon Redshiftを使ったデータ分析
jawsdays 2017 新訳-とある設計士の雲設計定石目録_3
jawsdays 2017 新訳-とある設計士の雲設計定石目録_3
a kyane
東急ハンズを支える技術
東急ハンズを支える技術
Tomoaki Imai
クラウドがもたらすイノベーションプラットフォームとは
クラウドがもたらすイノベーションプラットフォームとは
Atsuro Nakahashi
企業向けmBaaS「AppPot」を使ったサーバー開発なしの高速モバイルアプリ開発
企業向けmBaaS「AppPot」を使ったサーバー開発なしの高速モバイルアプリ開発
Ryohei Sogo
2015年12月 Amazon RDS for Aurora セミナー in 関西 「Aurora検証のご紹介」
2015年12月 Amazon RDS for Aurora セミナー in 関西 「Aurora検証のご紹介」
Serverworks Co.,Ltd.
スタートアップならおさえておきたいAWS(Amazon Web Services)入門 ~メディア露出時のピーク対策編~ 先生:高山 博史・今井 雄太
スタートアップならおさえておきたいAWS(Amazon Web Services)入門 ~メディア露出時のピーク対策編~ 先生:高山 博史・今井 雄太
schoowebcampus
クラウド・スマートデバイス事例調査報告
クラウド・スマートデバイス事例調査報告
Shinichi Tomita
Google big query × Amazon redshift
Google big query × Amazon redshift
Fumihide Nario
reinvent2015 ctn osaki
reinvent2015 ctn osaki
充博 大崎
Data API + AWS = (CMS どうでしょう 札幌編)
Data API + AWS = (CMS どうでしょう 札幌編)
Yuji Takayama
5分でわかるAWS IoT! - あなたも今日からIoT生活 -
5分でわかるAWS IoT! - あなたも今日からIoT生活 -
Toshiaki Enami
IoTデザインパターン 2015 JAWS沖縄
IoTデザインパターン 2015 JAWS沖縄
Toshiaki Enami
AWS初心者向けWebinar AWSでBig Data活用
AWS初心者向けWebinar AWSでBig Data活用
Amazon Web Services Japan
大ヒットソーシャルアプリの裏側
大ヒットソーシャルアプリの裏側
KLab株式会社
Soft layerのご紹介 1409
Soft layerのご紹介 1409
YoshiyukiKonno
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
hamaken
OpenWhisk Serverless への期待
OpenWhisk Serverless への期待
Hideaki Tokida
Movable Type の現在と未来〜Data API の可能性〜
Movable Type の現在と未来〜Data API の可能性〜
新一 佐藤
2011年12月 アタックス共同セミナー「先行投資を最小化するクラウドの最新事情」
2011年12月 アタックス共同セミナー「先行投資を最小化するクラウドの最新事情」
Serverworks Co.,Ltd.
IBM Data Science Experience and Watson Machine Learning 20170429
IBM Data Science Experience and Watson Machine Learning 20170429
Tsuyoshi Hirayama
Similar to Amazon Redshiftを使ったデータ分析
(20)
jawsdays 2017 新訳-とある設計士の雲設計定石目録_3
jawsdays 2017 新訳-とある設計士の雲設計定石目録_3
東急ハンズを支える技術
東急ハンズを支える技術
クラウドがもたらすイノベーションプラットフォームとは
クラウドがもたらすイノベーションプラットフォームとは
企業向けmBaaS「AppPot」を使ったサーバー開発なしの高速モバイルアプリ開発
企業向けmBaaS「AppPot」を使ったサーバー開発なしの高速モバイルアプリ開発
2015年12月 Amazon RDS for Aurora セミナー in 関西 「Aurora検証のご紹介」
2015年12月 Amazon RDS for Aurora セミナー in 関西 「Aurora検証のご紹介」
スタートアップならおさえておきたいAWS(Amazon Web Services)入門 ~メディア露出時のピーク対策編~ 先生:高山 博史・今井 雄太
スタートアップならおさえておきたいAWS(Amazon Web Services)入門 ~メディア露出時のピーク対策編~ 先生:高山 博史・今井 雄太
クラウド・スマートデバイス事例調査報告
クラウド・スマートデバイス事例調査報告
Google big query × Amazon redshift
Google big query × Amazon redshift
reinvent2015 ctn osaki
reinvent2015 ctn osaki
Data API + AWS = (CMS どうでしょう 札幌編)
Data API + AWS = (CMS どうでしょう 札幌編)
5分でわかるAWS IoT! - あなたも今日からIoT生活 -
5分でわかるAWS IoT! - あなたも今日からIoT生活 -
IoTデザインパターン 2015 JAWS沖縄
IoTデザインパターン 2015 JAWS沖縄
AWS初心者向けWebinar AWSでBig Data活用
AWS初心者向けWebinar AWSでBig Data活用
大ヒットソーシャルアプリの裏側
大ヒットソーシャルアプリの裏側
Soft layerのご紹介 1409
Soft layerのご紹介 1409
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
OpenWhisk Serverless への期待
OpenWhisk Serverless への期待
Movable Type の現在と未来〜Data API の可能性〜
Movable Type の現在と未来〜Data API の可能性〜
2011年12月 アタックス共同セミナー「先行投資を最小化するクラウドの最新事情」
2011年12月 アタックス共同セミナー「先行投資を最小化するクラウドの最新事情」
IBM Data Science Experience and Watson Machine Learning 20170429
IBM Data Science Experience and Watson Machine Learning 20170429
Amazon Redshiftを使ったデータ分析
1.
Amazon Redshift を使ったデータ分析 モンスター・ラボ 島根開発拠点 山口友洋
2.
自己紹介 株式会社モンスター・ラボ サービス開発事業部所属 Webアプリケーション開発 (Ruby, PHP,AWS) 2014年7月3日に、島根開発拠 点立ち上げ(松江テルサ別 館)
3.
Amazon Redshiftとは Amazon Web
Serviceで提供されいている、大規模 データ分析用途向け分散RDB 2013年6月から運用開始
4.
Amazon Redshiftとは 億円単位で導入していたDWHが、年額100万円∼で 利用可能に スタートアップなどの小規模なビジネスでもビッ グデータ分析が可能に
5.
Redshiftの料金 月額3万円程度から、スタートできる
6.
国内導入事例 広告配信、ソーシャルゲーム クックパッド「たべみる」 クラウド会計ソフト「freee」
7.
2015年のアプリ・モバイルトピック ものが繋がる(Intenet of Things) Beacon/ロケーションサービス ウェアラブル
8.
データの分析と活用がさらに進む 人間の身体に関わるデータ 人間の行動に関わるデータ 自動車・家電その他から得られるデータ
9.
分散RDBとはどういうものか 10億∼100億行以上の巨大なデータを扱い高速にレ スポンスを返す 1.2TBのデータサイズに対して約150秒のレスポンス タイム(hadoopの10倍) PostgreSQL互換インターフェース
10.
MySQL、PostgreSQLと同じ点 ODBCやJDBCから接続しSQLを実行できる テーブルを結合(JOIN)できる INSERT,SELECT,UPDATE,DELETEのSQL実行できる O/Rマッパからでも使える
11.
MySQL, PostgreSQLとの違い 複数のノードを1つのデータベースとして扱う データが各ノードに分散配置される ノードを増やすとクエリ性能が向上する
12.
Redshiftを上手に使うには ミドルウェアが持つ制限を知る アーキテクチャーを理解して、設定・チューニン グを行う
13.
Redshiftに存在する制限 同時接続数が少ない バイナリ型が使えない カラムの変更ができない
14.
Redshiftが向かないシステム たくさんのユーザが同時接続し、多くのクエリを 発行するシステム 柔軟なデータ型が求められるシステム
15.
おさえておきたいアーキテクチャ ノード構成 データ分散方式
16.
ノード構成図
17.
リーダーノードとコンピュートノード
18.
リーダーノードとコンピュートノード リーダーノードは接続を受付、コンピュートノー ドに実行プログラムを配布する コンピュートノードはデータを保持し、プログラ ムを実行する
19.
ノードスライス
20.
ノードスライスとは Redshiftの並列処理単位 CPUコア数=ノードスライス数 ノードスライスは独自にCPUコア、メモリ、スト レージを持つ ノードスライス間では、データ共有できない
21.
データ分散の方法 均等方式 分散キー方式 ALL 分散
22.
均等分散 テーブルが結合に関与しない場合に向いている
23.
分散キー方式 列の値が一致するとき 物理的に同じ場所に格納される
24.
ALL分散 更新頻度・範囲が少ないデータに適している
25.
再分散とは 異なるノードスライス間でJOINするとき、 一時テーブルに、必要な全データを転送する処理
26.
再分散が発生するケース(低速) 結合に使うキーと分散キーが異なる場合
27.
再分散が発生しないケース(高速) 結合に使うキーと分散キーが同じ場合
28.
データ分散の目標 ノード間でワークロードを均等に分散させる クエリ実行中のデータ移動を最小限にとどめる
29.
パフォーマンス・チューニング 1. 最適な分散方式の選択 2. 最適な分散キーの選択 3.
最適なソートキーの選択
30.
分散キーのチューニング 特定のノードに行が集中しないように、偏りのな いカラムを分散キーにする(CPU) 同じノードに配置されたデータでJOINできるよう に、結合キーを分散キーにする(ネットワーク) 同じノードに配置されたデータで集約できるよう に、GROUP BYに使うカラムを分散キーにする (ネットワーク)
31.
AWSシステム構成例
32.
Redshiftを使ったデモ 松江市人口統計データを S3経由でRedshiftにインポートし、 ビジュアライズツールtableauで可視化する
Download now