SlideShare ist ein Scribd-Unternehmen logo
1 von 18
Downloaden Sie, um offline zu lesen
大規模ログ分析における
Amazon Web Services の活用
株式会社 バンダ゗ナムコスタジオ
NE開発本部 分析運営部
竹村 伸太郎
1
• ゲームログ分析の事例紹介
– 大人の事情により、弊社タ゗トルの話はございません
– 恐縮ながら、その代わりに論文を紹介させて下さい
• バンダイナムコスタジオの大規模ログ集約・分析基
盤“Greco”の紹介
– ゗ンフラについての話がメ゗ンになります
– 特に最近サービス゗ンしたAmazon Redshiftについての
使用感を重点的にお伝えします
• ユーザー企業側の導入事例はまだ稀有なはず
• 分析に耐えうる「正確な」ログを作るために
– タ゗トル開発の現場で実践できることをお話しします
発表の流れ
2
本発表は個人の見解であり、所属する組織の公式見解ではありません
• 名前の由来は 映画 Ocean‘s Thirteen(2007)から
– カジノの併設ホテルを守る、人工知能セキュリテゖと
いう設定
– 映画のGrecoはこんなに凄い!
• 瞳孔や体温から顧客の感情を推定
• Exabyteのデータをリゕルタ゗ム分析
• 派手なモニタルーム
– けどリブート中にカジノが侵入されるというオチ
• 人工的に地震を発生→システム再起動
• GrecoはAmazon Web Services (AWS)を全面採用
– 映画のようにはいきません
データ集約・分析基盤 “Greco”
3
• ゲームログの用途
• ゲームログの種類
• 上記のニーズに耐えられるシステムが求められる
ゲームログの用途と種類
ユーザーサポート 集計・分析
処理内容 On-Line Transaction Processing
単一レコードの取得がメ゗ン
On-Line Analytical Processing
大量レコードの集計がメ゗ン
システム
要求
ログの書き込み速度
1クエリ当たりのレ゗テンシ
データ容量とクエリ性能に対す
るスケーラビリテゖ
イベントログ アクセスログ
形式 JSON(構造化データ) 平文(非構造化データ)
システム
要求
欠落がないこと
常時処理(タ゗ムラグ重視)
複雑な前処理が出来ること
バッチ処理(1日1回)前提
4
5
• ゲームログの用途とその出力先
• ゲームログの種類とその前処理
Grecoの選択
ユーザーサポート 集計・分析
処理内容 On-Line Transaction Processing
単一レコードの取得がメ゗ン
On-Line Analytical Processing
大量レコードの集計がメ゗ン
システム
要求
ログの書き込み速度
1クエリ当たりのレ゗テンシ
データ容量とクエリ性能に対す
るスケーラビリテゖ
出力先 Amazon RDS (MySQL) Amazon Redshift
イベントログ アクセスログ
形式 JSON(構造化データ) 平文(非構造化データ)
システム
要求
欠落がないこと
常時処理(タ゗ムラグ重視)
複雑な前処理が出来ること
バッチ処理(1日1回)前提
前処理
(ETL)
EC2で全件RDS/Redshiftに挿入
※RDSはパーテゖション必須
Hadoop (Elastic MapReduce) で処
理してからRedshiftに挿入
システム構成図(AWS+オンプレ)
6※Hadoop周りは単純化しております。クローラー、リゕルタ゗ムモニタ、ユーザーサポート系は割愛しています。
゗ベントログの収集につい
ては、
• Grecoチームで開発した
ものを組み込むケース
• プロジェクト側の運用に
合わせるケース
の2つがある
※Fluentdを採用しているプ
ロジェクトも複数あり
※S3をゕーカ゗ブ先として
いるのは共通
コンソールゲーム機
や、モバ゗ル端末か
らの入力を受け持つ
サーバーを指す
• データウェアハウス(Data Ware House, DWH)の定義
– Wikipediaより
In computing, a data warehouse or enterprise data warehouse
(DW, DWH, or EDW) is a database used for reporting and data
analysis.
• 一言でいえば
– 大規模集計のためのデータベース
(より正確にはOLTPではなくOLAPに特化したRDB)
– 巨大テーブルからのSELECTは得意だが、UPDATEや
DELETEが苦手(出来ないものもある)
– 数100万行以上のレコードから集計したいときに、
初めて採用を検討すべきもの(速いRDBではない!)
そもそもデータウェゕハウスって何?
7
• カラムナデータベース(Columnar Database)
– 大量の行に対する集約処理が得意
• 逆に少数の行や大量の列の取得は苦手
– データ圧縮によるI/O・ストレージ削減の効果が高い
• カーデゖナリテゖ(集合の要素の数)が低いデータや、
正規化されていない(JOIN不要な)データほど有利
– ゗ンデックスやテーブルパーテゖションは自動的に設
定されているものと考えて良い
• 超並列(Massively Parallel Processing, MPP)
– シャーデゖングを自動化できる
• ノード数を増やすことで、データの挿入や操作が分散処
理で行えるようになる
近年のDWHの2大特徴
8
• PostgreSQL互換のものが多い
– Amazon Redshift は ParAccel を AWSに載せたもの
代表的な商用DWH (2013/6 ver.)
特徴 互換性
Oracle Exadata MPP Oracle
Teradata Aster MPP Postgre
IBM Netezza MPP Postgre
SAP Sybase IQ MPP TDS
MS SQLServer 2012 P.D.W. MPP TDS
EMC Greenplum MPP Postgre
Actian ParAccel MPP Postgre
HP Vertica MPP Postgre
Infobright SMP MySQL
Calpont InfiniDB MPP MySQL
[1] Gartner : "Dataware house DBMS magic quadrant".
Dashboard Insight. February 2, 2013. 9
※ParAccelは2013年4月にActianに買収される
• ゲーム業界での採用事例
– HP Vertica
• Zynga
– Oracle Exadata
• Square Enix
• 導入のネック「一言でいうと高い!」
• 安いもの(HWは自前で用意)で初期投資 数100万
• ゕプラ゗ゕンス製品なら数1000万円を要覚悟
• 弊社のケース
– 様々なDWHを検証後、費用対効果を吟味し、Amazon
Redshift ($1,000 ~ /TB/1Y)の導入を決断
DWHとゲーム業界
10
• パフォーマンスについて
– 集計は本当に楽になりました
• かなり無茶なSQLでも即なくこなせるように
• PostgreSQL 8.4の共通テーブル式が一部使えます
– WITH xxx AS (SELECT …) SELECT … from xxx, ….
• PostgreSQL 8.4のウゖンドウ関数も一部使えます
– SELECT RANK() OVER (PARTITION BY xxx ORDER BY yyy) …
• ARRAY型は使えません(これが一番残念)
– Redshift独自のチューニングやマ゗グレーションについ
ての知識は必須
• 以降のスラ゗ドにて解説
Amazon Redshiftを導入してみて
11
• インデックスにもいろいろある
• DWHはHash型がデフォルトというケースが多い
– OracleやPostgreSQLでいうBitmap゗ンデックス
– 範囲検索を多用する場合はDDLでの指定が望ましい
Redshiftのチューニング
アルゴリズム Hash B-Tree LSM-Tree
機能・性質 等価検索のみ
Bitmap Index可
In Memory向け
範囲検索可
Read性能重視
HDD向け
範囲検索可
Write性能重視
SSD向け
write 定数Order 1回のrandom I/O append
read 定数Order 1回のrandom I/O N回のrandom I/O
採用例 Postgre(Bitmap)
Oracle(Bitmap)
Memcached
Postgre(Default)
Oracle(Default)
MongoDB
Cassandra
Hbase
LevelDB
12
• DISTKEY
– 分散処理に用いるキーを指定
• RDSでいうShardingの基準としたいキー
• 1つだけ指定可能
– JOINを多用するキーに指定するのが適切
• ユーザーID と 年月日、どちらが望ましいかは用途次第
• SORTKEY
– 範囲検索したいキーを指定
– 時系列ログなら例外なく生成日時が適切
– ログの種類に応じてユーザーステータスも
• ゲームなら例えばユーザーLV
• (1-10), (11-20) … と集計することが多いため
DDLの記述(キー指定)
13
• 基本はテーブル設計時に決める
– 自動カラム圧縮機能もあるが…
• 空のテーブルに100,000 /slice以上のレコードをS3経由で
バルク゗ンサートしたときのみ有効
• つまり頼りづらい
• 特に有用(使いやすい)なものは以下の2つ
– 辞書型(TEXT255, TEXT32K, BYTEDICT)
• カーデゖナリテゖ(集合の要素の数)が低いものに適用
• Enumを文字列で代用している場合とか
– 差分型(DELTA)
• Auto Incrementなカラムは迷わずこれ
DDLの記述(圧縮の指定)
14
• どのリージョンにするかは超重要
– 同一リージョンにあるS3上のフゔ゗ルからしか、Bulk
Insertが出来ない
– s3cmdの転送速度が最大のボトルネックとなることも
• MySQLのTIMESTAMPデフォルト値
– 0000/00/00 00:00:00はMySQL固有のルール
– 標準SQLに準拠しないのでLOAD時にエラー
• DELETEは速いが容量は減らない
– Redshiftは追記型(PostgreSQLの仕様を踏襲)
– よって定期的なVACUUMが必須
– DELETEやUPDATEは必要最小限に
DBからのマ゗グレーション注意点
15
16
• 最後に社内の取り組みの話を少しします
ここで何かご質問は?
• ログは出力する時点で構造化されているべき
– この思想を普及させたFluentdの功績はあまりに大きい
• だがそれだけで十分か?
– No
– 人為的なミスが紛れ込む要素はまだ多い
• 型が違う(数値と文字列)
• 外部キーが入るフゖールドで違うテーブルを参照
• そもそもフゖールドが欠落したレコードがある
etc…
– やっぱり制約が豊富なRDBMSって偉大だったんだなと
思うことが毎日のように…
• まずはログ生成のプロセスを見直しましょう
分析に耐え得るログを出力するために
17
18
• 前提条件
– 実装担当者の裁量に任せず、企画者や分析担当者の意
見を反映した上で、仕様をかっちり決める
• その上で必要なコード出力を自動化
– ログのスキーマを何らかのフォーマットで記述
• 参考: Google Protocol Buffers, Open Data Protocols
– ログ仕様から下記コードを生成するコンバータを用意
• SQLのデータ定義言語(DDL)
• ゗ベントログ(JSON)の出力関数
• 上記を徹底することで単純なミスを大幅に減らせる
– 実行時に難しいものは、ステージング環境でレポート
出力(これも極力自動化)を行うなど、工夫を重ねる
開発の現場で実践すべきこと

Weitere ähnliche Inhalte

Was ist angesagt?

[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...Insight Technology, Inc.
 
今こそクラウドへ!データの移行、連携、統合のコツ
今こそクラウドへ!データの移行、連携、統合のコツ今こそクラウドへ!データの移行、連携、統合のコツ
今こそクラウドへ!データの移行、連携、統合のコツ株式会社クライム
 
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...Insight Technology, Inc.
 
Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析shuichi iida
 
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] A33:Amazon DynamoDB Deep Dive by アマゾン データ サービス ...
[db tech showcase Tokyo 2015] A33:Amazon DynamoDB Deep Dive by アマゾン データ サービス ...[db tech showcase Tokyo 2015] A33:Amazon DynamoDB Deep Dive by アマゾン データ サービス ...
[db tech showcase Tokyo 2015] A33:Amazon DynamoDB Deep Dive by アマゾン データ サービス ...Insight Technology, Inc.
 
Pivotal Greenplumで実現する次世代データ分析基盤のご紹介
Pivotal Greenplumで実現する次世代データ分析基盤のご紹介Pivotal Greenplumで実現する次世代データ分析基盤のご紹介
Pivotal Greenplumで実現する次世代データ分析基盤のご紹介Masayuki Matsushita
 
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...Insight Technology, Inc.
 
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也Insight Technology, Inc.
 
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...Insight Technology, Inc.
 
[db tech showcase Tokyo 2017] D38: クラウドに「無停止」というイノベーションを ~HPE Virtualized Non...
[db tech showcase Tokyo 2017] D38: クラウドに「無停止」というイノベーションを ~HPE Virtualized Non...[db tech showcase Tokyo 2017] D38: クラウドに「無停止」というイノベーションを ~HPE Virtualized Non...
[db tech showcase Tokyo 2017] D38: クラウドに「無停止」というイノベーションを ~HPE Virtualized Non...Insight Technology, Inc.
 
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji ShinkuboD22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji ShinkuboInsight Technology, Inc.
 

Was ist angesagt? (20)

[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
 
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
 
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...
 
今こそクラウドへ!データの移行、連携、統合のコツ
今こそクラウドへ!データの移行、連携、統合のコツ今こそクラウドへ!データの移行、連携、統合のコツ
今こそクラウドへ!データの移行、連携、統合のコツ
 
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
 
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
 
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
 
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
 
Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析
 
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
 
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
 
[db tech showcase Tokyo 2015] A33:Amazon DynamoDB Deep Dive by アマゾン データ サービス ...
[db tech showcase Tokyo 2015] A33:Amazon DynamoDB Deep Dive by アマゾン データ サービス ...[db tech showcase Tokyo 2015] A33:Amazon DynamoDB Deep Dive by アマゾン データ サービス ...
[db tech showcase Tokyo 2015] A33:Amazon DynamoDB Deep Dive by アマゾン データ サービス ...
 
Pivotal Greenplumで実現する次世代データ分析基盤のご紹介
Pivotal Greenplumで実現する次世代データ分析基盤のご紹介Pivotal Greenplumで実現する次世代データ分析基盤のご紹介
Pivotal Greenplumで実現する次世代データ分析基盤のご紹介
 
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
 
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
 
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
 
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
 
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...
 
[db tech showcase Tokyo 2017] D38: クラウドに「無停止」というイノベーションを ~HPE Virtualized Non...
[db tech showcase Tokyo 2017] D38: クラウドに「無停止」というイノベーションを ~HPE Virtualized Non...[db tech showcase Tokyo 2017] D38: クラウドに「無停止」というイノベーションを ~HPE Virtualized Non...
[db tech showcase Tokyo 2017] D38: クラウドに「無停止」というイノベーションを ~HPE Virtualized Non...
 
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji ShinkuboD22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
 

Andere mochten auch

クラウドネイティブなアーキテクチャでサクサク解析
クラウドネイティブなアーキテクチャでサクサク解析クラウドネイティブなアーキテクチャでサクサク解析
クラウドネイティブなアーキテクチャでサクサク解析Yuta Imai
 
オープンデータ・パーソナルデータビジネス最前線
オープンデータ・パーソナルデータビジネス最前線オープンデータ・パーソナルデータビジネス最前線
オープンデータ・パーソナルデータビジネス最前線直之 伊藤
 
AWS Black Belt Tech シリーズ 2015 - Amazon Redshift
AWS Black Belt Tech シリーズ 2015 - Amazon RedshiftAWS Black Belt Tech シリーズ 2015 - Amazon Redshift
AWS Black Belt Tech シリーズ 2015 - Amazon RedshiftAmazon Web Services Japan
 
サイト/ブログから本文抽出する方法
サイト/ブログから本文抽出する方法サイト/ブログから本文抽出する方法
サイト/ブログから本文抽出する方法Takuro Sasaki
 
アポ前15分で詰め込む!ログ解析
アポ前15分で詰め込む!ログ解析アポ前15分で詰め込む!ログ解析
アポ前15分で詰め込む!ログ解析CAPS Association, Inc.
 
Webクローリング&スクレイピングの最前線 公開用
Webクローリング&スクレイピングの最前線 公開用Webクローリング&スクレイピングの最前線 公開用
Webクローリング&スクレイピングの最前線 公開用Lumin Hacker
 
サービス改善はログデータ分析から
サービス改善はログデータ分析からサービス改善はログデータ分析から
サービス改善はログデータ分析からKenta Suzuki
 
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京Koichi Hamada
 
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けRecruit Technologies
 
システム管理者向け、クラウドサービス「Oracle Management Cloud」で提供する3つの機能とは?~アプリケーション・パフォーマンス分析、ロ...
システム管理者向け、クラウドサービス「Oracle Management Cloud」で提供する3つの機能とは?~アプリケーション・パフォーマンス分析、ロ...システム管理者向け、クラウドサービス「Oracle Management Cloud」で提供する3つの機能とは?~アプリケーション・パフォーマンス分析、ロ...
システム管理者向け、クラウドサービス「Oracle Management Cloud」で提供する3つの機能とは?~アプリケーション・パフォーマンス分析、ロ...オラクルエンジニア通信
 
Objective Front-End JavaScript
Objective Front-End JavaScriptObjective Front-End JavaScript
Objective Front-End JavaScriptMuyuu Fujita
 
Svgアニメーションを実装してみよう 20150207
Svgアニメーションを実装してみよう 20150207Svgアニメーションを実装してみよう 20150207
Svgアニメーションを実装してみよう 20150207Kanako Kobayashi
 
BuddyPressで街のポータルサイトを作ろう
BuddyPressで街のポータルサイトを作ろうBuddyPressで街のポータルサイトを作ろう
BuddyPressで街のポータルサイトを作ろう松田 千尋
 
Webスクレイピング用の言語っぽいものを作ったよ
Webスクレイピング用の言語っぽいものを作ったよWebスクレイピング用の言語っぽいものを作ったよ
Webスクレイピング用の言語っぽいものを作ったよTakaichi Ito
 
20141022 リサーチ向け・ブラウザだけでスクレイピング(浅野)
20141022 リサーチ向け・ブラウザだけでスクレイピング(浅野) 20141022 リサーチ向け・ブラウザだけでスクレイピング(浅野)
20141022 リサーチ向け・ブラウザだけでスクレイピング(浅野) Hirosuke Asano
 
第3回Webスクレイピング勉強会@東京 happyou.info
第3回Webスクレイピング勉強会@東京 happyou.info第3回Webスクレイピング勉強会@東京 happyou.info
第3回Webスクレイピング勉強会@東京 happyou.infoShogo Okamoto
 
ソーシャル・スクレイピング(2014年10月Webスクレイピング勉強会資料)
ソーシャル・スクレイピング(2014年10月Webスクレイピング勉強会資料)ソーシャル・スクレイピング(2014年10月Webスクレイピング勉強会資料)
ソーシャル・スクレイピング(2014年10月Webスクレイピング勉強会資料)yuzoakakura
 
Scraping withawsAWSを利用してスクレイピングの悩みを解決するチップス
Scraping withawsAWSを利用してスクレイピングの悩みを解決するチップスScraping withawsAWSを利用してスクレイピングの悩みを解決するチップス
Scraping withawsAWSを利用してスクレイピングの悩みを解決するチップスTakuro Sasaki
 

Andere mochten auch (20)

クラウドネイティブなアーキテクチャでサクサク解析
クラウドネイティブなアーキテクチャでサクサク解析クラウドネイティブなアーキテクチャでサクサク解析
クラウドネイティブなアーキテクチャでサクサク解析
 
オープンデータ・パーソナルデータビジネス最前線
オープンデータ・パーソナルデータビジネス最前線オープンデータ・パーソナルデータビジネス最前線
オープンデータ・パーソナルデータビジネス最前線
 
AWS Black Belt Tech シリーズ 2015 - Amazon Redshift
AWS Black Belt Tech シリーズ 2015 - Amazon RedshiftAWS Black Belt Tech シリーズ 2015 - Amazon Redshift
AWS Black Belt Tech シリーズ 2015 - Amazon Redshift
 
サイト/ブログから本文抽出する方法
サイト/ブログから本文抽出する方法サイト/ブログから本文抽出する方法
サイト/ブログから本文抽出する方法
 
アポ前15分で詰め込む!ログ解析
アポ前15分で詰め込む!ログ解析アポ前15分で詰め込む!ログ解析
アポ前15分で詰め込む!ログ解析
 
Webクローリング&スクレイピングの最前線 公開用
Webクローリング&スクレイピングの最前線 公開用Webクローリング&スクレイピングの最前線 公開用
Webクローリング&スクレイピングの最前線 公開用
 
サービス改善はログデータ分析から
サービス改善はログデータ分析からサービス改善はログデータ分析から
サービス改善はログデータ分析から
 
ログ勉 Vol.1
ログ勉 Vol.1ログ勉 Vol.1
ログ勉 Vol.1
 
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京
 
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
 
システム管理者向け、クラウドサービス「Oracle Management Cloud」で提供する3つの機能とは?~アプリケーション・パフォーマンス分析、ロ...
システム管理者向け、クラウドサービス「Oracle Management Cloud」で提供する3つの機能とは?~アプリケーション・パフォーマンス分析、ロ...システム管理者向け、クラウドサービス「Oracle Management Cloud」で提供する3つの機能とは?~アプリケーション・パフォーマンス分析、ロ...
システム管理者向け、クラウドサービス「Oracle Management Cloud」で提供する3つの機能とは?~アプリケーション・パフォーマンス分析、ロ...
 
Objective Front-End JavaScript
Objective Front-End JavaScriptObjective Front-End JavaScript
Objective Front-End JavaScript
 
Js祭り
Js祭りJs祭り
Js祭り
 
Svgアニメーションを実装してみよう 20150207
Svgアニメーションを実装してみよう 20150207Svgアニメーションを実装してみよう 20150207
Svgアニメーションを実装してみよう 20150207
 
BuddyPressで街のポータルサイトを作ろう
BuddyPressで街のポータルサイトを作ろうBuddyPressで街のポータルサイトを作ろう
BuddyPressで街のポータルサイトを作ろう
 
Webスクレイピング用の言語っぽいものを作ったよ
Webスクレイピング用の言語っぽいものを作ったよWebスクレイピング用の言語っぽいものを作ったよ
Webスクレイピング用の言語っぽいものを作ったよ
 
20141022 リサーチ向け・ブラウザだけでスクレイピング(浅野)
20141022 リサーチ向け・ブラウザだけでスクレイピング(浅野) 20141022 リサーチ向け・ブラウザだけでスクレイピング(浅野)
20141022 リサーチ向け・ブラウザだけでスクレイピング(浅野)
 
第3回Webスクレイピング勉強会@東京 happyou.info
第3回Webスクレイピング勉強会@東京 happyou.info第3回Webスクレイピング勉強会@東京 happyou.info
第3回Webスクレイピング勉強会@東京 happyou.info
 
ソーシャル・スクレイピング(2014年10月Webスクレイピング勉強会資料)
ソーシャル・スクレイピング(2014年10月Webスクレイピング勉強会資料)ソーシャル・スクレイピング(2014年10月Webスクレイピング勉強会資料)
ソーシャル・スクレイピング(2014年10月Webスクレイピング勉強会資料)
 
Scraping withawsAWSを利用してスクレイピングの悩みを解決するチップス
Scraping withawsAWSを利用してスクレイピングの悩みを解決するチップスScraping withawsAWSを利用してスクレイピングの悩みを解決するチップス
Scraping withawsAWSを利用してスクレイピングの悩みを解決するチップス
 

Ähnlich wie 大規模ログ分析におけるAmazon Web Servicesの活用

Jet brainsnight resharper全社導入事例
Jet brainsnight resharper全社導入事例Jet brainsnight resharper全社導入事例
Jet brainsnight resharper全社導入事例AkihiroYamamoto
 
Kaggleのテクニック
KaggleのテクニックKaggleのテクニック
KaggleのテクニックYasunori Ozaki
 
SparkやBigQueryなどを用いた モバイルゲーム分析環境
SparkやBigQueryなどを用いたモバイルゲーム分析環境SparkやBigQueryなどを用いたモバイルゲーム分析環境
SparkやBigQueryなどを用いた モバイルゲーム分析環境yuichi_komatsu
 
Game Architecture Trends in Tokyo Kansai Social Game Study#5
Game Architecture Trends in Tokyo  Kansai Social Game Study#5Game Architecture Trends in Tokyo  Kansai Social Game Study#5
Game Architecture Trends in Tokyo Kansai Social Game Study#5Yasuhiro Matsuo
 
AWSが誕生するまでの秘話
AWSが誕生するまでの秘話AWSが誕生するまでの秘話
AWSが誕生するまでの秘話Yasuhiro Horiuchi
 
Amazon RDS for PostgreSQL ( JPUG 2014夏セミナー) #jpug
Amazon RDS for PostgreSQL ( JPUG 2014夏セミナー)  #jpugAmazon RDS for PostgreSQL ( JPUG 2014夏セミナー)  #jpug
Amazon RDS for PostgreSQL ( JPUG 2014夏セミナー) #jpugYasuhiro Matsuo
 
データセンター視点で比較したクラウドの内側
データセンター視点で比較したクラウドの内側データセンター視点で比較したクラウドの内側
データセンター視点で比較したクラウドの内側Atsushi Nakada
 
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々TB / Day規模のゲーム向けデータパイプラインを開発運用する日々
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々gree_tech
 
Sheepdogを使ってみて分かったこと(第六回ストレージ研究会発表資料)
Sheepdogを使ってみて分かったこと(第六回ストレージ研究会発表資料)Sheepdogを使ってみて分かったこと(第六回ストレージ研究会発表資料)
Sheepdogを使ってみて分かったこと(第六回ストレージ研究会発表資料)Masahiro Tsuji
 
[AWS re:invent 2013 Report] AWS New EC2 Instance Types
[AWS re:invent 2013 Report] AWS New EC2 Instance Types[AWS re:invent 2013 Report] AWS New EC2 Instance Types
[AWS re:invent 2013 Report] AWS New EC2 Instance TypesAmazon Web Services Japan
 
[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...
[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...
[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...Insight Technology, Inc.
 
Amazon ec2とは何か?
Amazon ec2とは何か?Amazon ec2とは何か?
Amazon ec2とは何か?Shinya_131
 
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮Hibino Hisashi
 
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介Masanori Takano
 
Windows 8 Developers カンファレンス
Windows 8 Developers カンファレンスWindows 8 Developers カンファレンス
Windows 8 Developers カンファレンスKaoru NAKAMURA
 
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]DeNA
 
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Appsグリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & AppsGoogle Cloud Platform - Japan
 

Ähnlich wie 大規模ログ分析におけるAmazon Web Servicesの活用 (20)

Jet brainsnight resharper全社導入事例
Jet brainsnight resharper全社導入事例Jet brainsnight resharper全社導入事例
Jet brainsnight resharper全社導入事例
 
Kaggleのテクニック
KaggleのテクニックKaggleのテクニック
Kaggleのテクニック
 
SparkやBigQueryなどを用いた モバイルゲーム分析環境
SparkやBigQueryなどを用いたモバイルゲーム分析環境SparkやBigQueryなどを用いたモバイルゲーム分析環境
SparkやBigQueryなどを用いた モバイルゲーム分析環境
 
Game Architecture Trends in Tokyo Kansai Social Game Study#5
Game Architecture Trends in Tokyo  Kansai Social Game Study#5Game Architecture Trends in Tokyo  Kansai Social Game Study#5
Game Architecture Trends in Tokyo Kansai Social Game Study#5
 
AWSが誕生するまでの秘話
AWSが誕生するまでの秘話AWSが誕生するまでの秘話
AWSが誕生するまでの秘話
 
Amazon RDS for PostgreSQL ( JPUG 2014夏セミナー) #jpug
Amazon RDS for PostgreSQL ( JPUG 2014夏セミナー)  #jpugAmazon RDS for PostgreSQL ( JPUG 2014夏セミナー)  #jpug
Amazon RDS for PostgreSQL ( JPUG 2014夏セミナー) #jpug
 
データセンター視点で比較したクラウドの内側
データセンター視点で比較したクラウドの内側データセンター視点で比較したクラウドの内側
データセンター視点で比較したクラウドの内側
 
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々TB / Day規模のゲーム向けデータパイプラインを開発運用する日々
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々
 
Sheepdogを使ってみて分かったこと(第六回ストレージ研究会発表資料)
Sheepdogを使ってみて分かったこと(第六回ストレージ研究会発表資料)Sheepdogを使ってみて分かったこと(第六回ストレージ研究会発表資料)
Sheepdogを使ってみて分かったこと(第六回ストレージ研究会発表資料)
 
[AWS re:invent 2013 Report] AWS New EC2 Instance Types
[AWS re:invent 2013 Report] AWS New EC2 Instance Types[AWS re:invent 2013 Report] AWS New EC2 Instance Types
[AWS re:invent 2013 Report] AWS New EC2 Instance Types
 
SEGA : Growth hacking by Spark ML for Mobile games
SEGA : Growth hacking by Spark ML for Mobile gamesSEGA : Growth hacking by Spark ML for Mobile games
SEGA : Growth hacking by Spark ML for Mobile games
 
[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...
[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...
[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...
 
Amazon ec2とは何か?
Amazon ec2とは何か?Amazon ec2とは何か?
Amazon ec2とは何か?
 
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
 
Zynga
ZyngaZynga
Zynga
 
Aws privte20110406 arai
Aws privte20110406 araiAws privte20110406 arai
Aws privte20110406 arai
 
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介
 
Windows 8 Developers カンファレンス
Windows 8 Developers カンファレンスWindows 8 Developers カンファレンス
Windows 8 Developers カンファレンス
 
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
 
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Appsグリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
 

Mehr von Shintaro Takemura

Measuring social dynamics in a massive multiplayer online game
Measuring social dynamics in a massive multiplayer online gameMeasuring social dynamics in a massive multiplayer online game
Measuring social dynamics in a massive multiplayer online gameShintaro Takemura
 
複雑ネットワーク 第4章 古典的なグラフ
複雑ネットワーク 第4章 古典的なグラフ複雑ネットワーク 第4章 古典的なグラフ
複雑ネットワーク 第4章 古典的なグラフShintaro Takemura
 
NetworkXによる語彙ネットワークの可視化
NetworkXによる語彙ネットワークの可視化NetworkXによる語彙ネットワークの可視化
NetworkXによる語彙ネットワークの可視化Shintaro Takemura
 
テキストマイニングで発掘!? 売上とユーザーレビューの相関分析
テキストマイニングで発掘!? 売上とユーザーレビューの相関分析テキストマイニングで発掘!? 売上とユーザーレビューの相関分析
テキストマイニングで発掘!? 売上とユーザーレビューの相関分析Shintaro Takemura
 
WordNetで作ろう! 言語横断検索サービス
WordNetで作ろう! 言語横断検索サービスWordNetで作ろう! 言語横断検索サービス
WordNetで作ろう! 言語横断検索サービスShintaro Takemura
 
PRML 4.1 Discriminant Function
PRML 4.1 Discriminant FunctionPRML 4.1 Discriminant Function
PRML 4.1 Discriminant FunctionShintaro Takemura
 

Mehr von Shintaro Takemura (6)

Measuring social dynamics in a massive multiplayer online game
Measuring social dynamics in a massive multiplayer online gameMeasuring social dynamics in a massive multiplayer online game
Measuring social dynamics in a massive multiplayer online game
 
複雑ネットワーク 第4章 古典的なグラフ
複雑ネットワーク 第4章 古典的なグラフ複雑ネットワーク 第4章 古典的なグラフ
複雑ネットワーク 第4章 古典的なグラフ
 
NetworkXによる語彙ネットワークの可視化
NetworkXによる語彙ネットワークの可視化NetworkXによる語彙ネットワークの可視化
NetworkXによる語彙ネットワークの可視化
 
テキストマイニングで発掘!? 売上とユーザーレビューの相関分析
テキストマイニングで発掘!? 売上とユーザーレビューの相関分析テキストマイニングで発掘!? 売上とユーザーレビューの相関分析
テキストマイニングで発掘!? 売上とユーザーレビューの相関分析
 
WordNetで作ろう! 言語横断検索サービス
WordNetで作ろう! 言語横断検索サービスWordNetで作ろう! 言語横断検索サービス
WordNetで作ろう! 言語横断検索サービス
 
PRML 4.1 Discriminant Function
PRML 4.1 Discriminant FunctionPRML 4.1 Discriminant Function
PRML 4.1 Discriminant Function
 

大規模ログ分析におけるAmazon Web Servicesの活用

  • 1. 大規模ログ分析における Amazon Web Services の活用 株式会社 バンダ゗ナムコスタジオ NE開発本部 分析運営部 竹村 伸太郎 1
  • 2. • ゲームログ分析の事例紹介 – 大人の事情により、弊社タ゗トルの話はございません – 恐縮ながら、その代わりに論文を紹介させて下さい • バンダイナムコスタジオの大規模ログ集約・分析基 盤“Greco”の紹介 – ゗ンフラについての話がメ゗ンになります – 特に最近サービス゗ンしたAmazon Redshiftについての 使用感を重点的にお伝えします • ユーザー企業側の導入事例はまだ稀有なはず • 分析に耐えうる「正確な」ログを作るために – タ゗トル開発の現場で実践できることをお話しします 発表の流れ 2 本発表は個人の見解であり、所属する組織の公式見解ではありません
  • 3. • 名前の由来は 映画 Ocean‘s Thirteen(2007)から – カジノの併設ホテルを守る、人工知能セキュリテゖと いう設定 – 映画のGrecoはこんなに凄い! • 瞳孔や体温から顧客の感情を推定 • Exabyteのデータをリゕルタ゗ム分析 • 派手なモニタルーム – けどリブート中にカジノが侵入されるというオチ • 人工的に地震を発生→システム再起動 • GrecoはAmazon Web Services (AWS)を全面採用 – 映画のようにはいきません データ集約・分析基盤 “Greco” 3
  • 4. • ゲームログの用途 • ゲームログの種類 • 上記のニーズに耐えられるシステムが求められる ゲームログの用途と種類 ユーザーサポート 集計・分析 処理内容 On-Line Transaction Processing 単一レコードの取得がメ゗ン On-Line Analytical Processing 大量レコードの集計がメ゗ン システム 要求 ログの書き込み速度 1クエリ当たりのレ゗テンシ データ容量とクエリ性能に対す るスケーラビリテゖ イベントログ アクセスログ 形式 JSON(構造化データ) 平文(非構造化データ) システム 要求 欠落がないこと 常時処理(タ゗ムラグ重視) 複雑な前処理が出来ること バッチ処理(1日1回)前提 4
  • 5. 5 • ゲームログの用途とその出力先 • ゲームログの種類とその前処理 Grecoの選択 ユーザーサポート 集計・分析 処理内容 On-Line Transaction Processing 単一レコードの取得がメ゗ン On-Line Analytical Processing 大量レコードの集計がメ゗ン システム 要求 ログの書き込み速度 1クエリ当たりのレ゗テンシ データ容量とクエリ性能に対す るスケーラビリテゖ 出力先 Amazon RDS (MySQL) Amazon Redshift イベントログ アクセスログ 形式 JSON(構造化データ) 平文(非構造化データ) システム 要求 欠落がないこと 常時処理(タ゗ムラグ重視) 複雑な前処理が出来ること バッチ処理(1日1回)前提 前処理 (ETL) EC2で全件RDS/Redshiftに挿入 ※RDSはパーテゖション必須 Hadoop (Elastic MapReduce) で処 理してからRedshiftに挿入
  • 7. • データウェアハウス(Data Ware House, DWH)の定義 – Wikipediaより In computing, a data warehouse or enterprise data warehouse (DW, DWH, or EDW) is a database used for reporting and data analysis. • 一言でいえば – 大規模集計のためのデータベース (より正確にはOLTPではなくOLAPに特化したRDB) – 巨大テーブルからのSELECTは得意だが、UPDATEや DELETEが苦手(出来ないものもある) – 数100万行以上のレコードから集計したいときに、 初めて採用を検討すべきもの(速いRDBではない!) そもそもデータウェゕハウスって何? 7
  • 8. • カラムナデータベース(Columnar Database) – 大量の行に対する集約処理が得意 • 逆に少数の行や大量の列の取得は苦手 – データ圧縮によるI/O・ストレージ削減の効果が高い • カーデゖナリテゖ(集合の要素の数)が低いデータや、 正規化されていない(JOIN不要な)データほど有利 – ゗ンデックスやテーブルパーテゖションは自動的に設 定されているものと考えて良い • 超並列(Massively Parallel Processing, MPP) – シャーデゖングを自動化できる • ノード数を増やすことで、データの挿入や操作が分散処 理で行えるようになる 近年のDWHの2大特徴 8
  • 9. • PostgreSQL互換のものが多い – Amazon Redshift は ParAccel を AWSに載せたもの 代表的な商用DWH (2013/6 ver.) 特徴 互換性 Oracle Exadata MPP Oracle Teradata Aster MPP Postgre IBM Netezza MPP Postgre SAP Sybase IQ MPP TDS MS SQLServer 2012 P.D.W. MPP TDS EMC Greenplum MPP Postgre Actian ParAccel MPP Postgre HP Vertica MPP Postgre Infobright SMP MySQL Calpont InfiniDB MPP MySQL [1] Gartner : "Dataware house DBMS magic quadrant". Dashboard Insight. February 2, 2013. 9 ※ParAccelは2013年4月にActianに買収される
  • 10. • ゲーム業界での採用事例 – HP Vertica • Zynga – Oracle Exadata • Square Enix • 導入のネック「一言でいうと高い!」 • 安いもの(HWは自前で用意)で初期投資 数100万 • ゕプラ゗ゕンス製品なら数1000万円を要覚悟 • 弊社のケース – 様々なDWHを検証後、費用対効果を吟味し、Amazon Redshift ($1,000 ~ /TB/1Y)の導入を決断 DWHとゲーム業界 10
  • 11. • パフォーマンスについて – 集計は本当に楽になりました • かなり無茶なSQLでも即なくこなせるように • PostgreSQL 8.4の共通テーブル式が一部使えます – WITH xxx AS (SELECT …) SELECT … from xxx, …. • PostgreSQL 8.4のウゖンドウ関数も一部使えます – SELECT RANK() OVER (PARTITION BY xxx ORDER BY yyy) … • ARRAY型は使えません(これが一番残念) – Redshift独自のチューニングやマ゗グレーションについ ての知識は必須 • 以降のスラ゗ドにて解説 Amazon Redshiftを導入してみて 11
  • 12. • インデックスにもいろいろある • DWHはHash型がデフォルトというケースが多い – OracleやPostgreSQLでいうBitmap゗ンデックス – 範囲検索を多用する場合はDDLでの指定が望ましい Redshiftのチューニング アルゴリズム Hash B-Tree LSM-Tree 機能・性質 等価検索のみ Bitmap Index可 In Memory向け 範囲検索可 Read性能重視 HDD向け 範囲検索可 Write性能重視 SSD向け write 定数Order 1回のrandom I/O append read 定数Order 1回のrandom I/O N回のrandom I/O 採用例 Postgre(Bitmap) Oracle(Bitmap) Memcached Postgre(Default) Oracle(Default) MongoDB Cassandra Hbase LevelDB 12
  • 13. • DISTKEY – 分散処理に用いるキーを指定 • RDSでいうShardingの基準としたいキー • 1つだけ指定可能 – JOINを多用するキーに指定するのが適切 • ユーザーID と 年月日、どちらが望ましいかは用途次第 • SORTKEY – 範囲検索したいキーを指定 – 時系列ログなら例外なく生成日時が適切 – ログの種類に応じてユーザーステータスも • ゲームなら例えばユーザーLV • (1-10), (11-20) … と集計することが多いため DDLの記述(キー指定) 13
  • 14. • 基本はテーブル設計時に決める – 自動カラム圧縮機能もあるが… • 空のテーブルに100,000 /slice以上のレコードをS3経由で バルク゗ンサートしたときのみ有効 • つまり頼りづらい • 特に有用(使いやすい)なものは以下の2つ – 辞書型(TEXT255, TEXT32K, BYTEDICT) • カーデゖナリテゖ(集合の要素の数)が低いものに適用 • Enumを文字列で代用している場合とか – 差分型(DELTA) • Auto Incrementなカラムは迷わずこれ DDLの記述(圧縮の指定) 14
  • 15. • どのリージョンにするかは超重要 – 同一リージョンにあるS3上のフゔ゗ルからしか、Bulk Insertが出来ない – s3cmdの転送速度が最大のボトルネックとなることも • MySQLのTIMESTAMPデフォルト値 – 0000/00/00 00:00:00はMySQL固有のルール – 標準SQLに準拠しないのでLOAD時にエラー • DELETEは速いが容量は減らない – Redshiftは追記型(PostgreSQLの仕様を踏襲) – よって定期的なVACUUMが必須 – DELETEやUPDATEは必要最小限に DBからのマ゗グレーション注意点 15
  • 17. • ログは出力する時点で構造化されているべき – この思想を普及させたFluentdの功績はあまりに大きい • だがそれだけで十分か? – No – 人為的なミスが紛れ込む要素はまだ多い • 型が違う(数値と文字列) • 外部キーが入るフゖールドで違うテーブルを参照 • そもそもフゖールドが欠落したレコードがある etc… – やっぱり制約が豊富なRDBMSって偉大だったんだなと 思うことが毎日のように… • まずはログ生成のプロセスを見直しましょう 分析に耐え得るログを出力するために 17
  • 18. 18 • 前提条件 – 実装担当者の裁量に任せず、企画者や分析担当者の意 見を反映した上で、仕様をかっちり決める • その上で必要なコード出力を自動化 – ログのスキーマを何らかのフォーマットで記述 • 参考: Google Protocol Buffers, Open Data Protocols – ログ仕様から下記コードを生成するコンバータを用意 • SQLのデータ定義言語(DDL) • ゗ベントログ(JSON)の出力関数 • 上記を徹底することで単純なミスを大幅に減らせる – 実行時に難しいものは、ステージング環境でレポート 出力(これも極力自動化)を行うなど、工夫を重ねる 開発の現場で実践すべきこと