SlideShare a Scribd company logo
1 of 25
Download to read offline
Advanced Tech Night No.04


   ログ収集フレームワークの新バージョン
            FlumeNG
                   の紹介

                                      2012/03/01
                            Acroquest Technology
                              音田 司(@t_otoda)
自己紹介

   氏名      :音田 司
   所属      : Acroquest Technology
   Twitter : @t_otoda
   専攻      :数学科(学部卒)
                           ↑私は写ってません

   業務
    • 現在、主にOSS(Hadoop等)の調査/検証/導入
       支援を行っています。
    • これまで、Hadoop、HBase、Flumeなどを中心
       に扱ってきました。


                                       2
目次

1. Flume
 1) Flumeとは
 2) Flumeの特徴
 3) アーキテクチャ

2. FlumeNG
 1)   FlumeNGとは
 2)   アーキテクチャ
 3)   FlumeOGからの改善点
 4)   FlumeNGで注意したい点

                       3
Flume




        4
1. Flumeとは

1. 大量のログデータを、多量のソースから中央のデー
   タストアへ、効率的に収集、集約、移動することを目
   的に開発された、高い信頼性と可用性を持つ分散型
   のサービスです。

2. Clouderaが開発したHadoopエコシステムの1つ

3. CDHでHDFSやHBase、Hiveとともにサポートされて
   いる
  ① CDH3u3では、Flume0.9.4+25.40
  ② Flume単体の最新バージョンは、Flume1.0.0
    (=Flume NG)


                                  5
(余談)大量のログデータ(BigData)とは?




                           6
2. Flumeの特徴 (1/2)

1. ログのストリーム転送
   text1行を1イベントとしてリアルタイムに転送
2. 選べる3つの信頼性

信頼性のレベル 概要
End2End WALを残し、Flumeが生存する限りフロー末端までの
               転送を保証
DiskFailOver   次のマシンへの転送障害発生時にログをディスクに保
               存
BestEffort     受信の確認や再送は行わない




                                      7
2. Flumeの特徴 (2/2)

3. スケーラビリティ
  Agent、Collectorの追加によるスケールアウトが
   可能
4. 設定の疎結合性
  ログの種類に影響されず、設定可能
5. ノード管理の簡易化
  FlumeMasterでの中央管理により、多数の
   FlumeNodeに対する設定反映が動的かつ集約的
   に可能


                               8
3. アーキテクチャ(データフロー)
データ(ログ)を収集するAgent、Agentからの情報を集約する
Collectorに対して、一連のデータフローを設定します。

ログ
     Agent
                          Collector
ログ
     Agent
                                                 ログ蓄積サーバ
ログ
                                               (HDFS・S3・ローカル)
     Agent
                          Collector
ログ                                     ログの転送/書込み
     Agent
                      ログの転送

             Master    FlumeMasterは全サーバ上の
                       FlumeNode(Agent/Collector)の状態を管理
                                                          9
3. アーキテクチャ(論理ノード)
FlumeNode(Agent/Collector)は論理ノード(Thread)を内
部に持ち、データの入力、変換、出力を行います。
             Agent                          Collector
          論理ノード(Thread)                   論理ノード(Thread)
              Sink        Sink   Source       Sink        Sink
 Source
            Decorator                       Decorator

  入力                      出力      入力                      出力


 論理ノード内の設定には以下の3種類があります。
  1. Source        ⇒データ入力部
  2. SinkDecorator ⇒SourceとSinkの間の中間処理(任意)
  3. Sink          ⇒データ出力部
 各部分は独自のPluginにより拡張可能です。

                                                            10
検証事例

    Agent
    Agent
     Agent
     Agent
  (Thread)
   (Thread)
    (Thread)
                            Collector
    Agent
                           Collector
    Agent
     Agent                  Collector            ログ蓄積サーバ
     Agent                 (Thread)
  (Thread)
   (Thread)                  Collector
                            (Thread)              (ローカル)
    (Thread)
                              (Thread)
    Agent
    Agent
     Agent                                  ログの転送/書込み
     Agent
  (Thread)
   (Thread)
    (Thread)
                  ログの転送

ログ出力サーバ: 80 台                           ログ収集/蓄積サーバ:1 台
 3論理ノード/Agent(240Thread)                 80論理ノード(80Thread)
ログ出力量:平均        60 MB/分                 1日の全転送量:0.8 TB
       最繁時 100 MB/分                     1台当たりの転送速度:1.4 Gbps
                                                        11
FlumeNG




          12
1. FlumeNGとは
Flumeが抱える制限を解決するため、
達成する目的は変更せずにリファクタリングした、
次世代(NewGeneration)のFlume
                 ※NGは「ダメダメ」ということではありません。。。

      ※慣例として、FlumeNG以前のFlumeは、FlumeOGと呼びます。
No.   変更点                    Flumeの抱える制限
1     Channel・Transactionの   Sinkの遅延がSourceの遅延に影響する
      追加
2     状態管理の実装変更              状態変更に伴うスレッド制御について一部問
                             題がある

3     Propertiesファイルによる      Masterサーバからしか設定変更できない
      設定
4     Groupの追加               設定で個々のホスト名を使用する
                                                      13
2. アーキテクチャ
データ(ログ)を収集するAgent、Agentからの情報を集約する
Collectorに対して、一連のデータフローを設定する所は変わら
ず、内部構造が変更になった。
ログ
     Agent
                          Collector
ログ
     Agent
                                                 ログ蓄積サーバ
ログ
                                               (HDFS・S3・ローカル)
     Agent
                          Collector
ログ                                     ログの転送/書込み
     Agent
                      ログの転送

             Master    FlumeMasterは全サーバ上の
                       FlumeNode(Agent/Collector)の状態を管理
                                                          14
3.1 Channel・Transactionの追加(1/2)
 Channel                          論理ノードという概念がなくなる


 Agent1          Client                       Sink
                                    Agent2

          Sink            Source   Channel


                                              Sink

          出力              入力       Channel


                                              出力
 改善点
    いままでSourceまたはSinkの遅延は、他方に影響を与えた
      Channelの導入により、FlumeOGの時の論理ノードThreadがなくなり、
       SourceとSinkがそれぞれThreadになることで非同期化される
                                                     15
3.1 Channel・Transactionの追加(2/2)
 Transaction
           Agent1                                    Agent2
Channel1            Sink1                  Source2             Channel2
      Transaction開始

           データ取得

                               データ転送
                                                Transaction開始

                                                     データ登録


                                                      Commit

           Commit           Agent2でのtransactionをCommitしたあと、
                            Agent1でのtransactionをCommitする。
                            エラー発生時は開始前にRollbackする。
                                                                    16
3.2 状態管理の実装変更

1. FlumeMasterが行っていた状態管理の実装変更
  状態に合わせてスレッドを起動/停止するのではなく、
   スレッドの起動/停止に合わせて状態を変化させる。
           Agentが起動した
          論理ノードThreadを
                                       Source,Sinkのスレッ
          コントロールできない
                                        ドを直接管理する。
          ⇒動的設定変更でお
           かしくなりやすい。

   Agent(Process)                  Agent(Process)
   論理ノード(Thread)         Source(Thread)        Sink(Thread)


 Source        Sink         Source                 Sink
                                       Channel



                                                     17
3.3 Propertiesファイルによる設定(1/2)
1. FlumeOGでは設定変更にはFlumeMasterからの
   変更が必須。
2. FlumeNGではプロパティファイルによる設定が可
   能になる。
  FlumeMasterを用意するか選択ができる。

3. プロパティファイルによる設定の導入には、以下
   のコンセプトが関わっている?
 Centralized is important to about 50% of users. The
 other half don't want it and would prefer simple local
 files. Everyone agrees dynamic configuration (runtime
 reconfiguration) is critical as downtime for data ingest
 systems hurts.

                                                       18
3.3 Propertiesファイルによる設定(2/2)
Avro(0.0.0.0:41414)をLISTEN⇒メモリに一時保存⇒ログ出力
という構成時の設定例
# now that we've defined all of our components, tell             使用するコンポーネントを定義
# host1 which ones we want to activate.                          <ホスト名>.
host1.sources = avro-source1
host1.channels = ch1
                                                                 [sources|channels|sinks]=xxx
host1.sinks = log-sink1

# Define an Avro source called avro-source1 on host1 and
tell it                                                          各コンポーネントを定義
# to bind to 0.0.0.0:41414. Connect it to channel ch1.
host1.sources.avro-source1.type = avro                           <ホスト名>.
host1.sources.avro-source1.bind = 0.0.0.0                        [sources|channels|sinks].
host1.sources.avro-source1.port = 41414                          xxx.type=yyy
host1.sources.avro-source1.channels = ch1
                                                                 …
# Define a memory channel called ch1 on host1
host1.channels.ch1.type = memory
                                                                 Channelは現在3種類
# Define a logger sink that simply logs all events it receives   (処理が早い)            (信頼性高い)
# and connect it to the other end of the same channel.                Memory > File > JDBC
host1.sinks.log-sink1.type = logger
host1.sinks.log-sink1.channel = ch1

                                                                                             19
3.4 Groupの追加
1. 「Group」という概念の追加
 ① すべてのClientとサーバはGroupに属する。
 ② 転送先の設定は、特定の物理ノード(ホスト名)を指定せず、
   Groupで指定する。




                              20
4. FlumeNGで注意したい点

1. 未実装の機能が多く残っている
 ① FlumeMasterや設定投入、監視用メトリクス
   (Source、Sinkの挙動を示すカウンターなど)など
 ② Flume1.1.0にて対応予定
2. FlumeOGとの互換性は保証されていない
 ① 通信プロトコルは現在Avroのみ対応
 ② プラグインの実装方法が変わる
 ③ 設定内容が変わる(Channelの追加、Source/Sink
   の名前変更)


                                21
(余談)FlumeNGの現状(3/1時点)
1. 2012/1/5リリース(Flume1.0.0)されています。
2. まだまだ実装中
   (実装残タスク:8/14)
3. 2012年上旬
 安定版リリース?




                               22
まとめ

1. Flumeは大量のログデータを、多量のソースか
   ら中央のデータストアへ、効率的に収集、集約、
   移動することを目的に開発された、高い信頼性
   と可用性を持つ分散型のサービスです。

2. FlumeNGはFlumeOGの問題点を、大胆なリ
   ファクタリングにより、改善させています。
   (現在進行形)


                           23
参考資料

1. Inside Flume
   •   http://www.slideshare.net/cloudera/inside-flume
2. Flume(日本語)
   •   http://www.slideshare.net/ashitanoken/flume
3. Apache Flume (incubating)
   •   https://blogs.apache.org/flume/entry/flume_ng_architecture
4. Flumeユーザガイド
   •   http://oss.infoscience.co.jp/flume/UserGuide/index.html
5. Flume Wiki
   •   https://cwiki.apache.org/FLUME/flume-ng.html
6. FlumeNG UserGuide
   •   http://dl.dropbox.com/u/27523578/Flume/FlumeUserGuide.pdf


                                                                    24
ご清聴
ありがとうございました


              25

More Related Content

What's hot

Pacemaker 操作方法メモ
Pacemaker 操作方法メモPacemaker 操作方法メモ
Pacemaker 操作方法メモMasayuki Ozawa
 
PacemakerのMaster/Slave構成の基本と事例紹介(DRBD、PostgreSQLレプリケーション) @Open Source Confer...
PacemakerのMaster/Slave構成の基本と事例紹介(DRBD、PostgreSQLレプリケーション) @Open Source Confer...PacemakerのMaster/Slave構成の基本と事例紹介(DRBD、PostgreSQLレプリケーション) @Open Source Confer...
PacemakerのMaster/Slave構成の基本と事例紹介(DRBD、PostgreSQLレプリケーション) @Open Source Confer...Tatsuya Watanabe
 
5ステップで始めるPostgreSQLレプリケーション@hbstudy#13
5ステップで始めるPostgreSQLレプリケーション@hbstudy#135ステップで始めるPostgreSQLレプリケーション@hbstudy#13
5ステップで始めるPostgreSQLレプリケーション@hbstudy#13Uptime Technologies LLC (JP)
 
Pacemaker NextGen OSC2012TokyoFall-20120908
Pacemaker NextGen OSC2012TokyoFall-20120908Pacemaker NextGen OSC2012TokyoFall-20120908
Pacemaker NextGen OSC2012TokyoFall-20120908ksk_ha
 
Pacemaker + PostgreSQL レプリケーション構成(PG-REX)のフェイルオーバー高速化
Pacemaker + PostgreSQL レプリケーション構成(PG-REX)のフェイルオーバー高速化Pacemaker + PostgreSQL レプリケーション構成(PG-REX)のフェイルオーバー高速化
Pacemaker + PostgreSQL レプリケーション構成(PG-REX)のフェイルオーバー高速化kazuhcurry
 
Stormの注目の新機能TridentAPI
Stormの注目の新機能TridentAPIStormの注目の新機能TridentAPI
Stormの注目の新機能TridentAPIAdvancedTechNight
 
PostgreSQLアーキテクチャ入門(INSIGHT OUT 2011)
PostgreSQLアーキテクチャ入門(INSIGHT OUT 2011)PostgreSQLアーキテクチャ入門(INSIGHT OUT 2011)
PostgreSQLアーキテクチャ入門(INSIGHT OUT 2011)Uptime Technologies LLC (JP)
 
第7回oss貢献者賞 森-20120316
第7回oss貢献者賞 森-20120316第7回oss貢献者賞 森-20120316
第7回oss貢献者賞 森-20120316ksk_ha
 
BigDataを迎え撃つ! PostgreSQL並列分散ミドルウェア「Stado」の紹介と検証報告
BigDataを迎え撃つ! PostgreSQL並列分散ミドルウェア「Stado」の紹介と検証報告BigDataを迎え撃つ! PostgreSQL並列分散ミドルウェア「Stado」の紹介と検証報告
BigDataを迎え撃つ! PostgreSQL並列分散ミドルウェア「Stado」の紹介と検証報告Uptime Technologies LLC (JP)
 
システムパフォーマンス勉強会#8
システムパフォーマンス勉強会#8システムパフォーマンス勉強会#8
システムパフォーマンス勉強会#8shingo suzuki
 
「今そこにある危機」を捉える ~ pg_stat_statements revisited
「今そこにある危機」を捉える ~ pg_stat_statements revisited「今そこにある危機」を捉える ~ pg_stat_statements revisited
「今そこにある危機」を捉える ~ pg_stat_statements revisitedUptime Technologies LLC (JP)
 
第4回Linux-HA勉強会資料 Pacemakerの紹介
第4回Linux-HA勉強会資料 Pacemakerの紹介第4回Linux-HA勉強会資料 Pacemakerの紹介
第4回Linux-HA勉強会資料 Pacemakerの紹介ksk_ha
 
PostgreSQLアーキテクチャ入門(PostgreSQL Conference 2012)
PostgreSQLアーキテクチャ入門(PostgreSQL Conference 2012)PostgreSQLアーキテクチャ入門(PostgreSQL Conference 2012)
PostgreSQLアーキテクチャ入門(PostgreSQL Conference 2012)Uptime Technologies LLC (JP)
 
HDFS HA セミナー #hadoop
HDFS HA セミナー #hadoopHDFS HA セミナー #hadoop
HDFS HA セミナー #hadoopCloudera Japan
 
PostgreSQL 9.2 新機能 - OSC 2012 Kansai@Kyoto
PostgreSQL 9.2 新機能 - OSC 2012 Kansai@KyotoPostgreSQL 9.2 新機能 - OSC 2012 Kansai@Kyoto
PostgreSQL 9.2 新機能 - OSC 2012 Kansai@KyotoShigeru Hanada
 
PostgreSQL 9.6 新機能紹介
PostgreSQL 9.6 新機能紹介PostgreSQL 9.6 新機能紹介
PostgreSQL 9.6 新機能紹介Masahiko Sawada
 

What's hot (20)

Pacemaker 操作方法メモ
Pacemaker 操作方法メモPacemaker 操作方法メモ
Pacemaker 操作方法メモ
 
Fluentd meetup #2
Fluentd meetup #2Fluentd meetup #2
Fluentd meetup #2
 
PacemakerのMaster/Slave構成の基本と事例紹介(DRBD、PostgreSQLレプリケーション) @Open Source Confer...
PacemakerのMaster/Slave構成の基本と事例紹介(DRBD、PostgreSQLレプリケーション) @Open Source Confer...PacemakerのMaster/Slave構成の基本と事例紹介(DRBD、PostgreSQLレプリケーション) @Open Source Confer...
PacemakerのMaster/Slave構成の基本と事例紹介(DRBD、PostgreSQLレプリケーション) @Open Source Confer...
 
PostgreSQLアーキテクチャ入門
PostgreSQLアーキテクチャ入門PostgreSQLアーキテクチャ入門
PostgreSQLアーキテクチャ入門
 
5ステップで始めるPostgreSQLレプリケーション@hbstudy#13
5ステップで始めるPostgreSQLレプリケーション@hbstudy#135ステップで始めるPostgreSQLレプリケーション@hbstudy#13
5ステップで始めるPostgreSQLレプリケーション@hbstudy#13
 
Pacemaker NextGen OSC2012TokyoFall-20120908
Pacemaker NextGen OSC2012TokyoFall-20120908Pacemaker NextGen OSC2012TokyoFall-20120908
Pacemaker NextGen OSC2012TokyoFall-20120908
 
Pacemaker + PostgreSQL レプリケーション構成(PG-REX)のフェイルオーバー高速化
Pacemaker + PostgreSQL レプリケーション構成(PG-REX)のフェイルオーバー高速化Pacemaker + PostgreSQL レプリケーション構成(PG-REX)のフェイルオーバー高速化
Pacemaker + PostgreSQL レプリケーション構成(PG-REX)のフェイルオーバー高速化
 
Stormの注目の新機能TridentAPI
Stormの注目の新機能TridentAPIStormの注目の新機能TridentAPI
Stormの注目の新機能TridentAPI
 
PostgreSQLアーキテクチャ入門(INSIGHT OUT 2011)
PostgreSQLアーキテクチャ入門(INSIGHT OUT 2011)PostgreSQLアーキテクチャ入門(INSIGHT OUT 2011)
PostgreSQLアーキテクチャ入門(INSIGHT OUT 2011)
 
第7回oss貢献者賞 森-20120316
第7回oss貢献者賞 森-20120316第7回oss貢献者賞 森-20120316
第7回oss貢献者賞 森-20120316
 
BigDataを迎え撃つ! PostgreSQL並列分散ミドルウェア「Stado」の紹介と検証報告
BigDataを迎え撃つ! PostgreSQL並列分散ミドルウェア「Stado」の紹介と検証報告BigDataを迎え撃つ! PostgreSQL並列分散ミドルウェア「Stado」の紹介と検証報告
BigDataを迎え撃つ! PostgreSQL並列分散ミドルウェア「Stado」の紹介と検証報告
 
PostgreSQL Query Cache - "pqc"
PostgreSQL Query Cache - "pqc"PostgreSQL Query Cache - "pqc"
PostgreSQL Query Cache - "pqc"
 
システムパフォーマンス勉強会#8
システムパフォーマンス勉強会#8システムパフォーマンス勉強会#8
システムパフォーマンス勉強会#8
 
「今そこにある危機」を捉える ~ pg_stat_statements revisited
「今そこにある危機」を捉える ~ pg_stat_statements revisited「今そこにある危機」を捉える ~ pg_stat_statements revisited
「今そこにある危機」を捉える ~ pg_stat_statements revisited
 
PostgreSQL安定運用のコツ2009 @hbstudy#5
PostgreSQL安定運用のコツ2009 @hbstudy#5PostgreSQL安定運用のコツ2009 @hbstudy#5
PostgreSQL安定運用のコツ2009 @hbstudy#5
 
第4回Linux-HA勉強会資料 Pacemakerの紹介
第4回Linux-HA勉強会資料 Pacemakerの紹介第4回Linux-HA勉強会資料 Pacemakerの紹介
第4回Linux-HA勉強会資料 Pacemakerの紹介
 
PostgreSQLアーキテクチャ入門(PostgreSQL Conference 2012)
PostgreSQLアーキテクチャ入門(PostgreSQL Conference 2012)PostgreSQLアーキテクチャ入門(PostgreSQL Conference 2012)
PostgreSQLアーキテクチャ入門(PostgreSQL Conference 2012)
 
HDFS HA セミナー #hadoop
HDFS HA セミナー #hadoopHDFS HA セミナー #hadoop
HDFS HA セミナー #hadoop
 
PostgreSQL 9.2 新機能 - OSC 2012 Kansai@Kyoto
PostgreSQL 9.2 新機能 - OSC 2012 Kansai@KyotoPostgreSQL 9.2 新機能 - OSC 2012 Kansai@Kyoto
PostgreSQL 9.2 新機能 - OSC 2012 Kansai@Kyoto
 
PostgreSQL 9.6 新機能紹介
PostgreSQL 9.6 新機能紹介PostgreSQL 9.6 新機能紹介
PostgreSQL 9.6 新機能紹介
 

Viewers also liked

Flumeを活用したAmebaにおける大規模ログ収集システム
Flumeを活用したAmebaにおける大規模ログ収集システムFlumeを活用したAmebaにおける大規模ログ収集システム
Flumeを活用したAmebaにおける大規模ログ収集システムSatoshi Iijima
 
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現するエフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現するSatoshi Ishikawa
 
Elsticsearch参考情報 URLリンク集
Elsticsearch参考情報 URLリンク集Elsticsearch参考情報 URLリンク集
Elsticsearch参考情報 URLリンク集Yoshio Fujimatsu
 
ピコもんのログ収集基板について
ピコもんのログ収集基板についてピコもんのログ収集基板について
ピコもんのログ収集基板についてairtoxin Ishii
 
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSSNYSOL
 
8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-Yuki Shimizu
 
米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向Takatsugu Kobayashi
 
Kadecot概要
Kadecot概要Kadecot概要
Kadecot概要sonycsl
 
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessRie Yamanaka
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Preferred Networks
 
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)NTT DATA OSS Professional Services
 
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例外道 父
 
CloudwatchをGrafana+Graphiteで見るようにしたら幸せになった件
CloudwatchをGrafana+Graphiteで見るようにしたら幸せになった件CloudwatchをGrafana+Graphiteで見るようにしたら幸せになった件
CloudwatchをGrafana+Graphiteで見るようにしたら幸せになった件Yu Nishimura
 
ポコロンダンジョンズとリアルタイム通信 -サーバサイド編-
ポコロンダンジョンズとリアルタイム通信 -サーバサイド編-ポコロンダンジョンズとリアルタイム通信 -サーバサイド編-
ポコロンダンジョンズとリアルタイム通信 -サーバサイド編-Suguru Shirai
 
ポコロンダンジョンズとリアルタイム通信 -クライアント編-
ポコロンダンジョンズとリアルタイム通信 -クライアント編-ポコロンダンジョンズとリアルタイム通信 -クライアント編-
ポコロンダンジョンズとリアルタイム通信 -クライアント編-Suguru Shirai
 
サイバーエージェントにおけるデータの品質管理について #cwt2016
サイバーエージェントにおけるデータの品質管理について #cwt2016サイバーエージェントにおけるデータの品質管理について #cwt2016
サイバーエージェントにおけるデータの品質管理について #cwt2016cyberagent
 
気の合う人達と社外で社内勉強会
気の合う人達と社外で社内勉強会気の合う人達と社外で社内勉強会
気の合う人達と社外で社内勉強会Yu Shibatsuji
 
解題:私がJavaからCsharpに乗り換えた10の理由
解題:私がJavaからCsharpに乗り換えた10の理由解題:私がJavaからCsharpに乗り換えた10の理由
解題:私がJavaからCsharpに乗り換えた10の理由Kentaro Inomata
 
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworksKimihiko Kitase
 
Big Data入門に見せかけたFluentd入門
Big Data入門に見せかけたFluentd入門Big Data入門に見せかけたFluentd入門
Big Data入門に見せかけたFluentd入門Keisuke Takahashi
 

Viewers also liked (20)

Flumeを活用したAmebaにおける大規模ログ収集システム
Flumeを活用したAmebaにおける大規模ログ収集システムFlumeを活用したAmebaにおける大規模ログ収集システム
Flumeを活用したAmebaにおける大規模ログ収集システム
 
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現するエフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
 
Elsticsearch参考情報 URLリンク集
Elsticsearch参考情報 URLリンク集Elsticsearch参考情報 URLリンク集
Elsticsearch参考情報 URLリンク集
 
ピコもんのログ収集基板について
ピコもんのログ収集基板についてピコもんのログ収集基板について
ピコもんのログ収集基板について
 
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
 
8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-
 
米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向
 
Kadecot概要
Kadecot概要Kadecot概要
Kadecot概要
 
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on Business
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
 
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
 
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例
 
CloudwatchをGrafana+Graphiteで見るようにしたら幸せになった件
CloudwatchをGrafana+Graphiteで見るようにしたら幸せになった件CloudwatchをGrafana+Graphiteで見るようにしたら幸せになった件
CloudwatchをGrafana+Graphiteで見るようにしたら幸せになった件
 
ポコロンダンジョンズとリアルタイム通信 -サーバサイド編-
ポコロンダンジョンズとリアルタイム通信 -サーバサイド編-ポコロンダンジョンズとリアルタイム通信 -サーバサイド編-
ポコロンダンジョンズとリアルタイム通信 -サーバサイド編-
 
ポコロンダンジョンズとリアルタイム通信 -クライアント編-
ポコロンダンジョンズとリアルタイム通信 -クライアント編-ポコロンダンジョンズとリアルタイム通信 -クライアント編-
ポコロンダンジョンズとリアルタイム通信 -クライアント編-
 
サイバーエージェントにおけるデータの品質管理について #cwt2016
サイバーエージェントにおけるデータの品質管理について #cwt2016サイバーエージェントにおけるデータの品質管理について #cwt2016
サイバーエージェントにおけるデータの品質管理について #cwt2016
 
気の合う人達と社外で社内勉強会
気の合う人達と社外で社内勉強会気の合う人達と社外で社内勉強会
気の合う人達と社外で社内勉強会
 
解題:私がJavaからCsharpに乗り換えた10の理由
解題:私がJavaからCsharpに乗り換えた10の理由解題:私がJavaからCsharpに乗り換えた10の理由
解題:私がJavaからCsharpに乗り換えた10の理由
 
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
 
Big Data入門に見せかけたFluentd入門
Big Data入門に見せかけたFluentd入門Big Data入門に見せかけたFluentd入門
Big Data入門に見せかけたFluentd入門
 

Similar to ログ収集フレームワークの新バージョン「FlumeNG」

Trema の紹介とネットワーク仮想化への応用
Trema の紹介とネットワーク仮想化への応用Trema の紹介とネットワーク仮想化への応用
Trema の紹介とネットワーク仮想化への応用kazuyas
 
cloudpack負荷職人結果レポート(サンプル)
cloudpack負荷職人結果レポート(サンプル)cloudpack負荷職人結果レポート(サンプル)
cloudpack負荷職人結果レポート(サンプル)iret, Inc.
 
20130329 rtm3
20130329 rtm320130329 rtm3
20130329 rtm3openrtm
 
Twitterのリアルタイム分散処理システム「Storm」入門
Twitterのリアルタイム分散処理システム「Storm」入門Twitterのリアルタイム分散処理システム「Storm」入門
Twitterのリアルタイム分散処理システム「Storm」入門AdvancedTechNight
 
C16 45分でわかるPostgreSQLの仕組み by 山田努
C16 45分でわかるPostgreSQLの仕組み by 山田努C16 45分でわかるPostgreSQLの仕組み by 山田努
C16 45分でわかるPostgreSQLの仕組み by 山田努Insight Technology, Inc.
 
Cloudera Manager4.0とNameNode-HAセミナー資料
Cloudera Manager4.0とNameNode-HAセミナー資料Cloudera Manager4.0とNameNode-HAセミナー資料
Cloudera Manager4.0とNameNode-HAセミナー資料Cloudera Japan
 
Flume cassandra real time log processing (日本語)
Flume cassandra real time log processing (日本語)Flume cassandra real time log processing (日本語)
Flume cassandra real time log processing (日本語)CLOUDIAN KK
 
デブサミ2014-Stormで実現するビッグデータのリアルタイム処理プラットフォーム ~ストリームデータ処理から機械学習まで~
デブサミ2014-Stormで実現するビッグデータのリアルタイム処理プラットフォーム ~ストリームデータ処理から機械学習まで~デブサミ2014-Stormで実現するビッグデータのリアルタイム処理プラットフォーム ~ストリームデータ処理から機械学習まで~
デブサミ2014-Stormで実現するビッグデータのリアルタイム処理プラットフォーム ~ストリームデータ処理から機械学習まで~Takanori Suzuki
 
Mr201304 open flow_security_jpn
Mr201304 open flow_security_jpnMr201304 open flow_security_jpn
Mr201304 open flow_security_jpnFFRI, Inc.
 
Lagopus Router v19.07.1
Lagopus Router v19.07.1Lagopus Router v19.07.1
Lagopus Router v19.07.1Tomoya Hibi
 
Rubyで創るOpenFlowネットワーク - LLまつり
Rubyで創るOpenFlowネットワーク - LLまつりRubyで創るOpenFlowネットワーク - LLまつり
Rubyで創るOpenFlowネットワーク - LLまつりYuya Rin
 
Kyoto Tycoon Guide in Japanese
Kyoto Tycoon Guide in JapaneseKyoto Tycoon Guide in Japanese
Kyoto Tycoon Guide in JapaneseMikio Hirabayashi
 
cloudpackサーバ仕様書(サンプル)
cloudpackサーバ仕様書(サンプル)cloudpackサーバ仕様書(サンプル)
cloudpackサーバ仕様書(サンプル)iret, Inc.
 
loggregator update
loggregator updateloggregator update
loggregator updateKen Ojiri
 
#logstudy 01 rsyslog入門
#logstudy 01 rsyslog入門#logstudy 01 rsyslog入門
#logstudy 01 rsyslog入門Takashi Takizawa
 
次世代Webコンテナ Undertowについて
次世代Webコンテナ Undertowについて次世代Webコンテナ Undertowについて
次世代Webコンテナ UndertowについてYoshimasa Tanabe
 
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)Shinichiro Isago
 

Similar to ログ収集フレームワークの新バージョン「FlumeNG」 (20)

Trema の紹介とネットワーク仮想化への応用
Trema の紹介とネットワーク仮想化への応用Trema の紹介とネットワーク仮想化への応用
Trema の紹介とネットワーク仮想化への応用
 
Oracle GoldenGate アーキテクチャと基本機能
Oracle GoldenGate アーキテクチャと基本機能Oracle GoldenGate アーキテクチャと基本機能
Oracle GoldenGate アーキテクチャと基本機能
 
cloudpack負荷職人結果レポート(サンプル)
cloudpack負荷職人結果レポート(サンプル)cloudpack負荷職人結果レポート(サンプル)
cloudpack負荷職人結果レポート(サンプル)
 
20130329 rtm3
20130329 rtm320130329 rtm3
20130329 rtm3
 
Twitterのリアルタイム分散処理システム「Storm」入門
Twitterのリアルタイム分散処理システム「Storm」入門Twitterのリアルタイム分散処理システム「Storm」入門
Twitterのリアルタイム分散処理システム「Storm」入門
 
P2Pって何?
P2Pって何?P2Pって何?
P2Pって何?
 
C16 45分でわかるPostgreSQLの仕組み by 山田努
C16 45分でわかるPostgreSQLの仕組み by 山田努C16 45分でわかるPostgreSQLの仕組み by 山田努
C16 45分でわかるPostgreSQLの仕組み by 山田努
 
Cloudera Manager4.0とNameNode-HAセミナー資料
Cloudera Manager4.0とNameNode-HAセミナー資料Cloudera Manager4.0とNameNode-HAセミナー資料
Cloudera Manager4.0とNameNode-HAセミナー資料
 
Flume cassandra real time log processing (日本語)
Flume cassandra real time log processing (日本語)Flume cassandra real time log processing (日本語)
Flume cassandra real time log processing (日本語)
 
デブサミ2014-Stormで実現するビッグデータのリアルタイム処理プラットフォーム ~ストリームデータ処理から機械学習まで~
デブサミ2014-Stormで実現するビッグデータのリアルタイム処理プラットフォーム ~ストリームデータ処理から機械学習まで~デブサミ2014-Stormで実現するビッグデータのリアルタイム処理プラットフォーム ~ストリームデータ処理から機械学習まで~
デブサミ2014-Stormで実現するビッグデータのリアルタイム処理プラットフォーム ~ストリームデータ処理から機械学習まで~
 
Mr201304 open flow_security_jpn
Mr201304 open flow_security_jpnMr201304 open flow_security_jpn
Mr201304 open flow_security_jpn
 
Lagopus Router v19.07.1
Lagopus Router v19.07.1Lagopus Router v19.07.1
Lagopus Router v19.07.1
 
osoljp 2011.08
osoljp 2011.08osoljp 2011.08
osoljp 2011.08
 
Rubyで創るOpenFlowネットワーク - LLまつり
Rubyで創るOpenFlowネットワーク - LLまつりRubyで創るOpenFlowネットワーク - LLまつり
Rubyで創るOpenFlowネットワーク - LLまつり
 
Kyoto Tycoon Guide in Japanese
Kyoto Tycoon Guide in JapaneseKyoto Tycoon Guide in Japanese
Kyoto Tycoon Guide in Japanese
 
cloudpackサーバ仕様書(サンプル)
cloudpackサーバ仕様書(サンプル)cloudpackサーバ仕様書(サンプル)
cloudpackサーバ仕様書(サンプル)
 
loggregator update
loggregator updateloggregator update
loggregator update
 
#logstudy 01 rsyslog入門
#logstudy 01 rsyslog入門#logstudy 01 rsyslog入門
#logstudy 01 rsyslog入門
 
次世代Webコンテナ Undertowについて
次世代Webコンテナ Undertowについて次世代Webコンテナ Undertowについて
次世代Webコンテナ Undertowについて
 
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)
 

More from AdvancedTechNight

CSS3Rendererを使ってiOSでもサクサク3D
CSS3Rendererを使ってiOSでもサクサク3DCSS3Rendererを使ってiOSでもサクサク3D
CSS3Rendererを使ってiOSでもサクサク3DAdvancedTechNight
 
D3.jsと学ぶVisualization(可視化)の世界
D3.jsと学ぶVisualization(可視化)の世界D3.jsと学ぶVisualization(可視化)の世界
D3.jsと学ぶVisualization(可視化)の世界AdvancedTechNight
 
3DCG(3Dコンピュータグラフィック)をWebGLで始めよう
3DCG(3Dコンピュータグラフィック)をWebGLで始めよう3DCG(3Dコンピュータグラフィック)をWebGLで始めよう
3DCG(3Dコンピュータグラフィック)をWebGLで始めようAdvancedTechNight
 
CSSだけで実現するグラフィック表現
CSSだけで実現するグラフィック表現CSSだけで実現するグラフィック表現
CSSだけで実現するグラフィック表現AdvancedTechNight
 
これから利用拡大?WebSocket
これから利用拡大?WebSocketこれから利用拡大?WebSocket
これから利用拡大?WebSocketAdvancedTechNight
 
全部入り!WGPで高速JavaScript+HML5体験
全部入り!WGPで高速JavaScript+HML5体験全部入り!WGPで高速JavaScript+HML5体験
全部入り!WGPで高速JavaScript+HML5体験AdvancedTechNight
 
TypeScriptのススメ ~JavaエンジニアのためのJava(like)Script
TypeScriptのススメ ~JavaエンジニアのためのJava(like)ScriptTypeScriptのススメ ~JavaエンジニアのためのJava(like)Script
TypeScriptのススメ ~JavaエンジニアのためのJava(like)ScriptAdvancedTechNight
 
three.jsで作る3Dの世界
three.jsで作る3Dの世界three.jsで作る3Dの世界
three.jsで作る3Dの世界AdvancedTechNight
 
単なるキャッシュじゃないよ!?infinispanの紹介
単なるキャッシュじゃないよ!?infinispanの紹介単なるキャッシュじゃないよ!?infinispanの紹介
単なるキャッシュじゃないよ!?infinispanの紹介AdvancedTechNight
 
分散ストリーム処理フレームワーク Apache S4
分散ストリーム処理フレームワーク Apache S4分散ストリーム処理フレームワーク Apache S4
分散ストリーム処理フレームワーク Apache S4AdvancedTechNight
 
Twitterのリアルタイム分散処理システム「Storm」入門 demo
Twitterのリアルタイム分散処理システム「Storm」入門 demoTwitterのリアルタイム分散処理システム「Storm」入門 demo
Twitterのリアルタイム分散処理システム「Storm」入門 demoAdvancedTechNight
 
Hadoop scr第7回 hw2011フィードバック
Hadoop scr第7回 hw2011フィードバックHadoop scr第7回 hw2011フィードバック
Hadoop scr第7回 hw2011フィードバックAdvancedTechNight
 
ななめ45°から見たJavaOne
ななめ45°から見たJavaOneななめ45°から見たJavaOne
ななめ45°から見たJavaOneAdvancedTechNight
 
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たちATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たちAdvancedTechNight
 
ATN No.1 Hadoop vs Amazon EMR
ATN No.1 Hadoop vs Amazon EMRATN No.1 Hadoop vs Amazon EMR
ATN No.1 Hadoop vs Amazon EMRAdvancedTechNight
 
ATN No.2 大阪から来たJavaPuzzlers
ATN No.2 大阪から来たJavaPuzzlersATN No.2 大阪から来たJavaPuzzlers
ATN No.2 大阪から来たJavaPuzzlersAdvancedTechNight
 

More from AdvancedTechNight (19)

CSS3Rendererを使ってiOSでもサクサク3D
CSS3Rendererを使ってiOSでもサクサク3DCSS3Rendererを使ってiOSでもサクサク3D
CSS3Rendererを使ってiOSでもサクサク3D
 
D3.jsと学ぶVisualization(可視化)の世界
D3.jsと学ぶVisualization(可視化)の世界D3.jsと学ぶVisualization(可視化)の世界
D3.jsと学ぶVisualization(可視化)の世界
 
3DCG(3Dコンピュータグラフィック)をWebGLで始めよう
3DCG(3Dコンピュータグラフィック)をWebGLで始めよう3DCG(3Dコンピュータグラフィック)をWebGLで始めよう
3DCG(3Dコンピュータグラフィック)をWebGLで始めよう
 
CSSだけで実現するグラフィック表現
CSSだけで実現するグラフィック表現CSSだけで実現するグラフィック表現
CSSだけで実現するグラフィック表現
 
これから利用拡大?WebSocket
これから利用拡大?WebSocketこれから利用拡大?WebSocket
これから利用拡大?WebSocket
 
全部入り!WGPで高速JavaScript+HML5体験
全部入り!WGPで高速JavaScript+HML5体験全部入り!WGPで高速JavaScript+HML5体験
全部入り!WGPで高速JavaScript+HML5体験
 
Backbone.js入門
Backbone.js入門Backbone.js入門
Backbone.js入門
 
TypeScriptのススメ ~JavaエンジニアのためのJava(like)Script
TypeScriptのススメ ~JavaエンジニアのためのJava(like)ScriptTypeScriptのススメ ~JavaエンジニアのためのJava(like)Script
TypeScriptのススメ ~JavaエンジニアのためのJava(like)Script
 
three.jsで作る3Dの世界
three.jsで作る3Dの世界three.jsで作る3Dの世界
three.jsで作る3Dの世界
 
単なるキャッシュじゃないよ!?infinispanの紹介
単なるキャッシュじゃないよ!?infinispanの紹介単なるキャッシュじゃないよ!?infinispanの紹介
単なるキャッシュじゃないよ!?infinispanの紹介
 
Spine入門
Spine入門Spine入門
Spine入門
 
分散ストリーム処理フレームワーク Apache S4
分散ストリーム処理フレームワーク Apache S4分散ストリーム処理フレームワーク Apache S4
分散ストリーム処理フレームワーク Apache S4
 
Twitterのリアルタイム分散処理システム「Storm」入門 demo
Twitterのリアルタイム分散処理システム「Storm」入門 demoTwitterのリアルタイム分散処理システム「Storm」入門 demo
Twitterのリアルタイム分散処理システム「Storm」入門 demo
 
Hadoop scr第7回 hw2011フィードバック
Hadoop scr第7回 hw2011フィードバックHadoop scr第7回 hw2011フィードバック
Hadoop scr第7回 hw2011フィードバック
 
ななめ45°から見たJavaOne
ななめ45°から見たJavaOneななめ45°から見たJavaOne
ななめ45°から見たJavaOne
 
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たちATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
 
ATN No.1 Hadoop vs Amazon EMR
ATN No.1 Hadoop vs Amazon EMRATN No.1 Hadoop vs Amazon EMR
ATN No.1 Hadoop vs Amazon EMR
 
ATN No.2 大阪から来たJavaPuzzlers
ATN No.2 大阪から来たJavaPuzzlersATN No.2 大阪から来たJavaPuzzlers
ATN No.2 大阪から来たJavaPuzzlers
 
ATN No.2 Scala事始め
ATN No.2 Scala事始めATN No.2 Scala事始め
ATN No.2 Scala事始め
 

Recently uploaded

新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価sugiuralab
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000Shota Ito
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directoryosamut
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxAtomu Hidaka
 
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールプレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールsugiuralab
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 

Recently uploaded (8)

新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
 
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
 
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールプレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツール
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
 

ログ収集フレームワークの新バージョン「FlumeNG」

  • 1. Advanced Tech Night No.04 ログ収集フレームワークの新バージョン FlumeNG の紹介 2012/03/01 Acroquest Technology 音田 司(@t_otoda)
  • 2. 自己紹介  氏名 :音田 司  所属 : Acroquest Technology  Twitter : @t_otoda  専攻 :数学科(学部卒) ↑私は写ってません  業務 • 現在、主にOSS(Hadoop等)の調査/検証/導入 支援を行っています。 • これまで、Hadoop、HBase、Flumeなどを中心 に扱ってきました。 2
  • 3. 目次 1. Flume 1) Flumeとは 2) Flumeの特徴 3) アーキテクチャ 2. FlumeNG 1) FlumeNGとは 2) アーキテクチャ 3) FlumeOGからの改善点 4) FlumeNGで注意したい点 3
  • 4. Flume 4
  • 5. 1. Flumeとは 1. 大量のログデータを、多量のソースから中央のデー タストアへ、効率的に収集、集約、移動することを目 的に開発された、高い信頼性と可用性を持つ分散型 のサービスです。 2. Clouderaが開発したHadoopエコシステムの1つ 3. CDHでHDFSやHBase、Hiveとともにサポートされて いる ① CDH3u3では、Flume0.9.4+25.40 ② Flume単体の最新バージョンは、Flume1.0.0 (=Flume NG) 5
  • 7. 2. Flumeの特徴 (1/2) 1. ログのストリーム転送  text1行を1イベントとしてリアルタイムに転送 2. 選べる3つの信頼性 信頼性のレベル 概要 End2End WALを残し、Flumeが生存する限りフロー末端までの 転送を保証 DiskFailOver 次のマシンへの転送障害発生時にログをディスクに保 存 BestEffort 受信の確認や再送は行わない 7
  • 8. 2. Flumeの特徴 (2/2) 3. スケーラビリティ  Agent、Collectorの追加によるスケールアウトが 可能 4. 設定の疎結合性  ログの種類に影響されず、設定可能 5. ノード管理の簡易化  FlumeMasterでの中央管理により、多数の FlumeNodeに対する設定反映が動的かつ集約的 に可能 8
  • 9. 3. アーキテクチャ(データフロー) データ(ログ)を収集するAgent、Agentからの情報を集約する Collectorに対して、一連のデータフローを設定します。 ログ Agent Collector ログ Agent ログ蓄積サーバ ログ (HDFS・S3・ローカル) Agent Collector ログ ログの転送/書込み Agent ログの転送 Master FlumeMasterは全サーバ上の FlumeNode(Agent/Collector)の状態を管理 9
  • 10. 3. アーキテクチャ(論理ノード) FlumeNode(Agent/Collector)は論理ノード(Thread)を内 部に持ち、データの入力、変換、出力を行います。 Agent Collector 論理ノード(Thread) 論理ノード(Thread) Sink Sink Source Sink Sink Source Decorator Decorator 入力 出力 入力 出力  論理ノード内の設定には以下の3種類があります。 1. Source ⇒データ入力部 2. SinkDecorator ⇒SourceとSinkの間の中間処理(任意) 3. Sink ⇒データ出力部  各部分は独自のPluginにより拡張可能です。 10
  • 11. 検証事例 Agent Agent Agent Agent (Thread) (Thread) (Thread) Collector Agent Collector Agent Agent Collector ログ蓄積サーバ Agent (Thread) (Thread) (Thread) Collector (Thread) (ローカル) (Thread) (Thread) Agent Agent Agent ログの転送/書込み Agent (Thread) (Thread) (Thread) ログの転送 ログ出力サーバ: 80 台 ログ収集/蓄積サーバ:1 台 3論理ノード/Agent(240Thread) 80論理ノード(80Thread) ログ出力量:平均 60 MB/分 1日の全転送量:0.8 TB 最繁時 100 MB/分 1台当たりの転送速度:1.4 Gbps 11
  • 12. FlumeNG 12
  • 13. 1. FlumeNGとは Flumeが抱える制限を解決するため、 達成する目的は変更せずにリファクタリングした、 次世代(NewGeneration)のFlume ※NGは「ダメダメ」ということではありません。。。 ※慣例として、FlumeNG以前のFlumeは、FlumeOGと呼びます。 No. 変更点 Flumeの抱える制限 1 Channel・Transactionの Sinkの遅延がSourceの遅延に影響する 追加 2 状態管理の実装変更 状態変更に伴うスレッド制御について一部問 題がある 3 Propertiesファイルによる Masterサーバからしか設定変更できない 設定 4 Groupの追加 設定で個々のホスト名を使用する 13
  • 14. 2. アーキテクチャ データ(ログ)を収集するAgent、Agentからの情報を集約する Collectorに対して、一連のデータフローを設定する所は変わら ず、内部構造が変更になった。 ログ Agent Collector ログ Agent ログ蓄積サーバ ログ (HDFS・S3・ローカル) Agent Collector ログ ログの転送/書込み Agent ログの転送 Master FlumeMasterは全サーバ上の FlumeNode(Agent/Collector)の状態を管理 14
  • 15. 3.1 Channel・Transactionの追加(1/2)  Channel 論理ノードという概念がなくなる Agent1 Client Sink Agent2 Sink Source Channel Sink 出力 入力 Channel 出力  改善点  いままでSourceまたはSinkの遅延は、他方に影響を与えた  Channelの導入により、FlumeOGの時の論理ノードThreadがなくなり、 SourceとSinkがそれぞれThreadになることで非同期化される 15
  • 16. 3.1 Channel・Transactionの追加(2/2)  Transaction Agent1 Agent2 Channel1 Sink1 Source2 Channel2 Transaction開始 データ取得 データ転送 Transaction開始 データ登録 Commit Commit Agent2でのtransactionをCommitしたあと、 Agent1でのtransactionをCommitする。 エラー発生時は開始前にRollbackする。 16
  • 17. 3.2 状態管理の実装変更 1. FlumeMasterが行っていた状態管理の実装変更  状態に合わせてスレッドを起動/停止するのではなく、 スレッドの起動/停止に合わせて状態を変化させる。 Agentが起動した 論理ノードThreadを Source,Sinkのスレッ コントロールできない ドを直接管理する。 ⇒動的設定変更でお かしくなりやすい。 Agent(Process) Agent(Process) 論理ノード(Thread) Source(Thread) Sink(Thread) Source Sink Source Sink Channel 17
  • 18. 3.3 Propertiesファイルによる設定(1/2) 1. FlumeOGでは設定変更にはFlumeMasterからの 変更が必須。 2. FlumeNGではプロパティファイルによる設定が可 能になる。  FlumeMasterを用意するか選択ができる。 3. プロパティファイルによる設定の導入には、以下 のコンセプトが関わっている? Centralized is important to about 50% of users. The other half don't want it and would prefer simple local files. Everyone agrees dynamic configuration (runtime reconfiguration) is critical as downtime for data ingest systems hurts. 18
  • 19. 3.3 Propertiesファイルによる設定(2/2) Avro(0.0.0.0:41414)をLISTEN⇒メモリに一時保存⇒ログ出力 という構成時の設定例 # now that we've defined all of our components, tell 使用するコンポーネントを定義 # host1 which ones we want to activate. <ホスト名>. host1.sources = avro-source1 host1.channels = ch1 [sources|channels|sinks]=xxx host1.sinks = log-sink1 # Define an Avro source called avro-source1 on host1 and tell it 各コンポーネントを定義 # to bind to 0.0.0.0:41414. Connect it to channel ch1. host1.sources.avro-source1.type = avro <ホスト名>. host1.sources.avro-source1.bind = 0.0.0.0 [sources|channels|sinks]. host1.sources.avro-source1.port = 41414 xxx.type=yyy host1.sources.avro-source1.channels = ch1 … # Define a memory channel called ch1 on host1 host1.channels.ch1.type = memory Channelは現在3種類 # Define a logger sink that simply logs all events it receives (処理が早い) (信頼性高い) # and connect it to the other end of the same channel. Memory > File > JDBC host1.sinks.log-sink1.type = logger host1.sinks.log-sink1.channel = ch1 19
  • 20. 3.4 Groupの追加 1. 「Group」という概念の追加 ① すべてのClientとサーバはGroupに属する。 ② 転送先の設定は、特定の物理ノード(ホスト名)を指定せず、 Groupで指定する。 20
  • 21. 4. FlumeNGで注意したい点 1. 未実装の機能が多く残っている ① FlumeMasterや設定投入、監視用メトリクス (Source、Sinkの挙動を示すカウンターなど)など ② Flume1.1.0にて対応予定 2. FlumeOGとの互換性は保証されていない ① 通信プロトコルは現在Avroのみ対応 ② プラグインの実装方法が変わる ③ 設定内容が変わる(Channelの追加、Source/Sink の名前変更) 21
  • 23. まとめ 1. Flumeは大量のログデータを、多量のソースか ら中央のデータストアへ、効率的に収集、集約、 移動することを目的に開発された、高い信頼性 と可用性を持つ分散型のサービスです。 2. FlumeNGはFlumeOGの問題点を、大胆なリ ファクタリングにより、改善させています。 (現在進行形) 23
  • 24. 参考資料 1. Inside Flume • http://www.slideshare.net/cloudera/inside-flume 2. Flume(日本語) • http://www.slideshare.net/ashitanoken/flume 3. Apache Flume (incubating) • https://blogs.apache.org/flume/entry/flume_ng_architecture 4. Flumeユーザガイド • http://oss.infoscience.co.jp/flume/UserGuide/index.html 5. Flume Wiki • https://cwiki.apache.org/FLUME/flume-ng.html 6. FlumeNG UserGuide • http://dl.dropbox.com/u/27523578/Flume/FlumeUserGuide.pdf 24