SlideShare a Scribd company logo
1 of 34
Download to read offline
三
                            ⽉月
                            ⼀一
                            ⽇日
アマゾン  データ  サービス  ジャパン株式会社
新製品発表会
私、                        インフ
           株式会社
           マイニング
           ブラウニー



           ・2006年設⽴立
           ・クローラの開発・運⽤用
           ・リサーチ
代表取締役
           ・テキストマイニング
得上  ⻯竜⼀一
インフラでの悩み   様々な


サーバの調達
インフラでの悩み   様々な


サーバの調達




Amazon
 EC2
インフラでの悩み            様々な


サーバの調達




Amazon
            効率的な
 EC2
         インフラの利⽤用
インフラでの悩み            様々な

          Amazon
サーバの調達     SQS



Amazon
            効率的な
 EC2
         インフラの利⽤用
インフラでの悩み               様々な
                    ⼤大量のデータを

          Amazon      保存できる
サーバの調達     SQS       データベース




Amazon
            効率的な
 EC2
         インフラの利⽤用
インフラでの悩み               様々な
                    ⼤大量のデータを

          Amazon      保存できる
サーバの調達     SQS       データベース




Amazon
            効率的な
 EC2
         インフラの利⽤用
様々なDBの検討   クロー
様々なDBの検討   クロー
様々なDBの検討   クロー
 システム停⽌止
なしでスケール
  できず断念
様々なDBの検討   クロー
 システム停⽌止
なしでスケール
  できず断念
様々なDBの検討                  クロー
               Sharding
 システム停⽌止   +ReplicaSetの
なしでスケール    インフラコスト
  できず断念    の⼤大きさで断念
様々なDBの検討                    クロー
               Sharding
 システム停⽌止   +ReplicaSetの
なしでスケール    インフラコスト
  できず断念    の⼤大きさで断念       SimpleDB
様々なDBの検討                     クロー
               Sharding
 システム停⽌止   +ReplicaSetの
なしでスケール    インフラコスト
  できず断念    の⼤大きさで断念        SimpleDB


                          10Gの容量では
                           ⾜足りず⼀一部で
                             のみ利⽤用
クローラだけではない                   検討を



      莫⼤大な数の1Kbyte以下の細かいデータ
      例)
      「吾輩は猫である」  Size:約700Kbyte
 テキスト
      ⽂文の数:9200
マイニング 単語:14,000種類、250,000単語
検討を重ねた   Dyna
検討を重ねた     Dyna




SimpleDB
検討を重ねた        Dyna
 1billion個の
 レコードでは
     ⾜足りず
⼀一部での利⽤用に




 SimpleDB
検討を重ねた             Dyna
 1billion個の
 レコードでは
     ⾜足りず
⼀一部での利⽤用に     S3




 SimpleDB
検討を重ねた                Dyna
 1billion個の
 レコードでは
     ⾜足りず
⼀一部での利⽤用に        S3




              検索機能の

 SimpleDB     弱さで断念
検討を重ねた                   Dyna
 1billion個の
 レコードでは
     ⾜足りず
⼀一部での利⽤用に        S3




              検索機能の

 SimpleDB     弱さで断念   Cassandra
検討を重ねた                   Dyna
 1billion個の
 レコードでは                 運⽤用の⼿手間
     ⾜足りず             インフラコスト
⼀一部での利⽤用に        S3 の⼤大きさで断念




              検索機能の

 SimpleDB     弱さで断念   Cassandra
Dynamoとの出会い   論⽂文
論⽂文                                                                              この論
|
Dynamo:Amazonʼ’s  Highly  Available  Key-‑value  Store


    Traditionally production systems store their state in relational databases. For many
    of the more common usage patterns of state persistence, however, a relational
    database is a solution that is far from ideal. Most of these services only store and
    retrieve data by primary key and do not require the complex querying and
    management functionality offered by an RDBMS. This excess functionality
    requires expensive hardware and highly skilled personnel for its operation,
    making it a very inefficient solution.
     In addition, the available replication technologies are limited and typically choose
    consistency over availability. Although many advances have been made in the
    recent years, it is still not easy to scale-out databases or use smart partitioning
    schemes for load balancing.
この論⽂文に出会ってから そして
この論⽂文に出会ってから そして


 2007年
この論⽂文に出会ってから そして


 2007年




         2008年
この論⽂文に出会ってから そして


 2007年              2009年




         2008年   SimpleDB
この論⽂文に出会ってから そして


 2007年              2009年




                            2010年
         2008年   SimpleDB   2011年
そして今⽇日                       クロー
|
Amazon  DynamoDBが⽇日本でも使えるようになりました。
|
⽇日本-‑⽶米国間のレイテンシの問題も解決
|
  
|
  
|
最⾼高のパフォーマンスで使えるようになりました
|
クローラのデータストア テキス
               クローラが
             集めたデータの
                保存先に



mitsubachi
クローラの
     PaaS
テキストマイニング              ビッグ
           テキストマイニ
            ングの過程で
           発⽣生する⼤大量の
           データの処理に

  hotaru
  テキスト
マイニングの
   SaaS
ビッグデータと共に
|
この1年でHadoopは当たり前のようになりました。
|
  
|
今年ビッグデータと呼ばれる⼤大規模なデータの処理
|
が今以上に当たり前になってきます。
|
  
|
ビッグデータの保存先として、
|
Amazon  DynamoDBほど適したデータストアは
|
他にはありません。
|

More Related Content

More from Ryuichi Tokugami

de:code 2019 AI04 あなたがコルタナさんに「ラーメン」と尋ねたとき、それはコルタナさんに何を求めていますか?
de:code 2019 AI04 あなたがコルタナさんに「ラーメン」と尋ねたとき、それはコルタナさんに何を求めていますか?de:code 2019 AI04 あなたがコルタナさんに「ラーメン」と尋ねたとき、それはコルタナさんに何を求めていますか?
de:code 2019 AI04 あなたがコルタナさんに「ラーメン」と尋ねたとき、それはコルタナさんに何を求めていますか?Ryuichi Tokugami
 
改めまして、Cognitive ToolKit です。
 改めまして、Cognitive ToolKit です。 改めまして、Cognitive ToolKit です。
改めまして、Cognitive ToolKit です。Ryuichi Tokugami
 
平成最後の1月ですし、Databricksでもやってみましょうか
平成最後の1月ですし、Databricksでもやってみましょうか平成最後の1月ですし、Databricksでもやってみましょうか
平成最後の1月ですし、DatabricksでもやってみましょうかRyuichi Tokugami
 
Azure MLで機械学習をやってみよう
Azure MLで機械学習をやってみようAzure MLで機械学習をやってみよう
Azure MLで機械学習をやってみようRyuichi Tokugami
 
UserDataでEC2をより便利に (2013-07-25 Jawsug中央線 第0回)
UserDataでEC2をより便利に (2013-07-25 Jawsug中央線 第0回)UserDataでEC2をより便利に (2013-07-25 Jawsug中央線 第0回)
UserDataでEC2をより便利に (2013-07-25 Jawsug中央線 第0回)Ryuichi Tokugami
 
初めてのSimpleDB (2013-06-22 JAWS-UG 大阪 第8回 )
初めてのSimpleDB (2013-06-22 JAWS-UG 大阪 第8回 )初めてのSimpleDB (2013-06-22 JAWS-UG 大阪 第8回 )
初めてのSimpleDB (2013-06-22 JAWS-UG 大阪 第8回 )Ryuichi Tokugami
 
Elastic beanstalk AWS 初心者から 次の一歩へ (2013-04-27 JAWS-UG つくば 第1回 勉強会)
Elastic beanstalk AWS 初心者から 次の一歩へ (2013-04-27 JAWS-UG つくば 第1回 勉強会)Elastic beanstalk AWS 初心者から 次の一歩へ (2013-04-27 JAWS-UG つくば 第1回 勉強会)
Elastic beanstalk AWS 初心者から 次の一歩へ (2013-04-27 JAWS-UG つくば 第1回 勉強会)Ryuichi Tokugami
 
JAWS-UG アップデート (2012-09-14 JAWS-UG 第13回 勉強会 )
JAWS-UG アップデート (2012-09-14 JAWS-UG 第13回 勉強会 )JAWS-UG アップデート (2012-09-14 JAWS-UG 第13回 勉強会 )
JAWS-UG アップデート (2012-09-14 JAWS-UG 第13回 勉強会 )Ryuichi Tokugami
 
"restaurant démonstration" (2012-09-01 クラウドごった煮 第6回 AWS枠)
"restaurant démonstration" (2012-09-01 クラウドごった煮 第6回 AWS枠)"restaurant démonstration" (2012-09-01 クラウドごった煮 第6回 AWS枠)
"restaurant démonstration" (2012-09-01 クラウドごった煮 第6回 AWS枠)Ryuichi Tokugami
 
AWSアップデート (2012-08-27 JAWS-UG 札幌 第7回 勉強会)
AWSアップデート (2012-08-27 JAWS-UG 札幌 第7回 勉強会)AWSアップデート (2012-08-27 JAWS-UG 札幌 第7回 勉強会)
AWSアップデート (2012-08-27 JAWS-UG 札幌 第7回 勉強会)Ryuichi Tokugami
 
AWS上にサービスを作る (2012-06-22 JAWS-UG 福岡)
AWS上にサービスを作る (2012-06-22 JAWS-UG 福岡)AWS上にサービスを作る (2012-06-22 JAWS-UG 福岡)
AWS上にサービスを作る (2012-06-22 JAWS-UG 福岡)Ryuichi Tokugami
 
Talking about love for DynamoDB & SimpleDB (2012-06-05 CloudDB Night)
Talking about love for DynamoDB & SimpleDB (2012-06-05 CloudDB Night)Talking about love for DynamoDB & SimpleDB (2012-06-05 CloudDB Night)
Talking about love for DynamoDB & SimpleDB (2012-06-05 CloudDB Night)Ryuichi Tokugami
 
CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会)
CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会)CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会)
CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会)Ryuichi Tokugami
 
Aws禅 (2012-05-13 JAWS-UG 子ども会)
Aws禅 (2012-05-13 JAWS-UG 子ども会)Aws禅 (2012-05-13 JAWS-UG 子ども会)
Aws禅 (2012-05-13 JAWS-UG 子ども会)Ryuichi Tokugami
 
Counter Table Pattern & Temporary Table Pattern (2012-04-13 CDP Night)
Counter Table Pattern & Temporary Table Pattern (2012-04-13 CDP Night)Counter Table Pattern & Temporary Table Pattern (2012-04-13 CDP Night)
Counter Table Pattern & Temporary Table Pattern (2012-04-13 CDP Night)Ryuichi Tokugami
 
サンタクラウド番外編 (2011-12-22 第11回 AWS User Group - Japan 東京勉強会)
サンタクラウド番外編 (2011-12-22 第11回 AWS User Group - Japan 東京勉強会)サンタクラウド番外編 (2011-12-22 第11回 AWS User Group - Japan 東京勉強会)
サンタクラウド番外編 (2011-12-22 第11回 AWS User Group - Japan 東京勉強会)Ryuichi Tokugami
 
S3解説 - 第1回 ビギナー編 AWS User Group - Japan 東京勉強会
S3解説 - 第1回 ビギナー編 AWS User Group - Japan 東京勉強会S3解説 - 第1回 ビギナー編 AWS User Group - Japan 東京勉強会
S3解説 - 第1回 ビギナー編 AWS User Group - Japan 東京勉強会Ryuichi Tokugami
 
AWSを使いこなしてコスト削減
AWSを使いこなしてコスト削減AWSを使いこなしてコスト削減
AWSを使いこなしてコスト削減Ryuichi Tokugami
 

More from Ryuichi Tokugami (20)

de:code 2019 AI04 あなたがコルタナさんに「ラーメン」と尋ねたとき、それはコルタナさんに何を求めていますか?
de:code 2019 AI04 あなたがコルタナさんに「ラーメン」と尋ねたとき、それはコルタナさんに何を求めていますか?de:code 2019 AI04 あなたがコルタナさんに「ラーメン」と尋ねたとき、それはコルタナさんに何を求めていますか?
de:code 2019 AI04 あなたがコルタナさんに「ラーメン」と尋ねたとき、それはコルタナさんに何を求めていますか?
 
改めまして、Cognitive ToolKit です。
 改めまして、Cognitive ToolKit です。 改めまして、Cognitive ToolKit です。
改めまして、Cognitive ToolKit です。
 
平成最後の1月ですし、Databricksでもやってみましょうか
平成最後の1月ですし、Databricksでもやってみましょうか平成最後の1月ですし、Databricksでもやってみましょうか
平成最後の1月ですし、Databricksでもやってみましょうか
 
Silk
SilkSilk
Silk
 
Azure MLで機械学習をやってみよう
Azure MLで機械学習をやってみようAzure MLで機械学習をやってみよう
Azure MLで機械学習をやってみよう
 
UserDataでEC2をより便利に (2013-07-25 Jawsug中央線 第0回)
UserDataでEC2をより便利に (2013-07-25 Jawsug中央線 第0回)UserDataでEC2をより便利に (2013-07-25 Jawsug中央線 第0回)
UserDataでEC2をより便利に (2013-07-25 Jawsug中央線 第0回)
 
初めてのSimpleDB (2013-06-22 JAWS-UG 大阪 第8回 )
初めてのSimpleDB (2013-06-22 JAWS-UG 大阪 第8回 )初めてのSimpleDB (2013-06-22 JAWS-UG 大阪 第8回 )
初めてのSimpleDB (2013-06-22 JAWS-UG 大阪 第8回 )
 
Elastic beanstalk AWS 初心者から 次の一歩へ (2013-04-27 JAWS-UG つくば 第1回 勉強会)
Elastic beanstalk AWS 初心者から 次の一歩へ (2013-04-27 JAWS-UG つくば 第1回 勉強会)Elastic beanstalk AWS 初心者から 次の一歩へ (2013-04-27 JAWS-UG つくば 第1回 勉強会)
Elastic beanstalk AWS 初心者から 次の一歩へ (2013-04-27 JAWS-UG つくば 第1回 勉強会)
 
Autoscalingとか
AutoscalingとかAutoscalingとか
Autoscalingとか
 
JAWS-UG アップデート (2012-09-14 JAWS-UG 第13回 勉強会 )
JAWS-UG アップデート (2012-09-14 JAWS-UG 第13回 勉強会 )JAWS-UG アップデート (2012-09-14 JAWS-UG 第13回 勉強会 )
JAWS-UG アップデート (2012-09-14 JAWS-UG 第13回 勉強会 )
 
"restaurant démonstration" (2012-09-01 クラウドごった煮 第6回 AWS枠)
"restaurant démonstration" (2012-09-01 クラウドごった煮 第6回 AWS枠)"restaurant démonstration" (2012-09-01 クラウドごった煮 第6回 AWS枠)
"restaurant démonstration" (2012-09-01 クラウドごった煮 第6回 AWS枠)
 
AWSアップデート (2012-08-27 JAWS-UG 札幌 第7回 勉強会)
AWSアップデート (2012-08-27 JAWS-UG 札幌 第7回 勉強会)AWSアップデート (2012-08-27 JAWS-UG 札幌 第7回 勉強会)
AWSアップデート (2012-08-27 JAWS-UG 札幌 第7回 勉強会)
 
AWS上にサービスを作る (2012-06-22 JAWS-UG 福岡)
AWS上にサービスを作る (2012-06-22 JAWS-UG 福岡)AWS上にサービスを作る (2012-06-22 JAWS-UG 福岡)
AWS上にサービスを作る (2012-06-22 JAWS-UG 福岡)
 
Talking about love for DynamoDB & SimpleDB (2012-06-05 CloudDB Night)
Talking about love for DynamoDB & SimpleDB (2012-06-05 CloudDB Night)Talking about love for DynamoDB & SimpleDB (2012-06-05 CloudDB Night)
Talking about love for DynamoDB & SimpleDB (2012-06-05 CloudDB Night)
 
CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会)
CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会)CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会)
CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会)
 
Aws禅 (2012-05-13 JAWS-UG 子ども会)
Aws禅 (2012-05-13 JAWS-UG 子ども会)Aws禅 (2012-05-13 JAWS-UG 子ども会)
Aws禅 (2012-05-13 JAWS-UG 子ども会)
 
Counter Table Pattern & Temporary Table Pattern (2012-04-13 CDP Night)
Counter Table Pattern & Temporary Table Pattern (2012-04-13 CDP Night)Counter Table Pattern & Temporary Table Pattern (2012-04-13 CDP Night)
Counter Table Pattern & Temporary Table Pattern (2012-04-13 CDP Night)
 
サンタクラウド番外編 (2011-12-22 第11回 AWS User Group - Japan 東京勉強会)
サンタクラウド番外編 (2011-12-22 第11回 AWS User Group - Japan 東京勉強会)サンタクラウド番外編 (2011-12-22 第11回 AWS User Group - Japan 東京勉強会)
サンタクラウド番外編 (2011-12-22 第11回 AWS User Group - Japan 東京勉強会)
 
S3解説 - 第1回 ビギナー編 AWS User Group - Japan 東京勉強会
S3解説 - 第1回 ビギナー編 AWS User Group - Japan 東京勉強会S3解説 - 第1回 ビギナー編 AWS User Group - Japan 東京勉強会
S3解説 - 第1回 ビギナー編 AWS User Group - Japan 東京勉強会
 
AWSを使いこなしてコスト削減
AWSを使いこなしてコスト削減AWSを使いこなしてコスト削減
AWSを使いこなしてコスト削減
 

マイニングブラウニーの場合 (2012-03-01 アマゾンデータサービスジャパン株式会社 新製品発表会)