Suche senden
Hochladen
CROSS 2015 全文検索群雄割拠
•
16 gefällt mir
•
4,582 views
Katsushi Yamashita
Folgen
2015.1.29 CROSS 2015 @大さん橋ホール
Weniger lesen
Mehr lesen
Technologie
Melden
Teilen
Melden
Teilen
1 von 75
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Empfohlen
エンジョイ☆スクレイピング
エンジョイ☆スクレイピング
Kazufumi Ohkawa
MongoDBが遅いときの切り分け方法
MongoDBが遅いときの切り分け方法
Tetsutaro Watanabe
良いUrlを設計する
良いUrlを設計する
Kenta Yamamoto
Mongo dbを半年ちょっと運用してみた
Mongo dbを半年ちょっと運用してみた
htty_hasumi
後悔しないもんごもんごの使い方 〜アプリ編〜
後悔しないもんごもんごの使い方 〜アプリ編〜
Masakazu Matsushita
Mongo dbを知ろう
Mongo dbを知ろう
CROOZ, inc.
Cassandra v0.6-siryou
Cassandra v0.6-siryou
あしたのオープンソース研究所
がっつりMongoDB事例紹介
がっつりMongoDB事例紹介
Tetsutaro Watanabe
Empfohlen
エンジョイ☆スクレイピング
エンジョイ☆スクレイピング
Kazufumi Ohkawa
MongoDBが遅いときの切り分け方法
MongoDBが遅いときの切り分け方法
Tetsutaro Watanabe
良いUrlを設計する
良いUrlを設計する
Kenta Yamamoto
Mongo dbを半年ちょっと運用してみた
Mongo dbを半年ちょっと運用してみた
htty_hasumi
後悔しないもんごもんごの使い方 〜アプリ編〜
後悔しないもんごもんごの使い方 〜アプリ編〜
Masakazu Matsushita
Mongo dbを知ろう
Mongo dbを知ろう
CROOZ, inc.
Cassandra v0.6-siryou
Cassandra v0.6-siryou
あしたのオープンソース研究所
がっつりMongoDB事例紹介
がっつりMongoDB事例紹介
Tetsutaro Watanabe
textsearch groonga v0.1
textsearch groonga v0.1
Takahiro Itagaki
MongoDB very basic (Japanese) / MongoDB基礎の基礎
MongoDB very basic (Japanese) / MongoDB基礎の基礎
Naruhiko Ogasawara
ソーシャルゲームログ解析基盤のMongoDB活用事例
ソーシャルゲームログ解析基盤のMongoDB活用事例
知教 本間
[OSC2016沖縄]商用DBからPostgreSQLへの移行入門
[OSC2016沖縄]商用DBからPostgreSQLへの移行入門
Kosuke Kida
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
Db tech showcase2015 how to replicate between clusters
Db tech showcase2015 how to replicate between clusters
Hiroaki Kubota
DB tech showcase: 噂のMongoDBその用途は?
DB tech showcase: 噂のMongoDBその用途は?
Hiroaki Kubota
ソーシャルゲームにおけるMongoDB適用事例 - Animal Land
ソーシャルゲームにおけるMongoDB適用事例 - Animal Land
Masakazu Matsushita
日本語:Mongo dbに於けるシャーディングについて
日本語:Mongo dbに於けるシャーディングについて
ippei_suzuki
45分で理解する webクローリング入門 斉藤之雄
45分で理解する webクローリング入門 斉藤之雄
Yukio Saito
MongoDB
MongoDB
あしたのオープンソース研究所
すぐ始めれるクラウド
すぐ始めれるクラウド
Soudai Sone
NoSQLデータベースと位置情報
NoSQLデータベースと位置情報
Koji Ichiwaki
RDB経験者に送るMongoDBの勘所(db tech showcase tokyo 2013)
RDB経験者に送るMongoDBの勘所(db tech showcase tokyo 2013)
Ryuji Tamagawa
MongoDBざっくり解説
MongoDBざっくり解説
知教 本間
MongoDB〜その性質と利用場面〜
MongoDB〜その性質と利用場面〜
Naruhiko Ogasawara
類義語検索と類義語ハイライト
類義語検索と類義語ハイライト
Shinichiro Abe
Web エンジニアが postgre sql を選ぶ 3 つの理由
Web エンジニアが postgre sql を選ぶ 3 つの理由
Soudai Sone
ビッグデータとioDriveの夕べ:ドリコムのデータ分析環境のお話
ビッグデータとioDriveの夕べ:ドリコムのデータ分析環境のお話
Tokoroten Nakayama
Postgre sqlから見るnosql
Postgre sqlから見るnosql
Soudai Sone
Elasticsearchベースの全文検索システムFess
Elasticsearchベースの全文検索システムFess
Shinsuke Sugaya
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半
Katsushi Yamashita
Weitere ähnliche Inhalte
Was ist angesagt?
textsearch groonga v0.1
textsearch groonga v0.1
Takahiro Itagaki
MongoDB very basic (Japanese) / MongoDB基礎の基礎
MongoDB very basic (Japanese) / MongoDB基礎の基礎
Naruhiko Ogasawara
ソーシャルゲームログ解析基盤のMongoDB活用事例
ソーシャルゲームログ解析基盤のMongoDB活用事例
知教 本間
[OSC2016沖縄]商用DBからPostgreSQLへの移行入門
[OSC2016沖縄]商用DBからPostgreSQLへの移行入門
Kosuke Kida
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
Db tech showcase2015 how to replicate between clusters
Db tech showcase2015 how to replicate between clusters
Hiroaki Kubota
DB tech showcase: 噂のMongoDBその用途は?
DB tech showcase: 噂のMongoDBその用途は?
Hiroaki Kubota
ソーシャルゲームにおけるMongoDB適用事例 - Animal Land
ソーシャルゲームにおけるMongoDB適用事例 - Animal Land
Masakazu Matsushita
日本語:Mongo dbに於けるシャーディングについて
日本語:Mongo dbに於けるシャーディングについて
ippei_suzuki
45分で理解する webクローリング入門 斉藤之雄
45分で理解する webクローリング入門 斉藤之雄
Yukio Saito
MongoDB
MongoDB
あしたのオープンソース研究所
すぐ始めれるクラウド
すぐ始めれるクラウド
Soudai Sone
NoSQLデータベースと位置情報
NoSQLデータベースと位置情報
Koji Ichiwaki
RDB経験者に送るMongoDBの勘所(db tech showcase tokyo 2013)
RDB経験者に送るMongoDBの勘所(db tech showcase tokyo 2013)
Ryuji Tamagawa
MongoDBざっくり解説
MongoDBざっくり解説
知教 本間
MongoDB〜その性質と利用場面〜
MongoDB〜その性質と利用場面〜
Naruhiko Ogasawara
類義語検索と類義語ハイライト
類義語検索と類義語ハイライト
Shinichiro Abe
Web エンジニアが postgre sql を選ぶ 3 つの理由
Web エンジニアが postgre sql を選ぶ 3 つの理由
Soudai Sone
ビッグデータとioDriveの夕べ:ドリコムのデータ分析環境のお話
ビッグデータとioDriveの夕べ:ドリコムのデータ分析環境のお話
Tokoroten Nakayama
Postgre sqlから見るnosql
Postgre sqlから見るnosql
Soudai Sone
Was ist angesagt?
(20)
textsearch groonga v0.1
textsearch groonga v0.1
MongoDB very basic (Japanese) / MongoDB基礎の基礎
MongoDB very basic (Japanese) / MongoDB基礎の基礎
ソーシャルゲームログ解析基盤のMongoDB活用事例
ソーシャルゲームログ解析基盤のMongoDB活用事例
[OSC2016沖縄]商用DBからPostgreSQLへの移行入門
[OSC2016沖縄]商用DBからPostgreSQLへの移行入門
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Db tech showcase2015 how to replicate between clusters
Db tech showcase2015 how to replicate between clusters
DB tech showcase: 噂のMongoDBその用途は?
DB tech showcase: 噂のMongoDBその用途は?
ソーシャルゲームにおけるMongoDB適用事例 - Animal Land
ソーシャルゲームにおけるMongoDB適用事例 - Animal Land
日本語:Mongo dbに於けるシャーディングについて
日本語:Mongo dbに於けるシャーディングについて
45分で理解する webクローリング入門 斉藤之雄
45分で理解する webクローリング入門 斉藤之雄
MongoDB
MongoDB
すぐ始めれるクラウド
すぐ始めれるクラウド
NoSQLデータベースと位置情報
NoSQLデータベースと位置情報
RDB経験者に送るMongoDBの勘所(db tech showcase tokyo 2013)
RDB経験者に送るMongoDBの勘所(db tech showcase tokyo 2013)
MongoDBざっくり解説
MongoDBざっくり解説
MongoDB〜その性質と利用場面〜
MongoDB〜その性質と利用場面〜
類義語検索と類義語ハイライト
類義語検索と類義語ハイライト
Web エンジニアが postgre sql を選ぶ 3 つの理由
Web エンジニアが postgre sql を選ぶ 3 つの理由
ビッグデータとioDriveの夕べ:ドリコムのデータ分析環境のお話
ビッグデータとioDriveの夕べ:ドリコムのデータ分析環境のお話
Postgre sqlから見るnosql
Postgre sqlから見るnosql
Andere mochten auch
Elasticsearchベースの全文検索システムFess
Elasticsearchベースの全文検索システムFess
Shinsuke Sugaya
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半
Katsushi Yamashita
はじパタ 10章 クラスタリング 前半
はじパタ 10章 クラスタリング 前半
Katsushi Yamashita
第1回「データ解析のための統計モデリング入門」読書会 オープニング
第1回「データ解析のための統計モデリング入門」読書会 オープニング
Katsushi Yamashita
Introduction of stan
Introduction of stan
Teito Nakagawa
「データ解析のための統計モデリング入門」読書会 最終回 クロージング
「データ解析のための統計モデリング入門」読書会 最終回 クロージング
Katsushi Yamashita
BUGSを使うメリット
BUGSを使うメリット
. .
Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習
Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習
Katsushi Yamashita
PIXTAの紹介
PIXTAの紹介
PIXTA Inc.
elasticsearch-hadoopをつかってごにょごにょしてみる
elasticsearch-hadoopをつかってごにょごにょしてみる
Katsushi Yamashita
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive
Amazon Web Services Japan
Elasticsearchを使うときの注意点 公開用スライド
Elasticsearchを使うときの注意点 公開用スライド
崇介 藤井
Elasticsearch+nodejs+dynamodbで作る全社システム基盤
Elasticsearch+nodejs+dynamodbで作る全社システム基盤
Recruit Technologies
Stan超初心者入門
Stan超初心者入門
Hiroshi Shimizu
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
Hiroshi Shimizu
PIXTAにおけるCloudSearchのコスト削減
PIXTAにおけるCloudSearchのコスト削減
PIXTA Inc.
Andere mochten auch
(16)
Elasticsearchベースの全文検索システムFess
Elasticsearchベースの全文検索システムFess
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半
はじパタ 10章 クラスタリング 前半
はじパタ 10章 クラスタリング 前半
第1回「データ解析のための統計モデリング入門」読書会 オープニング
第1回「データ解析のための統計モデリング入門」読書会 オープニング
Introduction of stan
Introduction of stan
「データ解析のための統計モデリング入門」読書会 最終回 クロージング
「データ解析のための統計モデリング入門」読書会 最終回 クロージング
BUGSを使うメリット
BUGSを使うメリット
Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習
Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習
PIXTAの紹介
PIXTAの紹介
elasticsearch-hadoopをつかってごにょごにょしてみる
elasticsearch-hadoopをつかってごにょごにょしてみる
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive
Elasticsearchを使うときの注意点 公開用スライド
Elasticsearchを使うときの注意点 公開用スライド
Elasticsearch+nodejs+dynamodbで作る全社システム基盤
Elasticsearch+nodejs+dynamodbで作る全社システム基盤
Stan超初心者入門
Stan超初心者入門
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
PIXTAにおけるCloudSearchのコスト削減
PIXTAにおけるCloudSearchのコスト削減
Ähnlich wie CROSS 2015 全文検索群雄割拠
全文検索In着うた配信サービス
全文検索In着うた配信サービス
techtalkdwango
おとなのテキストマイニング
おとなのテキストマイニング
Munenori Sugimura
AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...
AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...
Amazon Web Services Japan
Search on AWS - IVS CTO Night and Day 2016 Spring
Search on AWS - IVS CTO Night and Day 2016 Spring
Eiji Shinohara
いろいろ考えると日本語の全文検索もMySQLがいいね!
いろいろ考えると日本語の全文検索もMySQLがいいね!
Kouhei Sutou
捗るリコメンドシステムの裏事情(ハッカドール)
捗るリコメンドシステムの裏事情(ハッカドール)
mosa siru
[data analytics showcase] B14: 文字情報の分析基盤 Mroonga by 株式会社インサイトテクノロジー 小幡 一郎
[data analytics showcase] B14: 文字情報の分析基盤 Mroonga by 株式会社インサイトテクノロジー 小幡 一郎
Insight Technology, Inc.
全文検索入門
全文検索入門
antibayesian 俺がS式だ
第一回Web技術勉強会 efkスタック編
第一回Web技術勉強会 efkスタック編
tzm_freedom
self made Fulltext search first_step
self made Fulltext search first_step
Ryou Katou
情報検索の基礎
情報検索の基礎
Retrieva inc.
Azure Search 言語処理関連機能 〜 アナライザー、検索クエリー、辞書、& ランキング, etc
Azure Search 言語処理関連機能 〜 アナライザー、検索クエリー、辞書、& ランキング, etc
Yoichi Kawasaki
20121123 groonga nanapi
20121123 groonga nanapi
Shuichi Wada
Code4Lib 2013参加報告
Code4Lib 2013参加報告
Masao Takaku
AWS Black Belt Techシリーズ Amazon CloudSearch
AWS Black Belt Techシリーズ Amazon CloudSearch
Amazon Web Services Japan
オープンソースソフトウェア検索サーバ Solr入門
オープンソースソフトウェア検索サーバ Solr入門
Open Source Software Association of Japan
オープンソースソフトウェア検索サーバ Solr入門
オープンソースソフトウェア検索サーバ Solr入門
Jun Ohtani
セマンテックウェブとRDFDB
セマンテックウェブとRDFDB
Hirosuke Asano
みんな大好き“全文検索 on AWS”を試してみました!
みんな大好き“全文検索 on AWS”を試してみました!
宗 大栗
Pythonの非同期処理を始める前に
Pythonの非同期処理を始める前に
koralle
Ähnlich wie CROSS 2015 全文検索群雄割拠
(20)
全文検索In着うた配信サービス
全文検索In着うた配信サービス
おとなのテキストマイニング
おとなのテキストマイニング
AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...
AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...
Search on AWS - IVS CTO Night and Day 2016 Spring
Search on AWS - IVS CTO Night and Day 2016 Spring
いろいろ考えると日本語の全文検索もMySQLがいいね!
いろいろ考えると日本語の全文検索もMySQLがいいね!
捗るリコメンドシステムの裏事情(ハッカドール)
捗るリコメンドシステムの裏事情(ハッカドール)
[data analytics showcase] B14: 文字情報の分析基盤 Mroonga by 株式会社インサイトテクノロジー 小幡 一郎
[data analytics showcase] B14: 文字情報の分析基盤 Mroonga by 株式会社インサイトテクノロジー 小幡 一郎
全文検索入門
全文検索入門
第一回Web技術勉強会 efkスタック編
第一回Web技術勉強会 efkスタック編
self made Fulltext search first_step
self made Fulltext search first_step
情報検索の基礎
情報検索の基礎
Azure Search 言語処理関連機能 〜 アナライザー、検索クエリー、辞書、& ランキング, etc
Azure Search 言語処理関連機能 〜 アナライザー、検索クエリー、辞書、& ランキング, etc
20121123 groonga nanapi
20121123 groonga nanapi
Code4Lib 2013参加報告
Code4Lib 2013参加報告
AWS Black Belt Techシリーズ Amazon CloudSearch
AWS Black Belt Techシリーズ Amazon CloudSearch
オープンソースソフトウェア検索サーバ Solr入門
オープンソースソフトウェア検索サーバ Solr入門
オープンソースソフトウェア検索サーバ Solr入門
オープンソースソフトウェア検索サーバ Solr入門
セマンテックウェブとRDFDB
セマンテックウェブとRDFDB
みんな大好き“全文検索 on AWS”を試してみました!
みんな大好き“全文検索 on AWS”を試してみました!
Pythonの非同期処理を始める前に
Pythonの非同期処理を始める前に
Kürzlich hochgeladen
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
iPride Co., Ltd.
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツール
sugiuralab
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価
sugiuralab
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
Shota Ito
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
iPride Co., Ltd.
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
Atomu Hidaka
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
osamut
Kürzlich hochgeladen
(7)
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
CROSS 2015 全文検索群雄割拠
1.
全文検索エンジン 群雄割拠 〜あなたが使うべきはどれだ!〜 CROSS 2015 2015.1.29
2.
Agenda 1.セッション概要 2.スピーカ紹介 3.全文検索を駆け足でおさらい 4.各全文検索エンジンの紹介と 質疑&議論 5.全体質疑(時間があれば)
3.
Agenda 1.セッション概要← 2.スピーカ紹介 3.全文検索を駆け足でおさらい 4.各全文検索エンジンの紹介と 質疑&議論 5.全体質疑(時間があれば)
4.
本セッションの狙い
5.
例えば5, 6年前…
6.
「全文検索を使い隊!」
7.
Apache Solr or Senna
8.
現在
9.
Apache Solr or Groonga(senna) or Elasticsearch or CloudSearch or …
10.
( ³ω³)ファッ!?
11.
どれ使えばいいの? どこがどう違うの?
12.
はっきりさせようぜ!!
13.
そういう訳で、 各全文検索エンジンの 中の人や、ヘビーユーザに 集まってもらいました
14.
• Elasticsearch • Elasticsearch
大谷さん • Apache Solr • クックパッド 兼山さん • Amazon CloudSearch • ChatWork 藤原さん • Groonga(Mroonga,Rroonga,Nroonga) • クリアコード 須藤さん
15.
それぞれの特徴を 語ってもらいます
16.
これでスッキリ! …するかも
17.
本セッションは 質疑、議論重視 (ガチ)
18.
バシバシ質問 おなしゃす (ガチ)
19.
尚、本セッションの スライドは近日中に すべてどこかに上がります ハッシュタグで告知します
20.
Agenda 1.セッション概要 2.スピーカ紹介← 3.全文検索を駆け足でおさらい 4.各全文検索エンジンの紹介と 質疑&議論 5.全体質疑(時間があれば)
21.
Copyright Elasticsearch 2014.Copying,publishing
and/or distributing without written permission is strictly prohibited Jun Ohtani • Me, Jun Ohtani / Technical Adovocate lucene-gosenコ ミ ッ タ ー ElasticSearch Server日本語版の翻訳 elasticsearch-extended-analysisの開発 http://blog.johtani.info 好き な飲み物: プレ ミ アムモルツ • Elasticsearch, founded in 2012 Products: Elasticsearch, Logstash, Kibana, Marvel, Shield Professional services: Support & development subscriptions
22.
cookpad 兼山元太 日々の仕事: ・ 検索の満足度を上げる ・
検索のバッ ク エンド の開発 ・ 辞書の作成/管理 ・ レシピのメ タ データ の作成/管理 ・ 他チームの検索関連のお手伝い 夢は世界中で使われる道具を作るこ と
23.
24.
25.
やまかつ (@yamakatu) • 本名は秘密(うそ •
ヤフー株式会社 ヤフオクカンパニー • 検索、統計、機械学習しつつ、メイン は育児 • ぶっちゃけ、Groonga族とCloudSearch はまともに使ったことない(キリ
26.
Agenda 1.セッション概要 2.スピーカ紹介 3.全文検索を駆け足でおさらい ← 4.各全文検索エンジンの紹介と 質疑&議論 5.全体質疑(時間があれば)
27.
この後がマニアックなので その前に駆け足でおさらい
28.
全文検索エンジン is 何?
29.
1.全文検索機能 2.周辺機能
30.
1.全文検索機能← 2.周辺機能
31.
全文検索機能の おさらい
32.
入力:キーワード 出力:そのキーワード を含むドキュメント
33.
How?
34.
転置インデックス Inverted index と形態素解析とN-Gram
35.
Why 転置インデックス?
36.
RDBの 一般的インデックス アルゴリズム B+Tree
37.
RDBの 一般的インデックス アルゴリズム B+Tree じゃムリ
38.
RDBでインデックスを 貼らずに Select (略) where
id = 4 1 4 9 10 11 12 13 15 16 20 25 full scan(ex. 11 times) ぜんぶで11件
39.
B+Tree (ex. 4 times) B+Treeでインデクシング Select
(略) where id = 4
40.
4 times <
11 times データ量が増加すると、 差は指数的に増加
41.
B+Tree〜 速い〜 最高〜
42.
しかし、B+Treeで 全文検索はむりぽ
43.
Why?
44.
「くろす」で 全文検索したい場合 Select 略 where
text like “%くろす%”
45.
「くろす」で 全文検索したい場合 Select 略 where
text like “%くろす%” つまり部分一致
46.
B+Treeでテキストの部分一 致を実現しようとしても… 各文字列の中にキーワードが含まれている かどうかはfull scanしてみないとわからな い
47.
そこで 転置インデックス
48.
転置インデックス(簡略) 文書番号 文書 1 今年のCROSSは横浜 2
横浜行くの久しぶり 3 とりあえずモルツ もと文書
49.
転置インデックス(簡略) 文書番号 文書 1 今年のCROSSは横浜 2
横浜行くの久しぶり 3 とりあえずモルツ 単語 出現文書 横浜 1, 2 の 1, 2 CROSS 1 … … もと文書 転置 インデックス
50.
転置インデックス(簡略) 文書番号 文書 1 今年のCROSSは横浜 2
横浜行くの久しぶり 3 とりあえずモルツ 単語 出現文書 横浜 1, 2 の 1, 2 CROSS 1 … … もと文書 転置 インデックス 「CROSS」で検索
51.
転置インデックス(簡略) 文書番号 文書 1 今年のCROSSは横浜 2
横浜行くの久しぶり 3 とりあえずモルツ 単語 出現文書 横浜 1, 2 の 1, 2 CROSS 1 … … もと文書 転置 インデックス 「CROSS」で検索
52.
転置インデックス(簡略) 文書番号 文書 1 今年のCROSSは横浜 2
横浜行くの久しぶり 3 とりあえずモルツ 単語 出現文書 横浜 1, 2 の 1, 2 CROSS 1 … … もと文書 転置 インデックス 「CROSS」で検索 出現文書:1
53.
転置インデックスを用いて 全文検索を実現
54.
補足 1. 最近はRDBでも転置インデック スが実装されてます MySQL(innoDB, MyISAM): FullTextSearch PostgreSQL: GIST
Index, GIN Index Oracle:Oracle Text
55.
補足 2. B+treeでも 前方一致検であれば有効 select 略
where text like “くろす%”
56.
1.全文検索 2.周辺機能←
57.
周辺機能のおさらい • ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション
58.
周辺機能のおさらい • ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション
59.
周辺機能のおさらい • ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション
60.
周辺機能のおさらい • ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション
61.
周辺機能のおさらい • ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション
62.
周辺機能のおさらい • ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション
63.
周辺機能のおさらい • ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション
64.
周辺機能のおさらい • ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション
65.
• ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション 周辺機能のおさらい ノード1 シャード1台
66.
• ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション 周辺機能のおさらい ノード1 シャード1台 ノード2 シャード2 2台 ノード1 シャード1 検索クエリへの応答速度向上 インデクシングの高速化
67.
周辺機能のおさらい • ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション ノード1 シャード1台
68.
周辺機能のおさらい • ハイライト • スニペット •
ソート • ページング • サジェスト • もしかして • 絞込(カテゴリ) • シャーディング • レプリケーション ノード1 シャード1台 ノード2 (slave) 2台 ノード1 (master) 検索負荷の分散 シャードシャード
69.
1.全文検索 2.周辺機能
70.
Agenda 1.セッション概要 2.スピーカ紹介 3.全文検索を駆け足でおさらい 4.各全文検索エンジンの紹介と 質疑&議論← 5.全体質疑(時間があれば)
71.
• Elasticsearch • Elasticsearch
大谷さん • Apache Solr • クックパッド 兼山さん • Amazon CloudSearch • ChatWork 藤原さん • Groonga(Mroonga,Rroonga,Nroonga) • クリアコード 須藤さん
72.
大事なことなので 2回言います
73.
本セッションは 質疑、議論重視 (ガチ)
74.
バシバシ質問 おなしゃす (ガチ)
75.
Twitterでもハッシュタグ (#cross2015_c)付きで つぶやいていただければ 質問拾います (会場からの質問を優先しますので 時間切れしたら、ごめんなさい)
Jetzt herunterladen