Общие сведения о clickhouse и возможностях его применения для аналитики на примере нашего опыта.
More useful info on our:
- website: https://clickky.biz
- blog: https://clickky.biz/blog
Sign up!
11. Можно построить свой Data Warehouse и копать данные с невероятной скоростью
Что делать:
Берем Hadoop или другую “не такую быструю” базу
Копируем все данные в ClickHouse
Что получаем:
Realtime аналитика бизнес-процессов
Довольные аналитики и менеджеры
Легко построить внутренние дашбордыметрики
Кейс: внутренняя база для аналитики
Clickhouse 10
13. ClickHouse: best practices
Clickhouse
Широкие таблицы, много колонок
QPS относительно небольшой, но много
данных используется в каждом запросе
Большой поток входящих данных
Аналитика по петабайтам данных
12
14. Clickhouse
Когда НЕ надо использовать
OLTP
Key-value
Document-oriented
Модифицирование данных
12
17. Статистика по referer:
SELECT splitByChar('?',referer)[1] as referrer, count() as count
FROM stat.table
WHERE toMonth(ds) = toMonth(yesterday())
AND toYear(ds) = toYear(yesterday())
GROUP BY referrer WITH TOTALS ORDER BY count DESC
FORMAT CSVWithNames;
Clickhouse
Примеры из “реальности”
16
18. Лиды из одной подсети:
SELECT
toDateTime(dc) as date_time, app_id,
IPv4NumToStringClassC (IPv4StringToNum (tr_ips)) as ip,
concat(concat(toString(app_id),','), IPv4NumToStringClassC (IPv4StringToNu
m(tr_ips))) as uid,
FROM stat.leads
WHERE
concat(concat(toString(app_id),','), IPv4NumToStringClassC (IPv4StringToNum (tr
_ips)))
IN (...)
Clickhouse
Примеры из “реальности”
17
19. ● Очень быстро!
● Очень хорошая компрессия данных
● Привычный SQL с кучей доп. возможностей
● Нет транзакций, нет UPDATE / DELETE
● Нет UNIQUE KEY, нет авто-приведения типов
Clickhouse
Подведем итоги:
17
20. ★ Tutorial - https://clickhouse.yandex/tutorial.html
★ Вопросы - clickhouse-feedback@yandex-team.com
★ GitHub - https://github.com/yandex/ClickHouse
★ Документация - https://clickhouse.yandex/
Clickhouse
С чего начать?
17