8. Azure HDInsight のカスタマー モメンタム
16K+
Largest Cluster
10K+
Clusters / Day
500K+
Concurrent Cores
2X+
Growth in
Consumption
1,500
Concurrent Clusters (by
largest customer)
1B+
Batch Jobs per month
16. インタラクティブクエリの技術選択
Capability Hive LLAP Spark SQL Presto
Interactive Query Speed High High Medium
Scale High High Low
Caching Yes Yes Early Support
Result Caching Yes No No
Intelligent Cache Eviction Yes No No
Materialized Views Yes No No
Complex Fact to Fact Joins Yes Yes No
Transactions Yes No No
Query Concurrency High Low Low
Row , Column level security Yes [Apache Ranger+ AAD] Medium Medium
Rich end user Tools Yes Yes Yes
Language Support SQL, UDF SQL, Scala, Python SQL
Data Source Connector
Support
Storage Handlers Data Sources High number of
connectors
20. 負荷ベースのオートスケールの動作
• 次のメトリクスを毎分チェック:
• Total Pending CPU
• Total Pending Memory
• Total Free CPU
• Total Free Memory
• Used Memory per Node
• Number of Application Masters per Node
• スケールアウト:
• Total pending CPU が Total Free CPU よりも 3 分間以上高い状態の場合
• Total pending memory が Total Free Memory よりも 3 分間以上高い状態の場合
• スケールイン:
• Total Pending CPU が Total Free CPU よりも 10 分間以上低い状態の場合
• Total Pending Memory が Total Free Memory よりも 10 分間以上低い状態の場合