Deep Dive into Apache Kafka

Deep Dive into Apache
Kafka
Jun Rao
co-founder of Confluent

Agenda
• High throughput
• Reliability and durability
• Compacted topic

Scaled-out Architecture
5
Kafka cluster
broker 1
…
producer producer producer
consumer consumer
broker 2 broker n topic partition

Detailed Log Representation
7
offset 0 - 10000
timestamp
index
offset
index
offset 10001 - 20000 offset 20001 - 30000
offset
index
offset
index
timestamp
index
timestamp
index

Message Format
offset
message
length CRC timestamp
key
length
key
content
value
length
value
content
8 bytes 4 bytes 4 bytes
magic byte
1 byte
attribute
1 byte
8 bytes 4 bytes varies 4 bytes varies

Batching and Compression
compressed
batch 1send()
send()
send()
send()
producer
async
flush
poll()compressed
batch 2
compressed
batch 3
compressed
batch 1
compressed
batch 2
compressed
batch 3
consumerbroker

Kafka Replication
• Configurable replication factor
• Tolerating f – 1 failures with f replicas
• Unlike quorum based replication
• Automated failover

Replicas and Layout
• Topic partition has replicas
• Replicas spread evenly among brokers
topic1-part1
logs
broker 1
topic1-part2
logs
broker 2
topic2-part2
topic2-part1
logs
broker 3
topic1-part1
logs
broker 4
topic1-part2
topic2-part2 topic1-part1 topic1-part2
topic2-part1
topic2-part2
topic2-part1

High Level Data Flow in Replication
broker 1
producer
leader
broker 2
follower
broker 3
follower
4
2
2
3
commit
ack
When producer receives ack Latency Durability on failures
acks=0 (no ack) no network delay some data loss
acks=1 (wait for leader) 1 network roundtrip a few data loss
acks=all (wait for committed) 2 network roundtrips no data loss
consumer
1

Extend to Multiple Partitions
Leaders are evenly spread among brokers
broker 1 broker 2
topic3-part1
follower
broker 3
topic3-part1
follower
topic1-part1
producer
leader
topic1-part1
follower
topic1-part1
follower
broker 4
topic3-part1
leader
producer
topic2-part1
producer
leader
topic2-part1
follower
topic2-part1
follower

In-sync Replicas (ISR)
broker 1
producer
leader
broker 2
follower
broker 3
follower
2
2
1
m1 m1 m1
m2 m2 m2
ISR
last
committed
m2, m1
In-sync : replica reads from leader’s log
end within replica.lag.time.max.ms

Follower Failure
broker 1
producer
leader
broker 2
follower
broker 3
follower
2
2
1
m1 m1 m1
m2 m2 m2
ISR
last
committed

Shrinking ISR
broker 1
producer
leader
broker 2
follower
broker 3
2
1
m1 m1 m1
m2 m2 m2
ISR
m3 m3
m4 m4last
committed
m4, m3
follower

Failed Replica Coming Back
broker 1
producer
leader
broker 2
follower
broker 3
2
1
m1 m1 m1
m2 m2 m2
ISR
m3 m3
m4 m4last
committed
m3
2
follower

Leader Failure
broker 1
producer
leader
broker 2
follower
broker 3
2
1
m1 m1 m1
m2 m2 m2
ISR
m3 m3
m4 m4last
committed
m3
2
follower

Selecting New Leader from ISR
broker 1
producer
leader
broker 2
leader
broker 3
2
1
m1 m1 m1
m2 m2 m2
ISR
m3 m3
m4 m4last
committed
m3
follower

Expanding ISR
broker 1
producer
leader
broker 2
leader
broker 3
2
1
m1 m1 m1
m2 m2 m2
ISR
m3 m3
m4 m4
last
committed
m3
follower
m4
m5 m5
m5

m5
Unclean Leader Election
broker 1
producer
leader ???
broker 2
leader
broker 3
2
1
m1 m1 m1
m2 m2 m2
ISR
m3 m3
m4 m4last
committed
m3
follower
m4
m5

m5
Guaranteed Replicas
broker 1
producer
broker 2
leader
broker 3
1
m1 m1 m1
m2 m2 m2
m3 m3
m4 m4
last
committed
m3
m4
m5
ISR > min.insync.replicas ?
m6

Mission Critical Data
• Disable Unclean Leader Election
• unclean.leader.election.enable = false
• Set replication factor
• default.replication.factor = 3
• Set minimum ISRs
• min.insync.replicas = 2
• Set producer acks
• acks = all
24

Failure Detection and Controller Flow
broker 1 broker 2
topic3-part1
follower
broker 3
topic3-part1
follower
topic1-part1
controller
leader
topic1-part1
follower
topic1-part1
follower
broker 4
topic3-part1
leader
topic2-part1
leader
topic2-part1
follower
topic2-part1
follower
new leaders and ISRs

Use Case
product
catalog search
index
item1  “new description”

Adding a New Index Instance
product
catalog search
index
new
search
index

Using a Compacted Topic
product
catalog search
index
new
search
index
set consumer offset to 0

Log Cleaner Implementation
offset 3001 - 4000
firstDirty
1. build map
2. scan and probe map
firstDirty
offset 2001 - 3000offset 1001 - 2000 offset 4001 - 5000 offset 5001 - 6000
offset 3001 - 5000offset 1001 - 3000 offset 5001 - 6000
key1 3500
key2 3700
key3 4200key1 1500
key last offset
reject
key4 2100 keep
key3 4200 keep

Cleaning Configs
• log.cleaner.min.cleanable.ratio (default 0.5)
• dirty/total ratio when log cleaner is triggered
• log.cleaner.io.max.bytes.per.second (default infinite)
• Max rate cleaning can be done
• Can be used for throttling

Be Careful with Deletes
• Delete tombstone modeled as null message
• Danger of removing a deleted key too soon
• Consumer still assumes the old value with the key
• log.cleaner.delete.retention.ms (default 1 day)
• “Delete tombstone” removed after that time
• Consumer needs to finish consuming the tombstone before that
time

Summary
• Apache Kafka is a streaming platform
• The storage part supports
• High throughput
• High availability and durability
• Retaining database-like data

Coming Up Next
Date Title Speaker
10/27 Data Integration with Kafka Gwen Shapira
11/17 Demystifying Stream Processing Neha Narkhede
12/1 A Practical Guide To Selecting A Stream
Processing Technology
Michael Noll
12/15 Streaming in Practice: Putting Apache
Kafka in Production
Roger Hoover

Deep Dive into Apache Kafka

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Ähnlich wie Deep Dive into Apache Kafka

Ähnlich wie Deep Dive into Apache Kafka (20)

Mehr von confluent

Mehr von confluent (20)

Kürzlich hochgeladen

Kürzlich hochgeladen (20)

Deep Dive into Apache Kafka

Hinweis der Redaktion