Kafka Share Consumer 上線筆記：把工作佇列語意放進 Kafka

Kafka 的經典 consumer group 很適合「分割明確、每個 partition 單線處理」的場景。批次工作系統常常不是這種形狀：你要的是更多 worker 同時拉工作、單筆確認、失敗可重送。

這就是 Share Consumer 想解的問題。

KIP-932 的核心改動是把「工作分配單位」從 partition 進一步下沉到 record。消費者可以協作拉同一批 topic 資料，並對單筆訊息做 acknowledge / release / reject。KIP-932

併發上限不再被 partition 數量卡死

傳統 consumer group 的併發上限通常貼著 partition 數量。 Share group 允許同一個 topic-partition 被多個消費者協作處理，worker 數量可以超過 partition 數量。KIP-932

這個特性對三種工作很有感：

第一個是 acquisition lock。 record 被某個 consumer 拿到後會先上鎖，預設 lock duration 在 KIP-932 描述為 30 秒，可透過 group.share.record.lock.duration.ms 調整。KIP-932

第二個是 每筆 ack / release / reject。你可以成功確認、釋放給下一個 worker、或標記不可處理。這三個動作決定重試路徑是否可控。KIP-932

第三個是 partition lock 上限。 broker 用 group.share.partition.max.record.locks 控制每個 partition 可同時被鎖住的 record 數量。這是你的背壓閥門，太小會塞車，太大會放大超時與重試風暴。KIP-932

我會先做這個 baseline：

這樣可以先把兩件事穩住：

至少做四個情境：

觀察指標我會盯這幾個：

如果你看到 release 快速上升、同時處理延遲拉長，通常是 lock duration 與實際任務時間錯配。

最後提醒一點：Share Consumer 的設計已在 KIP-932 定義清楚，但你實際可用功能仍要對齊你部署的 Kafka 版本與文件；group.protocol 等設定也要看對應版本支援狀態再開。KIP-932、Kafka consumer config