llama : fix KV cache quantization for hybrid Mamba/attention models#1548

Closed

jnovy wants to merge 1 commit intoikawrakow:mainfrom

jnovy:fix-hybrid-kv-cache-quantization

Commits on Mar 29, 2026

llama : fix KV cache quantization for hybrid Mamba/attention models
jnovy
committed