Hash 冲突怎么办？

八股文_Redis面试题 0 278

在 Redis 中，哈希冲突是指多个键通过哈希函数映射到相同的槽位。Redis 使用开放地址法的变种——链地址法（Chaining Method）来处理哈希冲突。具体方法如下：

哈希冲突通常由于以下原因导致：
– 有限的槽位：哈希表的大小是固定的，当键的数量接近或超过槽位数量时，冲突的概率增加。
– 哈希函数的分布不均：如果哈希函数不能将键均匀分布到槽位，某些槽位可能聚集大量冲突。

Redis 使用链地址法解决哈希冲突：
– 每个哈希槽位存储一个链表的指针。
– 当冲突发生时，新的键值对会追加到链表末尾。
– Redis 在读取或写入时，通过遍历链表来查找目标键值对。

优点：
– 简单高效：实现链地址法的逻辑简单，能够快速处理冲突。
– 灵活性高：即使发生冲突，也可以动态扩展链表长度，不受哈希表初始大小的限制。

缺点：
– 性能退化：当链表长度变长时，查找性能会从 (O(1)) 退化到 (O(n))。
– 内存占用增加：链表的额外指针会消耗更多内存。

假设我们插入三个键 key1、key2 和 key3，它们经过哈希后映射到同一个槽位：

SET key1 "value1"
SET key2 "value2"
SET key3 "value3"

合理选择哈希表初始大小：
根据数据量估算哈希表大小，尽量减少装载因子接近 1 的情况。
避免大键：
单个键对应的数据量太大会导致冲突链过长，影响性能。
监控与调优：
使用 INFO 命令检查哈希表使用情况：
```
INFO memory
```
如果发现冲突严重，可以考虑扩展哈希表大小或优化操作逻辑。

Redis 使用链地址法结合渐进式重哈希来处理哈希冲突。通过高效的哈希函数、动态扩容等机制，Redis 在大部分场景下能够保证查询和写入性能。但在设计 Redis 数据结构时，应尽量避免过大的键值数据量，并合理规划哈希表初始大小，从而降低冲突概率并优化系统性能。