简述什么是片键？

Mongodb面试考题 0 34

片键（Shard Key） 是 MongoDB 分片机制中的核心概念，用于决定文档在分片（Shard）中的分布方式。分片键是一个字段或字段组合，它将集合中的数据划分为多个数据块（Chunk），然后将这些数据块分布到不同的分片上。

选择合适的分片键对于数据均衡和查询性能至关重要。

分片键的主要作用是控制文档的分布：
– MongoDB 根据分片键的值，将数据划分为数据块（Chunk）。
– 每个数据块映射到一个分片，分片之间存储不同的数据块。
– 分片键用于路由查询，当查询包含分片键时，MongoDB 可以直接定位到目标分片，避免全片查询。

语法：

sh.shardCollection("<database>.<collection>", { <shardKeyField>: 1 })

示例：
按 userId 字段进行分片：

sh.shardCollection("myDatabase.myCollection", { userId: 1 })

分片键必须满足以下条件：
1. 字段存在：分片键字段必须存在于所有文档中。
2. 字段不可更改：分片键字段在文档插入后不能更新。
3. 支持高效分布：选择的分片键应能使数据均匀分布到所有分片上，避免数据热点。

MongoDB 支持两种主要分片类型：

范围分片（Range Sharding）：
- 根据分片键的值范围划分数据块。
- 适合数据的连续分布，如时间戳、递增 ID。
- 优点：查询按范围查找时性能较高。
- 缺点：容易导致热点问题（如插入单调递增的时间戳数据）。
- 示例：
```
sh.shardCollection("logs", { timestamp: 1 })
```
哈希分片（Hash Sharding）：
- 使用分片键的哈希值来分配数据块。
- 适合分片键值分布不均的场景。
- 优点：能有效避免数据热点，确保数据均匀分布。
- 缺点：范围查询性能较低。
- 示例：
```
sh.shardCollection("users", { userId: "hashed" })
```

场景 1：按用户 ID 分片
场景：一个社交媒体平台存储用户数据。
片键：userId
类型：哈希分片
原因：用户 ID 的值分布较不均匀，使用哈希分片可以均匀分布数据。

场景 2：按时间分片
场景：日志系统按时间存储数据。
片键：timestamp
类型：范围分片
原因：需要基于时间查询数据，范围分片可以提高查询效率。

片键（Shard Key） 是 MongoDB 分片的核心组件，决定了数据在分片中的分布和查询的效率。选择合适的分片键需要综合考虑数据分布、查询模式和业务需求。范围分片适合范围查询场景，而哈希分片更适合避免数据热点。在实际应用中，合理选择和设计分片键是实现高效分布式存储的关键。