插件窝 干货文章 关于 UUID 您需要了解的一切

关于 UUID 您需要了解的一切

strong li 变体 版本 877    来源:    2024-10-20

通用唯一标识符 (uuid) 是计算机系统中用于唯一标识信息的 128 位标签。 uuid 被设计为在空间和时间上都是唯一的,允许它们在没有中央权威的情况下独立生成,从而最大限度地减少重复的风险。

uuid 有多种用途,包括:

  • 识别数据库中的记录。
  • 标记分布式系统中的对象。
  • 在唯一性至关重要的应用程序中充当主键。

现实世界的用例

  • 数据库:关系数据库中使用uuid作为主键,保证记录的唯一标识。
  • 微服务:通过为请求和资源提供唯一标识符来促进服务通信。
  • 物联网设备:唯一识别网络中的设备,确保可以聚合多个来源的数据而不会发生冲突。

使用uuid的优点和缺点

优点:

  • 全局唯一性:uuid 极不可能发生冲突,这使得它们适合多个节点独立生成标识符的分布式系统。
  • 不需要中央权威:它们可以在没有协调的情况下生成,这简化了分布式环境中的操作。
  • 可扩展性:它们在需要跨多个服务器或服务进行扩展的系统中运行良好。

缺点:

  • 存储大小:与传统整数 id(通常为 32 位)相比,uuid 消耗更多空间(128 位),这可能会导致存储成本增加。
  • 性能问题:由于 uuid 的随机性和大小,索引 uuid 会降低数据库性能,导致查询时间比顺序 id 慢。
  • 用户不友好:uuid 在用户界面中呈现时不容易记住或用户友好。

标准

uuid 的标准表示由 32 个十六进制字符组成,分为五组,用连字符分隔,遵循格式 8-4-4-4-12,总共 36 个字符(32 个字母数字加 4 个连字符) .

uuid 格式可以可视化如下:

xxxxxxxx-xxxx-mxxx-nxxx-xxxxxxxxxxxx

地点:

  • m表示uuid版本。
  • n 表示变体,这有助于解释 uuid 的布局。

uuid 的组成部分

  1. timelow:4 个字节(8 个十六进制字符),表示时间戳的低字段。
  2. timemid:2 个字节(4 个十六进制字符),表示时间戳的中间字段。
  3. timehighandversion:2 个字节(4 个十六进制字符),包含版本号和时间戳的高位字段。
  4. clocksequence:2 个字节(4 个十六进制字符),用于帮助避免冲突,特别是在快速连续生成多个 uuid 或调整系统时钟时。
  5. 节点:6个字节(12个十六进制字符),通常表示生成节点的mac地址。

uuid 的类型

  1. 版本 1:基于时间的 uuid,使用当前时间戳和生成节点的 mac 地址的组合。此版本确保跨空间和时间的唯一性。

  2. 版本 2:与版本 1 类似,但包含本地​​域标识符;然而,由于其局限性,它不太常用。

  3. 版本 3:使用命名空间标识符和名称的 md5 哈希生成的基于名称的 uuid。

  4. 版本 4:随机生成的 uuid,提供高度随机性和唯一性,仅保留少量位用于版本控制。

  5. 版本 5:与版本 3 类似,但使用 sha-1 进行哈希处理,使其比版本 3 更安全。

变体

uuid 中的变体字段决定其布局和解释。最常见的变体包括:

  • 变体 0:保留用于 ncs 向后兼容性。
  • 变体 1:大多数 uuid 使用的标准布局。
  • 变体 2:用于 dce 安全 uuid,不太常见。
  • 变体 3:保留供将来定义。

例子

对于 版本 4,uuid 可能如下所示:

550e8400-e29b-41d4-a716-446655440000

这里:

  • 41d4 表示这是版本 4。
  • a7 代表变体,在本例中为常见的“leach-salz”变体。

uuid 是如何计算的

  1. 版本 1(基于时间)

    • 时间戳通常是自 1582 年 10 月 15 日(公历改革日期)以来 100 纳秒间隔的数量。
    • 节点是生成uuid的机器的mac地址。
    • 时钟序列有助于确保时钟时间发生变化时的唯一性(例如,由于系统重新启动)。
  2. 版本 3 和版本 5(基于名称):

    • 命名空间(如 dns 域)与名称(如文件路径或 url)组合并进行哈希处理。
    • 然后将哈希值(版本 3 的 md5,版本 5 的 sha-1)构造为 uuid 格式,确保正确设置版本和变体字段。
  3. 版本 4(基于随机)

    • 为 uuid 的 122 位生成随机数或伪随机数。
    • 版本和变体字段进行相应设置,确保符合 uuid 标准。

uuidv4 计算示例

第 1 步:生成 128 个随机位

假设我们生成以下 128 位随机值:

11001100110101101101010101111010101110110110111001011101010110110101111011010011011110100100101111001011

第 2 步:应用 uuidv4 版本和变体

  1. 版本:将第 12-15 位(第 4 个字符)替换为 0100(对于 uuid 版本 4)。
    原来:1100 变成 0100 → 更新了这个位置的值。

  2. 变体:将第 9 个字节的第 6-7 位替换为 10(对于 rfc 4122 变体)。
    原来:11 变成 10 → 更新了该位置的值。

第3步:格式化为十六进制

将 128 位二进制转换为 5 个十六进制组:

  1. 32位组:11001100110101101101010101111010 → ccda55ba
  2. 16位组:1011101101101110 → b76e
  3. 16 位组:0100010101000101 → 4545(版本 4 为 0100)
  4. 16 位组:1010110111110010 → adf2(其中 10 为变体)
  5. 48位组:11010011011110100100101111001011 → d39d25cb

第 4 步:合并组

最终的 uuid 如下所示:
ccda55ba-b76e-4545-adf2-d39d25cb