分布式面试必懂：ID生成+事务，高频考点总结

在分布式系统面试中，分布式ID生成和分布式事务是“分水岭级”考点——许多候选人要么讲不清雪花算法的时钟回拨问题，要么混淆TCC和SAGA的适用场景，甚至不知道“最终一致性”该怎么落地。今天就拆解这两大核心模块，结合实际面试经历，帮你理清逻辑、避开坑，面试答得精准又落地。

第一题：分布式ID怎么设计？雪花算法原理是什么？有什么缺点？（理想汽车二面/微盟必问）

这道题是分布式系统的“入门题”，许多人只会背“64位ID”，却讲不清时钟回拨的危害，更不知道怎么解决。

方案	实现逻辑	优点	缺点	适用场景
UUID	生成128位随机字符串（如 6ba7b810-9dad-11d1-80b4-00c04fd430c8）	无中心、实现简单	无序（无法排序）、占空间（索引性能差）	非核心场景（如日志ID）
数据库自增	单库：auto_increment；多库：设置步长（如库1步长2、库2步长2）	有序、简单	单点风险（单库挂了无法生成）、性能低	中小规模、非高并发场景
Redis自增	用INCR/INCRBY生成自增ID，持久化到RDB/AOF	高性能、有序	依赖Redis（集群需同步）、宕机风险	高并发非金融场景（如商品ID）
雪花算法（Snowflake）	64位ID：1位符号位+41位时间戳+10位机器ID+12位序列号	有序、高性能、无依赖	依赖服务器时间（时钟回拨会重复）	高并发核心场景（如订单、支付ID）

2. 机器ID：

❌ 错误认知：“雪花算法无依赖，随意用”——忽略时钟回拨风险！生产环境因时钟回拨导致ID重复的事故很常见，必须提解决办法；

❌ 选UUID做核心ID：列如用UUID当订单ID，无法按创建时间排序，分页查询时性能极差；

❌ 机器ID乱配：多台机器用一样机器ID，上线后立即出现ID重复，这是低级但致命的错误。

“分布式系统一致性能力”，“分布式事务怎么设计”，“数据最终一致性怎么保证”，许多人只会说“2PC”，却不知道2PC在生产环境的局限性，更讲不清TCC的业务改造逻辑。

分布式事务是“跨服务的数据一致性问题”（如“订单服务创建订单”和“库存服务扣减库存”必须同时成功或同时失败），核心难点是“跨服务通信不可靠”（如服务A成功、服务B失败，如何回滚）。

方案	核心逻辑	优点	缺点	适用场景
2PC（两阶段提交）	协调者：1. 准备阶段（所有参与者预提交）；2. 提交阶段（所有准备成功则提交，否则回滚）	强一致性、简单	同步阻塞（参与者等待协调者）、单点风险（协调者挂了）	非高并发核心场景（如内部报表系统）
TCC（Try-Confirm-Cancel）	拆分事务为3步：1. Try（预留资源，如冻结库存）；2. Confirm（确认执行，如扣减冻结库存）；3. Cancel（回滚，如解冻库存）	无锁阻塞、性能高	需业务改造（每个事务需写Try/Confirm/Cancel方法）	高并发核心场景（如电商下单、支付）
SAGA	拆分为本地事务序列，每个事务执行后发消息触发下一个；失败则执行补偿事务（如“创建订单→扣库存”失败，执行“撤销订单→加库存”）	支持长事务、无需锁	最终一致性（非实时一致）、补偿逻辑复杂	长事务场景（如物流调度、跨系统审批）
消息队列（最终一致性）	1. 本地事务+发消息（原子性，如用RabbitMQ事务）；2. 消费端处理消息；3. 失败重试+定时校验	实现简单、低侵入	一致性延迟（消息异步）	非实时一致场景（如订单创建后发通知、日志同步）