那夜系统濒临崩盘，我靠Redis3行代码救场，老板猛夸了我三分钟！

一次真实的线上事故，让我重新认识了Redis的价值。这不仅是缓存，更是架构设计的基石。

引子：那个惊心动魄的周五夜晚

场景还原：

时间：周五晚上，促销活动高峰期
问题：数据库QPS暴涨10倍，CPU使用率95%，系统濒临崩溃
根本缘由：商品详情页每次请求都直接查询MySQL，并发下数据库不堪重负

解决方案：引入Redis缓存层

def get_product_detail(product_id):
    # 1. 先查Redis缓存
    cache_key = f"product:{product_id}"
    product_data = redis.get(cache_key)
    
    if product_data:
        return json.loads(product_data)
    
    # 2. 缓存未命中，查数据库
    product = mysql.query("SELECT * FROM products WHERE id = %s", product_id)
    if not product:
        return None
    
    # 3. 写入Redis，设置5分钟过期
    redis.setex(cache_key, 300, json.dumps(product.to_dict()))
    return product

优化效果：

MySQL压力下降70%
响应时间从2秒优化到50毫秒
系统恢复稳定

那夜系统濒临崩盘，我靠Redis3行代码救场，老板猛夸了我三分钟！

Redis核心应用场景深度解析

场景一：缓存系统（Cache）— 架构的”减压阀”

三大经典问题及解决方案：

1. 缓存穿透

def get_user_info(user_id):
    cache_key = f"user:{user_id}"
    
    # 布隆过滤器预检查
    if not bloom_filter.exists(user_id):
        return None
    
    data = redis.get(cache_key)
    if data == "NULL":  # 缓存空对象
        return None
    elif data:
        return json.loads(data)
    
    # 查询数据库
    user = mysql.query("SELECT * FROM users WHERE id = %s", user_id)
    if not user:
        # 缓存空值，避免穿透
        redis.setex(cache_key, 300, "NULL")
        return None
    
    redis.setex(cache_key, 3600, json.dumps(user.to_dict()))
    return user

2. 缓存击穿

def get_hot_product(product_id):
    cache_key = f"product:{product_id}"
    
    while True:
        data = redis.get(cache_key)
        if data:
            return json.loads(data)
        
        # 尝试获取分布式锁
        lock_key = f"lock:{cache_key}"
        if redis.setnx(lock_key, "1"):
            redis.expire(lock_key, 10)  # 防止死锁
            try:
                # 查询数据库并重建缓存
                product = query_product_from_db(product_id)
                redis.setex(cache_key, 300, json.dumps(product))
                return product
            finally:
                redis.delete(lock_key)
        else:
            time.sleep(0.1)  # 短暂等待后重试

3. 缓存雪崩

def set_cache_with_random_ttl(key, value, base_ttl=3600):
    # 基础TTL + 随机时间，避免同时过期
    random_ttl = base_ttl + random.randint(0, 300)
    redis.setex(key, random_ttl, json.dumps(value))

场景二：分布式锁 — 并发控制的”守护者”

基础实现：

class RedisDistributedLock:
    def __init__(self, redis_client, lock_key, expire_time=30):
        self.redis = redis_client
        self.lock_key = lock_key
        self.expire_time = expire_time
        self.identifier = str(uuid.uuid4())
    
    def acquire(self):
        # SET key value NX EX timeout
        result = self.redis.set(
            self.lock_key, 
            self.identifier, 
            nx=True, 
            ex=self.expire_time
        )
        return result is True
    
    def release(self):
        # 使用Lua脚本保证原子性
        lua_script = """
        if redis.call("get", KEYS[1]) == ARGV[1] then
            return redis.call("del", KEYS[1])
        else
            return 0
        end
        """
        script = self.redis.register_script(lua_script)
        return script(keys=[self.lock_key], args=[self.identifier])

# 使用示例
def seckill_activity(product_id):
    lock = RedisDistributedLock(redis, f"seckill_lock:{product_id}")
    if lock.acquire():
        try:
            # 执行秒杀业务逻辑
            return do_seckill_business(product_id)
        finally:
            lock.release()
    else:
        return {"error": "系统繁忙，请重试"}

场景三：计数器 — 高并发统计的”利器”

接口限流实现：

class ApiRateLimiter:
    def __init__(self, redis_client, prefix="rate_limit"):
        self.redis = redis_client
        self.prefix = prefix
    
    def is_allowed(self, api_key, max_requests, window_seconds=60):
        key = f"{self.prefix}:{api_key}"
        now = int(time.time())
        
        # 使用管道保证原子性
        pipe = self.redis.pipeline()
        pipe.zremrangebyscore(key, 0, now - window_seconds)
        pipe.zcard(key)
        pipe.zadd(key, {str(now): now})
        pipe.expire(key, window_seconds)
        
        results = pipe.execute()
        current_requests = results[1]
        
        return current_requests < max_requests

# 使用示例
limiter = ApiRateLimiter(redis)
if not limiter.is_allowed("user_123", 100, 3600):  # 1小时最多100次
    return {"error": "请求过于频繁"}

[](@replace=2)

场景四：排行榜 — 实时排序的”引擎”

热度排行榜实现：

class HotRanking:
    def __init__(self, redis_client, key="hot_ranking"):
        self.redis = redis_client
        self.key = key
    
    def add_score(self, item_id, score):
        """增加项目分数"""
        self.redis.zincrby(self.key, score, item_id)
    
    def get_top_n(self, n=10, with_scores=True):
        """获取Top N"""
        return self.redis.zrevrange(self.key, 0, n-1, withscores=with_scores)
    
    def get_rank(self, item_id):
        """获取某个项目的排名"""
        return self.redis.zrevrank(self.key, item_id)

# 使用示例 - 文章热度计算
ranking = HotRanking(redis)

# 用户点赞时更新热度（点赞+2分，评论+3分，浏览+1分）
def on_article_liked(article_id):
    ranking.add_score(article_id, 2)

def get_hot_articles():
    return ranking.get_top_n(20)

场景五：消息队列 — 异步处理的”枢纽”

基于Stream的消息队列：

class RedisMessageQueue:
    def __init__(self, redis_client, stream_key):
        self.redis = redis_client
        self.stream_key = stream_key
    
    def produce(self, message_data):
        """生产消息"""
        message_id = self.redis.xadd(
            self.stream_key,
            message_data,
            maxlen=10000  # 限制最大长度，防止内存溢出
        )
        return message_id
    
    def consume(self, consumer_group, consumer_name, count=10):
        """消费消息"""
        messages = self.redis.xreadgroup(
            consumer_group, consumer_name,
            {self.stream_key: '>'},
            count=count, block=5000
        )
        return messages
    
    def ack(self, consumer_group, message_id):
        """确认消息处理完成"""
        self.redis.xack(self.stream_key, consumer_group, message_id)

# 使用示例 - 异步发送邮件
mq = RedisMessageQueue(redis, "email_queue")

# 生产者
def send_async_email(to, subject, content):
    mq.produce({
        "to": to,
        "subject": subject,
        "content": content,
        "timestamp": time.time()
    })

# 消费者
def email_worker():
    while True:
        messages = mq.consume("email_workers", "worker_1")
        for message in messages:
            # 处理邮件发送逻辑
            send_email(message)
            mq.ack("email_workers", message['id'])

场景六：会话管理 — 分布式认证的”基石”

JWT Token管理：

class SessionManager:
    def __init__(self, redis_client):
        self.redis = redis_client
    
    def create_session(self, user_id, user_info, expire_days=7):
        """创建会话"""
        session_id = str(uuid.uuid4())
        session_key = f"session:{session_id}"
        user_key = f"user_sessions:{user_id}"
        
        session_data = {
            "user_id": user_id,
            "user_info": json.dumps(user_info),
            "created_at": time.time(),
            "last_activity": time.time()
        }
        
        # 存储会话数据
        pipe = self.redis.pipeline()
        pipe.hmset(session_key, session_data)
        pipe.expire(session_key, expire_days * 86400)
        
        # 记录用户的活跃会话
        pipe.sadd(user_key, session_id)
        pipe.expire(user_key, expire_days * 86400)
        
        pipe.execute()
        return session_id
    
    def validate_session(self, session_id):
        """验证会话有效性"""
        session_key = f"session:{session_id}"
        session_data = self.redis.hgetall(session_key)
        
        if not session_data:
            return None
        
        # 更新最后活动时间
        self.redis.hset(session_key, "last_activity", time.time())
        return session_data
    
    def logout_user(self, user_id):
        """用户登出，清理所有会话"""
        user_key = f"user_sessions:{user_id}"
        session_ids = self.redis.smembers(user_key)
        
        pipe = self.redis.pipeline()
        for session_id in session_ids:
            pipe.delete(f"session:{session_id}")
        pipe.delete(user_key)
        pipe.execute()

高级应用场景

1. 布隆过滤器 – 防止缓存穿透

class RedisBloomFilter:
    def __init__(self, redis_client, key, capacity=1000000, error_rate=0.001):
        self.redis = redis_client
        self.key = key
        self.capacity = capacity
        self.error_rate = error_rate
        
        # 计算需要的哈希函数数量和位图大小
        import math
        self.num_bits = -math.log(error_rate) * capacity / (math.log(2) ** 2)
        self.num_hashes = int(self.num_bits * math.log(2) / capacity)
    
    def add(self, item):
        """添加元素"""
        pipe = self.redis.pipeline()
        for seed in range(self.num_hashes):
            hash_val = self._hash(item, seed) % self.num_bits
            pipe.setbit(self.key, hash_val, 1)
        pipe.execute()
    
    def exists(self, item):
        """检查元素是否存在"""
        pipe = self.redis.pipeline()
        for seed in range(self.num_hashes):
            hash_val = self._hash(item, seed) % self.num_bits
            pipe.getbit(self.key, hash_val)
        results = pipe.execute()
        return all(results)

2. 分布式ID生成器

class DistributedIDGenerator:
    def __init__(self, redis_client, key="id_generator"):
        self.redis = redis_client
        self.key = key
    
    def next_id(self, business_type="order"):
        """生成分布式唯一ID"""
        key = f"{self.key}:{business_type}"
        # 日期前缀 + 自增序列
        date_str = time.strftime("%Y%m%d")
        sequence_key = f"{key}:{date_str}"
        
        sequence = self.redis.incr(sequence_key)
        self.redis.expire(sequence_key, 86400)  # 24小时后过期
        
        return f"{business_type}_{date_str}_{sequence:08d}"

性能优化最佳实践

1. 管道化操作

# 批量操作，减少网络往返
pipe = redis.pipeline()
for user_id in user_ids:
    pipe.get(f"user:{user_id}")
results = pipe.execute()

2. Lua脚本保证原子性

# 原子性的库存扣减
lua_script = """
local stock = tonumber(redis.call('GET', KEYS[1]))
if stock and stock > 0 then
    redis.call('DECR', KEYS[1])
    return stock - 1
else
    return -1
end
"""
script = redis.register_script(lua_script)
result = script(keys=['product_stock:1001'])

监控与告警

关键指标监控：

内存使用率
连接数
命中率
慢查询
键空间分析

def check_redis_health():
    info = redis.info()
    
    # 内存使用率
    memory_ratio = info['used_memory'] / info['total_system_memory']
    if memory_ratio > 0.8:
        send_alert("Redis内存使用率过高")
    
    # 命中率
    hit_ratio = info['keyspace_hits'] / (info['keyspace_hits'] + info['keyspace_misses'])
    if hit_ratio < 0.9:
        send_alert("Redis命中率过低")