智能语音对话机器人- 完整功能介绍
智能语音对话机器人
Python 桌面智能语音对话机器人,整合多模型语音识别、语音合成、角色系统、位置天气、新闻推荐等功能。
📋 项目概述
智能语音对话机器人基于 Python 开发,支持 本地语音识别、多 AI 模型、即时语音合成、角色系统、图片识别 等丰富功能,并提供现代化桌面 UI,带来沉浸式对话体验。
✨ 核心特性
🎯 主要功能
✅ 多 AI 模型支持(通义千问、豆包大模型)✅ 本地语音识别(Vosk)✅ 即时语音播报(Edge TTS)✅ 丰富音色库(30+)✅ 15+ 预设角色 & 自定义角色✅ 图片/文档解析✅ 自动定位 & 天气✅ 每日新闻✅ 可导出对话历史
🎭 角色系统
支持 15+ 预设角色及自定义角色:
| 角色 | 描述 | 适用场景 |
|---|---|---|
| 可爱少女 | 活泼热情 | 轻松聊天 |
| 专业顾问 | 数据分析 | 商务咨询 |
| 程序员助手 | 技术专家 | 编程开发 |
| 心理咨询师 | 情绪疏导 | 情感支持 |
| … 以及更多 |
用户可:
自定义角色名称配置系统提示词为角色指定音色
🎵 音色库
中文女声: 12 种中文男声: 6 种粤语/台湾: 6 种其他语言: 英语/日语/韩语
可自定义语速、音量、连续播放等
📦 技术架构
核心依赖
pip install requests edge-tts pygame Pillow
pip install vosk pyaudio
pip install volcengine-python-sdk[ark]
目录结构
智能语音对话机器人/
├── main.py
├── chatbot_settings_v7.json
├── chatbot_messages_v7.json
├── custom_roles.json
├── news_cache.json
└── vosk-model-cn-0.22/
🔑 API 配置
| API | 用途 | 可选 |
|---|---|---|
| 通义千问 | 文本+图片识别 | ✅ 必需 |
| 豆包 | 文本大模型 | ✅ 可选 |
| 高德地图 | 位置 & 天气 | ✅ 可选 |
🎤 语音功能
语音识别
本地运行 Vosk不上传云端,隐私安全
语音合成
Edge TTS 语音生成支持多音色 & 实时播放可手动停止
连续对话
自动循环:识别 → AI 回复 → 播放
📰 信息服务
📅 今日新闻
📚 推荐阅读
🌤️ 天气查询
💬 对话管理
保存历史支持导出 TXT
🎨 UI 设计
浅色未来主题分区布局:聊天 / 附件 / 功能栏智能表情系统
🚀 快速开始
安装依赖下载 Vosk 模型配置 API运行 main.py
🐛 常见问题
语音识别失败 → 检查模型播放失败 → 检查网络API 错误 → 检查 Key
📝 更新日志(v7.0)
新增:角色系统 & 自定义角色新增:高德 API新增:新闻推荐扩展:30+ 音色优化:性能
📄 许可证
仅用于学习研究,请遵守 API 服务条款
🙏 致谢
通义千问豆包大模型Edge TTSVosk高德开放平台
🌟 效果展示



欢迎提交建议,祝你使用愉快!
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...




