微软把语音 AI 玩出“Stable Diffusion 时刻”了?

内容分享3小时前发布
0 1 0
全能 AI 聚合平台 免费

一站式接入主流 AI 大模型,支持对话 · 生图 · 生视频,即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama
AI对话 AI生图 AI视频
免费使用 →

微软把语音 AI 玩出“Stable Diffusion 时刻”了?

我试了下 Vibing 这款语音输入法, 转录速度跟翻译速度都很快,无需本地模型,毕竟安装包就 1.3MB

VibeVoice 可以直接本地跑: ✅实时 TTS,300ms 就出声 ✅一口气生成 90 分钟、多说话人对话 ✅长音频转录还能标谁什么时候说的啥 可以省掉 ElevenLabs 的费用了哈哈

代码地址:
https://github.com/microsoft/VibeVoice

微软把语音 AI 玩出“Stable Diffusion 时刻”了?

微软把语音 AI 玩出“Stable Diffusion 时刻”了?

© 版权声明

相关文章

1 条评论

  • 头像
    财家富贵花 读者

    [db:评论]

    无记录
    回复