微软把语音 AI 玩出“Stable Diffusion 时刻”了？

内容分享2个月前发布

微软把语音 AI 玩出“Stable Diffusion 时刻”了？

我试了下 Vibing 这款语音输入法，转录速度跟翻译速度都很快，无需本地模型，毕竟安装包就 1.3MB

VibeVoice 可以直接本地跑： ✅实时 TTS，300ms 就出声 ✅一口气生成 90 分钟、多说话人对话 ✅长音频转录还能标谁什么时候说的啥可以省掉 ElevenLabs 的费用了哈哈

代码地址：
https://github.com/microsoft/VibeVoice

微软把语音 AI 玩出“Stable Diffusion 时刻”了？

微软把语音 AI 玩出“Stable Diffusion 时刻”了？

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

被 OpenAI 点名后，智谱刚刚发布新开源模型：国产最全能，一句话造出搜索引擎

被 OpenAI 点名后，智谱刚刚发布新开源模型：国产最全能，一句话造出搜索引擎

2个月前

130

unity3d源码2022 2D3D版推箱子合集/u3d游戏源码/u3d小游戏

unity3d源码2022 2D3D版推箱子合集/u3d游戏源码/u3d小游戏

3周前

120

网络《02》、Kali在U盘中持久化

网络《02》、Kali在U盘中持久化

8个月前

0140

OpenAI3000亿订单背后的AI野心这两天OpenAI一张3000亿美金的订单火出圈

OpenAI3000亿订单背后的AI野心这两天OpenAI一张3000亿美金的订单火出圈

内容分享 # ai # 投资 # 金融

11个月前

0110

1 条评论

财家富贵花读者

[db:评论]

2个月前无记录

回复