【2025年度总结】AI眼镜音频开发之路

2025年的目录

1月 有趣的智能吉他+年会2月 开工3月 搬家+评估项目的风险项4月 深圳校友会+出差杭州项目Bringup5月 BES2800 功能调试6月 紧张的项目开发+临近提测时间7月 工作+生活双线忙碌8月 深圳攻关项目卡点问题9月 杭州出差解决问题10月 攻克两大疑难问题11月 产品发布会+上半年绩效12月 团建轻松一刻12.1 CSDN视频卡片
2025年总结往年回顾

1月 有趣的智能吉他+年会

1月中旬,终于把XR875+ACM8615S 调通了,声音也播放正常了,不容易呀,也走了不少弯路。这个过程比较艰辛,都是加班加点在家里搞,一边看娃一边调试代码,真心不容易呀。

AI智能吉他音频调试

1月底年会,吃好喝好红包装好,红包抢了不少,开心呀。

【2025年度总结】AI眼镜音频开发之路

公司新项目的各种会议以及各个功能点的评估。

1月份过年,更多的记录的都是家庭琐事。

2月 开工

2月开工之后,一部分工作是测功耗,基本吧汇顶PA的功耗数据测试清楚了,确实不如预期,也整理出了数据,要做方案的汇报,整理了各个技术方案。
【2025年度总结】AI眼镜音频开发之路

3月 搬家+评估项目的风险项

3月初搬家,记不清楚这是第一次搬家,搬家原因是桐林公寓的2房一厅已经到期了,房租6500,只有我俩在做,暂时没必要住两房一厅,于是换个小了。

项目立项,各个音频的细节都需要落地确认,以及一些风险点都要提前说明。月中旬也是出差到杭州进行交流以及音频链路的进展同步。

3月初年度Review, 总结一下过去的工作。

4月 深圳校友会+出差杭州项目Bringup

【2025年度总结】AI眼镜音频开发之路
4月中旬出差 到杭州进行项目音频链路的Bring up,时间紧任务重,BES2800 下行音频播放很快打通,上行的录音链路 和 AR1 TDM 接口传输 4ch 遇到不少问题,过程中不断的咨询高通,才打通4ch的录音。

AI眼镜音频链路调试

另外就是绩效约谈

4月份比较有意义的一件事情就是 深圳校友聚会,见到了很久没见的辅导员,现在已经升官了,格外亲切,那晚喝了不少酒,拥抱了一下,主要是辅导员在大学对我帮助很大,转专业、三下乡等一系列事情,真的是感情非凡,很感动,感觉像是回到了毕业前夕的感觉。

5月 BES2800 功能调试

五一假期三天,主要是定下了月子中心和一起拍下孕妇照。拍完照在马家龙午餐吃了份羊肉面,味道为长津岛,真不错呀。

510周六,阿里日活动,但是深圳没啥活动,只有杭州有。

5月中在咸鱼上有个客户需要开发3mic+2ref 音频录音方案,然后评估了工作量以及可行性,找了一圈,还是基于Google Pixel 3 开发,想找一份原理图看看,逛了一圈,发现个好东西,鑫智造软件 包含了手机维修图纸,确实很方便,这个应该是手机圈经常用到的软件了。真的只是有想不到没有做不到。然后淘宝下单了Google Pixel 3,拿到实际真机验证下,研究了下高通的音频链路,尝试了多种方案,发现音频链路还是很复杂的,于是和客户沟通,果断放弃高通的方案,无奈客户坚持,不局限于手机,于是找了一款音箱,帮客户搞定了。提供了相关指导手册。 顺利交付录音测试的APK。
【2025年度总结】AI眼镜音频开发之路

5月中旬,大疆HR突然加微信,晚上电话沟通了下,本部HR,聊的比较多,工作精力以及工作难点,最后才知道,之前投递的简历挂掉的原因是觉得简历内容太简单了导致的,还是要挖掘项目难点,在不断努力之下,有了一面的机会,发挥的不是很好,主要是原因是没有好好复习和准备,很多问题都忘记了,导致错误了机会。当然大疆的加班也非常多,口碑是很好,但是不适合长待,我主要面试的原因是 挑战一下自己,也不一定非要去,目前的工作 也是可以的。

有一天晚上实在忍不了了,和BES FAE 吐槽了一下,一堆问题,就是拿我当测试了,验证这个验证那个,烦死了。 BES2800 前期遇到很多问题,算法的加载、录音链路、各种Crash 问题层出不穷,搞得人奔溃呀。

6月 紧张的项目开发+临近提测时间

项目进入开发阶段,各种各项的需求,每天下班都很晚。

困扰两天的问题点有了突破,周五的时候老板要求给支付宝录一下超声波的录音,看一下,结果发现TDM录音有混叠现象,百思不得其解,周末两天都在排查问题,首先分析是恒玄还是高通的问题, 恒玄FAE通过AP音频分析仪抓数据得出结论是高通DUMP的问题。于是开始在AR1高通这边调试,一步一步摸索,首先是QXDM 日志分析以及QCAT dump 音频数据分析, 把工具先玩通, 周日做了一下午实验,得出结论 还是BES2800 数据有问题,于是周一继续分析。 下周直接去深圳恒玄出差,现场调试,最终定位到为题原因。
【2025年度总结】AI眼镜音频开发之路
【2025年度总结】AI眼镜音频开发之路
【2025年度总结】AI眼镜音频开发之路6月底,临近提测时间点,发现很多事情都没有搞定,都是一半一半的,和高通沟通下来,发现录音中集成空间录音音效的算法,比想象中的复杂,还是很麻烦的,这件事情拖拉了很久,最后不得不去做,发现还是有问题,所以很多事情还是要提前去解决的。

7月 工作+生活双线忙碌

7月初二胎出生了,刚好这个时候项目节奏到了关键时候,也没有请太多假,在医院这几天每天都是电话接连不断, 在医院待了三天之后,就到了月子中心,有了一胎的经验之后,这次的月子中心 选的离家比较远,主要是性价比搞,价格实惠,而且还是一对一,父母过来之后也不需要再去住酒店了。 这段时间下班也比较晚,等回到月子中心,基本都是凌晨1点了,主要路上做地铁也得一个小时。这段时间虽然累但是也快乐着。

7月底,朋友打造的随弹吉他产品上市了,一句话,降低弹吉他的门槛,很容易体验吉他的乐趣。 这是少数派写的体验指南。 也许是最适合普通人的「弹唱」入门设备:Musspark AI 随弹吉他 S1 mini 体验

【2025年度总结】AI眼镜音频开发之路

8月 深圳攻关项目卡点问题

8/1日 项目遇到的问题比较多,拉了厂商的人在会议室攻关开发,问题太多了,写了一黑板,各种各样的问题,比如导航播放,持续杂音疑似hifi4卡死、hifi失联、 hifi4 crash 、kfifo overflow 一些列问题,主要是项目前期节奏太慢了,FAE 在前面支持也解决不了问题,问题一直在反复,这次直接把研发拉过来,现场解决问题,这样效率比较高, 这两周时间基本每天都搞到凌晨2点,简直累成狗。刚开始一周效率还是蛮高的,解决了大部分的问题,后一周 人比较疲了,问题进展很慢,很多问题测试也无法复现,相当于原本高概率的问题 解决一波之后,变为了低概率的问题。 攻关了两周之后,项目的音频问题 逐渐收敛了。过程中 也学习到了不少经验吧。

9月 杭州出差解决问题

9月大部分时间都在杭州出差,解决项目的杂音问题,场景就是滑动音量的播放很短的提示音后,大概率会出现兹拉的声音,特别明显,很影响用户体验,反复抓了dump了数据,一直找不到问题的原因,而且现在这个又必须要解掉,于是就专攻这个问题,既然大概率复现,呢就写脚本,让大概率变为必现,通过 SecureCRT 实现了一系列的自动化测试用例,基本跑几百次肯定会出现一次。这样必现之后反复验证,终于找到了问题所在,发现还是hifi4 处理 mp3 的逻辑问题呀。

10月 攻克两大疑难问题

国庆假期回家一趟,但是也闲不下来,产品内测,用户反馈了多例眼镜未佩戴的时候出现5s左右兹拉兹拉的电流音,这个时候刚好是播放暂停,PA 延迟5s 关键的时间。 分析了多份日志,百思不得其解,节后上班,测试同事稳定复现出了该现象,必现的场景 竟然是关掉串口后必现,很奇怪,于是找机器拆解拉硬件抓I2S 波形分析,发现clk和 data 的波形 有段时间是被强制拉低的,于是怀疑是引脚占用,排查代码之后,也没有发现引脚占用的地方,陷入了无奈,于是和厂商驱动的交流了下,发现了问题点,原因是 进入了低功耗后会出现这个现象,于是在SmartPA suspend 的加锁,禁止进入低功耗,问题解决。
【2025年度总结】AI眼镜音频开发之路
另外一个难题是长时间录音出现了杂音,当数字麦CLK为768k的时候,录音数据出现了周期性的脉冲信号,这个问题起初完全没有思路,而且又是特别难复现,没有明显的复现规律,有的时候开始录音就出现了,有的时候很长时间才出现,我自己也搭建了老化环境,发现老化了一晚上都没复现。 而且这个问题涉及到功耗,老板们基本每天都在问进展,因为拖得时间有点久了,于是静下来心来一步一步分析这个问题,同时也来厂商驱动的人来分析,核心是能够复现,这样才能验证各种猜测。提供的一种解决思路就是用 USB 录音声卡 来录MIC的数据,看现象是随着哪边再走,主要担心是硬件问题,压力特别大, 这样折腾之后,发现也没有复现。 于是一度陷入了迷茫, 这个时候测试同事带来了好消息,发现录音过程中,插拔下USB就可以大概率复现到,于是像是抓到了救命稻草,因为现在录音是靠串口录音的,所以必须是要接串口的,USB 是充电的,一般录音之前也会接上,在这个线索的提点下,我立马复现,把这个概率的现象变为必现的场景, 于是拉硬件抓波形,发现这个时候有个电压的过充,有5v的电压会回灌到GPIO中, 尼玛,终于找到必现场景和问题所在了, 这天深夜,松了一口气,此时已经是凌晨3点了,这问题太折磨人了。 问题的原因还是硬件电路设计上的问题,具体细节没办法描述的太细节,感兴趣或者遇到同样的问题,可以进一步交流探讨。
【2025年度总结】AI眼镜音频开发之路

11月 产品发布会+上半年绩效

11月一部分是时间在杭州出差攻关项目的卡点,音频的各个场景卡顿,在访客中心配合厂商解决问题。
今年的双十一没啥感觉,当天也在杭州出差,只见阿里灯火通明。
【2025年度总结】AI眼镜音频开发之路

产品发布会, 这一刻,期待很久了。不容易呀。

[]()

夸克AI眼镜「先见之明」新品发布会 20251127 | 夸克 AI 眼镜 S1 | MicroLED 单色光波导

上半年的绩效公布了,相对符合预期,至少过程中没有出啥太大的纰漏,但是太累了,工作量很多,加班很多,压力也很大。 唯一的不足是,项目过程中有些问题,可以更多的前瞻考虑,避险风险遗留到项目晚期。继续加油吧。 这部分可以见个人文档中25年复盘记录了。

12月 团建轻松一刻

困扰一周的Bug, 12/1 今晚似乎找到了解决方案,而且测试起来还可以。 回去的路上也在不断的用快捷词 xx录像、xx退出 测试,一直到家都没复现,代表这个方案应该是有效的。 背景是这样的,录像的过程中用快捷词唤醒去操作,发现退出录像和录像过程中无法唤醒,dump 数据发现是录音的通道顺序变了,原本第一通道的VPU 数据变为了第三通道,导致无法唤醒,经过反复排查之后,因为是异构多核的,这里的逻辑存在时序问题,反复调整之后,问题得到解决。

12月底去珠海外伶仃岛团建了一下,今年着实比较累,加班、熬夜、出差非常多。虽然团建两天,时间很短,还没开始就已经快结束了。但是也是相当于轻松了一下。海钓、爬山、海鲜大餐,挺不错的,很轻松,很惬意。 发现海钓也是挺有意思的事情,特别是上鱼之后的那种感觉,很有意思。

珠海外伶仃岛

另外一个工作就是招聘,面试了不少候选人,各个大厂、不同的年龄段、不同的工作背景。每场面试快结束后比较关注的就是离职原因,大家都各不相同。

12.1 CSDN视频卡片

CSDN 特有的「视频卡片」语法


[video(video-410kCrIv-1672476647801)(type-bilibili)(url-https://player.bilibili.com/player.html?aid=904622966)(image-https://i-blog.csdnimg.cn/...)(title-xxx)]

原本B站中的分享嵌入代码写到CSDN 博客中 发布之后并不会有视频,需要用一下特定的语法,核心是aid=后面的关键字,来自于B站中嵌入代码分享的链接中。

根据bvid获取预览图 BV1LQvrBaELk,

手动获取 Bilibili 官方封面图(用于验证)
Bilibili 的封面图有固定规则,可通过以下方式获取:

步骤 1:获取视频的 bvid 或 aid


你的视频:<iframe src="//player.bilibili.com/player.html?isOutside=true&aid=115795791183992&bvid=BV1LQvrBaELk&cid=35031616383&p=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"></iframe>
BV 号:BV1LQvrBaELk

步骤 2:通过 Bilibili API 获取封面图

直接访问 API(浏览器即可)打开:


https://api.bilibili.com/x/web-interface/view?bvid=BV1LQvrBaELk
在返回的 JSON 中找到 "pic" 字段:

json
{
  "code": 0,
  "data": {
    "pic": "https://i0.hdslb.com/bfs/archive/6f5d8a8e8c9e3f3d3e3b3e3b3e3b3e3b3e3b3e3b.jpg"
  }
}

✅ 这个 pic URL 就是官方高清封面图。

2025年总结

25年工作上主要是AI眼镜音频开发从0到1的交付。核心是恒玄BES2800 RTOS + 高通AR1 Android 技术方案,选择异构的方案更多是穿戴式产品的功耗考量,音频链路也是比较复杂的,涉及到异构的唤醒算法、算法的算力分配、 基本的音效算法、空间音频等各个场景。今年眼镜技术方案主要两大技术方案,一种是纯Android技术方案,比如 Meta、Rokid 都是高通的AR1方案为主。 另外一种就是RTOS + Android 比如理想AI眼镜 Livis 、阿里夸克眼镜S1。 我大部分的精力都是投入在 恒玄BES2800 RTOS 方案上的,因为大部分的业务都在上面,起初恒玄提供的SDK 以及 接口 很不稳定,各种各样的问题,要么就是跑不起来,要么就是跑起来有问题,关键是还不开源,天天相当于FAE一样,提需求、验证、发现问题、更新hifi bin 或者 .a ,一直这样的节奏持续了很久,而且老是在救火,时间紧、任务重、关键交付的东西还不稳定,这种心情真的是奔溃呀。还是熬下来了,项目终于量产、上市。开发过程中AR1 Android 上行录音链路集成4ch 空间音效算法,前期评估比较草率的,认为改动不大,实际落地过程中发现有各种各样的问题,首先是对高通AR1 平台不熟悉,本身是异构ADSP+ARM架构,和以往的MTK平台完全不一样,算法的集成难度比较大,放在ARM测,只有2ch的原始数据,放在ADSP上,发现短期又搞不定,一直拖,拖到最后不得不去做,陷入周末不断的加班中,一直救火。另外一个原因是工作量超出预期,80%的工作都是在BES2800 RTOS 系统上,过程中突然中断去调试 Android Audio 突然有点不适应,导致心烦意乱。5月份左右,帮咸鱼客户完成多通道录音APK的交付,过程真的是曲曲折折,原本要放弃了,坚持一下,结果搞成了,预料之外呀。今年最大的感触就是 AI 的发展太快了,而且工作中 也大量用到AI 编程,现在很多函数接口 基本不需要写代码了,直接提需求给AI ,自动帮你输出代码,而且写得比你自己的还好。 这也是进化同时也是对程序员的挑战。接下来的几年应该也是程序员转型的一个重要阶段。2026年的主要方向 依旧是 AI 眼镜,这才刚刚开始,有点像 2017年 Amazon Alexa 智能音箱的发展历程。

往年回顾

2024年度总结 : 找到自己的跑道,开启奔跑
2023年终总结 : 思考思考你的工作2022年终总结: 勇敢追梦,去和人生博弈2021年终总结 : 聚焦发展,稳步突破2020年终总结 : 乘风破浪2019年的前路有光, 永不断电2018年的经历有苦有甜2017年的知识清单

© 版权声明

相关文章

暂无评论

none
暂无评论...