很多老板手里都有一种"沉睡资产":客户电话、销售录音、客服语音、会议录音。
我自己硬盘里就躺着 5000+ 条通话录音。
以前这些文件看起来像资料,其实基本等于没用。因为没人会一条条听,也没人知道哪条是客户需求,哪条只是秒挂,哪条藏着投诉线索。
这次我不是只做"录音转文字"。
最后沉淀到 Obsidian 里了。
现在的效果是:
在 Obsidian 里能看到整套录音数据库,几千条记录可以按日期、号码、标签、关键词筛。
点开一条录音,里面有音频播放器,有 AI 摘要,有关键词,还有原始通话文字。
更关键的是,文字前面带时间戳。
看到某一句觉得重要,可以直接点时间戳,从那一秒开始播放原录音。
这就不是"转出来一堆 txt 文件"。
它变成了一个能回听、能搜索、能复盘的客户沟通库。
真正麻烦的地方在前面。
第一步不是转写,是清洗。
我和 AI 一起拆了几条规则:
小于 50KB 的,大概率是秒挂或空录音,先过滤。
服务号、银行号、明显推销号,先放到废弃区。
但纯数字陌生号不能一刀切。如果录音大于 500KB,说明聊得不短,可能真有客户内容,要保留。
因为真实生意里,很多重要客户一开始就是陌生号码。
后面再统一格式:mp3、amr、aac、wav,先用 FFmpeg 转成更适合识别的格式。
5000 多条也不能一次乱丢,按每 200 条一组分批处理。
语音识别我用 FunASR / Paraformer,本地批量转文字,再让 AI 做摘要、关键词和标签。
最后才进 Obsidian。
这件事不只适合录音多的人。
销售电话没人复盘、客服录音没人听、会议录音没人整理、员工跟客户聊了什么老板不知道,本质上都是同一种问题:有记录,但没人收拾。
AI 最适合先接这种活。
先把散、乱、脏、没人愿意整理的原始资料,变成能看的证据。
这个岗位,我叫它:AI 录音整理员。