本文围绕生成式AI带来的变革展开,重点介绍了网易有道推出的有道文档FM这款有声阅读、学习效率工具。作者亲自测试其功能和效果,对比国外相关产品,分析了AI播客在国内外的发展情况以及有道文档FM的市场意义。
不得不承认,生成式AI已然给我们的生活和工作带来了翻天覆地的变化。
作为一名文科出身且缺乏艺术细胞的人,在生成式AI大模型尚未问世之前,我所谓的“内容产出”,仅仅局限于动动手指、敲击键盘,让中文字符伴随着数字信号出现在电脑屏幕上,再无其他。
然而如今,即便我对绘画一窍不通,对乐理知识更是一无所知,只要掌握了提示词的编写技巧,我就能轻松“创作”出不同风格的画作,“打造”出各种流派的音乐。甚至连一向被视为“小而美”的播客这一传播媒介,也不再那么神秘莫测了。
3月25日,网易有道正式宣布有道文档FM开启公测。
有道文档FM是一款有声阅读和学习效率工具。它宣称支持将拍照、文档、链接、长文本等多种形式的内容一键转化为播客,还能迅速提炼出核心要点,生成简洁明了的总结和思维导图,让用户一眼就能把握内容的主旨。
我决定亲自为大家测试一番,看看这款国产AI播客到底实力如何。
「懒狗」也能做播客
想要体验有道文档FM其实非常简单。只需打开手机上的应用商店,搜索“有道文档FM”,看到那个蓝色气泡图标后点击下载即可。毕竟现在处于公测阶段,无需邀请码,对每个人来说都没有操作难度。
打开应用后,你会看到一些官方制作的播客示例。我先试听了附带的“《日航的奇迹》:飞向天际的涅槃”,这是通过生成式AI对原作进行的简明剖析解读。AI主持人的语音抑扬顿挫,停顿自然,还能模拟真人的吸气呼气声,听起来毫无违和感。
不过,这只是官方示例,实际效果还得我们亲自测试。
有道文档FM为用户提供了四种新建播客的方式,你可以拍照上传、粘贴网址、上传文件,也可以直接粘贴文字。需要注意的是,免费用户上传的文件不能超过5MB,开启会员后可扩展到20MB。
导入文本后,有道文档FM会提供包含文本朗读在内的二十种播客类型供用户选择。不同类型会使转写后的播客脚本有所差异。此外,用户还可以选择喜欢的音色,这里提供了13种男性声线和11种女性声线,像新闻男声、电台主播、深夜电台、元气青梅等应有尽有。
为了测试转播客的效果,我特意准备了三段不同的文本。之所以选择三段,是因为免费体验次数只有三次。
第一段文本是我早年在SteamCN(今keylol)论坛发表的《CRPG简述》,约5000字。我想借此看看这种亚文化内容的转写效果。点击生成后,实测5000字的文本大约耗时2 - 3分钟,就能得到一个约六分钟的、由两个AI主持人进行“深度探讨”的中文音频播客。
内容如下,感兴趣的读者可以自行下载收听:
从内容来看,有道文档FM很擅长抓重点,基本能提取出稿件中的重要内容。以这个播客为例,从主播A迷上《神界:原罪2》这款游戏引入,两位AI主播围绕CRPG游戏类型的定义、起源以及发展过程,讲解得头头是道。
它还能将稿件内容打碎,用口语化语言在两人的互动中表达出来。
第二段文本是我去年参加的一次群访记录,采访对象是机械革命创始人潘春节。这次转化出来的播客脚本显得有些死板,可能是因为对专访类内容资料不足,最终的播客脚本基本是两位AI主播添加了一些语气词后对原文的复述。
不过,除了播客内容,有道文档FM还在页面上方提供了文字版,甚至还有AI总结和思维导图,方便用户更有条理地掌握文本知识点,还是很实用的。
第三段文本是我大学时写的一本三流小说的第一部分,约7.5万字。我正好借此测试有道文档FM的“小说剧场”选项。这次转写耗时较长,等了十几分钟后,终于得到了一份长达35分钟的播客内容。
从转写效果来看,有道文档FM能够识别角色的行动,将背景、对话、行动以较为合理的方式拆解并讲述。但目前存在一个问题,播客中频繁出现“让我们继续这个引人入胜的故事”这句话,每当AI主播读到这里,都会让人感觉从内容中抽离出来。
此外,有道的AI播客目前还有一些瑕疵。比如部分男性声音语速较慢,且无法控制语速。特别是新闻男声和电台主播的音色,虽然字正腔圆、磁性十足,适合解说纪录片,但在播客中显得过于突兀。相声评书的音色还存在杂音,容易让人出戏。
不过就目前而言,有道文档FM在内容上表现不错,听感也基本正常,最终产出的内容更像是老师上课时的知识解读。有道或许也是这样定位的,用户可以利用它学习手头的资料,还能通过公众号链接转播客,快速吸收资讯和知识。借助其自带的DeepSeek,用户提出问题后得到回答,还能直接转写成播客内容进行学习。
比起单纯的娱乐享受,它的最大价值或许在于丰富了学习场景。
AI播客起风了?
事实上,AI播客的出现距离我们并不久远。2024年9月,谷歌的NotebookLM推出了“Audio Overview”功能,该功能可以将用户上传的内容转换为音频对话,由两位AI主播进行讨论。其内容流畅,音质逼真,仿佛真有两个人在交流。
作为这一类型的开创者,NotebookLM可能是最具“创造力”的产品。它生成的脚本不会局限于用户提供的内容,还会进行相关扩展,并且能根据需要调整语速。男女主播吐字清晰,语音语调自然真实,用户在音频播放期间还能直接与AI主持人互动。
对我们来说,这款产品的最大缺陷可能是只支持英文内容生成。
无论如何,NotebookLM的出现让人们看到了AI播客的潜力。人们可以用它快速消化大量信息,将长篇文章转化为有趣的对话,在做家务或开车时“阅读”平时没时间看的文章,甚至可以用它准备演讲稿,了解AI对自己观点的看法。
受此影响,在AI技术的推动下,播客制作和分发变得更加便捷,涌现出了“Listen Notes”、“Podcastle”、“Descript”等热门应用。这些平台利用AI语音转写、智能剪辑和音频增强等功能,大大降低了播客制作的门槛,让更多人能够轻松创建和分享自己的播客节目。
毋庸置疑,播客将成为下一个AI涌入的赛道。在国外,这是顺理成章的事情,因为播客在欧美市场颇具号召力,月度收听人数一度超过总人口的三分之一。
但在国内,情况则大不相同。对中文互联网来说,播客一直是小众且神秘的存在,喜欢的人爱不释手,不了解的人则望而却步。
移动互联网的普及,让大众习惯了视频和短视频的内容消费模式,快速刷新的视频流使人们习惯了超高速的信息获取方式,这使得播客这种相对“慢”的音频形式与快节奏的互联网显得格格不入。
当然,并非所有人都只追求视觉上的感官刺激。凭借其独特的陪伴感和深度,播客还是吸引了一批忠实的听众和创作者。当你在早晚高峰的地铁上,看到有人戴着耳机“闭目养神”,脸上偶尔露出笑容,那他很可能在听播客。
而我,恰好也是播客的“消费者”之一。在我看来,播客并非所谓“更为纯粹和深刻的交流方式”,而是一种充分利用碎片化时间的媒介。它排除了视觉干扰,让你在通勤、运动、打扫卫生时,都能沉浸在对话和叙事中,随时随地汲取感兴趣的观点。
对于追求效率的人来说,这一点非常难能可贵。
只可惜,国内播客节目的发展并不像爱好者们想象的那么顺利。在亚文化播客圈颇具影响力的“机核”,在近一年里接连撤裁了多位核心主播,变现与热爱之间的冲突似乎越来越激烈。
有道文档FM的出现,在一定程度上填补了“中文AI播客”的市场空白。它从学习的交互形式出发,将文档内容直接生成AI播客,为用户提供了一种高效输入特定知识的方法,是一款非常适合学习的AI应用。
曾经小众的播客,会因为被教育场景关注而不再小众吗?或许只有时间能给出答案。
3月20日 - 3月23日,AWE(中国家电及消费电子博览会) 2025 盛大开幕,海信、TCL、长虹、雷鸟、添可、追觅、云鲸、小熊、萤石、韶音、海尔、三翼鸟、九阳、科沃斯、万和、索尼、三星、LG等巨头纷纷参展。DeepSeek掀起的AI工业化浪潮如何影响家电成为重要看点,“AI家电”市场风起云涌。雷科技AWE 2025报道团正在全程追踪报道,敬请关注。
生成式AI背景下有道文档FM的公测情况,作者亲测其功能和效果,指出虽存在一些瑕疵,但在内容和学习场景上有一定优势。同时对比国外相关产品,分析了AI播客在国内外的发展差异,有道文档FM一定程度上填补了中文AI播客市场空白,未来播客是否因教育场景而改变小众局面有待时间验证。
原创文章,作者:东海凝丝,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/44424.html