DeepSeek - R1模型展开,讲述了它在文本生成能力方面的表现,以及其对中小企业和端侧AI发展的影响,还涉及到不同企业对该模型的应用和看法,最后探讨了其在多模态方面的短板等内容。
“就在刚刚,我还在对DeepSeek - R1模型的本地知识库进行测试呢,它的文本生成能力比我之前预想的还要出色。”2月6日,心动公司的媒体公关总监陈承这样对上海证券报的记者说道。
1月20日,DeepSeek正式推出了DeepSeek - R1模型,并且同步开源了模型权重。这一模型的出现犹如在行业中掀起了一阵狂风巨浪,使得众多公司迎来了“破圈时刻”。在软件方面,不少上市公司纷纷宣布接入DeepSeek,以此来加快自身AI应用产品的升级进程;在硬件方面,端侧AI也获得了加速发展的契机,有预测称在2025年可能会涌现出一波AI硬件创业的浪潮。
昆仑万维的董事长兼CEO方汉认为,DeepSeek这个性价比很高的模型充分证明了一点,那就是只要算法足够先进,那么训练成本和推理成本都能够大幅度地降低。这一情况必然会刺激整个大模型行业快速地在实际中落地,这对整个行业来说无疑是非常有益的。从行业的长远发展角度来看,DeepSeek对下游应用的落地有着很好的推动作用,像金融、互联网、法律等和编程、数理推断相关的行业,都会因为它而得到极大的发展。
中小企业纷纷涌入,AI迎来“破圈时刻”
据了解,DeepSeek - R1的训练费用还不到OpenAI GPT - 4o的十分之一,而且它的API定价仅仅是OpenAI o1的三十分之一。这就意味着,中小企业和个人开发者也能够轻松地使用这种高性能的人工智能技术了。
蚁智岛科技使用DeepSeek的服务已经有半年时间了,见证了它从v1到v3再到R1的版本更迭。蚁智岛科技的CEO隋阔表示,DeepSeek最核心的影响就是让AI实现了“破圈”。凭借其强大的产品实力,很多原本不在这个圈子里的人也能够迅速地了解到这一产品形态。“春节回来之后,有不少老板主动联系我,想要加快推动AI在企业中的落地。虽然大家在理解上还是存在一些差异,但是DeepSeek的接受度已经大大提高了。”
市场对DeepSeek浓厚的兴趣,也在各行各业的加速布局中体现得淋漓尽致。
上海钢联在2月5日发布的调研纪要中提到,DeepSeek - R1开源推理模型成本低、推理能力强,对于大宗商品语义理解的复杂性能够进行更好的处理。该公司还表示,希望能够尽快把基于DeepSeek的“小钢”做出来,在一季度借助DeepSeek - R1快速蒸馏出全新的“宗师”模型,并且切换“小钢”的基座模型。
2月6日,智云健康宣布将DeepSeek - R1模型接入公司自研的医疗人工智能系统“智云大脑”。这一举措将会增强智云医疗大脑的数据挖掘能力,从而提高慢病管理的效率。
中信证券发布研报称,DeepSeek是国内AI在生态级别的一次突围,有望带动国内AI全产业的快速发展。同时,它开源和低成本的特性也有望为AI应用厂商赋予能量,加速推动端侧AI的落地。
也有专家提出,在未来,大部分的企业或者个人都能够轻松地在本地部署DeepSeek,到那个时候,DeepSeek对于AIGC类公司的影响将会逐渐降低。企业的竞争力最终还是取决于自身的AI应用场景和产品。
方汉告诉记者:“整个行业需要在算法迭代以及芯片制造和设计方面更进一步,这样才能够真正进入世界先进水平的行列。”
隋阔表示,DeepSeek的“破圈”是一个利好消息。随着算力、算法、数据等其他环节的不断迭代优化,它将会有更大的应用前景。DeepSeek开源了R1的训练方法和流程,这大大提升了训练效率,不过如果企业要进行训练的话,成本依旧是“天价”。蒸馏模型依旧更适合企业,高质量的数据仍然是核心要素。
端侧AI加速发展,激活硬件生态
实际上,和AI软件相比,这次由DeepSeek带动的端侧AI加速发展,有望极大地激活AI硬件的商业化生态。
接受采访的业内人士告诉记者,端侧AI能够优化硬件性能,提高运算速度、减少延迟,同时还能够实现更复杂的任务、增强交互,并且支持更多离线等应用场景,从而全面提升AI硬件的能力和价值。2025年将会是AI眼镜、AI玩具等AI硬件行业发展的重要一年。
从技术层面来看,DeepSeek模型采用了经过改进的算法和架构,实现了算法、框架和硬件的优化协同,提高了模型在端侧设备上的运行效率,这使得端侧AI的部署变得更加具有普惠性。同时,通过知识蒸馏的方式,能够将大模型的能力高效地迁移到轻量化模型上,开发者可以快速地将其AI能力部署到硬件设备上并且针对不同场景进行定制化,这样就降低了智能产品集成AI功能的门槛。
Rokid的投资者关系负责人方雨晴表示,在智能眼镜行业,企业是否接入大模型主要取决于Token(词元)价格、平台稳定性和响应速度等因素。企业可以在前期选择多个AI大模型供用户自由选择。从行业整体来看,AI软硬件公司普遍期待DeepSeek等国产或者开源的大模型能够有更好的发展,这有助于降低行业的开发周期和投入。据介绍,Rokid专注于AR智能眼镜的软硬件研发,并且已经和通义千问等多模态大模型建立了合作关系。
华安证券的研报显示,目前国内有不少手机整机厂商推出了端侧AI功能。基于DeepSeek - R1在推理能力方面表现出色,如果这个模型能够进入AI智能终端,那么将会形成具有强大AI功能的产品,有望提升用户体验,增强产品的吸引力,从而在与其他厂商的竞争中占据更有利的地位。
从产业链的角度来看,DeepSeek也有利于SoC芯片和存储等行业的发展。
方汉说:“从行业的长远发展来说,DeepSeek会促使上游的推理芯片和训练芯片有大幅度的进步。”
泰凌微的副总经理、COO金海鹏对记者表示,随着蒸馏技术的成熟,可以预见到在泰凌微AI芯片上运行的模型也会变得更强大。不过,这些目标无法在短期内实现,还需要时间的积累。公司未来或许会在技术适配与优化、应用场景融合与生态合作方面与DeepSeek有交集。从行业的角度来看,DeepSeek推动端侧AI成本降低,使得整个端侧AI市场需求增长,从而带动端侧AI芯片公司的市场拓展。
在AI硬件的商业化落地过程中,即便有了DeepSeek也并非就可以高枕无忧了。
人形机器人被视为AI硬件应用的终极集成形态。如果将DeepSeek植入人形机器人当中,是否会迎来更大的商机呢?对此,国内一家机器人公司的相关负责人认为,DeepSeek属于ChatGPT的大类别,目前还无法深度驱动人形机器人。
陈承也表示,DeepSeek虽然在文本处理方面表现十分突出,但是目前它的多模态功能还是短板,所以其使用场景更多地聚焦在文本处理及其衍生场景上。
DeepSeek - R1模型的出现给AI行业带来了诸多影响。一方面,它以低成本优势让中小企业和个人开发者得以轻松使用,推动众多企业接入,促进了AI在各行业的应用落地,尤其在软件端助力应用产品升级。另一方面,在硬件端带动端侧AI加速发展,激活硬件商业化生态,但它也存在多模态功能短板,且企业若要训练模型成本依旧较高,不过总体上对整个AI产业发展有着积极意义。
原创文章,作者:Daniel Adela,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/11267.html