DeepSeek接入企业:是福是祸?

DeepSeek - R1模型展开,讲述该模型发布后众多企业接入的现象,探讨企业接入的原因、面临的问题,如成本压力、适配性等,还提及了适配厂商在这一热潮中的情况。

自1月20日DeepSeek公司发布推理模型DeepSeek - R1完整版本以来,一系列的连锁反应不断发生。这个模型通过算法优化,达成了一项了不起的成就,即以较低的训练成本就拥有了能与OpenAI推理模型o1相媲美的性能,并且还开源了。在传统的AI训练里,算力的需求如同一个无底洞,非常巨大。当整个行业都普遍认为AGI(通用人工智能)是靠强大的算力才能发展起来的时候,DeepSeek就像一个开拓者,开辟出了一片全新的领域,吸引了众多企业前来接入。所谓企业接入DeepSeek,就是企业通过自己的硬件设备连接DeepSeek的访问地址,进而获取DeepSeek的模型服务。据不完全统计,已经有超过100家国内上市公司接入了DeepSeek - R1模型,这里面包含了像阿里、腾讯、百度以及三大运营商这样本身就拥有自研模型和AI应用的大企业。时代周报记者通过采访多位业内人士发现,企业选择DeepSeek主要是基于两方面的原因。一方面,DeepSeek - R1开源得很彻底,部署起来特别方便,而且在特定的场景下展现出了极为强大的处理和推理能力。另一方面,DeepSeek的知名度越来越高,这就意味着接入的企业有机会获得它溢出的流量。从QuestMobile的数据来看,DeepSeek的日活跃用户数在2月1日就突破了3000万的大关。不过,那些大厂在接入DeepSeek模型的时候,也可能面临着巨大的亏损压力。近期,AI Infra(连接硬件和上层应用的中间层基础设施)企业潞晨科技CEO尤洋指出了一个惊人的数据,如果是满血版DeepSeek - R1,每百万token(输出)定价16元,要是每天输出1000亿token,一个月下来接入方企业能获得4800万元的收入。但是经过他的测算,要完成1000亿token的输出,需要大概4000台搭载H800的机器,按照目前H800的市价或者折旧来计算,每个月仅仅机器成本就达到了4.5亿元,这么算下来企业方每个月可能要面临4亿元的亏损,就像他说的“用户越多,服务成本越高,亏损越多”。AI Infra厂商市场负责人张迪(化名)告诉时代周报记者,距离DeepSeek开始疯狂发酵才仅仅几周的时间,软硬件适配、测试、上架等工程都是需要时间的,目前公司对外合作的项目还没有落地,所以具体的成本数据还不是很清晰。在AI这个充满变化的领域,就像潮汐一样有涨有落,企业接入DeepSeek是不是真的一本万利呢?这可能还需要再观察一段时间。再看企业接入DeepSeek的程度,目前是有所不同的。2月13日,腾讯的业务侧产品像微信、腾讯文档、QQ浏览器等先后接入DeepSeek - R1之后,腾讯自研的AI助手“腾讯元宝”也正式接入了DeepSeek - R1,这样用户就能够切换使用混元大模型和DeepSeek - R1。和腾讯几乎全面接入DeepSeek的决心相比,阿里等公司对DeepSeek的接入主要体现在自己的主营业务侧产品上,给自家自研的大模型产品留下了一部分发展空间。比如阿里的1688、钉钉、阿里云都相继接入了DeepSeek,但是其旗下的全能AI助手通义APP还没有表态。不难发现,那些接入DeepSeek的企业,首先把DeepSeek应用在了AI能力运用场景比较多的业务上。“接入模型不是比数量的多少,需求方应该充分考虑模型和业务场景的适配性。”值得买科技CTO王云峰在接受时代周报记者采访时这么说道。当下大模型的应用模式变得越来越多样,不同的模型都有各自适合的场景。值得买科技之前自己研发了130亿参数的消费大模型,也接入了一些主流的模型。当谈到接入DeepSeek的原因时,王云峰解释说,值得买科技的自研模型在商品理解、价格预测等垂直领域的能力是很不错的,但是AI技术非常复杂,单个模型不可能覆盖所有的场景。比如说做检索增强的时候,内部的工具流程需要AI合理调度,外部的通用模型很难适配,这个时候自研模型就负责内部流程调度、用户意图理解等关键任务,而通用模型就用于站内文章生成这样的通用场景。从实际的落地效果来看,DeepSeek - R1在问题处理和推理能力方面表现很出色。王云峰告诉时代周报记者,和包括DeepSeek - V3在内的其他模型相比,DeepSeek - R1生成的内容行文逻辑更加清晰,文学性也更突出。它强大的语言处理能力,让公司内容生产的效率有了显著的提升,“如果使用通用模型,还需要进行垂类数据微调才能更好地发挥作用。”网络安全公司知道创宇是更早受益于DeepSeek的企业。去年12月,知道创宇旗下的网络空间测绘引擎ZoomEye国际版就同步上线了对DeepSeek的调用支持。知道创宇CSO(首席战略官)周景平向时代周报记者表示,从接入DeepSeek到现在,ZoomEye国际版的平台注册量增长了28.5%,平台活跃度增长了121.6%,AI搜索功能使用率达到了35.8%。周景平在接受时代周报记者采访的时候,兴奋之情溢于言表。他说,DeepSeek被公司应用在漏洞挖掘、数据情报分析、规则转化处理、自动化安全运营等多个细分业务场景中。在数据情报分析方面,得益于DeepSeek等大模型的数据分析和推理能力,公司能够高效地补齐之前依赖分析师知识框架之外的细节点。“和GPT相比,DeepSeek聚焦通过低成本高性能的技术路线,降低企业的接入门槛,并且通过开源策略来促进技术普及和产业链协同,这为国内企业级应用的爆发提供了更大的可能性。”在周景平看来,DeepSeek - V3和DeepSeek - R1对接入企业的利好就在于性价比高。他说,DeepSeek开源比较彻底,同时发布了蒸馏模型的本地量化版,这让企业进行本地化部署的性价比大幅提高。企业扎堆接入DeepSeek,可忙坏了处于大模型产业链中间层的适配厂商。张迪向时代周报记者表示,DeepSeek爆火之后,来公司咨询业务的人一天比一天多。“以前一两个月才有一个来咨询业务的客户,现在我们每天都要接待十几个。”张迪说,现在几乎每天都要加班,除了应对业务咨询,还要参加直播、客户验收、商务对接等工作,公司和小组的会议往往都安排在晚上8点和9点。张迪还说,在DeepSeek大火之前,大家对于私有化部署仅仅停留在探讨产品功能的层面,而现在公司的咨询者,可能是在焦虑的驱使下,合作的目的更加明确了,双方谈话的主题大致锁定在提需求、了解产品性能、给报价这三个方面。另一位AI Infra厂商的创始人赵欣向时代周报记者表示,需求大幅增长,整个行业的工作节奏都普遍加快了,“有人手里拿着钱排队等你的产品,肯定要比没事做的时候兴奋。”他说,产品走向市场,真正被人使用,这也是个人价值层面的一种正向反馈。之前,有分析人士向时代周报记者称,由于国产算力适配成本比较高,在英伟达芯片稀缺的情况下,使用国产算力的企业接入DeepSeek可能会面临一定的财务压力,从而影响到中间层厂商的发展前景。尤洋向时代周报记者详细拆解了企业接入DeepSeek的路径,他说,DeepSeek是开源模型,接入方只要有算力就可以部署运行。尤洋提到,算力的主流提供方式一般有两种,一种是企业自有算力,比如有本地的一体机或者机房;另一种是公有云上的算力,企业可以按月租用。除此之外,还有一些云厂商提供MaaS(Model as a Service)的模式,也就是把DeepSeek模型部署到公有云上之后,需求企业再调用DeepSeek API,按照实际使用的token量付费,这种模式适合早期的轻量化探索需求。企业接入DeepSeek的成本主要分为硬件和部署成本两部分。在硬件成本方面,不同规格的硬件价格差异很大,相同规格不同规模的硬件价格也有很大的不同。“对于只需要使用模型的企业来说,选择推理芯片能够有效降低硬件成本;而对于有微调和训练要求的企业,可能在购买或者租赁硬件的时候需要使用训练芯片。另外,对于并发数量或者输出速度要求较高的企业,需要选择有充足算力和显存的芯片,这类芯片的价格会偏高。”尤洋表示。而部署成本的区别除了体现在不同规格芯片的部署难度上,还和企业的具体要求有关。比如,如果企业需要高并发、接入知识库、接入联网功能等,都会存在较大的工作量。“对于满血DeepSeek - R1 671B模型来说,本地化部署的硬件成本在百万级别,一般来说是远高于部署成本的。有些中小型企业会使用蒸馏版的模型,或者是直接调用云厂商的API,这样适配成本就会低很多。”尤洋补充道。对于业内的成本担忧,赵欣称,目前公司的客户以中小型企业和传统行业的大型企业为主,虽然公司体量、业务不同,所涉及的成本数据也存在较大差异,但从目前的适配案例来看,客户企业一般都具备承担该项成本的能力。

本文总结了DeepSeek - R1模型发布后众多企业接入的现象,深入分析了企业接入的原因,包括开源彻底、部署方便、特定场景能力强、可承接流量等,同时也指出了企业可能面临的亏损风险。还阐述了不同企业接入程度的差异,以及接入对业务的影响,如提升效率等。此外,讲述了适配厂商在这一热潮中的忙碌状态和面临的机遇,最后对企业接入的成本构成和成本压力进行了剖析。

原创文章,作者:购物狂魔,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/22612.html

(0)
购物狂魔购物狂魔
上一篇 2025年2月23日
下一篇 2025年2月23日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注