1月31日英伟达官宣DeepSeek - R1模型作为NVIDIA NIM微服务预览版在其面向开发者的网站发布的消息,包括DeepSeek - R1在英伟达HGX H200系统上的处理能力,它在推理、数学和编码方面的出色表现,还阐述了其推理模型的工作方式。同时提到DeepSeek的爆火对全球人工智能市场格局的颠覆,从其脱颖而出的原因到它带来的投资机会以及对相关行业的影响等多方面进行了描述。
1月31日,一则重磅消息从英伟达传来。英伟达正式宣布,DeepSeek - R1模型已经以NVIDIA NIM微服务预览版的形式,在英伟达面向开发者的网站上闪亮登场。据悉,DeepSeek - R1 NIM微服务在单个英伟达HGX H200系统上,展现出了强大的处理能力,每秒最多可处理3872个Token。英伟达方面还自豪地介绍,DeepSeek - R1模型堪称最先进且高效的大型语言模型,在推理、数学以及编码这些关键方面的表现都非常出众。从英伟达平台上线DeepSeek的具体情况来看,1月31日英伟达官网发布消息表明,DeepSeek - R1是一款开源模型,并且具备先进的推理能力。与那些直接给出答案的模型有所不同,DeepSeek - R1这样的推理模型在面对一个问题时,会进行多次推理,它通过思维链、共识以及搜索方法,从而生成最佳答案。英伟达把执行这样一系列推理过程(利用推理得出最佳答案)称为测试时间扩展。而DeepSeek - R1正是这个扩展定律的一个绝佳示例,这充分证明了加速计算对于代理AI推理的需求是多么的至关重要。由于这个模型能够反复对问题进行“思考”,所以它会创建更多的输出Token,并且生成周期也会更长,如此一来,模型的质量就会不断地提高。大量的测试时计算对于实现实时推理以及从DeepSeek - R1等推理模型中获取更高质量的响应是极为关键的,这也就需要更大规模的推理部署。R1在那些需要逻辑推理、推理、数学、编码以及语言理解的任务当中,提供了领先的准确性,并且还具备很高的推理效率。英伟达表示,为了助力开发者安全地试验这些功能,并且构建他们自己的专业代理,拥有6710亿参数的DeepSeek - R1模型如今已经作为NVIDIA NIM微服务预览版在build.nvidia.com上线了。而且DeepSeek - R1 NIM微服务能够在单个NVIDIA HGX H200系统上达成每秒3872个Token的处理能力。英伟达还称,开发人员能够运用应用程序编程接口(API)进行测试和试验,这个接口预计很快就会作为可下载的NIM微服务提供,并且会成为NVIDIA AI Enterprise软件平台的一部分。DeepSeek - R1 NIM微服务通过对行业标准API的支持来简化部署工作。企业可以在它们所偏好的加速计算基础设施上运行NIM微服务,以此来实现安全性和数据隐私的最大化。借助NVIDIA AI Foundry和NVIDIA NeMo软件,企业还将有能力创建定制化的DeepSeek - R1 NIM微服务,从而用于专业AI代理。DeepSeek的爆火可以说是颠覆了全球人工智能市场的格局。北京的一位公募人士道出了DeepSeek脱颖而出的两个原因。其一便是资金优势。DeepSeek的母公司幻方量化可是中国头部量化对冲基金,曾经管理的资金规模超过1000亿元。早在2021年的时候,他们就储备了超过1万块英伟达A100/H100 GPU集群,这就为训练大模型提供了必不可少的硬件基础。这种资源的积累使得DeepSeek能够避开传统公司依赖外部融资的瓶颈,从而专注于长期的研发工作。其二是技术理想主义。梁文锋毕业于浙江大学信息工程专业,早期通过量化交易积累了资金。他坚定地相信AI将会改变世界,所以坚持将技术成果开源,以此来推动整个生态的发展。这种非功利性的理念吸引了众多优秀的年轻人才加入。从投资机会的角度出发,多位业内人士都表示,DeepSeek的AI大模型有望大幅降低AI应用的成本,从而加速对相关产业的赋能进程,这对于机器人、计算机、传媒等下游AI应用的落地来说是个利好消息。此外,DeepSeek高性价比的特征不仅仅冲击了美国AI大模型的垄断地位,而且还对国内自主可控的信心和情绪有着明显的提振作用,所以建议关注TMT、高端制造等科技成长板块。浙商证券的研报指出,DeepSeek大模型具备颠覆性的成本优势,这可能会使得传统那种以“高投入、高算力”为核心的研发路径受到一定程度的冲击,市场对算力硬件需求持续高增长的预期或许会被动摇,进而对现有的AI上游硬件企业的业绩预期和估值产生负面影响。如果DeepSeek“花小钱办大事”的创新研发模式能够持续得到验证,那么未来可能就需要警惕美股隐含风险偏好向下均值回归的压力,以及英伟达等科技巨头企业盈利和估值下修的可能,到时候美股的波动或许会加大。华泰证券研报也提到,DeepSeek从V3到R1的发展,将会进一步推动全行业大模型的提升,从而更快地追赶GPT - 4o和GPT - o1;同时成本的下降,有助于AI应用和AI终端的普及。未来行业竞争将会进入“产品能力竞争”阶段,巨头的流量优势将会进一步凸显。AI全球竞争时代已经来临,看好以DeepSeek为代表的中国大模型的崛起,尤其看好AI应用和AI终端的落地。预期未来推理成本仍将显著增长,在全球AI竞争的背景下,国产替代是算力增长的核心。
文章首先介绍了DeepSeek - R1模型在英伟达平台上线的消息及其性能优势,接着阐述了其作为推理模型的工作原理和特点。然后讲述了DeepSeek爆火对全球人工智能市场格局的影响,包括其脱颖而出的原因、带来的投资机会以及对不同行业的影响,最后通过券商研报分析了DeepSeek可能带来的对行业发展路径、企业业绩预期、估值等多方面的影响,整体展现了DeepSeek - R1模型在AI领域的重要意义和广泛影响。
原创文章,作者:购物狂魔,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/6446.html