专注于AI基础设施研发的“清华系”企业无问芯穹获得七家国产芯片支持,正在打通DeepSeek - R1、V3在多个硬件平台的多芯片适配优化,且开发者已可获取相关服务。同时提到DeepSeek爆火后众多云服务商和芯片企业接入,其为国产算力带来机遇。还对比了美国模型、系统、芯片的闭环生态以及英伟达的情况,最后阐述了无问芯穹的团队背景和其在打造全国产化AI产业链中的愿景。
2月11日,在AI基础设施研发领域专注耕耘的“清华系”企业无问芯穹传来了一则重磅消息。这家企业宣布获得了七家国产芯片的支持,这七家芯片企业涵盖了壁仞、海光、摩尔线程、沐曦、昇腾、燧原、天数智芯等。无问芯穹正在积极地打通DeepSeek - R1、V3在这七个硬件平台上的多芯片适配优化工作。目前,对于广大的开发者来说,这是一个非常利好的消息,他们已经能够通过Infini - AI异构云平台轻松地一键获取DeepSeek系列模型以及多元异构的国产算力服务。自从春节前夕DeepSeek爆火以来,它就像是一块巨大的磁石,吸引着国内众多的云服务商和芯片企业。国内超30家云服务商以及近20家芯片企业纷纷宣布接入DeepSeek,大家都想要在由DeepSeek引发的流量盛宴中分得一杯羹。随着无问芯穹宣布得到这7家国产芯片的鼎力支持,并且多芯片适配的DeepSeek - R1也加入进来,DeepSeek为可控的国产算力所撬动的历史机遇变得越来越明朗化。在国内,目前的现状是大部分的国产模型都是借助国际主流芯片(像英伟达这样的芯片)来进行训练的,这样就导致了这些国产模型还没有能够与国内的AI系统、芯片形成一个完整的闭环生态。无问芯穹的联合创始人、CEO夏立雪有着自己深刻的见解。他认为,DeepSeek取得的突破激发了下游应用越来越强大的创造力。在未来,这个行业的日均tokens(token是大模型中可以理解和生成的最小意义的单位)消耗量将会达到百万亿这样一个庞大的级别。这一趋势不仅会刺激国产芯片的市场需求,而且还为打造全国产的AI产业闭环创造了极为有利的条件,从而实现更加可控的自主算力发展。再把目光投向美国,我们可以看到在美国模型、系统、芯片已经形成了一个非常完备的闭环生态。就拿英伟达来说,它的GPU之所以能够占据主流地位,与CUDA(英伟达的GPU编程平台)生态有着直接且紧密的联系。CUDA的优势在于它的软件堆栈,这个软件堆栈能够让研究人员和软件开发者更加顺利地在GPU上进行编程,并且构建各种各样的应用,还能够牵引下一代芯片的迭代方向。然而,随着技术的不断发展,Transformer架构逐渐成为主流技术方案,在开发实际应用的大模型时所需要的算子数量明显减少,这就使得英伟达依靠CUDA技术建立起来的技术壁垒优势正在一点点地被削弱。夏立雪有一个非常形象的比喻,他说:“DeepSeek作为开源模型,在AI 2.0时代所起的作用,就如同Android(安卓)在移动互联网革命中所起的作用一样,它将会重新构建整个产业生态,引发一系列的链式反应,广泛地调动起跨越软硬件以及上下游的生态,大家一起加大投入到‘模型 - 芯片 - 系统’的协同优化以及垂直打通工作中,从而继续‘打薄CUDA生态’。从某种程度上来说,CUDA已经成为历史了。”他还举例说明了这类协同优化工作的具体内容,比如根据新一代模型架构来定义未来芯片的底层电路,以及根据国产AI系统的互联通信方式来设计高效的混合专家模型结构等。据了解,无问芯穹的核心技术团队是源自清华大学纳米集成电路与系统实验室能效计算组的。自成立以来,无问芯穹一直致力于在国内算力市场格局相对分散、高端算力受限的情况下,实现不同模型和不同硬件之间的统一部署和联合优化。他们就像是在打造一个“模型和算力资源的淘宝”,把各种各样不同的模型和算力资源统一整合起来,转化为一套标准化的服务。夏立雪表达了自己的期望,他表示通过打通DeepSeek - R1、V3在国产硬件平台的多芯片适配优化,希望能够进一步团结从模型到芯片的上下游产业伙伴,在打造“国产模型 + 国产算力 + 国产系统 + 国产应用”全国产化AI产业链的进程中起到牵引带动的重要作用,集中优势资源,支持模型性能取得长足的进步,推动中国AI朝着自主可控的方向长远发展,从而为人工智能行业的发展筑牢坚实的算力基础。
无问芯穹获七家国产芯片支持进行DeepSeek多芯片适配优化,DeepSeek爆火吸引众多企业接入。国产模型训练多依赖国际芯片,DeepSeek将激发国产芯片需求助力闭环生态构建。美国英伟达有GPU与CUDA生态闭环但优势渐弱。无问芯穹团队来自清华,致力于整合模型和硬件,期望在全国产化AI产业链打造中起带动作用。
原创文章,作者:购物狂魔,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/14395.html