在人工智能发展普遍被认为依赖强大计算能力,各大公司抢购英伟达芯片、建设数据中心的背景下,新成立的合资企业Stargate计划对美国计算基础设施大额投资。而DeepSeek迅速发布两款性能相当的人工智能模型,成本极低,这一情况震惊硅谷,改变格局。同时介绍了DeepSeek成立于2023年7月,创始人梁文锋的相关情况以及他创立的DeepSeek的模型性能得到高度评价,还提到川普称DeepSeek的崛起给美国科技公司敲响警钟,最后介绍了DeepSeek总部情况、创始人梁文峰的个人经历等。
长期以来,业界有一个普遍的观点,那就是人工智能的发展必须要依靠越来越强大的计算能力。在这样的认知之下,各大科技公司展开了一系列的行动。他们纷纷开始抢购英伟达(Nvidia)最新的图形芯片,而且投入了巨额的资金来建设大规模的数据中心。最近,有一个重大的事件发生。美国总统川普、软银创始人孙正义、OpenAI首席执行官山姆·奥特曼以及甲骨文联合创始人拉里·埃里森共同宣布成立了一家合资企业,名字叫做Stargate。这个合资企业有着宏伟的计划,它打算向美国的计算基础设施投入至少1000亿美元,目的就是为了推动人工智能技术的不断进步。并且,他们还计划在未来的四年内,把投资的规模进一步扩大到5000亿美元。然而,就在这样的大环境下,DeepSeek却以一种独特的姿态出现在人们的视野之中。DeepSeek凭借低成本高性能的特点一下子脱颖而出。面对整个行业的这种发展趋势,DeepSeek迅速地推出了两款人工智能模型,这两款模型的性能和现有的模型相比是相当的。据DeepSeek公司自己透露,其中一款模型的训练成本竟然还不到600万美元,而且仅仅是依靠比较旧的Nvidia H800芯片就做到了这一点。DeepSeek还表示,他们的开源模型在使用成本方面比OpenAI的O1模型要低20到50倍呢,具体的倍数还要取决于任务的类型。这个消息一经传出,整个硅谷都被震惊了。这一情况不仅仅动摇了英伟达对于未来芯片销量的预期,而且还改变了全球人工智能竞赛的格局。那DeepSeek为什么会引发这么大的轰动呢?原来,DeepSeek是在2023年7月成立的,它的创始人是梁文锋。梁文锋在此之前就多次强调,DeepSeek要走的是开辟差异化技术路线,而不是去复制OpenAI的模式,所以DeepSeek必须得想出更有效的方法来训练自己的模型。值得一提的是,梁文锋还是头部量化私募幻方量化的创始人。大家都认为DeepSeek充分利用了幻方量化所积累的资金、数据以及计算卡等资源。DeepSeek在1月20日发布了R1模型,这个模型的性能能够和OpenAI - o1正式版相匹配。这一成果让硅谷和整个AI界都大为吃惊,因为它的大模型在某些功能上能够和OpenAI、谷歌以及Meta等公司的模型相匹敌,甚至是超过它们。而且DeepSeek - V3模型的性能更是和OpenAI以及Meta的最先进技术不相上下。硅谷的高管和科技大厂的工程师们都纷纷对这些模型给予了高度的评价。川普也对DeepSeek发表了自己的看法。据NBC报道,川普在周一的时候表示,中国人工智能应用DeepSeek的崛起“应当引起美国科技公司的警觉”。川普表示,虽然他依旧相信美国的科技公司在人工智能领域会占据主导的地位,但是他也承认DeepSeek构成了新的竞争威胁。在佛罗里达州的一次活动中,川普说:“中国公司发布DeepSeek AI应该给我们的行业敲响警钟,我们必须集中精力进行竞争。”川普还认为,这种低成本的模式对于人工智能行业来说是一个“非常积极的发展”,因为这意味着“无需花费数十亿美元,而是通过更少的投入也能找到类似的解决方案。”DeepSeek的总部位于杭州,它的主要控股股东是量化对冲基金High - Flyer的联合创始人梁文峰。在2023年3月的时候,梁文峰的基金宣布调整战略,集中资源成立独立研究小组,专门来探索通用人工智能(AGI),DeepSeek就是在这样的战略下应运而生的。梁文峰是一位80后,他来自广东湛江吴川。在2002年的时候,他以吴川市第一中学“高考状元”的身份考入了浙江大学电子信息工程专业,之后又在浙江大学攻读研究生。值得注意的是,梁文峰在读研期间,就带领着团队使用机器学习等技术来探索全自动量化交易。在2015年的时候,他成立了幻方量化,致力于通过数学和人工智能来进行量化投资。在2019年,他的资金管理规模突破了百亿元。从2020年开始,幻方的AI超级计算机“萤火一号”正式投入运作。到了2023年,幻方量化宣布成立大模型公司DeepSeek,正式进军通用人工智能领域。据梁文峰的高中同学兼好友陈先生透露,梁文锋为人非常低调朴实,而且还热心公益,曾经以个人的名义捐赠了大量的资金。陈先生还表示:“看到他取得成功,我感到非常高兴。前几天我给他发信息祝贺,他还说会回吴川过年,但今年可能要低调一些。”
本文总结了人工智能发展背景下,Stargate的投资计划,重点讲述了DeepSeek以低成本高性能的模型发布带来的震动,包括对英伟达预期和全球AI竞赛格局的影响,还介绍了DeepSeek创始人梁文峰的创业历程、公司成立背景以及他的个人品质等,同时提到川普对DeepSeek崛起的看法,认为其给美国科技公司敲响了警钟。
原创文章,作者:购物狂魔,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/5203.html