曼孚科技CEO揭秘:数据在AI发展中的关键角色

本文围绕博鳌亚洲论坛2025年会上人工智能技术发展的讨论展开,曼孚科技CEO赵剑接受采访,阐述了以大模型为代表的新技术推动AI发展、数据在AI中的核心作用、自动驾驶对数据需求的变化,以及从AI到AGI数据需求的转变等内容,还分析了全球科技巨头加大AI数据中心投资的趋势和未来数据处理的突破点。

在2025年的博鳌亚洲论坛年会上,人工智能技术的发展成为了众人热议的焦点话题。

曼孚科技的CEO赵剑,在参加会议期间接受了南方财经记者的专访。他指出,当下以大模型为代表的一系列新技术,正引领着AI步入新一轮的发展热潮。像自动驾驶、AI大模型等AI核心应用场景,正逐步迈向商业化的道路,人工智能与我们的日常生活联系也变得愈发紧密。

而在这繁荣发展的背后,数据正如同“燃料”一般,推动着AI不断向前发展。赵剑强调,数据已然成为决定AI模型上限的关键要素。“对于整个AI行业来说,算法、算力与数据是构成AI的核心三要素。其中,数据处理在AI时代占据了70% - 80%的工作量。” 随着智能驾驶即将成为汽车的“标配”,赵剑预测,在未来3 - 5年,将会产生极为庞大的数据标注需求。而构建一个从数据采集到模型训练的一体化平台,将是行业实现突破的重点方向。

对于全球科技巨头纷纷加大对AI数据中心投资这一趋势,赵剑表示,这标志着对于AI基础设施的争夺已经进入了白热化阶段。谁能够掌握AI数据,就意味着谁将掌控AI时代的基础设施。“所以,在AI时代,我们必须牢牢地将数据这项基础设施掌握在自己手中。”

在接受《全球财经连线》的访谈时,有记者提问:“人工智能在过去几年取得了哪些显著进展?目前处于怎样的发展阶段?”

赵剑回答道:“以大模型为代表的新技术的出现,掀起了人工智能新一轮的发展热潮。自动驾驶、AI大模型等AI核心应用场景逐渐走向商业化,让人工智能与日常生活的联系更加紧密。目前,人工智能正逐渐从实验室走向产业端,开始在各个场景实现落地应用,比如自动驾驶。基本上在未来三到五年,首先中国所有的车企都会标配L2智驾,提供辅助驾驶功能,之后智驾会成为全球所有车企的标配,这会给消费者带来更好的体验。”

记者又问:“作为曼孚科技的CEO,您如何看待数据在人工智能发展中的核心作用?比如在自动驾驶和大模型领域,数据质量和处理能力如何影响技术的进步?”

赵剑解释说:“从行业角度来看,数据标注作为AI产业的重要一环,已经得到了投资人的广泛认可。对于整个AI行业而言,算法、算力与数据是构成AI的核心三要素。其中,数据处理占据AI时代70% - 80%的工作量,数据已成为决定模型上限的关键。算法模型从技术理论到应用实践的落地过程都依赖于大量的训练数据。正因如此,数据标注已逐渐从一个辅助角色,转变为决定AI模型精度、鲁棒性和泛化能力的关键因素。”

他还打了个比方:“数据标注在AI产业链中的位置就如同台积电在芯片产业链中的位置一样,都是将算法(芯片)训练调优(制造)出来,以供终端市场使用。早期芯片依靠‘手搓’就能生产,但随着制程要求越来越高,只有更先进的制程技术,才能生产出高端芯片。这与数据标注行业相似,早期可以通过手动标注简单数据,但随着算法模型更加精细化,场景更复杂,以自动驾驶为代表的新业务兴起,对标注平台产品的场景覆盖度、自动化水平以及协作能力提出了更高的要求。产业链中,数据标注已成为类似芯片生产制造一样的高端制造业。”

“在人工智能与机器学习领域,标注数据的质量直接关系到模型的学习效果和预测能力。高质量的标注数据不仅能帮助模型更准确地理解数据模式,还能提高其在不同任务中的预测精度。此外,规模化的标注数据能增强模型的泛化能力,支持更复杂的模型训练。最后,在机器学习与深度学习模型的训练中,数据标注质量直接关系到模型的泛化能力,尤其在模型应用于训练数据之外的环境时,其性能稳定性尤为关键。”

记者接着问道:“自动驾驶行业对数据的需求相对明确。随着自动驾驶商业化的加速,数据需求是否会迎来更大的爆发?”

赵剑肯定地回答:“会的。从技术角度来看,近些年兴起的端到端、BEV Transformer等技术方案,都是以数据为核心的方案,相关算法模型的训练与迭代需要海量标注数据。从行业角度来看,随着以比亚迪为代表的车企开始推进全民智驾后,未来3到5年,国内所有车企都会标配L2智驾,提供辅助驾驶功能,此后智驾也会成为全球所有车企的标配,这在给消费者带来更好的体验的同时,也会诞生规模庞大的数据标注需求。近几年,曼孚科技每年业务量都能实现成倍增长,这既与自身坚定不移的投入与努力相关,也离不开数据标注市场规模的快速扩张。”

当被问到“从AI到AGI,对数据的需求将需要哪些变化?”时,赵剑表示:“数据体量从海量到超大规模,AGI需要模拟人类综合智能,其训练数据量需可能接近甚至超越人类终身学习的数据量,复杂度也是几何级提升。此外,数据类型将从单模态到多模态融合。AGI需同时处理文本、图像、音频、视频等多种模态信息,并实现跨模态关联。”

对于“全球科技巨头们正不断加大对AI数据中心的投资。您怎么看?未来数据处理的核心突破点可能在哪些方面?”这一问题,赵剑说:“这代表着一种趋势,数据之于AI的重要性得到了更为广泛的认知。同时,全球科技巨头们不断加大对AI数据中心的投资,也意味着对于AI基础设施的争夺开始变得白热化。谁掌握了AI数据,也即意味谁将掌握AI时代的基础设施。就像PC时代微软凭借操作系统掌握基础设施,互联网时代谷歌凭借广告平台掌握流量入口一样,数据之于AI的重要性逐渐被大众所认知,在AI时代我们必须要将数据这项基础设施牢牢把握在自己手中。未来数据处理的突破点主要集中于产品技术层面。只有构建从采集、标注、管理、训练的一体化闭环平台,才能实现对数据的有效管理。这也是曼孚科技正在做的事情,目前曼孚科技已构建起涵盖数据标注平台、数据管理平台与模型训练平台的闭环体系。”

本文围绕博鳌亚洲论坛上对人工智能发展的讨论,通过曼孚科技CEO赵剑的观点,详细阐述了数据在AI发展中的核心地位,包括其在决定模型上限、推动应用场景商业化等方面的关键作用。同时,分析了自动驾驶商业化对数据需求的增长以及从AI到AGI数据需求的变化,还指出全球科技巨头对AI数据中心投资的竞争趋势和未来数据处理的突破方向,强调了掌握数据基础设施的重要性。

原创文章,作者:Sorrowful,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/48685.html

(0)
SorrowfulSorrowful
上一篇 2025年4月1日
下一篇 2025年4月1日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注