本文围绕我国7个数据标注基地展开,介绍了其数据标注规模创新高的情况,阐述了数据标注的重要性、基地的分布及取得的成果,还提及国家数据局推动产业发展的举措。
近日,国家数据局在北京公布了一则令人瞩目的消息。截至目前,我国7个数据标注基地的数据标注规模再度刷新历史记录。这7个数据标注基地的数据标注总规模达到了17282TB,如此庞大的数据量,相当于中国国家图书馆数字资源总量的6倍左右,可谓是成绩斐然。
那么,数据标注究竟是什么呢?简单来说,数据标注就是对数据进行添加标记、说明、解释、分类和编码的过程。可别小看这个过程,它可是提升人工智能算法、模型核心能力的关键环节。就如同建造高楼大厦需要坚实的地基一样,优质的数据标注为人工智能的发展提供了有力支撑。
我国的这7个数据标注基地分别位于四川成都、辽宁沈阳、安徽合肥、湖南长沙、海南海口、河北保定和山西大同。经过不懈努力,这些基地已经取得了一系列令人振奋的成果。它们目前已形成医疗、工业、教育等多个行业的高质量数据集335个。这些高质量数据集为各个行业的智能化发展提供了丰富的数据资源。而且,这些数据集还成功赋能121个国产人工智能大模型研发,助力国产人工智能在技术创新的道路上不断前进。
不仅如此,这些数据标注基地还积极引进和培育标注企业。截至目前,已引进和培育标注企业223家,吸纳标注从业人员达5.8万人。这不仅为社会提供了大量的就业机会,还带动了数据标注行业相关产值超过83亿元,为地方经济发展注入了新的活力。
国家数据局表示,接下来将加快推动数据标注产业政策落地实施。一方面,进一步畅通数据采集、标注、人工智能应用产业链,使整个产业流程更加高效、顺畅。另一方面,推动工业、金融、医疗、交通、教育等领域的高质量数据集建设,为更多行业的智能化转型提供数据支持,从而促进数据标注产业高质量发展。
我国7个数据标注基地数据标注规模创新高,介绍了数据标注的重要性、基地分布及成果,包括形成高质量数据集、赋能国产人工智能大模型、引进培育企业和带动产值等。国家数据局也将采取措施推动数据标注产业政策落地,促进产业高质量发展。
原创文章,作者:Wonderful,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/41492.html