5月,长沙,湖南大数据交易所大屏幕上,一组数字在跳动:近1亿元数据标注订单、96个高质量数据集产品、42家单位现场签约、意向合作6107万元。这是2026年“模数共振 智赋潇湘”湖南省高质量数据集供需对接大会的现场。

5月,全省高质量数据集供需对接大会在长沙召开,现场达成意向合作6107万元,集中发布近1亿元数据标注订单和2012个AI数据人才岗位需求。
两年前,长沙被列入全国首批7个国家级数据标注基地。湖南以此为支点,将数据标注产业纳入全省“人工智能+”行动整体布局,明确推动各类建设主体加强高质量数据集和语料库建设。
两年来,湖南依托长沙国家数据标注基地,累计在文化旅游、医疗健康、工业制造、智慧农业等18个行业领域建成172个高质量数据集,数据总规模突破5.91万TB。
数据的背后是一场静默的产业突围:湖南正把海量数据资源转化为人工智能的核心驱动力。
筑基:打造AI的“学习标准”
面对AI浪潮,湖南按照“人工智能赋能行业发展到哪里,行业高质量数据集建设和服务就跟进到哪里”的要求,积极构建高质量数据集建设体系。早在3月,省数据局发布的《2026年政务服务和数据工作要点》明确提出,要出台“高质量数据集建设行动方案”“建设一批行业高质量数据集”。
将浩如烟海、杂乱无序的图像、语音、文本等数据,转化为AI可理解的“语言”,其中的关键工序便是数据标注。
在天心经开区园区里,标注员张星盯着屏幕,放大了一张长沙某路口视频里的3D图。他描点、分类、打标签,一笔一笔描出车道线、井盖、路灯、交通标识等。在湖南,像张星这样的数据标注员数以万计,他们是数字时代的“基建工人”,也是培育AI的老师。
“你喂给大模型什么水平的数据,它就长成什么样的脑子。”长沙谱蓝网络科技有限公司董事长蔡立说。这家企业从2015年地理信息标注起步,如今已成为国内数据标注行业第一梯队的服务商,为高德、百度、腾讯、科大讯飞等头部企业提供数据服务。
数据质量决定了AI的“智商”上限,只有高精准度的数据标注才有“高含金量”的数据集:车道线偏移1个像素,自动驾驶汽车可能压线;交通标志漏标一个,可能导致AI违章。
截至目前,长沙已构建“1个综合标注基地+7个行业标注基地”的特色布局,引育数据标注企业54家,带动相关产业产值突破120亿元。
赋能:高质量数据集驱动千行百业
筑基已成,赋能正酣。在2026年湖南省高质量数据集供需对接大会上,多家企业拿出了“教学方案”。
在中广天择的数据采集棚里,6台摄像机从不同角度同时录制专业运动员的出拳动作。10000+小时实拍数据、50万+复杂动作、2000+真实场景,一个动作被拆解成数百个瞬间,一招一式被拆解成三维空间里的坐标点。这些数据聚合成“高清连续多视角4D视频数据集”,成为机器人理解人类姿态与空间关系的“教材”。
“辛追夫人的晚宴”马王堆VR沉浸式互动展背后,离不开芒果数智打造的“中华历史文博多模态高质量数据集”。它整合了全国100家文博机构资源,覆盖中华文明24个历史时期,总规模达200TB,是全球已知规模最大、知识密度最高的文博专题数据集。
这些“教科书”背后,是湖南两年多来在数据规模与质量上的厚积薄发。目前,全省已累计建成近300个数据集,涵盖文本、语音、图像、视频等多类模态。其中,“融合高精实测、仿真与开放道路场景的多源多模态智能驾驶数据集”等2个数据集建设案例成功入选国家典型示范案例,“千博AI手语翻译高质量数据集”等2个项目获批国家高质量数据集建设先行先试试点,示范引领作用不断凸显。
高质量数据集正成为大模型研发的“燃料”。湖南林科达打造常见害虫、松材线材线虫变色立木等11类专业数据集,支撑全省首个多模态智能体“湘林慧”及20余项垂直模型研发,在湖南、江西、广西等多个省份林业部门应用。数字天蚂的高质量数据集有力支撑AI健康助手“蚂蚁阿福”建设,推出健康问答、健康陪伴、健康服务三大功能,用户数突破1亿。
赋能行业应用成效同样显著。在视频文创领域,长沙汇聚全球218万注册用户,积累超过500万个高质量3D数字资产,服务华为、腾讯、阿里等5000余家单位,平台交易额突破2亿元。在智慧农业领域,惠农科技的数据服务赋能行业客户100余家,年助农撮合交易额达540亿元,粮食增产约10%、亩均增收约500元,带动社会经济效益逾1000亿元。在智能网联汽车领域,建成开放道路、无人驾驶环卫等数据集,规模达1001.5TB,应用于智能驾驶算法训练、路径规划等场景,加速自动驾驶技术落地。
育才:构建AI的“专家库”
“数据生产、流通在加速,标注需求规模总量翻倍增长,用人需求较大。”近日,湖南琪耀科技有限公司董事长黄恺一语道出了行业紧迫感。
且随着AI向专业化、精细化演进,医学影像标注需要解剖学等医学知识、高精地图标注需要测绘基础、方言语音标注需要语言学敏感度……数据标注产业,正经历从劳动密集型向知识密集型的深刻转型。
人才从哪里来?湖南的答案是产教融合。
在首批长沙市数据标注产教融合人才实训基地名单中,神州映晟、琪耀科技、甲骨文教育科技、长沙联通被列为示范引领单位。大会现场,14家数据企业与8所高校完成产教融合项目签约。
“我们把真实的数据标注项目搬进课堂,让学生们更了解数据标注的底层逻辑。”长沙市数据标注协会会长、神州映晟产教融合基地总经理吴名为介绍,目前,基地已与湖南外贸职业学院、湖南交通职业技术学院等14所高校共建产业学院,通过开设订单班等方式,学生毕业即可上岗。
通过订单班接触到数据标注的张星说:“我们的工作能不断推动AI进步,未来还会继续从事这一行业。”
2026年,长沙出台《长沙市数据标注产教融合人才实训基地管理办法》,充分发挥61所高校资源优势,建成13个数据标注产教融合人才实训基地,培育标注人才达10万余人。
兹焉如有价,北斗量黄金。两年来,湖南从“数据多”走向“数据好”,这个中部省份正在为人工智能打下最基础也最坚固的“地基”。
(文/杨小康 吴媚 图/杨小康)

湘公网安备:43010302000524号

继续访问