您当前的位置:首页 > 电脑百科 > 人工智能

数据标注师:化“人工”为“智能”

时间:2023-08-22 09:47:15  来源:中国青年报  作者:

 人工智能训练师于2020年正式成为新职业并纳入国家职业分类目录。2021年,《人工智能训练师国家职业技能标准(2021年版)》发布,数据标注员是人工智能训练师的工种之一。

  ——————————

  4年前,陈霞还是一名全职妈妈,也从没想到自己会成为人工智能领域中的一员。如今,31岁的她已经是一名资深的数据标注师了。

  她参与的是无人驾驶项目,负责在电脑上对车在道路上采集的现实交通场景的原始数据进行处理,将其转化为机器学习可识别的专业数据。

 

 

  “比如道路上的各种障碍物、建筑、绿植,各类车道线以及行人等,我们要把这些人、物标出来,我们就是无人驾驶车的眼睛,告诉它们看见的东西是什么,应该怎么去行驶。”陈霞这样描述着她的工作。

  有多少智能,就有多少人工

  “数据标注是机器感知现实世界的起点,是大部分人工智能算法得以有效运行的关键环节。”百度智能云数据标注基地业务产品负责人胡驰说,简单来说,数据标注是对未经处理的语音、图片、文本、视频等数据进行特征标签,将非结构化的数据转变为机器可识别的结构化数据,使机器通过大量学习这些数据,化“人工”为“智能”。

  数据标注师是伴随人工智能发展诞生的新职业,人工智能的进步离不开数据的标注。随着中国人工智能产业的高速发展,数据标注师这个新职业的需求及人数也在壮大。作为人工智能的“启蒙老师”,数据标注行业流行着一句话,“有多少智能,就有多少人工”。

  目前,数据标注不仅服务于自动驾驶行业,还服务于医疗保健、智能安防、新零售等场景。

  帅双双是一名医疗数据标注师,他的工作主要是对医疗类问答进行标注,纠正生成式人工智能对医疗相关问题的解答,主要用于在线问诊等场景。他介绍说,“比如向AI提问心脏病的并发症有哪些,我们要从它的多个回答中标注出符合问题的选项。有时,AI的回答虽然正确,但是语句不通顺、不清晰,我们也要对此进行标注,通过这些操作,综合培养AI的回答系统。”

  AI技术的落地应用在很大程度上缓解了医疗资源紧张、地区分布不均等问题,提升了医疗体系的整体运行效率。数据标注有望在增强人工智能在医疗保健领域的应用方面发挥重要作用。

  胡驰表示,目前,人工智能技术不断演化、技术与行业场景融合不断泛化,这些都需要大量的数据支撑,会对数据产生许多新的需求。数据标注也从早期的相对通用数据向专业化、复杂化方向演进。越来越多的细分场景,需要更多定制化模型进行迭代训练,这也让数据标注师面临更多考验,“未来,数据标注师会伴随人工智能的发展不断成长与变化,具备较长的职业生命周期与上升空间。”

  数据标注师需求多元化 门槛高低各不同

  天眼查数据显示,目前我国有2000余家与“数据标注”相关的公司。其中,成立1-5年的占比24.2%,成立10年以上的占比50.8%。

  人工智能训练师于2020年正式成为新职业并纳入国家职业分类目录。2021年,《人工智能训练师国家职业技能标准(2021年版)》发布,数据标注员是人工智能训练师的工种之一。

  德勤发布的《2022年人工智能基础数据服务白皮书》显示,2022年中国人工智能基础数据服务市场规模为45亿元,预计2027年市场规模将达到130亿-160亿元。胡驰认为,人工智能技术的迅猛发展,带来了大量AI算法的训练需求,这推动了数据标注产业的快速增长,人工智能训练师的规模也由此快速增长。

  数据标注工具使用户能够通过向数据添加属性标签或对其进行标记来提高数据的价值。使用标注工具的主要好处是数据属性的组合使用户能够在单个位置管理数据定义,而无需在多个地方重写类似的规则。

  大数据的兴起和大型数据集数量的激增,也需要使用人工智能数据标注领域的技术。蚂蚁公益基金会副秘书长黄庆委表示,数据标注行业有望受益于对机器学习改进需求的不断增长,以及对先进自动驾驶技术投资的不断增加。

  对于未来,帅双双表示,随着数据行业的发展,未来行业的门槛会越来越高。人工智能应用场景在不断细分,数据分类也更加精细化、复杂化,作为数据标注师必须不断学习以满足行业发展需求。

  胡驰表示,数据标注行业对人才需求具有多元性,不同的标注数据与场景,对人员要求也呈现出一定的梯度分布的特征。较为低阶的标注如标点、划线等,对标注人员的要求往往不高,普通人经过培训即可胜任;中高阶的标注,如对自动驾驶、大模型等的标注,则对标注人员的要求更高、更专业。而一些细分复杂场景可能会需要更专业、更高学历的数据标注师来提供数据服务。胡驰认为,“未来,随着人工智能的不断发展,数据标注可能将从劳动密集型产业转向技术型产业。”

  中青报·中青网记者 高蕾 来源:中国青年报



Tags:数据标注师   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
数据标注师:化“人工”为“智能”
 人工智能训练师于2020年正式成为新职业并纳入国家职业分类目录。2021年,《人工智能训练师国家职业技能标准(2021年版)》发布,数据标注员是人工智能训练师的工种之一。  &m...【详细内容】
2023-08-22  Search: 数据标注师  点击:(216)  评论:(0)  加入收藏
▌简易百科推荐
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(1)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(1)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(1)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(2)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(2)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(4)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(5)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
第一批用 Kimi 做内容的网红已经杀疯了
作者:王东东 文章来自:斗战圣佛小组技术信仰派 VS 市场信仰派 朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是:大模型有没有戏。技术派...【详细内容】
2024-04-04    斗战圣佛小组  Tags:Kimi   点击:(4)  评论:(0)  加入收藏
昆仑万维发布面向人工智能时代的六条人才宣言
过去的一年多,是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里,我们见证了人工智能的快速发展和广泛的影响,人工智能已经迅速地融入了我们的生活,深刻...【详细内容】
2024-04-03    砍柴网  Tags:昆仑万维   点击:(7)  评论:(0)  加入收藏
相关文章
    无相关信息
站内最新
站内热门
站内头条