“全世界进入颠覆性变革新阶段”这一论断,已成为各国企业与政府高层热议的话题之一。
此话何来,不得不提的就是美国OpenAI公司研发的ChatGPT,一经发布就引爆全球,关于人工智能的话题从来没有这么被人强烈关注热烈讨论着,毫无疑问,ChatGPT 已然成为 2023 上半年最有影响力的商业话题,为什么它会被这么多人追捧,多数人只看到它能做什么,却没有意识到它背后的技术带来的是什么,单从它目前展现的能力来看,它能做的事包括但不限于:写代码、写文章、回答问题,具备跟人一样的推理能力,这是非常难能可贵的。
过去我们一度以为,人工智能只能替代一些蓝领级别的体力劳动或者基础的脑力劳动,而ChatGPT所能做的工作都是脑力工作,人和动物的区别,就是对工具利用程度的差别。人们发明了汽车,我们解放了双脚;发明了缝纫机,解放了双手;发明了手机,解放了五官、感官。ChatGPT的出现,代表即将解放我们的大脑;因此ChatGPT被认为有可能引发下一次生产力的解放,不管是业内还是普通人都对生成式人工智能技术进步的兴奋已经达到了狂热的程度。
现在,人工智能完全可以取代一些高级的脑力劳动,最后它可以替代你、替代未来的一切工作,这并不是危言耸听,已经有大量人工客服下岗,广告创意绘画类冲击尤其严重,大量的事实证明,掌握AI应用工作能节省大量的人工。回望人类的历史,每一次生产力释放,都不仅仅是在推动商业发展,而是颠覆了国际政治格局;蒸汽机的出现,让英国成为世界霸主;电力的出现,让美国成为世界霸主;计算机出现之后,带来的机器革命和数字化,让中国快速领先于世界。
那么,人工智能是一下子就智能的吗?显然不是,在让人工智能变得智能之前,人类做了大量的工作,一直致力于让人工智能实现与人比肩的能力甚至超过人类,至少从目前显露出来的技术来看,人工智能还处于机器学习技术的半监督学习阶段:既通过一定量的数据量,从有标签的训练数据中学习模型,然后对某个给定的新数据利用模型预测它的标签。如果分类标签精确度越高,则学习模型准确度越高,预测结果越精确。
通俗来讲,这个流程就是数据标注,数据标注是基于人工智能的计算机图形识别技术,是将各种数据集标注成机器可以识别理解的技术。而数据标注师就是连接机器与人之间的老师,在中国,这属于一个全新的职业,它的全称是:人工智能训练师。而它的另一个世俗名字:数据标注师是伴随ChatGPT走到聚光灯下的。
在中国有不下于70万人从事这个职业,早些年,这个职业并不需要多高的技术和经验门槛,有很多人说这个岗位流失率很大,诟病其重复性高、没啥技术含量,在人工智能技术尚未达到机器强化学习的阶段确实需要大量的人工去训练AI识别数据,现在仍属于机器学习的深度学习阶段,深度学习是一种基于人工神经网络的机器学习方法,通过多层神经元进行特征提取和模式识别,可以实现对大规模、高维度数据的较准确的分析和预测。在深度学习领域,使用大量数据进行训练,通过反向传播算法调整神经网络中的权重,从而不断优化模型,使其在各种任务上取得了很好的效果。
数据标注对于深度学习非常重要,它是训练深度学习模型的关键。在机器学习过程中,模型需要通过大量的数据来进行训练和学习,而这些数据必须要进行标注,才能使模型正确地识别和理解数据中的内容,进而得出正确的预测结果。
数据标注师为每个数据样本赋予正确的标签或者类别,从而使深度学习模型能够学习到如何将不同的输入数据与相应的输出结果联系起来。例如,在计算机视觉任务中,对图像进行分类、目标检测等任务,都需要通过给每张图片打上标签,比如衣服、动物、车辆等,使模型能够学会对不同类别的图像进行区分和分类。
那又有人说了,既然数据标注就是教AI识别物体,那AI学会了,不就不需要数据标注了吗?虽然AI在某些情况下能够自动进行数据标注,但是在绝大多数情况下,AI无法完全取代数据标注师的作用,主要原因有以下几点:
- 需要大量的数据来训练模型。从技术上来讲,不管出于何种的场景下,对数据进行标注需要人类专业领域知识和经验,这不是人工智能现阶段可以完全替代的。同时,由于不同任务需要的数据类型、样本数量以及标注方式也存在差异,因此为了追求更高的标注质量和效率,通常需要根据具体场景进行人力和AI算法结合的标注方式,这意味着可以进行少量的标注,但完全取代不行,因为你总得需要人类来画下第一个1,往后的0可以通过AI自己学习实现。
- 需要保证标注结果的准确性和一致性。数据标注的准确性和一致性直接影响到机器学习模型的性能和泛化能力。虽然AI可以快速地完成标注任务,但是在一些需要复杂判断的情境下,其标注结果可能不如人类准确。
- 需要比较高的标注质量。在需要高标注质量的场景下,需要人类进行标注,并且还需要进行审核、纠错、迭代等工作,以保证标注质量。因此,在这种情况下,AI无法完全取代数据标注的角色。
所以可以明显判断的是,数据标注是不会被取代的,未来对从业人员的要求不单单只要求标注合格的数据,有可能数据的呈现方式都会发生变化,因此对于人员的要求会更高,有可能会参与到算法的环节当中,如果说现在的数据标注师还是蓝领岗位,那未来有可能属于教授级别的岗位,因此,我们可以得出一个结论,人工智能技术的革新迭代再快,始终无法跳过的就是:先人工、再智能!
评论留言