那些给人工智能打工的人:我就是人工智能,前面那个“人工”(企业招聘信息免费发布,关键词优化)

时间:2024-05-08 10:04:47 作者 : 石家庄SEO 分类 : 关键词优化
  • TAG :

    %E9%82%A3%E4%BA%9B%E7%BB%99%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E6%89%93%E5%B7%A5%E7%9A%84%E4%BA%BA%EF%BC%9A%E6%88%91%E5%B0%B1%E6%98%AF%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%EF%BC%8C%E5%89%8D%E9%9D%A2%E9%82%A3%E4%B8%AA%E2%80%9C%E4%BA%BA%E5%B7%A5%E2%80%9D

这里生产你美颜时“一键瘦脸”的尖下颌,你一起学猫叫时的动态胡须,生产张学友演唱会被实时识别的犯人,生产未来的自动驾驶,智能门禁……

这里是中国特色的数据车间,他们遍布在河南、山东、河北等地的四五线小城里,日以继夜地为世界领先的AI产品服务。

越来越多的人正在加入他们的行列,成为为人工智能打工的人。

“梯子(可以移动的)”

马萌利面前出现一张欧洲户外咖啡馆的照片。她移动鼠标,绿色的画框浮现在照片上,显示备注“椅子”,她迅速在一瓶花束上补了一个绿框,标上“花(放在容器中)”。

下一张,一个日本花卉市场,几排密密麻麻的绿植中,马萌利检查了每一个标出的“花盆”。

下一张,一个美国孩子的卧室,“椅子”“桌子”……她飞速删掉了“梯子”的画框——客户要求是能移动的梯子,这种高低床上已经焊死的梯子就不能算。

下一张、下一张、下一张,不管眼前是什么场景,马萌利手速不变,依次圈出“梯子”“茶几”“地毯”“沙发”。

“梯子”“茶几”“地毯”“沙发”。“梯子”“茶几”“地毯”“沙发”……如此周而复始,不停重复循环。马萌利每天的工作从早晨8点钟开始,坐到工位,打开电脑,输入用户名和密码,移动鼠标开始标记,日复一日,每天持续9个小时。

屏幕上的图片很模糊,这些都是从全球社交网络上抓取的,角度混乱,像素也不高。那张韩国泡菜摊的照片,很明显来自一个角落里的摄像头。马萌利放大图片,在路人的脚边,圈出一个糊成一团的轮廓:“垃圾桶”。

旁边工位有人打开了音箱,活泼的流行歌响了起来:“燃烧我的卡路里!”

房间里有几百个屏幕,闪动着颜色不一的图片,每个人都在框选同样的内容:垃圾桶、梯子、茶几、地毯……这是河南省平顶山市郏县,一家叫千机数据的公司,房间看起来像一个网吧,在网络神曲伴奏下,年轻的员工们窝在柔软的沙发里,不停地拉框。马萌利是最后的审核员,她和同事要检查所有人拉的框,以保证每个画框都严丝合缝地贴着目标的边缘,图片里所有目标都要被框出来,不能有任何遗漏。

马萌利每天要检查至少1000张图。手头这个单子已经干了两个月,同事们标注了上万个垃圾桶、梯子、茶几、地毯……29岁的马萌利知道,这些标好框的图片汇总后,将发回北京一家AI独角兽公司,变成人工智能的学习材料。

她不知道的是,这几万个“梯子(可以移动的)”标注,展示了梯子的无数个样子,再经过深度学习算法加工,最终让计算机认识,这就是梯子,可以移动的那种。

她日复一日标注的数据来自百度、京东、阿里、旷视、Momenta等大公司,全部应用于人工智能训练。一种行业说法是,任何人类能在5岁之后做的事,对机器人来说都很简单,但是5岁之前,人类用本能就能理解的实际信息,计算机要用最笨的办法学习。这时候,就需要数以万计的马萌利们为人工智能提供标注服务了。

计算机认识沙发、梯子又有什么用?

马萌利回答不了这个问题,转头去问老板刘洋锋。刘洋锋今年31岁,是他去北京竞标抢到的这批活儿。他搔了搔头发,想起甲方提过一次,9月8号他们要去国外参加一场世界级人工智能比赛。“这些是给那场比赛用的?”他不太确定。再往下说,他也不懂了。

为AI服务

我来郏县的第一顿饭,刘洋锋和合伙人刘磊带我去吃了本地一家网红饸饹面,面馆有位漂亮的女主播,靠拍餐厅各种日常,在一家短视频平台上有88万粉丝。中午,餐厅两层楼坐得满满当当,一半是食客,一半是慕名而来的粉丝。

我们正好遇到女孩做直播,我发现,主播本人跟视频不一样:屏幕上她皮肤变好了,眼睛大大的,下巴更尖,苹果肌更圆。

是短视频软件的滤镜把她变美了。跟自拍软件一样,直播平台的滤镜靠的是人工智能,可以实时瘦脸、大眼并磨皮。APP之所以能识别哪儿是眼睛、哪儿是下巴,正是此前有AI数据标注工人标记了那些人脸的五官。

一直到我们离开,女孩仍一刻不停地招呼新进直播间的观众,对着镜头羞涩地笑:“我是单身,没有男朋友。”

“她是那家老板的儿媳妇呀。”说起女主播,马萌利一边对着一张俄罗斯餐厅图片拉框,一边哈哈大笑。郏县很小,藏不住什么秘密。她比画了一下公司的员工们:“生拉硬扯,我们都能扯上关系。”

同在一个县城,几年前,马萌利和女主播的处境差别不大。但技术后来将她们塑造成了两类人:马萌利成了每天为AI打工的人,而女主播运用AI提供的便利赚钱致富。

马萌利今年29岁,一见面就热情地笑,问什么说什么。初中毕业她就出门打工,在制衣厂做过缝纫,也进过富士康,做了4年线外流动员:流水线制造惠普电脑屏幕,她要随时给人做替补,前面做组装,把显示器的面板、外壳、支架都装好。后面做测试,用数据线测屏幕上有没有亮点,往屏幕上贴标签。

回乡后,她开过网吧,做过超市收银员。去年,她应聘了这份“电脑操作员”,每个月收入3~4千,比收银员高,比富士康低。她觉得工作环境不错:坐着用电脑,有空调,下班早,晚上回家还能陪孩子玩一会儿。而且,3个老板都是熟人,“我们村子都挨着,打小就认识”。

过去一年里,马萌利见过各种稀奇古怪的图片,她给人体标注过关节点,从头顶、脖子、膝盖到脚踝,一共打17个关节点;给道路图里的汽车、摩托车、自行车拉过边框,黑夜里的照片要比白天难一倍;她还录过一下午音,对着手机,念了300句话,有的短,就两个字、五个字,有的是十几二十几个字,具体内容,公司不让往外说。

2012年,谷歌大脑做了一个著名的实验:1000台计算机组成了超过10亿个“突触”连接的神经网络,研究者输入了1000万个静态图像,通过3天的密集寻找重复出现的模式后,谷歌大脑终于可以识别出一些特定的重复类别:人类面孔和人类身体,或者是一只猫。

马萌利这样的AI数据标注工人,就是给计算机输入图像,为人工智能提供学习材料的人。他们用的是最原始的办法,一张图接一张图地手动标记。他们在人脸上标注几百个记号点,让计算机知道哪里是内眼角、外眼角,瞬间扩出大眼睛;他们录入的语音信息,被拆分标注后,能让智能音箱懂得“关机”和“十分钟后给我老公打电话”是什么意思。未来,自动驾驶的车辆之所以能在路口停下,就是因为工人们标注过红灯、斑马线和一帧一帧移动的行人。

关于这项技术,最为人所熟知的一个例子是,在张学友南昌、赣州、嘉兴、金华4场巡回演唱会上,警方用安检时的人脸识别系统,一共抓获了5名在逃犯人。

我一提到这个新闻,刘洋锋立刻讲出了背后公司的名字。虽然没合作过,但知道他们是如何运转的:当逃犯们兴冲冲地拿着票走过摄像头时,他们的面部信息已经被抽取,实时传到云端,与后端数据库飞快地做比对。

这是一种无差别的信息比对,如果用传统人工,在几万人的演唱会安检现场找到一名在逃犯,需要成百上千名安防人员。现在,只要几秒钟,比对完成,系统发出警告,警察按图索骥,拿下案犯。

太简单了,就跟QQ截图差不多

这家公司只有一年历史,从设想到成立,一共才花了3天时间。

第一天,刘洋锋和另外两名创始人聚在一起,琢磨以后要干点儿什么。他翻出一个文件,一家江苏的数据标注公司在转卖一个单子,提到一个新鲜的概念:数据标注。

刘洋锋试验了一下软件,在一张马路的照片上,他给一个行人圈了一个框——太简单了,就跟QQ截图差不多。

第二天,三个人就去买了网线,去平顶山买了20个格子间卡位,旧货市场买的,90块钱一个。

第三天,面试。刘洋锋有个开手机店的老表,在乡镇里混了七八年了,“他有微信群,认识的人多,一发朋友圈就有人来。”招工唯一的要求是,年龄不要太大。招20个,去掉几个四十多岁的应聘者,正好招满。

2007年,普林斯顿大学助理教授、计算机视觉专家李飞飞第一次试验做数据标注时,她以10美元/小时的价格,雇佣了一批普林斯顿的本科生。10年后,这项试验已经演变成产业,在郏县这种中国的三、四线城市,以工厂、车间、质检员的形式落地生根。

刘洋锋的公司是在县城郊区一个农民楼里成立的。第一批员工是初中刚毕业的学生、三十多岁在家带孩子的妇女、前手机店店员和前服装店的销售员们。已经经过了江苏来的业务一道盘剥,算下来每拉一个框3分2厘钱,公司再抽成,到员工手里,变成了2分5。

一个星期之后,所有人都已经能熟练地在电脑上操作,这份工作的门槛几乎为零。电脑从20台扩充到40台、100台,一年后,已经到了500多台。员工都是本地人,马萌利的村子今年来了7个人,她骑电瓶车载我回了一趟家,10公里的村路,她小时候骑自行车,碾着泥坑,一上午都骑不到,现在变成水泥路,20分钟就到家了。马萌利家刚贷款买了一台哈弗SUV,下雨天就拉着村里人一起去上班。

夏末天气变凉,晚风吹过小河和玉米地,叶子窸窸窣窣作响。家里7岁的儿子马上要开学,趴在空调房里看恐怖片,一见马萌利回来,跳起来扑到了妈妈身上。

刘洋锋最近天天忙到后半夜,直接在办公室里睡了,一觉醒来,想起又忘了给儿子买书皮,顿时懊悔起来。他1987年出生,中专读了一半就不念了,他学的电脑专业,讲了3年,才从电脑的起源讲到怎么配置服务器。

2005年,刘洋锋跑到重庆的工地上开挖掘机,一个月就能赚五千多块钱。他买了个二手IBM ThinkPad,拿着一个蛇皮袋子装计算机教材、软件杂志,走到哪儿带到哪儿,晚上在宿舍里自学。此后,他在全国跑过饮料瓶推销,在云南红河卖过进口高档葡萄化肥,还去智利待了一个月。当时有老板想把深圳华强北的山寨机推销到南美去,让他先学了一个月西班牙语,手机生意黄了,他唯一的收获是记住了hola (你好)和gracias(谢谢)。

刘洋锋回郏县之前,还在珠海做过一段单片机,用上了自己的计算机知识。小公司攒出来一台自动化设备,能精确地拿起来、放下,专门给手机做WiFi、主板测试,这正是马萌利过去在流水线做的活儿。

单片机速度快,24小时不眠不休,花几万块买一台,一个10人的流水线小组就全被替代掉了。而大公司做AI标注的结果,也会是大规模替代人力。李开复曾撰文表达过对AI技术快速发展的担忧,认为这将导致社会结构的洗牌,贫富分化加剧,很多人将面临阶层坠落的风险,进而丧失尊严:

“这种转变将为开发人工智能以及运用人工智能的企业带来大量利润……我们由此将面临两种无法和谐共存的新情况:大量财富集中到极少数人手中,大批人员失业。”

但处于产业链末端的人,不思考这些问题。这离他们太遥远了。北京一位AI数据标注公司老板告诉我,“工人只是打开人家的网页,用人家的软件,在上面把人家的数据,按人家的格式给人家处理好,交给人家,公司接触不了人工智能任何东西,这个数据自己也保留不了。”“我们没有研发能力,纯粹也就是一个(代工的)富士康。”

在郏县,这还是个新兴产物,今年8月,刘洋锋在“郏县之窗”公众号上发了一篇招聘广告,文章把AI标注员的工作捧得很高:“在这个岗位上,其实你的一些想法就代表了人工智能的想法,人工智能会根据你加工的数据进行深度学习,从而实现智能化。”宣传的月薪是3000~8000元(上不封顶,多劳多得)。

“这都是噱头。”刘洋锋很诚实,“没有人能拿到8000,干得最好的能拿到4000多。”跟郏县遍地“2500~3000元”的招工广告相比,这已经比上不足比下有余了。这个广告是刘洋锋请朋友来写的,微信号头条的刊例价是3000块,关系好,没要钱。

前几天,县里有领导来公司参观,饶有兴致地读起墙上的海报:“......服务于百度公司、阿里巴巴、京东、腾讯、滴滴等世界500强及行业独角兽企业。”领导赞不绝口:你们这是高科技产业啊!人工智能!

刘洋锋当面也没解释,他觉得不解释更好。

中国包揽冠军

6亿美元,这是国内一家AI独角兽公司最近的C轮融资数额。国内AI市场这几年一直在风口上,所有你能想到的互联网巨头都在AI行业布局。李开复形容,这是经济上“有史以来最大的、难以打破的垄断”。

数据标注工厂,是人工智能产业体系里最末端的毛细血管,类似这样的小公司都是在巨头的夹缝里生活。刘洋锋这一年跟巨头们直接合作,现在拉一个框,员工收入6分起,最高能到1毛钱。具体价格取决于刘洋锋竞标的报价。过去几年里,行业默认百度的活儿最好:结款快,1号发过去,15号可能钱就到账了,很多小公司都把人押在百度上。

本文:那些给人工智能打工的人:我就是人工智能,前面那个“人工”的详细内容,希望对您有所帮助,信息来源于网络。
上一篇:消防温馨提示:工厂生产消防安全知识下一篇:

9 人围观 / 0 条评论 ↓快速评论↓

(必须)

(必须,保密)

阿狸1 阿狸2 阿狸3 阿狸4 阿狸5 阿狸6 阿狸7 阿狸8 阿狸9 阿狸10 阿狸11 阿狸12 阿狸13 阿狸14 阿狸15 阿狸16 阿狸17 阿狸18