本文來自微信公眾號:鏡相工作室,作者:馬舒葉,頭圖來自:AI生成
AI焦慮已經(jīng)從大廠滲透進了大學這座象牙塔。在一片“被替代”的憂懼聲中,一群來自非北上廣深、非985高校的大學生,主動跳進了這股浪潮——他們不是來做實習的,是來兼職“擰螺絲”的,擰的是AI大模型的螺絲。
在“AI將替代99%的崗位”和“拿AI offer月入3萬”兩種聲音的共同影響下,這批不容易擠進大廠實習隊伍的大學生,走進了大廠數(shù)據(jù)標注的流水線,成為新的AI工人。他們每天在大廠提供的兼職平臺上搶單、標注、糾錯、優(yōu)化,月收入大多在1000到2000元之間。在這條看不見的AI流水線上,他們既是訓練者,也是被挑選的對象。
他們分散在成都、鄭州、武漢、廈門等非一線城市的角落,在課余或下班后的時間里,登錄那個決定他們今晚“有活干”還是“白蹲守”的后臺,他們標注圖片,校準對話,貢獻鄉(xiāng)音,優(yōu)化代碼,試圖找到新的機會。
對于大廠來說,大學生群體兼具垂直領(lǐng)域的專業(yè)知識和充足的參與熱情,是完成最基礎(chǔ)的AI數(shù)據(jù)標注、AI回復糾錯、AI聲音識別等最合適的人群。通過向大學生伸出兼職橄欖枝,他們不僅能高效率地找到符合大模型訓練要求的人,還能減輕雇傭正職員工的成本。
這成了一場“雙向奔赴”,甚至由于供不應求,大廠AI數(shù)據(jù)標注的兼職還需要搶單。只是,這份兼職真的能成為大學生們通往AI大廠的一條曲徑嗎?
一、大學生進“廠”,擰大模型的螺絲
鄭州某高校大學教室里,剛剛結(jié)束一堂課,學生們魚貫而出,只有大三學生張瑩立刻打開手機。她要在下課的十幾分鐘內(nèi)“搶單”——在名為“Xpert”的平臺上,幾分鐘的不間斷重復點擊下,她終于搶到了一個任務(wù)。一旁的室友沒有她這么幸運,任務(wù)就像春節(jié)返家時的票,前一秒顯示還有6個,點進去的瞬間就歸了零。
她們都在做同一份兼職——張瑩稱這是給大廠的AI大模型“擰螺絲”。
起初,張瑩在學校兼職群里看到了學長的推薦。他只知道和AI訓練有關(guān),項目名稱是“字節(jié)大模型領(lǐng)域?qū)<艺衅浮薄_@份兼職不需要AI相關(guān)經(jīng)驗,只要在任何領(lǐng)域有專業(yè)知識即可,一次任務(wù)就有50-200元的收益,很適合她這樣的在校大學生。
搶到任務(wù)后,她需要根據(jù)出題專家給定的題目和答案完成評估,比如審核大模型在中文教學場景下的回復是否存在語音或語法錯誤,然后進行語言糾正。作為熟手,通常不到2分鐘她就能完成一個任務(wù)。接下來張瑩只要等待專家質(zhì)檢,通過就能領(lǐng)到對應的兼職費。
整個過程,張瑩都接觸不到真人。申請成為Xpert專家時是網(wǎng)頁提交驗證資料,做任務(wù)時也是在線查看提前準備好的說明文檔,沒有人教她怎么做,在進入這個大模型兼職平臺后,她只能單向?qū)Υ竽P洼敵觥!拔蚁袷谴竽P偷娘暳稀!睆埇摫硎尽?/p>
來自武昌理工學院的王磊今年21歲,9月開始在“Xpert”平臺上接單,做的是最基礎(chǔ)的數(shù)據(jù)標注:將圖像劃分為不同類別,區(qū)分風景圖或人物圖;給文本打標簽,判斷一篇新聞的主題屬于科技、娛樂還是體育。
“這工作聽起來簡單,但做起來挺磨人的。”王磊一般會選在沒有課的下午或晚上,一次做一兩個小時。在后臺界面上,系統(tǒng)清晰地記錄著他的“數(shù)字工時”:某天下午花費1.5小時,完成了8條文本標注和2條模型反饋優(yōu)化任務(wù),總耗時1.5小時,完成任務(wù)量10個。這些數(shù)據(jù)是他參與AI大模型訓練的證明。
不過這份兼職沒有宣傳的那樣高薪。
從去年下半年開始,王磊每周會拿出五天時間,做1-2小時任務(wù),一個月下來扣除審核不通過的任務(wù),收入在800-1200元之間。為了搶到更多兼職,王磊要找準工作日的空閑時段不斷進入后臺查看任務(wù)是否有更新。綜合算下來,時薪在80元左右。“和去校門口奶茶店搖奶茶差不多。”王磊告訴鏡相工作室。
時間長了,王磊也想嘗試那些單價更高的“出題”任務(wù),這些任務(wù)單次完成就能賺300-1000元,但往往限定在金融、法律或醫(yī)療等專業(yè)領(lǐng)域。“想拿到更高的兼職費用,得有硬知識儲備,還得會抓大模型的知識盲區(qū)。比如出醫(yī)療題,你得知道專業(yè)術(shù)語和臨床常識,不能瞎編。”非相關(guān)專業(yè)的王磊只能繼續(xù)做數(shù)據(jù)標注。
據(jù)鏡相工作室了解,除了字節(jié)推出的Xpert會招攬大模型兼職訓練專家外,阿里有曉天睿士、騰訊有AI Expert,這些大廠都會通過組建大模型專家社區(qū)構(gòu)建AI數(shù)據(jù)集。高薪則是這些兼職平臺共同的宣傳重點,比如阿里曉天睿士宣稱參與者可以獲得高達每小時1000元的高薪,只是在詳情頁里,將兼職費用的下限定為50元,并標注了“以最終項目定價為準”。
兼職的出題要求,希望題目難倒大模型。圖源:受訪者
在為大模型做數(shù)據(jù)標注、糾錯之外,這些遠離一線城市的大學生們也有別的兼職機會。
遠在福建的林薇正在讀博一,今年在一位山東曲阜師大的朋友介紹下,她踏入了一個更為隱蔽和原始的AI數(shù)據(jù)采集層。她主要為大模型提供“聲音”——閩南語和臺灣腔普通話的錄音及轉(zhuǎn)寫。
由于福建方言“神似”臺灣腔,林薇得到的第一份任務(wù),是用閩南語或臺灣腔普通話進行自言自語或雙人對話,錄制好的音頻將作為“語料”用于訓練大模型的語音識別能力。隨著和AI打電話、AI錄音轉(zhuǎn)寫成為大廠AI App的標配功能,大廠也需要更多方言作為語料喂養(yǎng)大模型。因此,林薇接觸的也不止Xpert,還有一些專門為大廠處理數(shù)據(jù)需求的中介平臺。
只是想憑賣聲音賺錢并不容易,這份兼職的要求極其繁瑣。有的項目要求在不同的環(huán)境噪音(低、中、高分貝)下進行錄音,但“錄音平臺非常不穩(wěn)定,有時一直進不去”,而且噪音分貝往往很難把控。
平臺審查更嚴格的是后續(xù)的文本轉(zhuǎn)寫工作,她稱之為“翻譯”。轉(zhuǎn)寫的文本將被喂給大模型,打磨大模型方言音頻轉(zhuǎn)化文字的識別能力。而由于閱讀這份文本的是大模型,林薇必須要寫成大模型能讀懂的樣子。她不僅要把音頻里的內(nèi)容一字不變地轉(zhuǎn)寫,且轉(zhuǎn)寫文本只能使用逗號、句號、問號和感嘆號四種標點。這些細微到極致的格式要求,是在用最原始的人力,喂養(yǎng)AI的“標準化”輸出。
這樣的錄音往往會持續(xù)2-3個小時,但“收入情況卻不是很理想”。林薇會被一些平臺騙稿,有些中介會以各種理由推脫、扣錢。她和她的“搭子”都曾深受其害。她描述了一種典型的陷阱:一個聲稱是“豆包”項目的老板,最初承諾每人100元,但在錄音數(shù)小時后,卻以“音色不符合”等模糊理由拒絕對“搭子”付款,林薇本人也只收到了60元。
二、雙非大學生,把AI兼職當敲門磚
真正讓這些大學生感受到自己在“訓練”AI而不僅僅是“服務(wù)”AI,來自于成功“難倒”大模型的時刻。
王磊在一次針對專業(yè)編程問題的反饋任務(wù)中,提出了一個用Python實現(xiàn)二叉樹層序遍歷并優(yōu)化時間復雜度的問題。豆包大模型給出的代碼雖然能運行,但時間復雜度并非最優(yōu),并且漏掉了一個邊界條件處理。
“我把這個問題標注出來,并詳細解釋了代碼中因冗余導致的復雜度偏高,還附上了優(yōu)化思路。”王磊說,“這時候我感覺到,我們其實就是針對它的知識盲區(qū)找出邏輯漏洞,相當于幫大模型查漏補缺。”
林薇偶爾也會有一絲參與感,她專長是閩南語和臺灣腔,在和AI用方言打電話時,她會感覺“自己確實也在參與訓練大模型,給一個新的生命注入一些自己的特色,比如我們的腔調(diào),或者地方的一些文化”。
有一次標注,張瑩的題目是:當用戶說今天下雨沒帶傘,淋成了落湯雞,AI的回復是“建議下次帶傘”。張瑩立刻標注“情感類吐槽別講大道理”,建議AI要先情感關(guān)懷,再加一句實用建議。還有次張瑩向AI吐槽課時太長時,大模型回復“我懂這太累了,忙完記得喝點小甜水”,張瑩會嘀咕,“這搞不好是我當初標注過的”。
盡管做的是最基礎(chǔ)的工作,但偶爾,他們也能從“擰螺絲”中獲得一絲超越金錢回報的微妙體驗。
而對于這些雙非大學生而言,這份兼職的更大意義,是給自己的簡歷添彩。
“我做這個,一是因為和專業(yè)相關(guān),二是想給簡歷加上AI相關(guān)經(jīng)驗。”張瑩坦言,她學的是國際中文教育專業(yè),中文語用偏誤糾錯本就是課程內(nèi)容。
在AI引發(fā)熱潮的這兩年,中文教育專業(yè)的就業(yè)越發(fā)緊張。不少教輔和留學機構(gòu)都引入了AI輔助學生學習,傳統(tǒng)的中文教育崗位薪資一再走低。而張瑩在鄭州讀書,能接觸到的大公司并不多,這份AI兼職對她意義重大。
就在這個月,張瑩得到了一家頭部教培機構(gòu)的實習面試邀約,是做“AI+教培”的課程開發(fā)崗位,HR在邀約時就表示了對她大模型兼職經(jīng)歷的興趣。“如果沒有相關(guān)兼職經(jīng)驗,我連實習邀約都拿不到。”張瑩告訴鏡相工作室,并非985學歷的她在之前找實習時總會在第一輪簡歷初篩時就被篩下來。
面試時,張瑩也被HR問到了大模型訓練的具體流程和錯誤校準的邏輯,這些她都能結(jié)合之前的經(jīng)歷講解清楚。最終,她得到了這次實習機會。
計算機相關(guān)專業(yè)的王磊也有規(guī)劃。“我會在簡歷里寫‘參與過AI大模型訓練相關(guān)兼職,負責過文本或圖像數(shù)據(jù)標注,累計完成了多少任務(wù)量’。”他強調(diào),“這樣就不是空泛地說‘我做過AI兼職’,而是有具體成果。對非相關(guān)專業(yè)、想往AI領(lǐng)域靠的同學來說,是給履歷添彩的。”一段大模型相關(guān)實踐,或許是他們跨越學歷和地域門檻,拿到理想offer的一次機會。
三、AI時代的另一面:焦慮的大學生們
時代變了,象牙塔里的大學生們也感知到了用人市場的變化。
一方面,企業(yè)期待引進AI以實現(xiàn)降本增效,在微軟、亞馬遜、X等科技大廠宣布更多代碼由AI生成的同時,美國科技行業(yè)截至今年7月已累計裁撤近9萬崗位,同比增長36%。傳統(tǒng)崗位在縮減,AI相關(guān)崗位招聘在增多。根據(jù)獵聘數(shù)據(jù)研究院,今年上半年,AI技術(shù)新發(fā)職位整體增幅為36.82%。大廠校招成了風向標,以阿里今年秋招為例,計劃發(fā)出的7000多個offer中,AI相關(guān)崗位占比超六成。
11月,馬斯克宣布X用AI模型替代了大量員工,負責平臺安全的工程團隊裁員90%。圖源:社交媒體
隨著AI技術(shù)的狂飆猛進,這群身處浪潮之中的年輕人,對于自己的未來既有憧憬,也有危機感。
王磊已經(jīng)開始感受到就業(yè)市場的壓力。作為計算機相關(guān)專業(yè)的學生,數(shù)據(jù)分析師是此前不少學長學姐的就業(yè)方向,而如今不少崗位已經(jīng)被AI替代。“有學長告訴我,他的公司引入大模型后,數(shù)據(jù)部門裁員了30%。”再加上處在湖北,能供王磊選擇的公司并不多,他也沒有雙一流的學歷優(yōu)勢,畢業(yè)后,王磊要面臨更嚴峻的就業(yè)環(huán)境。
除了找工作越來越難,王磊還意識到,“AI時代一個人要身兼數(shù)職,比如會軟件開發(fā)的人還得懂運維。以后數(shù)據(jù)分析也可能被AI替代。企業(yè)需要的工作人員要同時兼具多個角色,或者被機器人取代。”但他還是保留了一絲樂觀,“不過機器人還是要有人來操控的。”
做大模型相關(guān)兼職成為了他們在大學階段對抗焦慮的方法之一。
大廠的模型訓練需求催生了這些兼職平臺,在國內(nèi)有Xpert、曉天睿士、AI Expert和各種中介平臺;在海外,也有以O(shè)penAI為大客戶的Mercor,剛在8月完成3.5億美元的C輪融資,估值達到100億美元。不過,對這些雙非大學生來說,即便是這些低門檻的兼職平臺,也越來越卷了。
已經(jīng)工作3年的張毅見證了這條流水線從“藍海”到“紅海”的變遷。“2022年那會兒,搶單接單都容易。平臺剛推出這類任務(wù),做的人少,甚至不算嚴格意義上的搶單。”他回憶,那時平臺每天有固定任務(wù)或時段性上新,無需掐點蹲守,即便下班晚上七八點登錄,也照樣有活干。
與王磊這樣的“新手”相比,在成都工作的張毅可謂是這條流水線上的“老師傅”。93年出生的他,從2022年就開始游走于美團的“龍貓數(shù)據(jù)”和字節(jié)的“Xpert”兩個平臺之間。
他記得自己是如何“入行”的:“當時刷到一個職場圈的公眾號,推送了龍貓的兼職,標題寫的是‘本地生活內(nèi)容校準,下班就能做’,就去了解了一下。”他所做的“本地生活內(nèi)容校準”,是為AI對話進行校準,涉及社區(qū)周邊商鋪的推薦、便民服務(wù)點的位置信息,以及口語化表達的準確性。
那是屬于早期參與者的“紅利期”。張毅細數(shù)著當時的“好光景”:一條合理的方言便民指引能拿到1到2元,一組十條的地址校準報酬是8到10元。“那會兒下班做個一兩小時,周末抽半天時間,一個月下來賺2000到4000元都非常輕松。”不過,當下?lián)寙巫冸y了,隨著越來越多人涌入,數(shù)千個任務(wù)往往不到一分鐘就會搶光,他說:“未來肯定會更卷。”
“在訓練AI的時候,我不再是牛馬,而是牛馬的飼料。”張瑩的一句話,為這份看似站在技術(shù)前沿的AI兼職,添上了一抹現(xiàn)實底色——在宏大的技術(shù)敘事下,個體感受到的是自身的渺小與工作的瑣碎。在張瑩看來,AI吸收她的經(jīng)驗、知識,變成一個更強大、更不知疲倦的牛馬,最終也難免會取代她。不過眼下,她還是可以通過訓練AI先得到工作機會。
隨著大廠在AI大模型訓練上的持續(xù)加碼,這條由代碼、數(shù)據(jù)和聲音構(gòu)成的龐大流水線將持續(xù)運轉(zhuǎn),這些大學生們則是這條流水線上沉默的大多數(shù),終將成為智能涌現(xiàn)后不被看見的“微塵”與“聲紋”。
本文來自微信公眾號:鏡相工作室,作者:馬舒葉
