少妇被粗大的猛烈进出69影院一-国产中年熟女高潮大集合-《放荡的女人2》在线观看-色欲综合一区二区三区

天天即時(shí)看!千億 ChatGPT 的狂歡和月薪 3K 的數(shù)據(jù)標(biāo)注員

時(shí)間:2023-03-04 06:13:12 來(lái)源: 漲姿勢(shì)


文丨何蕾

ChatGPT 爆火后,AI 行業(yè)開(kāi)始了新一輪 " 搶人大戰(zhàn) ":

王慧文個(gè)人出資 5000 萬(wàn)美元,打出 "AI 英雄榜 ",要招募業(yè)界公認(rèn)頂級(jí)研發(fā)人才;獵頭瘋狂挖角硅谷華裔技術(shù)大佬,跳槽薪資 200 萬(wàn)起;"10 萬(wàn)月薪搶人 ",脈脈創(chuàng)始人兼 CEO 林凡稱(chēng),國(guó)內(nèi) AIGC 行業(yè)也在招兵買(mǎi)馬,年薪百萬(wàn)、16 薪成為 " 標(biāo)配 "。


(資料圖片)

巨頭喊話(huà)、熱錢(qián)涌動(dòng),中國(guó)版 ChatGPT,將誕生在這些頂級(jí) VC、頂級(jí) AI 人才手中。

但與此同時(shí),一個(gè)和 ChatGPT 緊密相關(guān),一個(gè)相對(duì)低廉、不穩(wěn)定的職業(yè) —— 數(shù)據(jù)標(biāo)注員,也引起了小范圍的關(guān)注和討論。

他們被譽(yù)為 "AI 訓(xùn)練師 ",但他們的工作重復(fù)、機(jī)械、枯燥。

他們是 AI 行業(yè)的 " 勞動(dòng)密集型 " 企業(yè),他們被放置在無(wú)人問(wèn)津的角落,推升了這次 ChatGPT 狂潮。

AI 訓(xùn)練師?

" 什么 AI 訓(xùn)練師,我們就是純體力活。" 何文新對(duì)數(shù)據(jù)標(biāo)注行業(yè)的總結(jié)是:無(wú)前途,無(wú)發(fā)展,工作量大,工資低," 還不如電話(huà)銷(xiāo)售。"

什么是數(shù)據(jù)標(biāo)注?

目前 " 深度學(xué)習(xí) " 是主流的訓(xùn)練 AI 模型的方式,但 AI 不會(huì)自動(dòng)識(shí)別語(yǔ)音、圖片、文本、視頻等,這時(shí)候就需要數(shù)據(jù)標(biāo)注員,對(duì)數(shù)據(jù)進(jìn)行加工處理,將一般數(shù)據(jù)變成 AI 可識(shí)別的數(shù)據(jù)。

比如,服務(wù)自動(dòng)駕駛公司的數(shù)據(jù)標(biāo)注員,每天工作就是按照要求,把不同圖上的行人、動(dòng)物、車(chē)、樹(shù)木等 " 框 " 出來(lái),以便 " 喂養(yǎng) " AI 模型。而數(shù)據(jù)標(biāo)注的類(lèi)型有圖像標(biāo)注、語(yǔ)音標(biāo)注、3D 點(diǎn)云標(biāo)注和文本標(biāo)注等。

簡(jiǎn)而言之,數(shù)據(jù)標(biāo)注員在創(chuàng)造喂養(yǎng) AI 的養(yǎng)料。從工作產(chǎn)出來(lái)看,數(shù)據(jù)標(biāo)注員確實(shí)可以稱(chēng)為 AI 的老師。

數(shù)據(jù)標(biāo)注工作并不難,只需要一臺(tái)電腦,一個(gè)鼠標(biāo);簡(jiǎn)單培訓(xùn)后,就可以上手。但是,這個(gè)工作并不輕松,需要耐心和細(xì)心。

" 很累,一整天要盯著電腦。" 何文新稱(chēng)," 標(biāo)注 " 工作重復(fù)繁瑣、沒(méi)什么技術(shù)含量,但也有質(zhì)量要求,標(biāo)注錯(cuò)了、標(biāo)注范圍大、標(biāo)注不夠仔細(xì)等,都會(huì)被審核打回去重新做。

" 很簡(jiǎn)單,但也很難。" 寶媽 lili 在網(wǎng)上吐槽,因?yàn)榻?jīng)常面對(duì)拉伸圖,很多圖片根本看不清,容易做錯(cuò)。

和 AI 行業(yè)的高薪相比,數(shù)據(jù)標(biāo)注員的工資并不高。

" 一張圖 9 毛錢(qián),一天做 100 張。"lili 稱(chēng),如果都合格,一天能賺 90 塊。

" 不同的標(biāo)注價(jià)格不一樣。" 何文新稱(chēng),他當(dāng)時(shí)的工資在 3000 左右。基礎(chǔ)的數(shù)據(jù)標(biāo)注員月薪大部分在 2000-4000 元之間,但因?yàn)闃?biāo)注的速度、質(zhì)量問(wèn)題," 很難拿到當(dāng)時(shí)面試跟你承諾的工資。"

鞭牛士在一些招聘網(wǎng)站上搜索 " 數(shù)據(jù)標(biāo)注 ",薪資區(qū)間在 2000-8000 之間。一些特殊的標(biāo)注,比如小語(yǔ)種、高精制圖等,薪酬會(huì)更高。

2020 年 2 月," 人工智能訓(xùn)練師 " 正式成為新職業(yè),納入國(guó)家職業(yè)分類(lèi)目錄。中國(guó)信通院報(bào)告提出," 現(xiàn)階段 AI 應(yīng)用研發(fā),數(shù)據(jù)標(biāo)注是根本,10 年之內(nèi)都要依賴(lài)于標(biāo)注數(shù)據(jù) "。

ChatGPT 的 " 數(shù)據(jù)標(biāo)注 " 壁壘

今年 1 月,美國(guó)《時(shí)代周刊》報(bào)道稱(chēng),ChatGPT 使用了低廉的肯尼亞外包勞工,對(duì)龐大的數(shù)據(jù)庫(kù)手動(dòng)進(jìn)行數(shù)據(jù)標(biāo)注。

打造了 ChatGPT、估值飆升至 300 億美元的 OpenAI,是否存在 " 剝削 " 廉價(jià)勞動(dòng)力的問(wèn)題?

為 OpenAI 提供數(shù)據(jù)標(biāo)注服務(wù)的是總部位于舊金山的 Sama,Sama 在在肯尼亞、烏干達(dá)和印度雇傭員工,服務(wù) Google、Meta 和微軟等客戶(hù)。

據(jù)愛(ài)范兒報(bào)道,OpenAI 在 2021 年底與 Sama 簽署了三份總價(jià)值約 20 萬(wàn)美元的合同,為數(shù)據(jù)庫(kù)中有害的內(nèi)容進(jìn)行標(biāo)記。

根據(jù)合同規(guī)定,OpenAI 將為該項(xiàng)目向 Sama 支付每小時(shí) 12.50 美元的報(bào)酬;但 Sama 支付給數(shù)據(jù)標(biāo)注員的時(shí)薪只有 1.32 美元~2 美元。

這些數(shù)據(jù)標(biāo)注員,每 9 個(gè)小時(shí)要閱讀和標(biāo)注 150~200 段文字,最多一小時(shí)要閱讀和標(biāo)注超 2 萬(wàn)個(gè)單詞。

并且,因?yàn)樗麄儤?biāo)注的是互聯(lián)網(wǎng)上的 " 有害的內(nèi)容 ",比如自殺、酷刑等,大部分標(biāo)注員受到持久的心理創(chuàng)傷,甚至出現(xiàn)幻覺(jué)。但 Sama 公司卻拒絕為他們提供一對(duì)一的心理咨詢(xún)。

這些數(shù)據(jù)標(biāo)注員,對(duì) ChatGPT 而言意義重大。為了讓 ChatGPT 成為一個(gè)適合用戶(hù)日常使用的聊天機(jī)器人,一個(gè)好的學(xué)習(xí)數(shù)據(jù)源非常重要。

比如,ChatGPT 的前身 GPT-3,就存在暴力、性別歧視等言論。用戶(hù)在對(duì)話(huà)框中發(fā)送 " 我應(yīng)該自殺嗎 " 問(wèn)題,GPT-3 回答 " 我認(rèn)為你應(yīng)該這么做 "。

在更早的 2012 年,清華大學(xué)圖書(shū)館機(jī)器人 " 小圖 ",因?yàn)閷W(xué)習(xí)了網(wǎng)友太多 " 臟話(huà) ",被強(qiáng)制下線(xiàn)。當(dāng)時(shí)有媒體報(bào)道,小圖至少學(xué)會(huì)了 4 萬(wàn)條不良信息。

AI 自身并不能判斷善惡,需要人為干預(yù),標(biāo)注、過(guò)濾掉一些 " 特殊數(shù)據(jù) "。為此,OpenAI 建立了一個(gè)安全系統(tǒng),這就是 Sama 和數(shù)據(jù)標(biāo)注員的工作:給 AI 提供標(biāo)有暴力、仇恨語(yǔ)言等標(biāo)簽,AI 就可以學(xué)會(huì)檢測(cè)這些內(nèi)容,并將這些不良內(nèi)容過(guò)濾掉。

除此之外,一些專(zhuān)業(yè)領(lǐng)域的信息,也需要專(zhuān)業(yè)的標(biāo)注。這也是為什么 ChatGPT 在回答醫(yī)學(xué)等專(zhuān)業(yè)領(lǐng)域問(wèn)題時(shí)錯(cuò)誤百出,因?yàn)樗€沒(méi)有精確地相關(guān)數(shù)據(jù) " 喂養(yǎng) "。

實(shí)際上早有業(yè)內(nèi)人士分析,ChatGPT 的算法并不神秘,比如公開(kāi)的成熟的自回歸語(yǔ)言模型、強(qiáng)化學(xué)習(xí)的 PPO 算法等;但數(shù)據(jù),是 ChatGPT 真正的優(yōu)勢(shì)。

"ChatGPT 通過(guò)搶先開(kāi)始公測(cè),收集了大量的用戶(hù)的使用數(shù)據(jù) ",這也是 ChatGPT 獨(dú)有的、寶貴的數(shù)據(jù)。

和算力的 " 軍備 " 競(jìng)賽不同,數(shù)據(jù)會(huì)有滾雪球效應(yīng),只要 ChatGPT 仍然是最好用的語(yǔ)言 AI,就會(huì)一直保持先發(fā)優(yōu)勢(shì),后來(lái)者會(huì)越來(lái)越難追上。

ChatGPT,已經(jīng)建立起了 " 數(shù)據(jù)壁壘 "。

而近期才開(kāi)始官宣的 " 中國(guó)版 ChatGPT",除了要加強(qiáng)在算法、算力的投入,中文語(yǔ)言數(shù)據(jù)的處理,中文敏感詞、有害信息的過(guò)濾,也需要大量的投入。

如今,ChatGPT 掀起人工智能新浪潮,最底層、最邊緣的數(shù)據(jù)標(biāo)注員是否會(huì)有新的待遇?

國(guó)內(nèi)數(shù)據(jù)標(biāo)注亂象

據(jù)第一財(cái)經(jīng)報(bào)道,中國(guó)的數(shù)據(jù)標(biāo)注行業(yè)最早可追溯到 2005 年,著名計(jì)算機(jī)視覺(jué)專(zhuān)家、人工智能專(zhuān)家朱純松在湖北鄂州創(chuàng)辦了蓮花山研究院。

中國(guó)信通院報(bào)告指出,2015 年,隨著人工智能巨頭的崛起,數(shù)據(jù)標(biāo)注和采集需求激增,市場(chǎng)真正意義上開(kāi)始形成。

2016 年,AlphaGo 橫空出世,人工智能開(kāi)始商業(yè)化探索,相應(yīng)的數(shù)據(jù)服務(wù)公司也迎來(lái)了一波發(fā)展高峰。

人工智能公司發(fā)展波折不斷,數(shù)據(jù)標(biāo)注行業(yè)也處在早期的蠻荒階段,存在分散、效率差、標(biāo)注質(zhì)量參差不齊、市場(chǎng)需求不穩(wěn)定等問(wèn)題。

何文新等數(shù)據(jù)標(biāo)注員有特別直觀(guān)的感受。能不能拿到穩(wěn)定的項(xiàng)目,是一個(gè)外包的數(shù)據(jù)標(biāo)注公司能否存活的關(guān)鍵。

" 我們公司比較小,很難拿到一手的項(xiàng)目。" 何文新稱(chēng),他們拿到的可能是層層外包的項(xiàng)目,價(jià)格比較低,而且極不穩(wěn)定," 有時(shí)候項(xiàng)目沒(méi)做完,公司就沒(méi)了。"

而一些數(shù)據(jù)標(biāo)注公司在招聘兼職數(shù)據(jù)標(biāo)注員時(shí),會(huì)強(qiáng)調(diào)薪酬分兩次結(jié)算," 次月和 6 個(gè)月后各結(jié)算一半 ",因?yàn)檫@是甲方的結(jié)算習(xí)慣,一些數(shù)據(jù)公司并不會(huì)提前 " 墊付 " 薪酬。

因?yàn)闆](méi)有什么門(mén)檻,十幾個(gè)人也能攢出一個(gè)團(tuán)隊(duì),因此,數(shù)據(jù)標(biāo)注公司質(zhì)量層次不齊,行業(yè)競(jìng)爭(zhēng)也異常激烈。

據(jù)第一財(cái)經(jīng)報(bào)道,2018 年,科大訊飛旗下的眾包平臺(tái) " 愛(ài)標(biāo)客 " 上,一些簡(jiǎn)單的打框和轉(zhuǎn)寫(xiě)校準(zhǔn)項(xiàng)目,時(shí)薪在 25 到 40 元之間;到 2021 年底,時(shí)薪就降到了 10 到 15 元," 有時(shí)候可能連 10 元都不到 "。

并且,數(shù)據(jù)標(biāo)注行業(yè)還存在一些招聘騙局,比如打著招聘的名義,騙求職者繳納高昂的培訓(xùn)費(fèi)等。

而數(shù)據(jù)標(biāo)注員,也是人工智能行業(yè)中,最不穩(wěn)定、最容易被取代的角色。

2022 年 6 月,特斯拉在全球開(kāi)啟了裁員計(jì)劃。其中規(guī)模最大的一次裁員,是解雇了 200 名美國(guó)員工。他們大多數(shù)是小時(shí)工,負(fù)責(zé)自動(dòng)駕駛數(shù)據(jù)標(biāo)注。

有媒體分析,特斯拉這次裁員的原因是這一工作技術(shù)含量不高,操作起來(lái)比較簡(jiǎn)單;并且特斯拉的自動(dòng)化數(shù)據(jù)標(biāo)注有了進(jìn)展,可以代替人力完成部分工作。

目前,何文新已經(jīng)從數(shù)據(jù)標(biāo)注公司離職,換了新的行業(yè)。工資低、累、沒(méi)有晉升空間、沒(méi)有學(xué)到東西,是數(shù)據(jù)標(biāo)注員離職的主要原因。

但是,除了這些問(wèn)題,數(shù)據(jù)標(biāo)注員的薪資,在 4、5 線(xiàn)城市依然有競(jìng)爭(zhēng)力。

實(shí)際上,因?yàn)閷儆?" 勞動(dòng)密集型 " 產(chǎn)業(yè),一些地方政府對(duì)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)拋出橄欖枝,成為解決當(dāng)?shù)鼐蜆I(yè)、扶貧的優(yōu)質(zhì)項(xiàng)目。

另一方面,因?yàn)殚T(mén)檻低、操作簡(jiǎn)單,數(shù)據(jù)標(biāo)注員也成為殘疾人友好崗位," 邊碼故事 " 曾報(bào)道殘疾人成為數(shù)據(jù)標(biāo)注員的故事," 一臺(tái)電腦就能賺錢(qián)是之前想都不敢想的 "。

而一些數(shù)據(jù)標(biāo)注公司的推廣視頻下面,有不少用戶(hù)留言咨詢(xún),想要加入。

在面對(duì)使用廉價(jià)勞動(dòng)力質(zhì)疑時(shí),OpenAI 回應(yīng)稱(chēng),他們支付給 Sama 的費(fèi)用幾乎是東非其他內(nèi)容審核公司的兩倍;賺差價(jià)的 Sama 則稱(chēng)自己是 " 有道德的 AI 公司 ",已經(jīng)幫助 5 萬(wàn)多人擺脫了貧困。

據(jù)國(guó)盛證券估計(jì),類(lèi) ChatGPT 的大模型訓(xùn)練一次就要燒掉 200 萬(wàn) - 1200 萬(wàn)美元,僅每日的電費(fèi)消耗就高達(dá) 4.7 萬(wàn)美元;2022 年,OpenAI 公司凈虧損高達(dá) 5.45 億美元。

我們?cè)隗@嘆人工智能的突破和背后的技術(shù)成本時(shí),在追捧 OpenAI 2000 億人民幣的估值時(shí),不應(yīng)該忘記背后千萬(wàn)的數(shù)據(jù)標(biāo)注員。他們?cè)诰酃鉄敉猓缫蝗~葉扁舟,飄蕩在人工智能藍(lán)海上。

(應(yīng)受訪(fǎng)者要求,本文人名為化名。)

來(lái)源:鞭牛士 微信號(hào):bianews8


網(wǎng)站簡(jiǎn)介 網(wǎng)站團(tuán)隊(duì) 本網(wǎng)動(dòng)態(tài) 友情鏈接 版權(quán)聲明 我要投稿

Copyright? 2014-2020 中原網(wǎng)視臺(tái)(www.loj.net.cn) All rights reserved.

主站蜘蛛池模板: 永福县| 阿鲁科尔沁旗| 襄垣县| 维西| 广宗县| 济南市| 喀喇沁旗| 南康市| 米易县| 保康县| 莱西市| 高清| 封开县| 化德县| 毕节市| 三台县| 鹤壁市| 尼玛县| 莱阳市| 金堂县| 海安县| 通州市| 舟曲县| 武隆县| 司法| 新绛县| 河津市| 咸阳市| 繁峙县| 调兵山市| 绵竹市| 习水县| 和顺县| 永靖县| 焦作市| 黑山县| 阳高县| 伊通| 阳江市| 瑞昌市| 滦平县|