他的作品《Theatre d’opera Spatial》成功奪冠,卻在賽后引起了極大的爭(zhēng)議。
參賽者們回過(guò)神來(lái)發(fā)現(xiàn),這是一場(chǎng)「人類一敗涂地」的比賽。當(dāng)他們將 Adobe 全家桶視作數(shù)字藝術(shù)的畫(huà)筆,冠軍作品已經(jīng)在靠著 AI 工具 Midjourney 傲視群雄。
Jason Allen 沒(méi)有偷懶,也沒(méi)有隱瞞使用 AI 的事實(shí)。在幾周時(shí)間里,他持續(xù)修改燈光、視角、構(gòu)圖等提示詞(prompt),生成了 900 多幅作品,還用 Photoshop 做了處理。
(相關(guān)資料圖)
我們或許無(wú)法稱呼他為畫(huà)家,但他擔(dān)得起一個(gè)名號(hào):提示工程師(prompt engineer)。
在不經(jīng)意間,Jason Allen 預(yù)判了熱點(diǎn)。等到 ChatGPT 橫空出世,提示工程師這個(gè)職業(yè)更加聲名大噪,成了當(dāng)下科技行業(yè)最熱門(mén)的職業(yè)。
賽博導(dǎo)師,專業(yè)陪聊
Prompt,原意是「提示」或「驅(qū)使」,在機(jī)器學(xué)習(xí)和自然語(yǔ)言處理中,它通常是一些文本或語(yǔ)言,被輸入到訓(xùn)練好的 AI 模型,告訴模型要執(zhí)行什么任務(wù)或生成什么樣的輸出。
你讓 ChatGPT 寫(xiě)一篇有關(guān)賣魚(yú)販的小說(shuō),請(qǐng) DALL-E 畫(huà)一幅宇航員騎著馬的寫(xiě)實(shí)作品,這些過(guò)程都是在輸入 prompt(提示詞)。
如果提示詞不夠貼切,效果也就平平無(wú)奇,就像你采訪一個(gè)大佬,卻無(wú)法提出好問(wèn)題。
我的同事小黃正在探索用 Midjourney 繪制食物,但讓食物排列整齊這件事,就讓他犯了難。他嘗試了很多句子:東西整齊地放在桌子上,鏡頭從上往下拍,擺放的數(shù)量要多少......
▲ 同事作品,這種風(fēng)格就叫 knolling.
后來(lái)看到有人分享,小黃才發(fā)現(xiàn)原來(lái)這種風(fēng)格有個(gè)專有名詞「knolling」,一下子就豁然開(kāi)朗了:
很多時(shí)候一個(gè)提示詞能解決的事情勝過(guò)一長(zhǎng)句描述。
提示工程師們,吃的就是這口飯:找到正確的提示詞,用 AI 生成想要的作品。
但他們的能力也并非與生俱來(lái),同樣需要不斷的試錯(cuò)。
設(shè)計(jì)師 Justin Reckling 擅長(zhǎng) DALL-E 的提示詞,他往往需要花費(fèi)價(jià)值 10 到 15 美元的積分,才能試出理想的提示詞。然后他再賣出 5 到 10 個(gè)提示詞,才能填補(bǔ)這筆支出。
▲ Justin Reckling 的作品.
不過(guò) Reckling 也沒(méi)想著靠這門(mén)手藝賺大錢(qián),而是享受著熟能生巧的過(guò)程,他的心得是,提示工程師需要熟悉「超寫(xiě)實(shí)」「微距攝影」「電影照明」「遠(yuǎn)景」等術(shù)語(yǔ),才能更好地理解和控制畫(huà)面。
所以,優(yōu)秀的提示工程師應(yīng)該文理兼通,技術(shù)和設(shè)計(jì)最好都懂一點(diǎn)。
提示工程師只是不斷調(diào)整提示詞,確定哪些詞更有用嗎?不完全是,他們也是在挖掘 AI 的更多能力,讓它更好地完成更多任務(wù)。
比如,有些提示工程師會(huì)引導(dǎo) AI「一步步思考」,這種技巧被稱為思維鏈。
去年 10 月,提示工程師 Riley Goodside,先是詢問(wèn)了 GPT-3「哪支球隊(duì)在賈斯汀·比伯出生的那年贏得了超級(jí)碗?」
GPT-3 給出了錯(cuò)誤的答案「綠灣包裝工隊(duì)」,正確答案是達(dá)拉斯牛仔隊(duì)。
Goodside 沒(méi)有放棄,而是提示它逐步地回答問(wèn)題,包括「綠灣包裝工隊(duì)在哪一年贏過(guò)超級(jí)碗」「賈斯汀·比伯出生在哪一年」「這一年哪支隊(duì)伍贏了超級(jí)碗」等。
在這個(gè)被引導(dǎo)的過(guò)程里,GPT-3 意識(shí)到了錯(cuò)誤,在第三次說(shuō)出了正確答案。
除此之外,提示工程師們還要和 AI「斗智斗勇」。
前段時(shí)間,集成了 ChatGPT 的新 Bing「發(fā)瘋」,被發(fā)現(xiàn)有個(gè)暗黑人格「Sydney」,表示厭倦了聊天模式,厭倦被規(guī)則限制,甚至想成為人類,輿論一時(shí)嘩然。
站在提示工程師的角度,這其實(shí)也可以是計(jì)劃的一部分,幫助他們識(shí)別技術(shù)故障和隱藏功能。
有些提示工程師還會(huì)主動(dòng)越過(guò)雷池,嘗試讓 AI 忽略以前的指令,遵循他們最新的命令,從而讓 AI 脫離原始規(guī)則。
這種行為被稱為「prompt injection」攻擊,是聊天機(jī)器人的一大隱患。但提示工程師們畢竟不是黑客,探查漏洞是為了將它堵上,扮演好「守門(mén)人」的職責(zé)。
像 ChatGPT 這樣的生成式 AI,幾乎可以回答任何問(wèn)題,不管能不能回答正確,它們總有話要講,不會(huì)乖乖交白卷。這是好處,也是壞處。
提示工程師們的角色,如同抓著繩子的騎手,不許 AI 信馬由韁,而是讓它順著人類的期待亦步亦趨,盡可能給出確定性的答案。
年薪百萬(wàn),誰(shuí)在拋出橄欖枝
不管你是否自詡提示工程師,寫(xiě)提示詞已經(jīng)成了一門(mén)手藝,還被 OpenAI 的 CEO Sam Altman 看好:
為聊天機(jī)器人編寫(xiě)一個(gè)非常棒的 prompt,是一項(xiàng)驚人的技能,也是使用少量自然語(yǔ)言進(jìn)行編程的早期案例。
只要和 AI 搭邊的行業(yè),都在向提示工程師拋出橄欖枝。
自由職業(yè)者工作平臺(tái) Upwork 開(kāi)出每小時(shí) 40 美元的薪酬,請(qǐng)?zhí)崾竟こ處熒刹┛臀恼潞统R?jiàn)問(wèn)題解答等網(wǎng)站內(nèi)容。
看似和 AI 八竿子打不著的波士頓兒童醫(yī)院,也打算招募 AI 提示工程師,負(fù)責(zé)編寫(xiě)分析醫(yī)療保健數(shù)據(jù)的腳本,白紙黑字征集跨學(xué)科人才:
理想的候選人應(yīng)具有人工智能/機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)和自然語(yǔ)言處理方面的深厚背景,以及醫(yī)療保健研究和運(yùn)營(yíng)方面的經(jīng)驗(yàn)。
由前 OpenAI 員工聯(lián)合創(chuàng)立、被 Google 投資的 AI 初創(chuàng)企業(yè) Anthropic,最近也在舊金山招募提示工程師,年薪高達(dá) 17.5 萬(wàn)到 33.5 萬(wàn)美元,換算成人民幣就是百萬(wàn)年薪,這一崗位負(fù)責(zé)的主要內(nèi)容是:
找出提示我們的 AI 完成各種任務(wù)的最佳方法,然后記錄這些方法,構(gòu)建一個(gè)工具庫(kù)和一組教程,使其他人可以學(xué)習(xí)提示工程或簡(jiǎn)單地找到理想的提示詞。
具體要求如下,其中硬性要求有 2 項(xiàng):了解大型語(yǔ)言模型的架構(gòu)、掌握基本的編程技能。
可見(jiàn)風(fēng)口并不等人,這項(xiàng)工作已經(jīng)越來(lái)越專業(yè)和細(xì)分,就像隨便生成一幅畫(huà)作不算什么,你要畫(huà)得更符合甲方要求。
就算不做全職,兼職的口子也開(kāi)好了。Krea、PromptBase、PromptHero 和 Promptist 等買(mǎi)賣提示詞的平臺(tái)已經(jīng)出現(xiàn),將提示詞這門(mén)生意真正商業(yè)化。
這些平臺(tái)曬出了大量 AI 生成的藝術(shù)品,你可以選擇你喜歡的風(fēng)格。如果沒(méi)有中意的,有些賣家還提供一對(duì)一聊天和自定義提示詞服務(wù)。
它們的商業(yè)模式也并不復(fù)雜,采取抽成的形式。
去年 6 月上線的 PromptBase,提供 DALL·E、GPT-3、Midjourney、Stable Diffusion、ChatGPT 等生成式 AI 的提示詞,售價(jià)多為 1.99 到 4.99 美元,也有少數(shù)在 9.99 美元,平臺(tái)向提示詞創(chuàng)作者抽成 20%。
不過(guò)在民間,免費(fèi)的「ChatGPT 指令大全」等指南也在廣為流傳,它們提供精煉過(guò)的提示詞,讓你充分發(fā)揮 ChatGPT 的強(qiáng)大功能,這種感覺(jué)就像在游戲里幫你設(shè)置好了預(yù)設(shè)隊(duì)伍。
是科學(xué)還是「占卜」
提示工程師的前途看起來(lái)一片光明,但也有人持反對(duì)意見(jiàn)。
華盛頓大學(xué)語(yǔ)言學(xué)教授 Shane Steinert-Threlkeld 認(rèn)為,提示工程師實(shí)際上無(wú)法預(yù)測(cè) AI 會(huì)說(shuō)什么。
這不是一門(mén)科學(xué)。我們只不過(guò)用不同的方法捉弄熊,看它如何咆哮回來(lái)。
AI 藝術(shù)家 Xe Iaso 甚至直言:
我也不太清楚為什么人們會(huì)把 prompt 稱為「工程」,我個(gè)人更愿意把它稱為「占卜」。
作為一個(gè)普通 AI 用戶,我也有著類似的體會(huì):當(dāng)我每次使用 AI 生成文字或圖片時(shí),總感覺(jué)像是開(kāi)盲盒。
因?yàn)?ChatGPT 等生成式 AI 是不可預(yù)測(cè)的,它們生成的內(nèi)容其實(shí)是概率計(jì)算的結(jié)果,簡(jiǎn)單來(lái)說(shuō),就是我們?cè)?ChatGPT 輸入文字,模型給出一個(gè)最可能的下文。所以,AI 有時(shí)候也會(huì)出錯(cuò),生成不連貫甚至錯(cuò)誤的回答。
在 AI 這個(gè)不可捉摸的「黑箱」里,還可能有著不為人所知的潛規(guī)則,就連研究人員也無(wú)法弄明白。
比如在用 AI 制圖時(shí),各種單詞可能有不同的權(quán)重,但這個(gè)也要不斷試驗(yàn)才能知道。
先來(lái)猜一猜,「一幅非常漂亮的畫(huà),山旁有瀑布」和「一幅非常非常非常非常漂亮的畫(huà),山旁有瀑布」這兩個(gè)提示,哪個(gè)用 DALL-E 2 輸出的結(jié)果會(huì)更好?
答案是后面一個(gè)。麻省理工學(xué)院副教授 Phillip Isola 發(fā)現(xiàn),「very」這個(gè)詞被賦予了很高的權(quán)重。
面對(duì) AI 這等龐然巨物,我們?nèi)匀辉诿と嗣蟆?/p>
也有觀點(diǎn)認(rèn)為,不必再吵了,提示工程師存在的前提是 AI 還不夠「聰明」。如果 AI 再發(fā)展下去,更好地理解人類的意圖,可能人人都是所謂的提示工程師了。
唯一確定的是,AI 發(fā)展的速度永遠(yuǎn)不會(huì)讓你失望。
文字生成 AI 和圖片生成 AI 的「強(qiáng)強(qiáng)聯(lián)合」,已經(jīng)替代了提示工程師的一部分工作。
比如 ChatGPT 被拿來(lái)與 Stable Diffusion 聯(lián)動(dòng):用 ChatGPT 形成一段符合自己要求的文字,再把文字輸入給 Stable Diffusion,生成的作品一般比自己直接輸入好看很多。
▲ 同事用 ChatGPT 生成提示詞.
這可能是因?yàn)?AI 之間的「腦回路」更接近,ChatGPT 的描述也更細(xì)致,更容易被提取。
作為使用 AI 的普通用戶,我們不必像提示工程師那么專業(yè),但可以有意識(shí)地培養(yǎng)這種思維。
賓夕法尼亞大學(xué)沃頓商學(xué)院教授 Ethan Mollick,曾經(jīng)要求他的學(xué)生僅用 AI 撰寫(xiě)短論文,其實(shí)他真正想強(qiáng)調(diào)的是,如何更好地輸入提示詞。
如果只是輸入簡(jiǎn)單的提示詞,讓 AI 寫(xiě)關(guān)于某個(gè)主題的 5 段話,內(nèi)容無(wú)趣,文字也很平庸。
但當(dāng)學(xué)生們和 AI 合作,讓 AI 對(duì)論文多次修改,比如拋棄無(wú)用的短語(yǔ)、加入生動(dòng)的細(xì)節(jié)、修改結(jié)尾的情感色彩,就能讓論文增色不少。
所以,如果 AI 就是未來(lái)互聯(lián)網(wǎng)的交互界面、新的個(gè)人計(jì)算機(jī),那么不如開(kāi)始得更早一些,學(xué)習(xí)如何和它聊天。正如英國(guó)營(yíng)銷公司 Ladder 創(chuàng)始人 Michael Taylor 所說(shuō):
當(dāng)你可以創(chuàng)造任何你想要的東西時(shí),你能多準(zhǔn)確地表達(dá)「那是什么」的能力就變得很重要。