出品|虎嗅科技組
作者|齊健
編輯|陳伊凡
(資料圖)
頭圖| 視覺(jué)中國(guó)
ChatGPT加入搜索后,會(huì)顛覆Google嗎?
這是過(guò)去幾周里,在科技產(chǎn)業(yè)圈里熱議的話(huà)題。
1月3日,科技媒體The Information爆料了人工智能研究實(shí)驗(yàn)室OpenAI與微軟Bing最新的合作計(jì)劃。兩位直接參與該計(jì)劃的人士稱(chēng),微軟正與OpenAI一起研究一款具備AI對(duì)話(huà)能力的新版Bing搜索引擎,預(yù)計(jì)將于3月底前公布。該版本將融合了OpenAI最新推出的對(duì)話(huà)大模型ChatGPT,與以往單純羅列網(wǎng)頁(yè)鏈接的搜索模式不同,ChatGPT可以直接回答搜索查詢(xún)。
DA Davidson分析師甚至因此給予了微軟“買(mǎi)入”評(píng)級(jí),并稱(chēng),短期內(nèi)OpenAI的ChatGPT,將會(huì)轉(zhuǎn)化為Azure的增量。從長(zhǎng)遠(yuǎn)來(lái)看,將ChatGPT功能整合到必應(yīng)(Bing)可能會(huì)為微軟提供十年一次的推翻谷歌搜索主導(dǎo)地位的機(jī)會(huì)。
在此合作之前,微軟一直出錢(qián)出力,支持OpenAI業(yè)務(wù)。2020年,微軟以10億美元投資OpenAI。同年,微軟Azuer云也成為了OpenAI的獨(dú)家算力伙伴。在此之前OpenAI曾一度成為Google云的五大企業(yè)客戶(hù)之一,年單1.2億美元。不過(guò),微軟收購(gòu)OpenAI之后,似乎從微軟拿到了極低的云計(jì)算折扣。有數(shù)據(jù)顯示,在2021財(cái)年中,OpenAI在微軟產(chǎn)品上的開(kāi)支僅為92000美元,而以O(shè)penAI運(yùn)維、研發(fā)GPT-3和GPT-3.5等大模型的進(jìn)度來(lái)看,云計(jì)算用量并未有明顯下降。
與Bing的合作被曝出之后,OpenAI在1月6日早些時(shí)候又傳出出售股票的消息。據(jù)《華爾街日?qǐng)?bào)》報(bào)道,OpenAI正在與Thrive Capital、Founders Fund兩家基金談判,以290億美元的估值出售至少價(jià)值3億美元的股票。2021年,OpenAI員工向紅杉資本、老虎環(huán)球出售股票時(shí)的估值約為200億美元。
AI對(duì)于搜索行業(yè)太超前?
既然通用大模型如此厲害,為何在搜索上積累最深的Google不做,畢竟要論搜索,Google在業(yè)內(nèi)有絕對(duì)優(yōu)勢(shì)。
據(jù)《紐約時(shí)報(bào)》報(bào)道,ChatGPT發(fā)布之后不久,Google首席執(zhí)行官Sundar Pichai就在內(nèi)部動(dòng)員研究人員團(tuán)隊(duì)想辦法應(yīng)對(duì)ChatGPT,并宣布這種情況是“紅色代碼”的威脅。
其實(shí)Google也并非沒(méi)有嘗試,在2021年5月的I/O大會(huì)上Google就展示了語(yǔ)言類(lèi)通用大模型LaMDA,并持續(xù)對(duì)其進(jìn)行迭代研發(fā)。然而直至目前,Google都沒(méi)有向公眾發(fā)布LaMDA,Google方面稱(chēng),部分原因在于LaMDA目前尚不完美,其中存在較多錯(cuò)誤。
事實(shí)上,在大模型尚未成熟的時(shí)代,搜索引擎就已開(kāi)始嘗試AI技術(shù)了。在查詢(xún)過(guò)程中,搜索引擎利用自然語(yǔ)言處理(Natural Language Processing,NLP)分析和理解用戶(hù)輸入的查詢(xún)?cè)~語(yǔ)。在搜索過(guò)程中,利用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN),解決“隱式搜索”問(wèn)題。
“隱式搜索是百度內(nèi)部的說(shuō)法,也可以叫做‘真正的語(yǔ)義搜索’。”一位百度搜索技術(shù)專(zhuān)家告訴虎嗅,隱式搜索不再是單純的字面搜索,而是利用AI分析用戶(hù)關(guān)鍵詞語(yǔ)的深層意思。例如,搜索“現(xiàn)實(shí)版鋼鐵俠”,得到的搜索結(jié)果就都是馬斯克相關(guān)的內(nèi)容。
此外,Google、百度、Bing等還利用AI實(shí)驗(yàn)了類(lèi)似ChatGPT的AI功能,使搜索呈現(xiàn)出的結(jié)果不只是羅列網(wǎng)頁(yè),更能從搜索結(jié)果中篩選內(nèi)容,直接回答用戶(hù)的問(wèn)題。
例如搜索“ChatGPT是什么”。
Google會(huì)在側(cè)邊欄直接引用維基百科:“ChatGPT是由OpenAl開(kāi)發(fā)的一個(gè)人工智能聊天機(jī)器人程序,于2022年11月推出……”
百度則會(huì)篩選搜索內(nèi)容,并摘取答案直接回答在第一條的顯著位置:“聊天機(jī)器人,chatgpt是OpenAl開(kāi)發(fā)的一個(gè)大型預(yù)訓(xùn)練語(yǔ)言模型……”
不過(guò)這種技術(shù)在搜索行業(yè)并沒(méi)有得到廣泛認(rèn)可,甚至沒(méi)有統(tǒng)一的名字?!澳憧梢怨苓@種技術(shù)叫精準(zhǔn)搜索,也可以叫唯一答案或阿拉丁。”
即便是ChatGPT搜索,也仍存在一些問(wèn)題。
首先,AI挑選出的內(nèi)容很難確保準(zhǔn)確性,連OpenAI的CEO Sam Altman都認(rèn)為,“現(xiàn)在依賴(lài)它(ChatGPT)來(lái)做任何重要的事情都是錯(cuò)誤的?!比绻袰hatGPT提供的搜索結(jié)果作為“唯一答案”呈現(xiàn)給用戶(hù),卻無(wú)法保證其準(zhǔn)確性的話(huà),那么在錯(cuò)誤的答案面前,再好的交互體驗(yàn),都會(huì)成為笑話(huà)。
此外,有的時(shí)候用戶(hù)使用搜索引擎的目的是直接得到答案,比如你搜“ChatGPT是什么”時(shí),你想看到的就是一個(gè)定義。但當(dāng)你搜“關(guān)于AI通用大模型的技術(shù)文章”時(shí),你可能需要的是搜集廣泛、全面的資料,如果AI篩選了部分內(nèi)容,則可能影響你在搜索結(jié)果中博采眾長(zhǎng)。
更重要的是經(jīng)濟(jì)賬
不過(guò),雖然搜索引擎很早就融入了AI技術(shù),但卻很難有更深入的應(yīng)用,其中的原因就是算不好經(jīng)濟(jì)賬。
通用AI大模型的研發(fā)、運(yùn)維投入都不是小數(shù)目,更別說(shuō)加入了搜索。
“搜索”是一項(xiàng)開(kāi)銷(xiāo)巨大的業(yè)務(wù),要利用爬蟲(chóng)從互聯(lián)網(wǎng)海量數(shù)據(jù)中抓取搜索結(jié)果,背后需要大量的算力支持。據(jù)業(yè)內(nèi)人士透露,百度搜索處理的網(wǎng)頁(yè)數(shù)量在七八年前就已達(dá)到千億級(jí)別。服務(wù)器用量超過(guò)一萬(wàn)臺(tái),每年純?cè)O(shè)備成本超50億。如果算上研發(fā)、運(yùn)營(yíng)和維護(hù)的人工成本,總開(kāi)銷(xiāo)可能會(huì)接近100億。雖然近兩年服務(wù)器成本或有下滑,但人力成本會(huì)一直隨著通脹逐年上升。
而這只是不包含ChatGPT情況下的純搜索成本。
數(shù)據(jù)顯示,GPT-3的訓(xùn)練成本約1200萬(wàn)美元,而ChatGPT的運(yùn)行成本大概是單輪回答(Single Turn)幾美分,聽(tīng)起來(lái)不多,但疊加到搜索引擎每天處理的數(shù)億、數(shù)十億次搜索中,產(chǎn)生的開(kāi)銷(xiāo)就高得過(guò)分了。如果按照每天10億次搜索量來(lái)計(jì)算,把ChatGPT的回答成本壓到最低的1美分,那么按照現(xiàn)在的匯率看,這樣一個(gè)搜索引擎2天的“答題成本”就要一個(gè)半“小目標(biāo)”。
由于ChatGPT的訓(xùn)練并不是基于非實(shí)時(shí)更新的數(shù)據(jù)庫(kù)(數(shù)據(jù)皆采集于2021年以前),它的搜索功能無(wú)法解答2021年以后的新問(wèn)題。目前要對(duì)ChatGPT進(jìn)行實(shí)時(shí)訓(xùn)練,就要面臨新的技術(shù)挑戰(zhàn)和成本問(wèn)題。
不過(guò)也有AI行業(yè)專(zhuān)家認(rèn)為,實(shí)時(shí)更新的AI搜索引擎實(shí)用價(jià)值并沒(méi)有想象中那么大。雖然互聯(lián)網(wǎng)中每天新增的數(shù)據(jù)量很大,但真正有價(jià)值,值得沉淀下來(lái)的知識(shí)非常有限。用戶(hù)對(duì)于這些知識(shí)的需求,也是隨時(shí)間推移階段性增長(zhǎng)的。這樣就可以把重新訓(xùn)練大模型或更新數(shù)據(jù)庫(kù)的時(shí)間拉長(zhǎng),從而攤薄成本。
那么花大價(jià)錢(qián)融入搜索引擎的ChatGPT能帶來(lái)多少回報(bào)呢?
與上邊提到過(guò)的“精準(zhǔn)搜索、唯一答案、阿拉丁”技術(shù)相似,ChatGPT也無(wú)法直接提供經(jīng)濟(jì)效益。曾經(jīng)的谷歌廣告團(tuán)隊(duì)負(fù)責(zé)人Sridhar Ramaswamy就表示,ChatGPT的使用,從一定程度上阻止了用戶(hù)點(diǎn)擊帶有廣告的谷歌鏈接。Google在2021年的廣告業(yè)務(wù)收入為2080億美元,占Alphabet總收入的81%。
為何Bing可以去做與ChatGPT結(jié)合的嘗試?
“單看搜索業(yè)務(wù),國(guó)內(nèi)頭部搜索引擎的利潤(rùn)率大概在65%左右?!币晃凰阉餍袠I(yè)專(zhuān)家向虎嗅透露,雖然成本會(huì)隨著服務(wù)器和人員的多少增減,但要保證搜索引擎可用,單個(gè)服務(wù)器的成本差距不大,廣告規(guī)模卻會(huì)差很多。因此營(yíng)收規(guī)模越大,利潤(rùn)率也越高。放在任何一個(gè)成熟的海外市場(chǎng),頭部搜索引擎的利潤(rùn)率也都差不多是這個(gè)數(shù)。
據(jù)微軟財(cái)報(bào)顯示,在截至2022年6月的財(cái)年數(shù)據(jù)中,搜索、MSN.com和其他新聞產(chǎn)品的廣告收入共116億美元,其中搜索業(yè)務(wù)占比較大。相比之下,Google搜索業(yè)務(wù)的同期收入至少是Bing的10倍。
據(jù)海外多家調(diào)研機(jī)構(gòu)的統(tǒng)計(jì)顯示,Bing在美國(guó)本土的市場(chǎng)占有率遠(yuǎn)低于Google,目前全球搜索市場(chǎng)中Bing的市占率不超過(guò)10%,而Google的市占率保守估計(jì)也不低于80%。從市占率看來(lái),Bing和Goggle二者的競(jìng)爭(zhēng)關(guān)系似乎并不明顯。
因?yàn)槭袌?chǎng)占比小,搜索利潤(rùn)率相對(duì)較低,Bing很自然地不承擔(dān)過(guò)多的營(yíng)收壓力,也就可以放心大膽地嘗試ChatGPT這種未來(lái)的顛覆式創(chuàng)新,而不需要考慮太多成本。
技術(shù)創(chuàng)新的故事就是如此充滿(mǎn)戲劇性和殘酷性。有時(shí)候賭對(duì)了一個(gè)技術(shù)路線(xiàn),就能贏下未來(lái)十年甚至幾十年的商業(yè)戰(zhàn)爭(zhēng)。而原有技術(shù)路線(xiàn)的優(yōu)勢(shì)者,往往由于自身的路徑依賴(lài),反過(guò)來(lái)被自己的優(yōu)勢(shì)地位掣肘,難以在新技術(shù)上勇往直前。正如曾經(jīng)的光刻機(jī)霸主尼康賭錯(cuò)了技術(shù)路線(xiàn),在浸潤(rùn)式光刻機(jī)上被荷蘭ASML公司捷足先登,喪失了此后幾十年的市場(chǎng)領(lǐng)先地位;諾基亞在智能手機(jī)時(shí)代被后繼者超越,跌下神壇。ChatGPT大規(guī)模商用后會(huì)怎么樣,誰(shuí)也不知道,而一旦爆發(fā),將是顛覆式創(chuàng)新,誰(shuí)贏下了這場(chǎng)賭注,誰(shuí)就能贏下下一個(gè)人工智能時(shí)代。
關(guān)鍵詞: 搜索引擎 搜索業(yè)務(wù) ai賭局 財(cái)務(wù)會(huì)計(jì) 財(cái)務(wù)報(bào)表 Google
推薦閱讀
最新資訊