一年狂攬73億美元投資,Anthropic點(diǎn)燃硅谷大模型“戰(zhàn)火”
Sora給科技圈帶來(lái)的沖擊還未平靜,Claude 3又來(lái)了。
3月4日晚,被稱之為是OpenAI最強(qiáng)競(jìng)爭(zhēng)對(duì)手的Anthropic發(fā)布了其最新大模型系列Claude 3。該系列包含三個(gè)模型,能力由強(qiáng)至弱分別是Claude 3 Opus(著作)、Claude 3 Sonnet(十四行詩(shī)) 和Claude 3 Haiku(俳句)。
Anthropic發(fā)布的跑分顯示,Opus在多項(xiàng)基準(zhǔn)測(cè)試中得分都超過(guò)了GPT-4 和Gemini 1.0 Ultra,擁有接近人類(lèi)本科生水平的知識(shí),“在數(shù)學(xué)、編程、多語(yǔ)言理解、視覺(jué)等多個(gè)維度樹(shù)立了新的行業(yè)基準(zhǔn)”。
自去年3月GPT-4發(fā)布后,其一直是行業(yè)的最高標(biāo)準(zhǔn)以及追趕目標(biāo),此次Claude 3的出現(xiàn),意味著其Top 1地位可能不保,不少人發(fā)出“GPT-4時(shí)代已過(guò)”的感嘆。
不過(guò),天使投資人、資深人工智能專(zhuān)家郭濤對(duì)第一財(cái)經(jīng)表示,這可能是一種過(guò)于過(guò)激的說(shuō)法,GPT-4在許多應(yīng)用中可能會(huì)比 Claude 3 更適合。開(kāi)源大模型生態(tài)社區(qū)OpenCSG的創(chuàng)始人陳冉也并不認(rèn)可“時(shí)代已過(guò)”,他表示,這是一個(gè)層級(jí)和另外一個(gè)層級(jí)比,畢竟GPT-4已經(jīng)出來(lái)很長(zhǎng)一段時(shí)間了。
Claude 3之后,大家自然地將目光投向了OpenAI,GPT-5或許已經(jīng)不遠(yuǎn),這是“暴風(fēng)雨前的寧?kù)o”。
全面超越GPT-4?
據(jù)Anthropic官方發(fā)布的跑分結(jié)果,Claude 3 Opus在本科級(jí)別專(zhuān)業(yè)知識(shí)(MMLU)、研究生級(jí)別專(zhuān)家推理(GPQA)、基礎(chǔ)數(shù)學(xué)(GSM8K)等領(lǐng)域都超過(guò)了GPT-4在內(nèi)的領(lǐng)先模型。
事實(shí)真的如此嗎?在Claude 3發(fā)布后,陳冉進(jìn)行了試用和測(cè)評(píng),在用他自己的一套方法測(cè)試了Opus的邏輯推理、代碼等能力后,他認(rèn)為,Claude 3的整體性能相比GPT-4平均提升了50%以上,包括“幻覺(jué)”、正確率和非正確率方面的表現(xiàn)等。
從大模型胡亂回答問(wèn)題的“幻覺(jué)”這一項(xiàng)來(lái)看,Claude3相比GPT-4要好很多,另外,在 GPT-4中,有些問(wèn)題不會(huì)被回答,但在Claude 3中其回答的正確率提高了。在代碼能力和推理上,陳冉測(cè)試了貪吃蛇游戲、撲克游戲等,他對(duì)第一財(cái)經(jīng)表示,在這些方面GPT-4都失敗了,但Claude 3 Opus做到了。
在陳冉看來(lái),此次Anthropic的發(fā)布策略很好,一次性推出三個(gè)不同性能的大模型,最出色的大模型打分都比GPT-4高,較小的模型打分也不低,而在成本上相對(duì)輕量的兩個(gè)模型會(huì)比GPT-4便宜。
Anthropic此次發(fā)布的Opus、Sonnet和Haiku分別針對(duì)不同的性能需求和成本效益。據(jù)官方介紹,Opus是最智能的模型,可以處理復(fù)雜的分析、具有多個(gè)步驟的較長(zhǎng)任務(wù)以及高階數(shù)學(xué)和編碼任務(wù);Sonnet是性能和速度的最佳組合,可實(shí)現(xiàn)高效、大體量的任務(wù);Haiku是最快且最具成本效益的模型,可以執(zhí)行輕量級(jí)操作,具有行業(yè)領(lǐng)先的速度。
在成本上,能力最好的Claude 3 Opus比 GPT-4 Turbo 還要貴得多:GPT-4 Turbo 每百萬(wàn)token的輸入/輸出費(fèi)用為 10/30 美元 ,而 Claude 3 Opus為 15/75 美元。不過(guò),也有更具性價(jià)比的選擇,Claude 3系列中,Sonnet的輸入/輸出定價(jià)是3 美元/15 美元,Haiku是0.25 美元/1.25 美元。
值得一提的是,此次發(fā)布的Claude 3系列模型都支持 200k的上下文窗口, Anthropic還特別表示,在這個(gè)基礎(chǔ)上,所有三個(gè)模型都能夠接受超過(guò) 100 萬(wàn)tokens的輸入,會(huì)提供給有特定需要的客戶。
作為對(duì)比,2023年更新的GPT-4窗口文本容量限制是32k,而2023年11月更新的GPT-4 turbo版能夠接收128k的輸入,相當(dāng)于10萬(wàn)字的小說(shuō)長(zhǎng)度。
對(duì)大模型來(lái)說(shuō),上下文窗口的文本長(zhǎng)度越大,意味著其能更好地理解長(zhǎng)篇文章或?qū)υ挕4饲埃虾H斯ぶ悄軐?shí)驗(yàn)室領(lǐng)軍科學(xué)家林達(dá)華對(duì)第一財(cái)經(jīng)介紹,有了長(zhǎng)語(yǔ)境交互,大模型能夠讀幾百頁(yè)的財(cái)報(bào),將里面一些非常細(xì)致的信息精準(zhǔn)提取出來(lái)形成摘要,或者聽(tīng)一場(chǎng)幾個(gè)小時(shí)的會(huì)議轉(zhuǎn)錄,并將會(huì)議的關(guān)鍵信息摘取出來(lái),對(duì)于大模型的落地很有用。
基于Claude 3在多項(xiàng)能力上超越了GPT-4,行業(yè)這兩天也出現(xiàn)了“GPT4時(shí)代已過(guò)”的聲音,不過(guò),郭濤認(rèn)為,Claude 3 在某些基準(zhǔn)測(cè)試中超過(guò)了 GPT-4,并不意味著 GPT-4 的時(shí)代已經(jīng)過(guò)去,一方面基準(zhǔn)測(cè)試并不能全面反映一個(gè)模型的全部能力,例如創(chuàng)造性寫(xiě)作、情感理解或特定領(lǐng)域知識(shí)方面的表現(xiàn);另一方面,GPT-4在許多應(yīng)用中可能會(huì)比 Claude 3 更適合,“而OpenAI也在不斷研發(fā)新的技術(shù)和模型,很難說(shuō) GPT-4 的時(shí)代已經(jīng)過(guò)去。”
能與OpenAI一較高下嗎
對(duì)于Claude3這次的超越,在驚嘆其表現(xiàn)之余,業(yè)界沒(méi)有太多的意外,Anthropic過(guò)去一直被視為OpenAI最大的競(jìng)爭(zhēng)對(duì)手之一。
Anthropic的核心團(tuán)隊(duì)來(lái)自O(shè)penAI,其創(chuàng)始人達(dá)里奧?阿莫迪(Dario Amodei)曾是OpenAI的研究副總裁,也是一位與高效利他主義社區(qū)有聯(lián)系的研究員,因?qū)penAI的未來(lái)方向有一些分歧而離開(kāi),并在2021年成立了Anthropic,計(jì)劃以可信、安全可控的方式發(fā)展AI。
Anthropic是目前除OpenAI外最被看好的大模型初創(chuàng)公司之一。在過(guò)去一年,Anthropic狂攬約73億美元的投資,其中,亞馬遜、谷歌作為最主要的投資者,分別投資了40億美元和20億美元,韓國(guó)電信巨頭SK下注約1億美元。就在過(guò)去一個(gè)月,Anthropic再次獲得7.5億美元的投資,來(lái)自硅谷風(fēng)投機(jī)構(gòu)Menlo Ventures。
在未來(lái)與OpenAI的競(jìng)爭(zhēng)中,陳冉認(rèn)為Anthropic的勝面不小,一方面,其團(tuán)隊(duì)在算法上與OpenAI幾乎沒(méi)有差距,且Anthropic背后有亞馬遜、谷歌這樣的靠山,算力方面也并不缺,其次,作為背后投資者亞馬遜擁有許多生態(tài)和場(chǎng)景,相應(yīng)也能提供很多高質(zhì)量的數(shù)據(jù)。陳冉認(rèn)為,現(xiàn)在大模型競(jìng)爭(zhēng)最關(guān)鍵的是數(shù)據(jù),數(shù)據(jù)的質(zhì)量越高越能訓(xùn)練好模型。
“最終Claude有可能會(huì)贏。因?yàn)樘厣呛弦?guī)和安全。”在Claude3發(fā)布后次日,陳冉在朋友圈表示。相比GPT-4等模型,Claude對(duì)安全的強(qiáng)調(diào)尤為明顯。
在技術(shù)文檔中,Anthropic表示,Claude在訓(xùn)練過(guò)程中重點(diǎn)是有幫助、無(wú)害和誠(chéng)實(shí),Anthropic通過(guò)給模型一個(gè)想法來(lái)做到這一點(diǎn),即一套倫理和行為原則,模型使用這些原則來(lái)指導(dǎo)其輸出,以避免性別歧視、種族主義和有害的產(chǎn)出,以及避免幫助人類(lèi)從事非法或不道德的活動(dòng)。此外,Anthropic還會(huì)有安全評(píng)估,信任和安全團(tuán)隊(duì)會(huì)監(jiān)控違反原則的有害、惡意用例的提示和輸出。
對(duì)于Anthropic未來(lái)是否能和 OpenAI 一較高下,郭濤認(rèn)為這主要取決于幾方面的因素。一方面,持續(xù)的研發(fā)和創(chuàng)新是保持競(jìng)爭(zhēng)力的關(guān)鍵。如果 Anthropic 能夠持續(xù)推出先進(jìn)的技術(shù)和改進(jìn),它有可能在市場(chǎng)上與 OpenAI 競(jìng)爭(zhēng)。另一方面,AI 大模型的成功不僅取決于核心技術(shù),還取決于能夠建立廣泛的生態(tài)系統(tǒng)和合作伙伴關(guān)系,他認(rèn)為,OpenAI 在這方面有著較強(qiáng)的影響力和網(wǎng)絡(luò)效應(yīng)。此外,如何在商業(yè)模式和市場(chǎng)策略上進(jìn)行創(chuàng)新和調(diào)整,也是決定未來(lái)競(jìng)爭(zhēng)格局的重要因素。
“大家有共識(shí)目前Claude 3已經(jīng)在部分能力上超越GPT-4,但具體未來(lái)能不能比GPT系列好,拭目以待。”陳冉說(shuō)。
Claude 3出現(xiàn)了,GPT-5還會(huì)遠(yuǎn)嗎?在Claude 3發(fā)布后不久,英偉達(dá)高級(jí)科學(xué)家Jim Fan就在X上發(fā)文調(diào)侃,“正在等待幾個(gè)小時(shí)后精心安排的GPT-5的發(fā)布”。
Jim Fan隨后表示,“我喜歡Claude在GPT和Gemini主導(dǎo)的競(jìng)技場(chǎng)上掀起熱度。但請(qǐng)記住,GPT-4V這個(gè)每個(gè)人都迫切想要超越的高水位線,是在2022年完成訓(xùn)練的。這是暴風(fēng)雨前的寧?kù)o。”
作者:劉曉潔
本文鏈接:一年狂攬73億美元投資,Anthropic點(diǎn)燃硅谷大模型“戰(zhàn)火”http://www.lensthegame.com/show-5-7920-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。