一年狂攬73億美元投資，Anthropic點(diǎn)燃硅谷大模型“戰(zhàn)火”

2024-03-07 12:10:44 來(lái)源：

觀看：175

　　一年狂攬73億美元投資，Anthropic點(diǎn)燃硅谷大模型“戰(zhàn)火”

　　Sora給科技圈帶來(lái)的沖擊還未平靜，Claude 3又來(lái)了。

　　3月4日晚，被稱之為是OpenAI最強(qiáng)競(jìng)爭(zhēng)對(duì)手的Anthropic發(fā)布了其最新大模型系列Claude 3。該系列包含三個(gè)模型，能力由強(qiáng)至弱分別是Claude 3 Opus(著作)、Claude 3 Sonnet(十四行詩(shī)) 和Claude 3 Haiku(俳句)。

　　Anthropic發(fā)布的跑分顯示，Opus在多項(xiàng)基準(zhǔn)測(cè)試中得分都超過(guò)了GPT-4 和Gemini 1.0 Ultra，擁有接近人類(lèi)本科生水平的知識(shí)，“在數(shù)學(xué)、編程、多語(yǔ)言理解、視覺(jué)等多個(gè)維度樹(shù)立了新的行業(yè)基準(zhǔn)”。

　　自去年3月GPT-4發(fā)布后，其一直是行業(yè)的最高標(biāo)準(zhǔn)以及追趕目標(biāo)，此次Claude 3的出現(xiàn)，意味著其Top 1地位可能不保，不少人發(fā)出“GPT-4時(shí)代已過(guò)”的感嘆。

　　不過(guò)，天使投資人、資深人工智能專(zhuān)家郭濤對(duì)第一財(cái)經(jīng)表示，這可能是一種過(guò)于過(guò)激的說(shuō)法，GPT-4在許多應(yīng)用中可能會(huì)比 Claude 3 更適合。開(kāi)源大模型生態(tài)社區(qū)OpenCSG的創(chuàng)始人陳冉也并不認(rèn)可“時(shí)代已過(guò)”，他表示，這是一個(gè)層級(jí)和另外一個(gè)層級(jí)比，畢竟GPT-4已經(jīng)出來(lái)很長(zhǎng)一段時(shí)間了。

　　Claude 3之后，大家自然地將目光投向了OpenAI，GPT-5或許已經(jīng)不遠(yuǎn)，這是“暴風(fēng)雨前的寧?kù)o”。

　　全面超越GPT-4?

　　據(jù)Anthropic官方發(fā)布的跑分結(jié)果，Claude 3 Opus在本科級(jí)別專(zhuān)業(yè)知識(shí)(MMLU)、研究生級(jí)別專(zhuān)家推理(GPQA)、基礎(chǔ)數(shù)學(xué)(GSM8K)等領(lǐng)域都超過(guò)了GPT-4在內(nèi)的領(lǐng)先模型。

　　事實(shí)真的如此嗎？在Claude 3發(fā)布后，陳冉進(jìn)行了試用和測(cè)評(píng)，在用他自己的一套方法測(cè)試了Opus的邏輯推理、代碼等能力后，他認(rèn)為，Claude 3的整體性能相比GPT-4平均提升了50%以上，包括“幻覺(jué)”、正確率和非正確率方面的表現(xiàn)等。

　　從大模型胡亂回答問(wèn)題的“幻覺(jué)”這一項(xiàng)來(lái)看，Claude3相比GPT-4要好很多，另外，在 GPT-4中，有些問(wèn)題不會(huì)被回答，但在Claude 3中其回答的正確率提高了。在代碼能力和推理上，陳冉測(cè)試了貪吃蛇游戲、撲克游戲等，他對(duì)第一財(cái)經(jīng)表示，在這些方面GPT-4都失敗了，但Claude 3 Opus做到了。

　　在陳冉看來(lái)，此次Anthropic的發(fā)布策略很好，一次性推出三個(gè)不同性能的大模型，最出色的大模型打分都比GPT-4高，較小的模型打分也不低，而在成本上相對(duì)輕量的兩個(gè)模型會(huì)比GPT-4便宜。

　　Anthropic此次發(fā)布的Opus、Sonnet和Haiku分別針對(duì)不同的性能需求和成本效益。據(jù)官方介紹，Opus是最智能的模型，可以處理復(fù)雜的分析、具有多個(gè)步驟的較長(zhǎng)任務(wù)以及高階數(shù)學(xué)和編碼任務(wù)；Sonnet是性能和速度的最佳組合，可實(shí)現(xiàn)高效、大體量的任務(wù)；Haiku是最快且最具成本效益的模型，可以執(zhí)行輕量級(jí)操作，具有行業(yè)領(lǐng)先的速度。

　　在成本上，能力最好的Claude 3 Opus比 GPT-4 Turbo 還要貴得多：GPT-4 Turbo 每百萬(wàn)token的輸入/輸出費(fèi)用為 10/30 美元，而 Claude 3 Opus為 15/75 美元。不過(guò)，也有更具性價(jià)比的選擇，Claude 3系列中，Sonnet的輸入/輸出定價(jià)是3 美元/15 美元，Haiku是0.25 美元/1.25 美元。

　　值得一提的是，此次發(fā)布的Claude 3系列模型都支持 200k的上下文窗口， Anthropic還特別表示，在這個(gè)基礎(chǔ)上，所有三個(gè)模型都能夠接受超過(guò) 100 萬(wàn)tokens的輸入，會(huì)提供給有特定需要的客戶。

　　作為對(duì)比，2023年更新的GPT-4窗口文本容量限制是32k，而2023年11月更新的GPT-4 turbo版能夠接收128k的輸入，相當(dāng)于10萬(wàn)字的小說(shuō)長(zhǎng)度。

　　對(duì)大模型來(lái)說(shuō)，上下文窗口的文本長(zhǎng)度越大，意味著其能更好地理解長(zhǎng)篇文章或?qū)υ挕４饲埃虾Ｈ斯ぶ悄軐?shí)驗(yàn)室領(lǐng)軍科學(xué)家林達(dá)華對(duì)第一財(cái)經(jīng)介紹，有了長(zhǎng)語(yǔ)境交互，大模型能夠讀幾百頁(yè)的財(cái)報(bào)，將里面一些非常細(xì)致的信息精準(zhǔn)提取出來(lái)形成摘要，或者聽(tīng)一場(chǎng)幾個(gè)小時(shí)的會(huì)議轉(zhuǎn)錄，并將會(huì)議的關(guān)鍵信息摘取出來(lái)，對(duì)于大模型的落地很有用。

　　基于Claude 3在多項(xiàng)能力上超越了GPT-4，行業(yè)這兩天也出現(xiàn)了“GPT4時(shí)代已過(guò)”的聲音，不過(guò)，郭濤認(rèn)為，Claude 3 在某些基準(zhǔn)測(cè)試中超過(guò)了 GPT-4，并不意味著 GPT-4 的時(shí)代已經(jīng)過(guò)去，一方面基準(zhǔn)測(cè)試并不能全面反映一個(gè)模型的全部能力，例如創(chuàng)造性寫(xiě)作、情感理解或特定領(lǐng)域知識(shí)方面的表現(xiàn)；另一方面，GPT-4在許多應(yīng)用中可能會(huì)比 Claude 3 更適合，“而OpenAI也在不斷研發(fā)新的技術(shù)和模型，很難說(shuō) GPT-4 的時(shí)代已經(jīng)過(guò)去。”

　　能與OpenAI一較高下嗎

　　對(duì)于Claude3這次的超越，在驚嘆其表現(xiàn)之余，業(yè)界沒(méi)有太多的意外，Anthropic過(guò)去一直被視為OpenAI最大的競(jìng)爭(zhēng)對(duì)手之一。

　　Anthropic的核心團(tuán)隊(duì)來(lái)自O(shè)penAI，其創(chuàng)始人達(dá)里奧?阿莫迪(Dario Amodei)曾是OpenAI的研究副總裁，也是一位與高效利他主義社區(qū)有聯(lián)系的研究員，因?qū)penAI的未來(lái)方向有一些分歧而離開(kāi)，并在2021年成立了Anthropic，計(jì)劃以可信、安全可控的方式發(fā)展AI。

　　Anthropic是目前除OpenAI外最被看好的大模型初創(chuàng)公司之一。在過(guò)去一年，Anthropic狂攬約73億美元的投資，其中，亞馬遜、谷歌作為最主要的投資者，分別投資了40億美元和20億美元，韓國(guó)電信巨頭SK下注約1億美元。就在過(guò)去一個(gè)月，Anthropic再次獲得7.5億美元的投資，來(lái)自硅谷風(fēng)投機(jī)構(gòu)Menlo Ventures。

　　在未來(lái)與OpenAI的競(jìng)爭(zhēng)中，陳冉認(rèn)為Anthropic的勝面不小，一方面，其團(tuán)隊(duì)在算法上與OpenAI幾乎沒(méi)有差距，且Anthropic背后有亞馬遜、谷歌這樣的靠山，算力方面也并不缺，其次，作為背后投資者亞馬遜擁有許多生態(tài)和場(chǎng)景，相應(yīng)也能提供很多高質(zhì)量的數(shù)據(jù)。陳冉認(rèn)為，現(xiàn)在大模型競(jìng)爭(zhēng)最關(guān)鍵的是數(shù)據(jù)，數(shù)據(jù)的質(zhì)量越高越能訓(xùn)練好模型。

　　“最終Claude有可能會(huì)贏。因?yàn)樘厣呛弦?guī)和安全。”在Claude3發(fā)布后次日，陳冉在朋友圈表示。相比GPT-4等模型，Claude對(duì)安全的強(qiáng)調(diào)尤為明顯。

　　在技術(shù)文檔中，Anthropic表示，Claude在訓(xùn)練過(guò)程中重點(diǎn)是有幫助、無(wú)害和誠(chéng)實(shí)，Anthropic通過(guò)給模型一個(gè)想法來(lái)做到這一點(diǎn)，即一套倫理和行為原則，模型使用這些原則來(lái)指導(dǎo)其輸出，以避免性別歧視、種族主義和有害的產(chǎn)出，以及避免幫助人類(lèi)從事非法或不道德的活動(dòng)。此外，Anthropic還會(huì)有安全評(píng)估，信任和安全團(tuán)隊(duì)會(huì)監(jiān)控違反原則的有害、惡意用例的提示和輸出。

　　對(duì)于Anthropic未來(lái)是否能和 OpenAI 一較高下，郭濤認(rèn)為這主要取決于幾方面的因素。一方面，持續(xù)的研發(fā)和創(chuàng)新是保持競(jìng)爭(zhēng)力的關(guān)鍵。如果 Anthropic 能夠持續(xù)推出先進(jìn)的技術(shù)和改進(jìn)，它有可能在市場(chǎng)上與 OpenAI 競(jìng)爭(zhēng)。另一方面，AI 大模型的成功不僅取決于核心技術(shù)，還取決于能夠建立廣泛的生態(tài)系統(tǒng)和合作伙伴關(guān)系，他認(rèn)為，OpenAI 在這方面有著較強(qiáng)的影響力和網(wǎng)絡(luò)效應(yīng)。此外，如何在商業(yè)模式和市場(chǎng)策略上進(jìn)行創(chuàng)新和調(diào)整，也是決定未來(lái)競(jìng)爭(zhēng)格局的重要因素。

　　“大家有共識(shí)目前Claude 3已經(jīng)在部分能力上超越GPT-4，但具體未來(lái)能不能比GPT系列好，拭目以待。”陳冉說(shuō)。

　　Claude 3出現(xiàn)了，GPT-5還會(huì)遠(yuǎn)嗎？在Claude 3發(fā)布后不久，英偉達(dá)高級(jí)科學(xué)家Jim Fan就在X上發(fā)文調(diào)侃，“正在等待幾個(gè)小時(shí)后精心安排的GPT-5的發(fā)布”。

　　Jim Fan隨后表示，“我喜歡Claude在GPT和Gemini主導(dǎo)的競(jìng)技場(chǎng)上掀起熱度。但請(qǐng)記住，GPT-4V這個(gè)每個(gè)人都迫切想要超越的高水位線，是在2022年完成訓(xùn)練的。這是暴風(fēng)雨前的寧?kù)o。”

　　作者：劉曉潔

本文鏈接：一年狂攬73億美元投資，Anthropic點(diǎn)燃硅谷大模型“戰(zhàn)火”http://www.lensthegame.com/show-5-7920-0.html

聲明：本網(wǎng)站為非營(yíng)利性網(wǎng)站，本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn)，不代表本站觀點(diǎn)，本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅，請(qǐng)大家謹(jǐn)防詐騙！若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。

下一篇：打造新增長(zhǎng)引擎商業(yè)航天迎“黃金時(shí)代”

一年狂攬73億美元投資，Anthropic點(diǎn)燃硅谷大模型“戰(zhàn)火”

熱門(mén)資訊

推薦資訊

社會(huì)最熱文章