被爆炒的“AI智能體” Manus:有體驗(yàn)者稱(chēng)性能強(qiáng)但不穩(wěn)定,為何頻遭質(zhì)疑
國(guó)內(nèi)最新AI(人工智能)智能體產(chǎn)品在走紅的同時(shí)也備受質(zhì)疑。
3月5日晚間,成立于2023年的中國(guó)AI初創(chuàng)公司Butterfly Effect(蝴蝶效應(yīng))發(fā)布AI Agent(智能體)Manus的早期預(yù)覽版,將其稱(chēng)為“全球首款通用智能體產(chǎn)品”。從介紹來(lái)看,使用者只需要給Manus一個(gè)簡(jiǎn)單的指令,它就能自動(dòng)完成復(fù)雜的任務(wù)。Manus的出現(xiàn)推動(dòng)A股相關(guān)概念在6日大漲。
目前,Manus只放出了官網(wǎng)和介紹視頻,若想體驗(yàn)Manus就需要獲得內(nèi)測(cè)邀請(qǐng)碼。介紹視頻中展示了Manus執(zhí)行三個(gè)任務(wù)的過(guò)程,分別是篩選簡(jiǎn)歷、挑選房產(chǎn)和分析股票。從介紹來(lái)看,使用者只需要給Manus一個(gè)簡(jiǎn)單的指令,它就能自動(dòng)完成復(fù)雜的任務(wù)。
“挺強(qiáng)的,但還是不夠穩(wěn)定。”一位Manus的體驗(yàn)者告訴澎湃新聞?dòng)浾摺?span style="display:none">aTB流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM
因強(qiáng)大自主性而走紅,質(zhì)疑聲隨之而來(lái)
Manus將自己定義為“通用智能體”。從團(tuán)隊(duì)提供的案例來(lái)看,似乎用戶只需給出一個(gè)指令,它就能自動(dòng)完成復(fù)雜的任務(wù)。例如,用戶可以要求Manus為自己提供日本的旅游攻略,配上對(duì)旅程的細(xì)節(jié)要求和對(duì)攻略最終表現(xiàn)形式的要求,Manus就會(huì)像專(zhuān)業(yè)的旅行社員工一樣搜集資料并整理好反饋給用戶。
北京郵電大學(xué)智能交互設(shè)計(jì)專(zhuān)業(yè)副教授譚劍向澎湃新聞?dòng)浾弑硎荆Y(jié)合目前已有的官方資料和測(cè)試直播來(lái)看,Manus能夠接收自然語(yǔ)言指令,融合語(yǔ)言、圖像、語(yǔ)音等多種模態(tài)數(shù)據(jù),貫穿瀏覽器、云平臺(tái)、個(gè)人終端等數(shù)字平臺(tái),精準(zhǔn)捕捉用戶的深層需求,獨(dú)立完成任務(wù)。這種從“思考”到“行動(dòng)”的閉環(huán)能力,展示了其強(qiáng)大的自主性。
譚劍指出,另一邊,Manus存在的缺陷也很明顯,“不是任何任務(wù)都聽(tīng)得懂干得了”,“盡管Manus展示了強(qiáng)大的自主執(zhí)行能力,但在復(fù)雜任務(wù)或未知環(huán)境中,也會(huì)出現(xiàn)宕機(jī)的狀態(tài),原因在于其推理鏈路的缺失或知識(shí)的不完備。可以預(yù)知,還有大量的特殊性任務(wù)需要進(jìn)一步優(yōu)化和訓(xùn)練。”
其實(shí),自從發(fā)布以來(lái),Manus受到了不少質(zhì)疑。有網(wǎng)友指出,Manus只放出了一個(gè)英文的官方網(wǎng)站和英文的宣傳片,看起來(lái)更像是個(gè)出海產(chǎn)品,但在海外社交平臺(tái)上的討論度并不高,而Manus在國(guó)內(nèi)也沒(méi)有社群和服務(wù)方面的支持。也有海外研究者在社交平臺(tái)上發(fā)文稱(chēng),Manus是一款好產(chǎn)品,但并非是技術(shù)突破。
而在3月7日午間,一個(gè)在X平臺(tái)名為@ManusAI_HQ賬號(hào)顯示被凍結(jié),該賬號(hào)凍結(jié)前并未獲得任何認(rèn)證,僅發(fā)布了數(shù)條有關(guān)Manus的視頻和文字介紹,但Manus官網(wǎng)的X平臺(tái)鏈接均指向于此。7日下午,疑似為Manus聯(lián)合創(chuàng)始人兼首席科學(xué)家季逸超的X平臺(tái)賬號(hào)(@peakji)發(fā)布聲明稱(chēng):“我們的官方X帳戶昨天意外被凍結(jié)。我們正積極與X團(tuán)隊(duì)合作解決此事。初步觀察表明,此次凍結(jié)可能與第三方提及加密貨幣詐騙有關(guān)。澄清一下:Manus 從未參與過(guò)加密貨幣項(xiàng)目、代幣發(fā)行或區(qū)塊鏈計(jì)劃,任何聲稱(chēng)與我們有關(guān)聯(lián)的類(lèi)似名稱(chēng)的加密貨幣企業(yè)都是具有欺詐性的。”
此外,由于邀請(qǐng)碼機(jī)制,只有極少數(shù)開(kāi)發(fā)者能夠?qū)嶋H體驗(yàn)到產(chǎn)品,又與Manus在國(guó)內(nèi)社交媒體上的“火爆”形成了鮮明對(duì)比。6日當(dāng)天,有網(wǎng)友關(guān)注到Manus的邀請(qǐng)碼在二手電商平臺(tái)一度被炒至數(shù)萬(wàn)元之高,不過(guò)成交量為零。到了3月7日,在二手電商平臺(tái)已經(jīng)看不到高價(jià)的Manus邀請(qǐng)碼,而是出現(xiàn)了許多的代申請(qǐng)服務(wù)。
3月6日,Manus的合伙人張濤在微信朋友圈發(fā)文回應(yīng)稱(chēng)“完全低估了大家的熱情”,公司“從未開(kāi)設(shè)任何付費(fèi)獲取邀請(qǐng)碼的渠道”,并且“從未投入任何市場(chǎng)推廣預(yù)算”,內(nèi)測(cè)期間系統(tǒng)容量有限,將優(yōu)先保障現(xiàn)有用戶的核心體驗(yàn),并逐步有序釋放邀請(qǐng)。
多位國(guó)內(nèi)AI從業(yè)者對(duì)記者表示,自己和身邊的朋友都沒(méi)能夠獲得邀請(qǐng)碼,無(wú)以一睹該產(chǎn)品的“真面目”。有相關(guān)研究者表示,Manus的宣傳可能有些過(guò)熱,在這種情況下,大眾對(duì)產(chǎn)品產(chǎn)生質(zhì)疑也很正常。
與國(guó)內(nèi)社交平臺(tái)和網(wǎng)絡(luò)熱烈討論形成鮮明對(duì)比的是,目前海外討論聲音并不算多,或許是因?yàn)槎鄶?shù)人并未能上手體驗(yàn)。
獵豹移動(dòng)董事長(zhǎng)兼CEO傅盛6日在“傅盛講AI”的視頻號(hào)中也提到,從目前公開(kāi)的資料來(lái)看,Manus的功能“確實(shí)很像鋼鐵俠里的賈維斯(AI系統(tǒng))了,但是具體能力很難評(píng)估,因?yàn)檫@個(gè)受基座模型的影響也很大,但目前相關(guān)信息并沒(méi)有公開(kāi)。套了好幾家的殼是一定的,就不知道都套了哪些。”
3月7日,全球最大代碼托管平臺(tái)GitHub上還開(kāi)始出現(xiàn)Manus的開(kāi)源復(fù)刻項(xiàng)目。例如,一個(gè)名為OpenManus的項(xiàng)目打出了“無(wú)需邀請(qǐng)碼即可實(shí)現(xiàn)任何想法”的旗號(hào),在不到一天的時(shí)間內(nèi),該項(xiàng)目的Star量(星標(biāo))已經(jīng)超過(guò)了四千。開(kāi)發(fā)者只需創(chuàng)建環(huán)境,克隆項(xiàng)目并修改相應(yīng)信息,即可在本地搭建一個(gè)近似于Manus的AI智能體。
體驗(yàn)者評(píng)價(jià):性能強(qiáng)但不穩(wěn)定
“挺強(qiáng)的,但還是不夠穩(wěn)定。”一位Manus的體驗(yàn)者告訴澎湃新聞?dòng)浾撸孧anus設(shè)計(jì)了一份跨度長(zhǎng)達(dá)半年的多國(guó)旅行攻略,單靠人力需要花費(fèi)十幾天才能完成的工作,Manus幾十分鐘就搞定了,而且這份攻略“全到令我震驚,比之前的大模型輸出的路線規(guī)劃明顯更合理”。
不過(guò),他也指出,“速度很關(guān)鍵,如果是普通的任務(wù),用戶可能沒(méi)耐心等待幾十分鐘”。同時(shí),在處理更為復(fù)雜的任務(wù)時(shí),也會(huì)因算力不足的原因出現(xiàn)報(bào)錯(cuò)和任務(wù)中斷的情況。
澎湃新聞?dòng)浾咴谟^察其他體驗(yàn)者使用的過(guò)程中也發(fā)現(xiàn),Manus目前在處理任務(wù)時(shí)等待時(shí)間都較長(zhǎng),同時(shí)也需要進(jìn)行一些人為干預(yù),來(lái)糾正例如對(duì)自然語(yǔ)言指令理解出現(xiàn)偏差的情況。
對(duì)于大家都“催”著Manus盡快開(kāi)放,多名AI業(yè)內(nèi)人士對(duì)記者表示,Manus選擇內(nèi)測(cè)的形式可能是因?yàn)椤疤F”、“太燒算力”。
至于agent的使用價(jià)格,外媒近日曝出了OpenAI對(duì)AI agent的收費(fèi)計(jì)劃,“博士”級(jí)別的agent每月收費(fèi)可能高達(dá)2萬(wàn)美元,主要面向希望補(bǔ)充軟件工程師或醫(yī)學(xué)研究人員的用戶,尤其是愿意為大規(guī)模自動(dòng)化支付高價(jià)的企業(yè)客戶;可用于軟件開(kāi)發(fā)的agent每月收費(fèi)1萬(wàn)美元;面向“高收入知識(shí)工作者”的agent每月收費(fèi)2000美元。
前述業(yè)內(nèi)人士對(duì)記者表示,如果agent確實(shí)效果好且有實(shí)際需求,付費(fèi)模式應(yīng)該不成問(wèn)題,但考慮到較高的價(jià)格,可能給用戶提供幾次試用機(jī)會(huì)會(huì)更具可行性。
譚劍表示,雖然2025年被廣泛視為AI智能體規(guī)模化落地的關(guān)鍵年份,但在處理復(fù)雜任務(wù)、理解上下文和人機(jī)交互等方面,智能體仍需進(jìn)一步提升:“不過(guò),我看好AI智能體的未來(lái)。可以設(shè)想,結(jié)合了AI智能體的機(jī)器人將具有自然語(yǔ)言溝通、團(tuán)隊(duì)協(xié)作和復(fù)雜流程自動(dòng)化作業(yè)的能力,這是非常有前景的生產(chǎn)力發(fā)展方向。”
本文鏈接:被爆炒的“AI智能體”Manus:有體驗(yàn)者稱(chēng)性能強(qiáng)但不穩(wěn)定http://www.lensthegame.com/show-5-48945-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇: 水利部部長(zhǎng)李國(guó)英:近10年全國(guó)用水總量實(shí)現(xiàn)零增長(zhǎng)