OpenAI一紙禁令,挑動了大模型行業(yè)的神經(jīng)。但沒有什么阻礙,可以抵擋技術(shù)向上的決心。在不少大模型廠商開出優(yōu)惠價(jià)格,試圖從OpenAI禁令中截流用戶的同時(shí),國產(chǎn)大模型的代表企業(yè)科大訊飛,拿出了直面技術(shù)挑戰(zhàn)的勇氣。
6月27日,科大訊飛在北京國家會議中心舉行訊飛星火4.0發(fā)布會。在“懂你的AI助手”這個主題下,訊飛星火大模型不但在8個國際主流測試集中排名第一,實(shí)現(xiàn)了對GPT-4 Turbo的全面對標(biāo),還對商業(yè)化落地、生產(chǎn)力探索做出了更全面的闡釋,前瞻了行業(yè)的“Next-level”。
這一次,星火大模型掀起了新的巨浪。
自力更生,星火大模型成國產(chǎn)力量代言人
在國內(nèi)外總共覆蓋中英文的12項(xiàng)主流測試集,訊飛星火大模型V4.0在其中8項(xiàng)全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。后面這三位,正是目前英文世界大模型的戰(zhàn)力天花板選手。
換一個指標(biāo),去年,科大訊飛參與設(shè)計(jì)了國產(chǎn)通用認(rèn)知智能大模型測評體系,包含由481個測試項(xiàng)組成的7個方面。而如今,星火大模型V4.0在其中的文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力五個方面超越了GPT-4 Turbo,僅在代碼能力和多模態(tài)能力上仍有一定差距。
不過從數(shù)據(jù)來看,文本生成(80.2%)、語言理解(82.3%)、知識問答(85.7%)、邏輯推理(82.2%)、數(shù)學(xué)能力(86.5%)、代碼能力(81.2%)、多模態(tài)能力(78.4%)這組數(shù)據(jù)放在一起,星火大模型V4.0總體已然算是國產(chǎn)大模型的能力代表。
具體來看,GPT-4 Turbo、Claude 3 Opus和星火大模型V4.0,重點(diǎn)都放在多維度信息組成的復(fù)雜指令、更考驗(yàn)邏輯任務(wù)能力的空間推理等高階能力上。根據(jù)科大訊飛發(fā)布會現(xiàn)場的介紹,星火大模型V4.0不僅在長文本等通用能力上整體打平GPT-4 Turbo,而且更加擅長利用已有資料進(jìn)行聯(lián)系推理——比如解讀幾張有聯(lián)系的圖片的關(guān)系,為其補(bǔ)全內(nèi)容情節(jié),并減少“幻覺”的出現(xiàn)。
有趣的地方在于,星火大模型V4.0其實(shí)在多模態(tài)能力方面,實(shí)現(xiàn)了對GPT4-Turbo的部分超越,比如科研、金融、醫(yī)療、司法和辦公等專業(yè)領(lǐng)域的圖文識別能力。這代表星火大模型V4.0的側(cè)重點(diǎn)明顯不同于普通的通用大模型。它更側(cè)重于某些垂直領(lǐng)域的應(yīng)用潛力。
對此,科大訊飛董事長劉慶峰在演講中做了一些闡述:“大模型不僅可以寫詩、作畫,在改變工業(yè)、改變科研范式等方面已經(jīng)實(shí)實(shí)在在發(fā)揮作用,包括我們和中國科學(xué)技術(shù)大學(xué)做的合成類的科學(xué)創(chuàng)新,比如說化學(xué);還有與合肥綜合性國家科學(xué)中心能源研究院合作,在推進(jìn)大模型賦能核聚變整個過程中更快地預(yù)測、更好地應(yīng)對各種各樣的異常情況。”
應(yīng)用,已經(jīng)成為星火大模型V4.0的重頭戲。只有真正用起來,能力才會有價(jià)值。
以訊飛星火APP為例,自2023年9月全面開放以來,訊飛星火APP在安卓公開市場累計(jì)下載量達(dá)1.31億次。現(xiàn)在,全新升級的訊飛星火APP,允許消費(fèi)者用自己的知識庫打造“更懂你的AI助手”。換句話說,專屬于個體的智能體。
按照劉慶峰在演講中透露的信息,訊飛星火APP使用的高峰期是工作日的工作時(shí)間段,意味著它真的變成了不少用戶的剛需。這是對“AI只能用來玩玩”的刻板印象的有力回?fù)簦彩切腔鸫竽P蛢r(jià)值的體現(xiàn)。
但更讓人激動的應(yīng)用,其實(shí)還在蓄力。個人能從星火大模型中找到助手,企業(yè)乃至社會,將從中汲取更大的力量。這就是整個大模型產(chǎn)業(yè)的“Next-level”,它的亮點(diǎn)就在落地的最后一公里,以及那些暫時(shí)還是暢想的形式。
真正的Next-level,藏在最后一公里
幾個簡單的問題,可以讓我們對星火大模型V4.0的未來進(jìn)化更有數(shù)。
首先,智能體為什么值得期待?九合創(chuàng)投在近日召開的年會上發(fā)布了《不朽的計(jì)算:比特連接世界,詞元生成未來》報(bào)告。其中提到,“模型是能夠沉淀智慧的計(jì)算形態(tài)”。傳統(tǒng)算法是數(shù)學(xué)結(jié)果,一次使用不具備普及性。但模型可以持續(xù)進(jìn)化,適應(yīng)多維度的使用需求。而封裝為智能體之后的超級模型,已經(jīng)是特定領(lǐng)域的智慧結(jié)晶。它具有不可估量的復(fù)用價(jià)值。
以星火企業(yè)智能體平臺為例,科大訊飛已經(jīng)首批創(chuàng)建了32個企業(yè)智能體,可以深入業(yè)務(wù)流程,滿足企業(yè)的需求。而這個過程其實(shí)非常輕松,企業(yè)只需要提出需求就可以開始創(chuàng)建智能體,經(jīng)過功能驗(yàn)證后,就可以真實(shí)上馬,并可以和企業(yè)內(nèi)部辦公平臺打通。
從市場價(jià)值來看,訊飛星火大模型從去年發(fā)布到現(xiàn)在,已經(jīng)和國家能源集團(tuán)、中國石油、中國移動、交通銀行、大眾汽車、海爾集團(tuán)、美的集團(tuán)等行業(yè)領(lǐng)軍企業(yè)建立合作,證明其使用價(jià)值得到一線認(rèn)可。
其次,為什么是訊飛?因?yàn)槠髽I(yè)智能的底層除了大模型技術(shù),還有對企業(yè)業(yè)務(wù)的理解,對分門別類的場景的認(rèn)知,這不是坐在辦公室里就能拍腦袋想出來的。訊飛建立這些認(rèn)知,花費(fèi)了數(shù)十年的時(shí)間和遍布各行各業(yè)的具體嘗試。所以,智能體是新物種,但在訊飛和星火大模型的共同支持下,它會很快和現(xiàn)有生態(tài)相融。
換句話說,訊飛的領(lǐng)先,是星火大模型的技術(shù)領(lǐng)先和自身To B和To G業(yè)務(wù)領(lǐng)先的復(fù)合結(jié)果。2024年6月,訊飛剛剛榮獲國家科學(xué)技術(shù)進(jìn)步獎一等獎,獲獎項(xiàng)目名為“多語種智能語音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”,技術(shù)和產(chǎn)業(yè)化的雙劍合璧,成為一塊勛章。上半場的技術(shù)較量,訊飛能和OpenAI掰手腕。下半場的應(yīng)用較量,訊飛更懂中國市場。
最后,星火大模型V4.0背后的進(jìn)化,對智能體概念的探索,遠(yuǎn)期價(jià)值恐怕會遠(yuǎn)超普通人的想象。目前,還只是這個概念的蓄力階段。
一個很關(guān)鍵的問題是,從GPT-4 Turbo到星火大模型V4.0,我們越來越關(guān)注大模型的多模態(tài)能力、空間和邏輯推理能力、對復(fù)雜指令的理解和執(zhí)行能力等等。這種需求引導(dǎo)下發(fā)展的大模型和智能體,注定用于和現(xiàn)實(shí)世界融合交互。
現(xiàn)代機(jī)器人之父羅德尼·布魯克斯(Rodney Brooks)在1991年發(fā)表的《沒有表征的智能》論文中提出,傳統(tǒng)智能基于復(fù)雜算法和內(nèi)部數(shù)據(jù)模型是錯誤和片面的,真正的智能行為要從自主機(jī)器與環(huán)境的物理交互中產(chǎn)生。這個想法更加適合今天大模型和智能體的發(fā)展,或者說“具身智能”的概念——能理解和推理物理世界,并且產(chǎn)生互動。
“AI教母”李飛飛選擇的創(chuàng)業(yè)方向就是與之類似的“空間智能”。她曾在TED的演講上舉過一個例子——一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她說,人類大腦可以評估“這個玻璃杯的幾何形狀,它在三維空間中的位置,它與桌子、貓和所有其他東西的關(guān)系”,所有推理都基于這些認(rèn)知。
無疑,星火大模型V4.0也好,GPT-4 Turbo也罷,都是在朝著這種意義上的智能發(fā)展。
劉慶峰曾提出星火大模型的四條商業(yè)化路徑,其中一條就是基于“超腦2030計(jì)劃”推動機(jī)器人走進(jìn)千家萬戶,重頭戲在于全棧機(jī)器人能力,而這又源于大模型的多模感知和多維表達(dá)。
對科大訊飛來說,好消息是它所掌握的應(yīng)用經(jīng)驗(yàn),很有可能讓星火大模型在向空間智能、具身智能的發(fā)展過程中步步領(lǐng)先。比如現(xiàn)在,星火個人智能體和企業(yè)智能體的落地,其實(shí)已經(jīng)在調(diào)動現(xiàn)實(shí)要素對大模型和智能體進(jìn)行完善。只不過,目前的應(yīng)用停留在數(shù)字空間,還沒有深入現(xiàn)實(shí)進(jìn)行交互。
但我們相信,這一天會比想象的更早到來。畢竟,從去年的星火大模型1.0版本到如今的4.0版本,科大訊飛從無到有,創(chuàng)造出世界一流的大模型能力和應(yīng)用,已然是一個奇跡。
而在當(dāng)下這個世界中,地緣層面的割裂已經(jīng)影響到大模型世界的完整性。當(dāng)OpenAI發(fā)出斷供宣言,有星火大模型這樣的一線玩家能夠頂上,不得不說是中國大模型產(chǎn)業(yè)的幸運(yùn)。在這一年,中國人工智能領(lǐng)域的實(shí)力,正在這些領(lǐng)先者身上,閃耀著新的光芒。
來源:松果財(cái)經(jīng)
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
每一輪技術(shù)浪潮出現(xiàn)時(shí),沖在最前面的都是朝氣蓬勃的年輕人。當(dāng)大模型代表的人工智能浪潮席卷全球,作為移動互聯(lián)網(wǎng)“原住民”的年輕開發(fā)者,可以說是最活躍的群體。他們的臉龐還有些稚嫩,但在技術(shù)和方向上有著自己的想法,在火熱的AI賽道里加速狂奔,努力打下一片新天地。面壁智能CTO曾國洋就是其中的佼佼者,26歲的
如果說2023年是大模型的資格賽,融資額度決定了能否晉級,2024年已然快進(jìn)到了淘汰賽的階段。字節(jié)跳動、阿里云、百度智能云、騰訊云等先后在5月中下旬加入“價(jià)格戰(zhàn)”,輕量級模型直接免費(fèi),主力模型的API價(jià)格普遍下調(diào)了90%以上。曾經(jīng)以“燒錢”著稱的大模型,迅速進(jìn)入到“白菜價(jià)”時(shí)代。當(dāng)時(shí)就有人提出這樣的
明知產(chǎn)能嚴(yán)重過剩的新能源企業(yè)卻還在重金擴(kuò)產(chǎn),多半因?yàn)樗麄兓ǖ牟皇亲约旱腻X;明知極度燒錢的AI大模型卻開始打價(jià)格戰(zhàn),多半因?yàn)樗麄儾⒉豢窟@東西掙錢。所有投資人必備的一項(xiàng)技能,就是中觀行業(yè)景氣度及商業(yè)模式對比。很明顯,AI有很多的商業(yè)邏輯與其他行業(yè)非常相似。就比如:有實(shí)力的才能卷、免費(fèi)的往往才是最貴的。打
Manus撕開一道真相
文/八真來源/節(jié)點(diǎn)財(cái)經(jīng)具身智能賽道,誰最有可能拔得A股資本市場的頭籌?答案大概率是誕生剛剛兩年,由華為"天才少年"、B站百萬粉絲科技UP主稚暉君(彭志輝)創(chuàng)立的智元機(jī)器人。近期,從事新材料研發(fā)與生產(chǎn)的上緯新材(688585.SH)丟出重磅炸彈,宣布智元機(jī)器人及相關(guān)主體將通過收購其至少63.62%的股
文/道哥大舉裁員、清空賬號、國內(nèi)IP無法訪問——曾被譽(yù)為“中國AIAgent希望之星”的Manus,在估值飆至5億美元的高光時(shí)刻“閃離”中國市場。近日,Manus“裁員、出走”的消息在媒體端大量發(fā)酵。消息稱,Manus公司總部將由中國遷至新加坡,其國內(nèi)團(tuán)隊(duì)也將大幅裁撤——原有120人規(guī)模團(tuán)隊(duì)除40余
四個月前邀請碼炒至10萬元,如今官網(wǎng)變灰、社交賬號清空,這家AI新貴的閃電遷移折射中國科技企業(yè)出海潮涌。7月11日,打開Manus官網(wǎng)的用戶發(fā)現(xiàn)一則突兀提示:“Manus在你所在的地區(qū)不可用”。而就在不久前,這個位置還顯示著“Manus中文版本正在開發(fā)中”的樂觀聲明。同時(shí),Manus官方微博和小紅書
文/十界來源/節(jié)點(diǎn)財(cái)經(jīng)一場圍繞算力自主的競賽,正在科創(chuàng)板上演。近日,國產(chǎn)全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書,擬募資約80億人民幣,成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者,也打響了“國產(chǎn)英偉達(dá)”上市的第一槍。據(jù)招股書顯示,摩爾線程自2020年成立以來,主營全功能GPU芯片的研發(fā)與銷售,以自主
“AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
百度AI團(tuán)隊(duì)今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場
“宇樹已形成硬件、算法、場景聯(lián)動的業(yè)務(wù)飛輪,自研率超95%的技術(shù)壁壘讓其成為全球機(jī)器人賽道不可忽視的中國力量。”首程資本管理合伙人朱方文在追加投資時(shí)如是評價(jià)。7月7日,據(jù)每日經(jīng)濟(jì)新聞從宇樹科技投資方處獲悉,國內(nèi)人形機(jī)器人領(lǐng)軍企業(yè)宇樹科技(UnitreeRobotics)已明確計(jì)劃于科創(chuàng)板IPO,預(yù)計(jì)
推理與多模態(tài)的終極融合,將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認(rèn)將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個強(qiáng)大模型,特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”,為用戶提供前所未有的統(tǒng)一體驗(yàn)。OpenAI開發(fā)者體驗(yàn)負(fù)