
日前,在福建省福州市鼓樓區(qū)安泰街道南門(mén)兜地鐵站里舉行的2025年就業(yè)援助月專項(xiàng)活動(dòng)中,工作人員利用AI技術(shù)和大數(shù)據(jù)分析等先進(jìn)技術(shù),為求職者提供智能化的崗位匹配和職業(yè)規(guī)劃建議。謝貴明攝(人民視覺(jué))

一位江蘇市民正在使用大模型輔助完成日常工作。王坤垚攝
國(guó)家互聯(lián)網(wǎng)信息辦公室2025年1月8日發(fā)布的信息顯示,截至2024年12月31日,共302款生成式人工智能服務(wù)在國(guó)家網(wǎng)信辦完成備案,其中2024年新增238款備案。
從名單看,細(xì)分領(lǐng)域的大模型大量涌現(xiàn),如科大訊飛的“訊飛星火教育大模型”、平安健康的“聊個(gè)天大模型”等。與此同時(shí),隨著DeepSeek-V3等大模型產(chǎn)品憑借更低成本、更強(qiáng)性能引發(fā)海內(nèi)外市場(chǎng)關(guān)注,越來(lái)越多國(guó)產(chǎn)生成式人工智能大模型加入了“提質(zhì)+降價(jià)”的隊(duì)伍。
國(guó)產(chǎn)大模型應(yīng)用情況如何?正處于什么樣的發(fā)展階段?帶著這些問(wèn)題,記者進(jìn)行了采訪。
功能更強(qiáng)
工作生活“好搭子”
備案數(shù)量的增多,從一個(gè)側(cè)面反映出國(guó)產(chǎn)大模型在工作和生活中出現(xiàn)的頻率增高了。
國(guó)產(chǎn)大模型具體發(fā)揮著怎樣的作用?“把自己從繁瑣、細(xì)碎的基礎(chǔ)工作中解放出來(lái)”是很多用戶談到應(yīng)用體會(huì)時(shí)的第一感受。
安徽姑娘強(qiáng)宇銘目前主修法律專業(yè)。在她看來(lái),和人際溝通類似,如果能夠給大模型提供明確且精準(zhǔn)的提示詞,使用者就能獲得事半功倍的效果。“國(guó)產(chǎn)大模型是我學(xué)習(xí)的‘好搭子’。國(guó)內(nèi)人工智能企業(yè)月之暗面開(kāi)發(fā)的Kimi大模型幫我搜最新的司法立法動(dòng)態(tài),文心一言能幫我草擬或潤(rùn)色文章。我還會(huì)使用通義法睿等專門(mén)針對(duì)法律行業(yè)的大模型服務(wù),來(lái)回答法律問(wèn)題、輔助案情分析,并生成各類法律文書(shū)。”強(qiáng)宇銘舉例說(shuō)。
除了搜索和生成之外,大模型提供的服務(wù)也越來(lái)越專業(yè)、越來(lái)越精細(xì)。
“有一次,我臨時(shí)需要將一份專業(yè)報(bào)告中的多種圖片調(diào)整成統(tǒng)一大小。這需通過(guò)Word文檔中的VBA功能實(shí)現(xiàn),不僅需要編寫(xiě)代碼,而且較為復(fù)雜。要是在以前,我只能自己上網(wǎng)搜尋教程并從基礎(chǔ)學(xué)起?,F(xiàn)在,豆包大模型提供的解決方案非常實(shí)用,同時(shí)提供了具體的代碼示例?!痹谏虾氖路康禺a(chǎn)開(kāi)發(fā)工作的薛天朗說(shuō)。
據(jù)百度智能云AI與大模型平臺(tái)業(yè)務(wù)副總經(jīng)理李景秋介紹,擴(kuò)展大模型應(yīng)用場(chǎng)景需要滿足不同維度的要求:一是基座模型質(zhì)量,要有一個(gè)可被指令增強(qiáng)的基礎(chǔ)模型;二是準(zhǔn)備相關(guān)場(chǎng)景化數(shù)據(jù),關(guān)注數(shù)據(jù)與實(shí)際場(chǎng)景的一致性和配適性;三是在訓(xùn)練過(guò)程中找到最優(yōu)的調(diào)試參數(shù)。
李景秋說(shuō),依托大模型強(qiáng)大的能力,百度智能云千帆平臺(tái)開(kāi)始與更多行業(yè)和企業(yè)進(jìn)行合作。比如,在教育領(lǐng)域,借助大模型,“考試寶”為其會(huì)員提供試題解析服務(wù)的能力顯著提升。在招聘領(lǐng)域,獵聘利用大模型快速?gòu)暮?jiǎn)歷中抽取信息進(jìn)行語(yǔ)義分析,人才供需匹配效果更好。“目前,互聯(lián)網(wǎng)行業(yè)之外,金融、教育、文娛、能源等行業(yè)都能看到大模型的身影。”她說(shuō)。
中國(guó)信通院政策與經(jīng)濟(jì)研究所主任工程師程瑩認(rèn)為,國(guó)產(chǎn)大模型技術(shù)在語(yǔ)言、視覺(jué)、多模態(tài)等領(lǐng)域持續(xù)突破,在文本、音頻、視覺(jué)、3D等數(shù)據(jù)方面實(shí)現(xiàn)多模態(tài)統(tǒng)一,持續(xù)突破人工智能感知、理解和推理世界的能力邊界。這些,拓展著大模型與各行各業(yè)融合的深度和廣度?!叭缃?,芯片制造商、數(shù)據(jù)供應(yīng)商、模型研發(fā)企業(yè)、應(yīng)用開(kāi)發(fā)商等方面協(xié)同合作正日益增強(qiáng),共同創(chuàng)造全新應(yīng)用場(chǎng)景和市場(chǎng)空間?!?/p>
成本更低
應(yīng)用普及“降門(mén)檻”
本領(lǐng)增長(zhǎng)的同時(shí),國(guó)產(chǎn)大模型的使用成本也不斷降低。
不久前,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司推出的DeepSeek-V3上線并同步開(kāi)源,快速吸引了全球同行的目光。在多項(xiàng)基準(zhǔn)測(cè)試中,DeepSeek-V3的成績(jī)超越了不少開(kāi)源模型,并在性能上和世界頂尖的閉源模型不分伯仲。OpenAI創(chuàng)始成員安德烈·卡帕斯稱贊道:“DeepSeek—V3使得在有限算力預(yù)算上進(jìn)行模型預(yù)訓(xùn)練這件事變得容易?!?/p>
算力門(mén)檻降低、訓(xùn)練成本減少、性能持續(xù)提高……這些變化,在很多國(guó)產(chǎn)大模型上都有體現(xiàn)。
2024年12月底,阿里云計(jì)算有限公司宣布對(duì)大模型產(chǎn)品進(jìn)行新一輪降價(jià),其中Qwen-VL-Plus輸入價(jià)格每千tokens(源代碼中可以被編譯器識(shí)別的最小單位)從0.008元降至0.0015元,降幅達(dá)81.3%。按照最新價(jià)格,1塊錢可以處理約600張720P圖片或1700張480P圖片。此前,字節(jié)、百度、智譜AI等國(guó)內(nèi)大模型領(lǐng)軍企業(yè)也紛紛調(diào)降了相關(guān)產(chǎn)品和服務(wù)的價(jià)格。
國(guó)產(chǎn)大模型降價(jià)底氣何在?商業(yè)上是否可持續(xù)?
記者了解到,在降成本方面,國(guó)產(chǎn)大模型供應(yīng)商們正在不斷取得新進(jìn)展。
有的進(jìn)行峰谷調(diào)節(jié),優(yōu)化配置資源?!岸拱竽P屯ㄟ^(guò)技術(shù)創(chuàng)新來(lái)降低成本,定價(jià)上有合理的毛利空間,既能保障企業(yè)和開(kāi)發(fā)者用得起,又確保自身商業(yè)可持續(xù)?!被鹕揭嫦嚓P(guān)負(fù)責(zé)人說(shuō),業(yè)務(wù)團(tuán)隊(duì)從算法設(shè)計(jì)階段就考慮到超大規(guī)模的推理需求,在KV cache機(jī)制等方面進(jìn)行創(chuàng)新,使模型能夠用更低成本完成復(fù)雜的推理任務(wù)。在工程方面,利用規(guī)?;瘍?yōu)勢(shì),根據(jù)科研、辦公、休閑娛樂(lè)等不同場(chǎng)景的不同負(fù)載進(jìn)行波峰波谷混合調(diào)度,實(shí)現(xiàn)整體成本的降低。
有的主打差異供給,力求事半功倍。比如,千帆大模型平臺(tái)根據(jù)用戶不同需要進(jìn)行針對(duì)性供給,從而降低其使用成本?!拔覀兲峁┒喾N類型的大模型服務(wù),支持企業(yè)調(diào)用旗艦級(jí)模型解決復(fù)雜問(wèn)題,使用輕量級(jí)模型解決簡(jiǎn)單問(wèn)題,從而大幅降低使用成本?!卑俣戎悄茉魄Хa(chǎn)品相關(guān)負(fù)責(zé)人說(shuō),千帆積極提供工具鏈支持企業(yè)對(duì)輕量級(jí)模型進(jìn)行訓(xùn)練調(diào)試,同時(shí)通過(guò)提供數(shù)據(jù)飛輪、模型蒸餾等模型精調(diào)技術(shù)和訓(xùn)練方法進(jìn)行效果提升,幫助企業(yè)用戶以更低成本、更高效率完成專有模型的全鏈路開(kāi)發(fā)。
在中國(guó)信通院人工智能研究所軟硬件與生態(tài)部主任李論看來(lái),國(guó)產(chǎn)大模型降價(jià)有多方面因素。從供給側(cè)看,算法、芯片等軟硬件進(jìn)步帶來(lái)的技術(shù)紅利,讓大模型訓(xùn)練及推理成本逐漸降低。從需求側(cè)看,降低價(jià)格可以鼓勵(lì)更多用戶和企業(yè)使用大模型,從而豐富應(yīng)用場(chǎng)景、創(chuàng)造全新價(jià)值、實(shí)現(xiàn)規(guī)模效應(yīng)?!半S著預(yù)訓(xùn)練階段逐步完成,全球及國(guó)內(nèi)大模型廠商將轉(zhuǎn)向大力推進(jìn)大模型的后訓(xùn)練及推理側(cè)工程技術(shù)優(yōu)化。未來(lái),高性價(jià)比的大模型服務(wù)有望增加?!崩钫撜f(shuō)。
前景更好
“邊干邊學(xué)”是趨勢(shì)
多位業(yè)內(nèi)人士表示,理想情況下,大模型產(chǎn)品應(yīng)實(shí)現(xiàn)價(jià)格、私密安全性和大模型能力效果的平衡?,F(xiàn)實(shí)中,國(guó)產(chǎn)大模型還面臨缺乏高質(zhì)量數(shù)據(jù)、特定場(chǎng)景表現(xiàn)不佳、服務(wù)不穩(wěn)定等挑戰(zhàn),需要在性能優(yōu)化中擴(kuò)大應(yīng)用,在應(yīng)用擴(kuò)大中提升性能?!拔覀円煤么竽P偷幕灸芰?、創(chuàng)意能力、多模態(tài)能力、業(yè)務(wù)能力、創(chuàng)新能力和科學(xué)能力,并將其與我國(guó)產(chǎn)業(yè)創(chuàng)新應(yīng)用場(chǎng)景充分結(jié)合,最終賦能百行千業(yè)?!?60集團(tuán)創(chuàng)始人周鴻祎說(shuō)。
數(shù)據(jù)的數(shù)量決定大模型的廣度,數(shù)據(jù)的質(zhì)量決定大模型的精度。在實(shí)踐中,不少企業(yè)正通過(guò)讓大模型“邊干邊學(xué)”實(shí)現(xiàn)良性循環(huán)。
騰訊云智能AI產(chǎn)品專家趙新宇介紹,大模型在不同行業(yè)落地的同時(shí),也在推動(dòng)其自身的成長(zhǎng)。比如,“少年得到”的K12語(yǔ)文作文批改功能,就應(yīng)用了騰訊混元大模型的多模態(tài)能力。這款產(chǎn)品通過(guò)騰訊云智能的OCR技術(shù)識(shí)別學(xué)生作文內(nèi)容,并根據(jù)設(shè)置好的評(píng)分標(biāo)準(zhǔn),由大模型為作文打分。“通常,大模型和學(xué)校教師判分,偏差需要控制在5分甚至更低?!壁w新宇說(shuō),客戶群體的擴(kuò)大不僅對(duì)大模型提出了新要求,也有助于加快大模型開(kāi)發(fā)迭代速度,提高大模型的實(shí)用性和適應(yīng)性。
中國(guó)移動(dòng)基于10086客服領(lǐng)域多年沉淀的客服業(yè)務(wù)特色數(shù)據(jù)資源,通過(guò)對(duì)用戶意圖識(shí)別、語(yǔ)言理解、邏輯推理、知識(shí)檢索等任務(wù)的針對(duì)性、系統(tǒng)化訓(xùn)練,讓“九天”客服大模型不斷煥發(fā)新生機(jī)?!?G網(wǎng)絡(luò)支撐起海量數(shù)據(jù)和大規(guī)模連接需求,讓全社會(huì)的信息流動(dòng)更加順暢、更加高效,人與人、人與物、物與物的連接更加緊密,經(jīng)濟(jì)社會(huì)發(fā)展的網(wǎng)絡(luò)底座更加健壯?!敝袊?guó)移動(dòng)董事長(zhǎng)楊杰說(shuō),中國(guó)移動(dòng)推廣“九天”多模態(tài)通用大模型服務(wù),積極推進(jìn)更大參數(shù)體量、更強(qiáng)推理能力的模型訓(xùn)練。
專家預(yù)計(jì),“邊干邊學(xué)、邊學(xué)邊用”的良性循環(huán)將會(huì)讓國(guó)產(chǎn)大模型加速走進(jìn)日常生活。
“未來(lái),大模型有望全方位融入普通人的生活。它可以作為生活助手,即時(shí)解答各類知識(shí)疑問(wèn);可作為娛樂(lè)伙伴,幫助人們創(chuàng)作小說(shuō)、繪畫(huà)、音樂(lè)等;可以作為健康管家,預(yù)警健康風(fēng)險(xiǎn),輔助醫(yī)療咨詢?!背态撜f(shuō)。(王俊嶺)
(責(zé)任編輯:蔡文斌)