編者按:
12月1日,阿里云舉辦通義千問發(fā)布會,開源通義千問720億參數(shù)模型Qwen-72B、18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。至此,通義千問共開源18億、70億、140億、720億參數(shù)的4款大語言模型,以及視覺理解、音頻理解兩款多模態(tài)大模型,實(shí)現(xiàn)了“全尺寸、全模態(tài)”的開源。
基于開源的大語言模型,用戶可在魔搭社區(qū)直接體驗(yàn)Qwen系列模型效果,也可通過阿里云靈積平臺調(diào)用模型API,或基于阿里云百煉平臺定制大模型應(yīng)用。
利用時(shí)髦的開源大模型,如何結(jié)合專業(yè)所學(xué),做一件有意義的事?
顏鑫,華東理工大學(xué)“心動(dòng)實(shí)驗(yàn)室”(X-D Lab)成員,一位剛剛畢業(yè)的本科生。他所在的團(tuán)隊(duì),現(xiàn)在正專注于社會計(jì)算和心理情感領(lǐng)域的AI應(yīng)用開發(fā)?;陂_源的通義千問開源模型,他們開發(fā)了心理健康、醫(yī)療健康、教育及考試三款大模型,并希望實(shí)現(xiàn)產(chǎn)品化。
以下為顏鑫的講述。
孤獨(dú)是一種普遍的社會情緒
我是“00后”,就讀于華東理工大學(xué)自動(dòng)化專業(yè),今年(2023年)剛剛本科畢業(yè)。
“心動(dòng)實(shí)驗(yàn)室”此前的研究方向包括社會計(jì)算與社會智能、群體智能與隱私保護(hù)、公共衛(wèi)生與輿情監(jiān)測、工業(yè)智能與智能系統(tǒng)等,大模型出現(xiàn)后,我們聚焦AI情感計(jì)算領(lǐng)域,希望利用大語言模型、自然語言處理、機(jī)器學(xué)習(xí)、聯(lián)邦學(xué)習(xí)等技術(shù),開發(fā)一些好的應(yīng)用,撫慰和治愈當(dāng)代人的心靈。
我們做了三款垂直領(lǐng)域大模型:心理健康大模型MindChat(漫談),主要提供心理撫慰、心理測評等服務(wù);醫(yī)療健康大模型 Sunsimiao(孫思邈),主要提供一些用藥和養(yǎng)生建議;教育/考試大模型 Gradchat(錦鯉),給學(xué)生提供就業(yè)、升學(xué)、出國留學(xué)等方面的指導(dǎo)。
MindChat是一款心理咨詢工具, 像個(gè)AI心理咨詢師,能在溫暖、安全、及時(shí)、方便的對話環(huán)境下,為用戶提供心理評估等服務(wù)。我們在Qwen基礎(chǔ)上,結(jié)合心理學(xué)專業(yè)知識,訓(xùn)練與調(diào)試了該模型,大家可以通過阿里云魔搭社區(qū)體驗(yàn)。
打工人上班被老板罵了,心里不爽;學(xué)生寫不出論文,影響畢業(yè)……遇到這些事情,都可以去跟MindChat聊聊,甚至可以語音輸入。MindChat會共情用戶,通過文字內(nèi)容和語音語調(diào),分析用戶的情感和心理狀態(tài),給出相應(yīng)的建議,包括是否需要真正的人類專家/心理專家介入。
現(xiàn)代社會,需要心理咨詢或心理陪伴的人很多,中國人不習(xí)慣找心理醫(yī)生,不是自己憋著,就是跟家人朋友傾訴。家人朋友的好處是,能給出實(shí)時(shí)的反饋。我們希望MindChat成為用戶的朋友,能為人們提供安全的、實(shí)時(shí)反饋的溝通環(huán)境。
目前已有超過20萬人次用過我們的大模型,我們累計(jì)提供了超過100萬次的問答服務(wù)。大家問得最多的就是升學(xué)、考研、就業(yè)、職場之類的壓力。我們的感覺是,現(xiàn)代人的心理狀態(tài)都比較低落,有的人很喪,有的人戾氣很重。
這個(gè)項(xiàng)目起源于我跟老師在飯桌上的一次對話。我的老師之前在德國發(fā)展,長居德國,三四年前為了照顧家里老人,回到了國內(nèi)。我是一個(gè)人在外求學(xué),留爺爺奶奶孤獨(dú)在家,偶爾會打打電話。但這些都不夠,家人還是缺少陪伴。
孤獨(dú)可能是這個(gè)社會的普遍情緒,科技能不能帶來一點(diǎn)幫助呢?用簡單易用的界面提供服務(wù),讓孤獨(dú)的人找到情緒出口,保持與社會的連接。所以我們決定開發(fā)心理大模型。
“為場景找技術(shù)”,而不是為技術(shù)找場景
大模型應(yīng)用落地的驅(qū)動(dòng)力,不應(yīng)該是“為技術(shù)找場景”,而應(yīng)該是“為場景找技術(shù)”。
心理服務(wù)就是這樣的場景,它在整個(gè)社會有很大的需求空間,而整體供給又很匱乏,優(yōu)質(zhì)可靠的心理咨詢服務(wù)在很多地方都是奢侈品。我們想用大模型技術(shù)把這類服務(wù)變得普惠。
我們做這件事最開始是很偶然的,整個(gè)小團(tuán)隊(duì)從模型微調(diào)開始,一點(diǎn)點(diǎn)摸索。但做著做著發(fā)現(xiàn),在解決一些需求點(diǎn)的時(shí)候,我們又回歸到主業(yè)上。比如聯(lián)邦學(xué)習(xí),這是一種針對分布式系統(tǒng)的機(jī)器學(xué)習(xí)技術(shù),可以采用各種隱私技術(shù)(如加密技術(shù)等),確保參與聯(lián)邦學(xué)習(xí)的各方做出有用的計(jì)算,同時(shí)保證用戶數(shù)據(jù)不被泄露。我們在做模型微調(diào)時(shí),就關(guān)注信息隱私保護(hù)和數(shù)據(jù)加密,采用分布式架構(gòu)存儲與分析訓(xùn)練數(shù)據(jù),很好地保護(hù)了用戶信息。這可能也是場景驅(qū)動(dòng)帶來的驚喜吧。
醫(yī)療、心理都是非常注重隱私的場景,很多客戶都要求私有化部署,所以我們選擇開源模型。我們一直在追蹤開源領(lǐng)域大模型的發(fā)展,Qwen出現(xiàn)之前,我們試用了一些其他模型,比如ChatGLM、Baichuan、InternLM。
Qwen-7B和14B推出后,我們快速做了試驗(yàn),用內(nèi)部數(shù)據(jù)和自己的benchmark做了測評。在我們的場景中,通義千問是所有的開源模型里發(fā)揮最好的,是目前的最優(yōu)解。尤其在復(fù)雜的邏輯推理方面,通義千問表現(xiàn)出很強(qiáng)的能力。在同樣的對焦實(shí)驗(yàn)下,當(dāng)我們用同樣的方法、把同樣規(guī)模的數(shù)據(jù)應(yīng)用到各個(gè)開源模型,Qwen的效果比其他模型好得多。所以,我們的三款垂直領(lǐng)域大模型主要以Qwen為基座。
如何選擇一款對的模型?
我們做模型選型,主要關(guān)注幾個(gè)問題:
是否可持續(xù)。我們沒有資源從頭訓(xùn)練一個(gè)基座模型,從市場上選模型的第一個(gè)考量就是,它背后的機(jī)構(gòu)能不能給模型很好的背書,能不能持續(xù)投入基座模型及其生態(tài)建設(shè)?為跟風(fēng)、吃紅利而生的大模型不可持續(xù)。阿里云是國內(nèi)“大廠”里唯一開源大模型的組織,能把通義千問72B這么大尺寸的模型都開源出來,說明在開源上是有決心的、能持續(xù)投入的。
是否有生態(tài)。我們希望選擇主流的、穩(wěn)定的模型架構(gòu),它能最大限度發(fā)揮生態(tài)的力量,匹配上下游的環(huán)境。通義千問開源模型是符合要求的。
是否滿足場景需求。心理領(lǐng)域需要溫柔、知性、能共情的大模型,教育大模型要有豐富的知識、優(yōu)秀的計(jì)算能力和調(diào)用外部工具的能力。不同廠家的模型性格各異,從知識結(jié)構(gòu)來說,有的模型像文科生,千問像理科生。
從可持續(xù)性、生態(tài)和場景適配這三個(gè)維度判斷,通義千問成了當(dāng)下最優(yōu)解。此前有一家企業(yè)找我們合作,我們只用20萬tokens的數(shù)據(jù)微調(diào)了Qwen基座模型,就得到了比另一家用百萬級數(shù)據(jù)微調(diào)的模型更好的效果。這證明了通義千問基座模型的能力,也證明了我們有很好的行業(yè)know-how。
至于模型大小,7B、14B等的模型各有適用場景。我們有些心理領(lǐng)域的客戶需要私有化部署模型,也要控制算力消耗,這時(shí)我們推薦 7B。有些客戶對模型性能要求更高,我們就優(yōu)先推薦14B。總之,在性能和成本之間找到最佳平衡。我們也在探索模型的量化、壓縮、推理加速等技術(shù),希望未來能讓大模型部署到手機(jī)等端側(cè)場景。
我對72B的模型抱有非常大的期待,好奇72B在我們領(lǐng)域中的能力極限值。高校計(jì)算資源有限,我們可能不會用這么大參數(shù)的模型直接做推理服務(wù),但可能基于Qwen-72B 做些學(xué)術(shù)探索,包括利用聯(lián)邦學(xué)習(xí)算法處理數(shù)據(jù)。也希望72B的推理成本能得到很好的控制。
我們團(tuán)隊(duì)都是堅(jiān)定的開源支持者,X-D Lab采取開閉源兩條腿走路的策略,一部分模型對外開源,反哺開源社區(qū);另一部分適用于真實(shí)場景的模型以閉源API的方式對外提供服務(wù)。也是根據(jù)場景需求來做匹配。
還沒有評論,來說兩句吧...