快科技3月27日消息,今天,阿里云宣布通義千問(wèn)Qwen2.5-Omni-7B正式開源。
這是通義系列模型中首個(gè)端到端全模態(tài)大模型,可同時(shí)處理文本、圖像、音頻和視頻等多種輸入,并實(shí)時(shí)生成文本與自然語(yǔ)音合成輸出。
在的多模態(tài)融合任務(wù)OmniBench等測(cè)評(píng)中,Qwen2.5-Omni刷新業(yè)界紀(jì)錄,全維度遠(yuǎn)超谷歌的Gemini-1.5-Pro等同類模型。
阿里云表示,相較于動(dòng)輒數(shù)千億參數(shù)的閉源大模型,Qwen2.5-Omni以7B的小尺寸讓全模態(tài)大模型在產(chǎn)業(yè)上的廣泛應(yīng)用成為可能。
即便在手機(jī)上,也能部署和應(yīng)用Qwen2.5-Omni模型。
目前,Qwen2.5-Omni已在魔搭社區(qū)和Hugging Face 同步開源,用戶也可在Qwen Chat上直接體驗(yàn)。
據(jù)悉,2023年起,通義團(tuán)隊(duì)陸續(xù)開發(fā)覆蓋0.5B、1.5B、3B、7B、14B、32B、72B、110B等參數(shù)的200多款全尺寸大模型,囊括文本生成模型、視覺(jué)理解/生成模型、語(yǔ)音理解/生成模型、文生圖及視頻模型等全模態(tài)。
開源地址:
https://huggingface.co/Qwen/Qwen2.5-Omni-7B
https://modelscope.cn/models/Qwen/Qwen2.5-Omni-7B
https://github.com/QwenLM/Qwen2.5-Omni
(舉報(bào))
還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...