欧美日本亚洲国产_欧美日韩高清福利区_亚洲日精品一区在线观看_亚洲国产精品热久久2022_欧美美女被操网站_中文字幕日韩精品网站_最近中文字幕大全_精品国产福利在线观看91帕_美女黄色视频大全集_国内在线视频一区

微軟、英偉達紛紛押注小模型,大模型不香了?

微軟、英偉達紛紛押注小模型,大模型不香了?

huangyuzhong 2025-01-15 經(jīng)濟 2 次瀏覽 0個評論

來源:雪球App,作者: 神的財富管家,(https://xueqiu.com/6839283062/302344549)

全文2125字,閱讀約需7分鐘,幫我劃重點

劃重點

01隨著人工智能發(fā)展,科技巨頭紛紛推出小型語言模型(SLM),挑戰(zhàn)過去“越大越好”的觀念。

02微軟和發(fā)布了最新的小型語言模型Phi-3.5-mini-instruct和Mistral-NeMo-Minitron8B,強調(diào)計算資源使用和功能表現(xiàn)之間的平衡。

03人工智能初創(chuàng)公司Hugging Face預(yù)測2024年將成為SLM之年,目前科技巨頭已發(fā)布9款小模型。

04然而,SLM在特定領(lǐng)域內(nèi)表現(xiàn)優(yōu)異,但在特定訓(xùn)練領(lǐng)域之外可能表現(xiàn)不佳,缺乏廣泛的知識庫。

05由于成本和技術(shù)復(fù)雜性,大型語言模型(LLM)的開發(fā)和部署面臨挑戰(zhàn),促使科技公司關(guān)注SLM。

以上內(nèi)容由混元大模型生成,僅供參考

在人工智能發(fā)展的道路上,科技巨頭們曾經(jīng)競相開發(fā)規(guī)模龐大的語言模型,但如今出現(xiàn)了一種新趨勢:小型語言模型(SLM)正逐漸嶄露頭角,挑戰(zhàn)著過去“越大越好”的觀念。

視覺中國

當?shù)貢r間8月21日,微軟和相繼發(fā)布了最新的小型語言模型——Phi-3.5-mini-instruct和 Mistral- NeMo- Minitron8B。這兩款模型的主要賣點是它們在計算資源使用和功能表現(xiàn)之間實現(xiàn)了良好的平衡。在某些方面,它們的性能甚至可以媲美大模型。

人工智能初創(chuàng)公司Hugging Face的首席執(zhí)行官Clem Delangue指出,高達99%的使用場景可以通過SLM來解決,并預(yù)測2024年將成為SLM之年。據(jù)不完全統(tǒng)計,包括、、在內(nèi)的科技巨頭們今年已經(jīng)發(fā)布了9款小模型。

大模型訓(xùn)練成本攀升

微軟、英偉達紛紛押注小模型,大模型不香了?

SLM的崛起并非偶然,而是與大模型(LLM)在性能提升與資源消耗方面的挑戰(zhàn)密切相關(guān)。

AI 初創(chuàng)公司 Vellum 和Hugging Face今年4月份發(fā)布的性能比較表明,LLM之間的性能差距正在迅速縮小,特別是在多項選擇題、推理和數(shù)學(xué)問題等特定任務(wù)中,頂級模型之間的差異極小。例如,在多項選擇題中,Claude 3 Opus、GPT- 4 和Gemini Ultra的準確率均超過83%,而在推理任務(wù)中,Claude3 Opus、GPT-4和Gemini 1.5Pro的準確率均超過92%。

Uber AI 前負責(zé)人 Gary Marcus指出:“我想每個人都會說GPT-4比GPT-3.5領(lǐng)先了一步,但此后的一年多沒有任何質(zhì)的飛躍。”

與有限的性能提升相比,LLM的訓(xùn)練成本卻在不斷攀升。訓(xùn)練這些模型需要海量數(shù)據(jù)和數(shù)以億計甚至萬億個參數(shù),導(dǎo)致了極高的資源消耗。訓(xùn)練和運行LLM所需的計算能力和能源消耗令人咋舌,這使得小型組織或個人難以參與核心LLM開發(fā)。

國際能源署估計,數(shù)據(jù)中心、加密貨幣和人工智能相關(guān)的電力消耗到2026年,會大致相當于日本全國的用電量。

OpenAI首席執(zhí)行官阿爾特曼曾在麻省理工學(xué)院的一次活動上表示,訓(xùn)練GPT-4的成本至少為1億美元,而Anthropic首席執(zhí)行官Dario Amodei預(yù)測,未來訓(xùn)練模型的成本可能達到1000億美元。

此外,使用LLM所需的工具和技術(shù)的復(fù)雜性也增加了開發(fā)人員的學(xué)習(xí)曲線。從訓(xùn)練到部署,整個過程耗時漫長,減緩了開發(fā)速度。劍橋大學(xué)的一項研究顯示,公司可能需要90天或更長時間才能部署一個機器學(xué)習(xí)模型。

LLM的另一個重大問題是容易產(chǎn)生“幻覺”——即模型生成的輸出看似合理,但實際上并不正確。這是由于LLM的訓(xùn)練方式是根據(jù)數(shù)據(jù)中的模式預(yù)測下一個最可能的單詞,而非真正理解信息。因此,LLM可能會自信地生成虛假陳述、編造事實或以荒謬的方式組合不相關(guān)的概念。如何檢測和減少這些“幻覺”是開發(fā)可靠且可信賴語言模型的持續(xù)挑戰(zhàn)。

小模型可降低成本

對LLM巨大能源需求的擔(dān)憂,以及為企業(yè)提供更多樣化AI選項的市場機會,讓科技公司將注意力逐漸轉(zhuǎn)向了SLM。

《每日經(jīng)濟新聞》記者注意到,不管是Arcee、Sakana AI和Hugging Face等AI初創(chuàng)公司,還是科技巨頭都在通過SLM和更經(jīng)濟的方式吸引投資者和客戶。

此前,、、OpenAI和Anthropic都發(fā)布了比旗艦LLM更緊湊、更靈活的小模型。這不僅降低了開發(fā)和部署的成本,也為商業(yè)客戶提供了更便宜的解決方案。鑒于投資者越來越擔(dān)心AI企業(yè)的高成本和不確定的回報,更多的科技公司可能會選擇這條道路。即便是微軟和,如今也先后推出了自己的小模型(SLM)。

SLM是LLM的精簡版本,具有更少的參數(shù)和更簡單的設(shè)計,它們需要更少的數(shù)據(jù)和訓(xùn)練時間——只需幾分鐘或幾小時。這使得SLM更高效,更易于在小型設(shè)備上部署。例如,它們可以嵌入到手機中,而無需占用超算資源,從而降低成本,并顯著提升響應(yīng)速度。

SLM的另一個主要優(yōu)勢是其針對特定應(yīng)用的專業(yè)化。SLM專注于特定任務(wù)或領(lǐng)域,這使它們在實際應(yīng)用中更加高效。例如,在情緒分析、命名實體識別或特定領(lǐng)域的問答中,SLM的表現(xiàn)往往優(yōu)于通用模型。這種定制化使得企業(yè)能夠創(chuàng)建高效滿足其特定需求的模型。

SLM在特定領(lǐng)域內(nèi)也不易出現(xiàn)“幻覺”,因為它們通常在更窄、更有針對性的數(shù)據(jù)集上訓(xùn)練,這有助于模型學(xué)習(xí)與其任務(wù)最相關(guān)的模式和信息。SLM的專注性降低了生成不相關(guān)、意外或不一致輸出的可能性。

盡管規(guī)模較小,SLM在某些方面的性能并不遜色于大模型。最新推出的Phi-3.5-mini-instruct僅擁有38億個參數(shù),但其性能優(yōu)于Llama3.18B和Mistral7B等參數(shù)遠高于它的模型。美國東北大學(xué)(位于美國馬薩諸塞州波士頓,是一所頂尖的私立研究型大學(xué))語言模型研究專家Aaron Mueller指出,擴展參數(shù)數(shù)量并非提高模型性能的唯一途徑,使用更高質(zhì)量的數(shù)據(jù)訓(xùn)練也可以產(chǎn)生類似效果。

OpenAI首席執(zhí)行官阿爾特曼在4月的一次活動中表示,他相信當前正處于巨型模型時代的末期,“我們將通過其他方式來提升它們的表現(xiàn)?!?/p>

不過,需要注意的是,雖然SLM的專業(yè)化是一大優(yōu)勢,但也有局限性。這些模型可能在其特定訓(xùn)練領(lǐng)域之外表現(xiàn)不佳,缺乏廣泛的知識庫,和LLM相比無法生成廣泛主題的相關(guān)內(nèi)容。這一限制要求用戶可能需要部署多個SLM來覆蓋不同的需求領(lǐng)域,從而使AI基礎(chǔ)設(shè)施復(fù)雜化。

隨著AI領(lǐng)域的快速發(fā)展,小模型的標準可能會不斷變化。東京小模型初創(chuàng)公司Sakana的聯(lián)合創(chuàng)始人兼首席執(zhí)行官David Ha表示,幾年前看似龐大的AI模型,現(xiàn)在看來已經(jīng)顯得“適中”?!按笮】偸窍鄬Φ??!盌avid Ha說道。

轉(zhuǎn)載請注明來自杭州安米通儀器設(shè)備有限公司,本文標題:《微軟、英偉達紛紛押注小模型,大模型不香了?》

百度分享代碼,如果開啟HTTPS請參考李洋個人博客
每一天,每一秒,你所做的決定都會改變你的人生!

發(fā)表評論

快捷回復(fù):

評論列表 (暫無評論,2人圍觀)參與討論

還沒有評論,來說兩句吧...

Top
 國際音標最新  貝因美最新消息  最新愛秀  奧田最新  最新高鐵圖片  20萬貸款20年月供明細表  美團最新頭盔  現(xiàn)貨2017最新消息  浠水房價最新一覽表  衛(wèi)捷最新電影  2021最新抖音名  去福建一定要去哪里旅游  出租車2024最新版下載  英國最新gdp數(shù)據(jù)  映秀最新  最新澳門娛樂網(wǎng)站  智度最新消息  國內(nèi)旅游推薦地方  興化市戴南最新規(guī)劃  影視  漢陽三眼橋最新規(guī)劃  系列哥最新原創(chuàng)  最新二手車  黃驊港最新招聘信息  特朗普會贏大選最新消息  寶應(yīng)最新新聞  最新城  潘忠苗最新