人人鲁免费播放视频,日韩精品无码免费午夜,国语对白操逼,国产成人精品午夜福利,国模娜娜一区二区三区,成人无码男男gv在线观看网站,亚洲欧美一区二区久久

壓縮算法為大語言模型“瘦身”

來源:科技日報
2024-11-23 08:47 
分享
分享到
分享到微信

原標(biāo)題:壓縮算法為大語言模型“瘦身”

據(jù)美國科學(xué)促進(jìn)會旗下網(wǎng)站19日報道,美國普林斯頓大學(xué)和斯坦福大學(xué)團(tuán)隊開發(fā)出一種新壓縮算法CALDERA,能精簡大型語言模型(LLM)的海量數(shù)據(jù),為LLM“瘦身”。這項(xiàng)算法不僅有助保護(hù)數(shù)據(jù)隱私、節(jié)約能源、降低成本,還能推動LLM在手機(jī)和筆記本電腦上高效使用。

團(tuán)隊舉例稱,當(dāng)人們使用ChatGPT時,請求會被發(fā)送到OpenAI公司的后端服務(wù)器進(jìn)行處理。這一過程不僅成本高昂、能耗巨大,通常還很慢。如果用戶想要使用消費(fèi)級圖形處理單元運(yùn)行LLM,就需要對這些LLM進(jìn)行壓縮。

CALDERA算法通過減少LLM冗余并降低信息層的精度來發(fā)揮作用?!笆萆怼焙蟮腖LM更加精簡,可在手機(jī)或筆記本電腦等設(shè)備上存儲和訪問,同時提供了與未壓縮版本幾乎一樣準(zhǔn)確而微妙的性能。

雖然CALDERA并非首個壓縮LLM的算法,但其獨(dú)特之處在于兼具“低精度”和“低排序”兩種特性。其中,“低精度”減少了比特數(shù),加快了數(shù)據(jù)存儲和處理速度。而“低排序”則降低了LLM數(shù)據(jù)中的冗余。

團(tuán)隊表示,使用CALDERA壓縮的LLM可能適用于那些對精度要求不是最高的場景。此外,用戶可在智能手機(jī)或筆記本電腦等設(shè)備上對壓縮后的LLM進(jìn)行微調(diào),這使其能根據(jù)特定需求調(diào)整模型來增強(qiáng)隱私,而無需與第三方共享敏感數(shù)據(jù)。

不過團(tuán)隊也提醒道,在智能手機(jī)或筆記本電腦上運(yùn)行LLM,可能會占用設(shè)備內(nèi)存。(記者 劉霞)

【責(zé)任編輯:張瑨瑄】

為你推薦

換一批
中國日報網(wǎng)版權(quán)說明:凡注明來源為“中國日報網(wǎng):XXX(署名)”,除與中國日報網(wǎng)簽署內(nèi)容授權(quán)協(xié)議的網(wǎng)站外,其他任何網(wǎng)站或單位未經(jīng)允許禁止轉(zhuǎn)載、使用,違者必究。如需使用,請與010-84883777聯(lián)系;凡本網(wǎng)注明“來源:XXX(非中國日報網(wǎng))”的作品,均轉(zhuǎn)載自其它媒體,目的在于傳播更多信息,其他媒體如需轉(zhuǎn)載,請與稿件來源方聯(lián)系,如產(chǎn)生任何問題與本網(wǎng)無關(guān)。
版權(quán)保護(hù):本網(wǎng)登載的內(nèi)容(包括文字、圖片、多媒體資訊等)版權(quán)屬中國日報網(wǎng)(中報國際文化傳媒(北京)有限公司)獨(dú)家所有使用。 未經(jīng)中國日報網(wǎng)事先協(xié)議授權(quán),禁止轉(zhuǎn)載使用。給中國日報網(wǎng)提意見:rx@chinadaily.com.cn

<menuitem id="4ve18"></menuitem>
    <option id="4ve18"></option>
    <ul id="4ve18"><dfn id="4ve18"></dfn></ul>

    1. <b id="4ve18"></b>
    2. <menuitem id="4ve18"></menuitem>

        <th id="4ve18"><span id="4ve18"></span></th>

        人人鲁免费播放视频,日韩精品无码免费午夜,国语对白操逼,国产成人精品午夜福利,国模娜娜一区二区三区,成人无码男男gv在线观看网站,亚洲欧美一区二区久久 a√片免费大全在线观看不卡 性插动态图第139期百度 人妻在线a免费视频 高清无码性爱网站 99精品视频免费热播 99久久这里都是精品免费 亚洲自偷自偷图片高清不卡