China Daily Homepage
中文網(wǎng)首頁
時政
資訊
C財經(jīng)
生活
視頻
專欄
原創(chuàng)
觀天下
地方

登錄

注冊

移動新媒體

China Daily Homepage
中文網(wǎng)首頁
時政
資訊
C財經(jīng)
生活
視頻
專欄
漫畫
原創(chuàng)
觀天下
地方

壓縮算法為大語言模型“瘦身”

來源：科技日報

2024-11-23 08:47　

分享到

分享到微信

原標(biāo)題：壓縮算法為大語言模型“瘦身”

據(jù)美國科學(xué)促進(jìn)會旗下網(wǎng)站19日報道，美國普林斯頓大學(xué)和斯坦福大學(xué)團(tuán)隊開發(fā)出一種新壓縮算法CALDERA，能精簡大型語言模型（LLM）的海量數(shù)據(jù)，為LLM“瘦身”。這項(xiàng)算法不僅有助保護(hù)數(shù)據(jù)隱私、節(jié)約能源、降低成本，還能推動LLM在手機(jī)和筆記本電腦上高效使用。

團(tuán)隊舉例稱，當(dāng)人們使用ChatGPT時，請求會被發(fā)送到OpenAI公司的后端服務(wù)器進(jìn)行處理。這一過程不僅成本高昂、能耗巨大，通常還很慢。如果用戶想要使用消費(fèi)級圖形處理單元運(yùn)行LLM，就需要對這些LLM進(jìn)行壓縮。

CALDERA算法通過減少LLM冗余并降低信息層的精度來發(fā)揮作用?！笆萆怼焙蟮腖LM更加精簡，可在手機(jī)或筆記本電腦等設(shè)備上存儲和訪問，同時提供了與未壓縮版本幾乎一樣準(zhǔn)確而微妙的性能。

雖然CALDERA并非首個壓縮LLM的算法，但其獨(dú)特之處在于兼具“低精度”和“低排序”兩種特性。其中，“低精度”減少了比特數(shù)，加快了數(shù)據(jù)存儲和處理速度。而“低排序”則降低了LLM數(shù)據(jù)中的冗余。

團(tuán)隊表示，使用CALDERA壓縮的LLM可能適用于那些對精度要求不是最高的場景。此外，用戶可在智能手機(jī)或筆記本電腦等設(shè)備上對壓縮后的LLM進(jìn)行微調(diào)，這使其能根據(jù)特定需求調(diào)整模型來增強(qiáng)隱私，而無需與第三方共享敏感數(shù)據(jù)。

不過團(tuán)隊也提醒道，在智能手機(jī)或筆記本電腦上運(yùn)行LLM，可能會占用設(shè)備內(nèi)存。（記者劉霞）

【責(zé)任編輯：張瑨瑄】

科技日報

最熱新聞

為你推薦

換一批

關(guān)于我們 | 聯(lián)系我們

首頁
時政
資訊
財經(jīng)
生活
視頻
專欄
漫畫
獨(dú)家
招聘

違法和不良信息舉報
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120170006
信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證0108263號
京公網(wǎng)安備11010502032503號
京網(wǎng)文[2011]0283-097號
京ICP備13028878號-6

中國日報網(wǎng)版權(quán)說明：凡注明來源為“中國日報網(wǎng)：XXX（署名）”，除與中國日報網(wǎng)簽署內(nèi)容授權(quán)協(xié)議的網(wǎng)站外，其他任何網(wǎng)站或單位未經(jīng)允許禁止轉(zhuǎn)載、使用，違者必究。如需使用，請與010-84883777聯(lián)系；凡本網(wǎng)注明“來源：XXX（非中國日報網(wǎng)）”的作品，均轉(zhuǎn)載自其它媒體，目的在于傳播更多信息，其他媒體如需轉(zhuǎn)載，請與稿件來源方聯(lián)系，如產(chǎn)生任何問題與本網(wǎng)無關(guān)。

版權(quán)保護(hù)：本網(wǎng)登載的內(nèi)容（包括文字、圖片、多媒體資訊等）版權(quán)屬中國日報網(wǎng)（中報國際文化傳媒（北京）有限公司）獨(dú)家所有使用。未經(jīng)中國日報網(wǎng)事先協(xié)議授權(quán)，禁止轉(zhuǎn)載使用。給中國日報網(wǎng)提意見：rx@chinadaily.com.cn

首頁
時政
資訊
財經(jīng)
文化
漫畫
視頻
地方

中文 | English

中國日報版權(quán)所有
Content@chinadaily.com.cn

人人鲁免费播放视频,日韩精品无码免费午夜,国语对白操逼,国产成人精品午夜福利,国模娜娜一区二区三区,成人无码男男gv在线观看网站,亚洲欧美一区二区久久

壓縮算法為大語言模型“瘦身”