解決傳統(tǒng)架構(gòu)記憶瓶頸 MiniMax發(fā)布新一代模型

3個月前來源：新京報觀看：37

1月15日，“AI六小虎”之一的MiniMax發(fā)布并開源了新一代01系列模型，包含基礎(chǔ)語言大模型MiniMax-Text-01和視覺多模態(tài)大模型MiniMax-VL-01。該系列模型使用多項突破性創(chuàng)新，以大規(guī)模應(yīng)用線性注意力機制打破了Transformer傳統(tǒng)架構(gòu)的記憶瓶頸。

未來，AI智能體有望成為最重要的產(chǎn)品形態(tài)，由于智能體處理的任務(wù)變得越來越復(fù)雜，涉及的數(shù)據(jù)量也越來越大，單個智能體的記憶以及多個智能體協(xié)作間的上下文都會變得越來越長。因此，長上下文能力與多模態(tài)處理能力的提升至關(guān)重要。

技術(shù)上，MiniMax-01系列模型首次將線性注意力機制擴展到商用模型的級別，受益于此次架構(gòu)創(chuàng)新，該系列模型在處理長輸入的時候具有非常高的效率，接近線性復(fù)雜度。從規(guī)模效應(yīng)、結(jié)構(gòu)設(shè)計、訓(xùn)練優(yōu)化和推理優(yōu)化等層面綜合考慮，MiniMax選擇模型參數(shù)量為4560億，其中每次激活459億，能夠高效處理400萬token的上下文，將有效替代Transformer傳統(tǒng)架構(gòu)并開啟超長文本輸入時代。相較于Gemini等一眾全球頂級模型，MiniMax-01隨著輸入長度變長，性能衰減最慢。

值得注意的是，MiniMax還開源了Text-01模型、VL-01模型的完整權(quán)重，以便于更多開發(fā)者做有價值、突破性的研究。MiniMax方面表示，“我們認為這有可能啟發(fā)更多長上下文的研究和應(yīng)用，從而更快促進Agent時代的到來，二是開源也能促使我們努力做更多創(chuàng)新，更高質(zhì)量地開展后續(xù)的模型研發(fā)工作。”

點擊展開全文

本文鏈接：http://www.020gz.com.cn/news-2-195-0.html解決傳統(tǒng)架構(gòu)記憶瓶頸 MiniMax發(fā)布新一代模型

聲明：本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻，不代表本站觀點，本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅，請大家謹(jǐn)防詐騙！若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。

上一篇：深瞳丨AI為藥物研發(fā)按下“快進鍵”

下一篇：絲巾變色、火柴變玫瑰年貨節(jié)期間淘寶魔術(shù)道具銷量大增174%

為你推薦

超導(dǎo)直線等離子體裝置“赤霄” 建成投運

1月14日，記者從中國科學(xué)院合肥物質(zhì)科學(xué)研究院等離子體物理研究所（以下簡稱“等離子體所”）獲悉，由該所建設(shè)運行的國家重大科技基礎(chǔ)設(shè)施“聚變堆主機關(guān)...

01-21

可見光圖像下火場火線自動提取技術(shù)獲突破

1月21日，記者從福州大學(xué)獲悉，該校物理與信息工程學(xué)院森林火災(zāi)智能防控科研團隊首次利用計算機視覺和人工智能技術(shù)，通過無人機從空中采集火場的可見光...

01-22

古韻點燃旅游熱潮

　　作者：本報記者魯元珍《光明日報》（2025年02月06日15版）　　到北方冰雪世界感受銀裝素裹的美景，...

02-07

遼寧將通過收購存量商品房方式新增12萬套保障性住房

　　近日，《遼寧省加大存量商品房收購力度　進一步提升住房保障能力的若干措施》（以下簡稱《若干措施》）正...

02-07

北京擬不斷優(yōu)化房地產(chǎn)政策！持續(xù)推進房地產(chǎn)市場回穩(wěn)向好

　　開年以來，多地將穩(wěn)樓市作為重要工作。　　1月14日，鄭州市房協(xié)發(fā)出倡議書，倡議全市房企在“春節(jié)...

01-21

今冬以來我國為何降水偏少？氣象專家分析→

　　近日，全國多地氣溫偏高，很多地區(qū)沒有降水或降水稀少。中央氣象臺數(shù)據(jù)顯示，19日又是雨雪非常稀少的一天，上午10時，只有6個國家級氣象站降水量達到0.1毫米。為什么會出現(xiàn)這...

01-21

小米YU7實車圖再曝光無框式車門一體式尾門開啟拉花樣式運動

[本站資訊] 日前，小米YU7實車圖再度曝光，這組實車圖展示給我們新車的更多細節(jié)，新車定位為中大型SUV，售價預(yù)計會在30-40萬之間，并將在2025年6月-7月份正式上市。此次最新...

01-24

寧德時代移動式充儲檢一體機器人“CharGo 充電狗”在江蘇、上海、海南等地部署

1 月 27 日消息，寧德時代官微今日發(fā)文稱，今年，寧德時代分別在江蘇、上海、海南等地部署移動式充儲檢一體機器人 —— CharGo 充電狗。根據(jù)江蘇省交通運輸廳和南京市交...

01-28

【文化評析】提升微短劇質(zhì)量打造文旅消費亮點

　　【文化評析】　　作者：劉誠（中國社會科學(xué)院財經(jīng)戰(zhàn)略研究院研究員）　　近年來，微短劇在我國迅猛...

01-24

《顧念》劇情介紹

《顧念》正在熱播，該劇憑借精彩的劇情、精良的制作和演員們的出色表演，贏得了觀眾的一致好評，并迅速登頂收視榜首，成為一部非常值得一看的作品。主演是馬士堯和...

02-22

年終專稿?健康鄉(xiāng)村建設(shè) | 山東基層診療干出好成績

　　大眾網(wǎng)記者孫海燕濟南報道　　2024年9月3日，國家衛(wèi)健委等14部門聯(lián)合發(fā)布《關(guān)于推進健康鄉(xiāng)村建設(shè)的指導(dǎo)意見》，將健康鄉(xiāng)村建設(shè)作為落實鄉(xiāng)村振興和健康中國兩大國家...

01-21

上海開啟男性HPV疫苗接種：男女共防實現(xiàn)群體免疫是關(guān)鍵

21世紀(jì)經(jīng)濟報道記者韓利明上海報道隨著日前四價HPV疫苗佳達修?的多項新適應(yīng)證獲得國家藥品監(jiān)督管理局的上市批準(zhǔn)，成為中國境內(nèi)首個且目...

01-25

數(shù)字化助力傳統(tǒng)文化服飾傳承與創(chuàng)新

　　近日，在第三屆全球數(shù)字貿(mào)易博覽會上發(fā)布了首批全國農(nóng)村電商“領(lǐng)跑縣”典型案例，曹縣是山東省唯一上榜者。文化自信是新時代的突出優(yōu)勢，也是新時代文化的鮮明標(biāo)識。正是...

01-21

以新修訂的國防教育法為引領(lǐng) 推動新時代學(xué)校國防教育高質(zhì)量發(fā)展

作者：王歡（西安交通大學(xué)黨委副書記）國無防不立，民無防不安。國防教育是建設(shè)和鞏固國防的基礎(chǔ)，是增強民族凝聚...

01-22

鋼銀電商：本周全國城市鋼材庫存環(huán)比增加14.39% 建材庫存增幅超兩成

　　摘要　　【鋼銀電商：本周全國城市鋼材庫存環(huán)比增加14.39%建材庫存增幅超兩成】鋼銀電商27日...

01-28

多空因素交織致鋼價震蕩尋底政策預(yù)期與關(guān)稅風(fēng)險成博弈焦點

　　近期，受美國關(guān)稅政策影響，市場情緒波動較大，螺紋鋼期價呈沖高回落走勢，主力合約自高位累計下跌3...

02-13

怎么判斷天蝎男愛你，這些表現(xiàn)特征他有嗎

天蝎座的男生通常深沉、神秘，他們不會輕易表露自己的感情。然而，當(dāng)一個天蝎男愛上你時，他...

01-22

天蝎男開始動情的細節(jié)有哪些

天蝎座的男性通常給人一種神秘而深沉的感覺，他們內(nèi)心充滿了激情和熱情。當(dāng)一個天蝎男開...

01-22

健身男胖子穿搭？ 160斤男胖子穿搭夏季？

健身男胖子穿搭？ 160斤男胖子穿搭夏季？一、健身男胖子穿搭？最帥的搭配是上身一件工字背心，下身一件緊身褲，一雙白色運動鞋，完美二、160斤男胖子穿搭夏季？160斤胖子夏季應(yīng)穿寬松的衣...

02-12

時尚T臺秀上的秘密武器：道具傘的魅力與創(chuàng)意

時尚T臺秀上的秘密武器：道具傘的魅力與創(chuàng)意當(dāng)我走進時尚界的T臺秀場，映入眼簾的總是那些色彩斑斕、設(shè)計獨特的服裝，以及為其增光添彩的各種道具。其中，有一種道具常常成為我特別...

02-17

永輝超市春節(jié)后首批調(diào)改店確認涉及15個城市

2月11日消息，永輝超市日前發(fā)布了乙巳蛇年首批調(diào)改門店名單，共計20家門店，涉及15個城市。其中，包括了武漢、太原、南寧、開封、溫州、東莞、綿陽和福清8個新晉調(diào)改城市，屆時，調(diào)改店...

02-11

抖音電商累計處置“盜播”直播間10萬余個

2月10日消息，抖音發(fā)布直播間盜播違規(guī)處理公示，自2024年11月份起，抖音電商開啟了對直播間“內(nèi)容作弊：盜播”行為開展了專項治理行動，至今已累計處置盜播直播間10萬余個，涉及違規(guī)作...

02-11

攜程業(yè)績打破歷史記錄，年收入達500億

梁建章：拿高倍望遠鏡都看不到攜程的競爭對手。攜程2024年業(yè)績大漲這年頭，誰不愛游山玩水，品嘗各地美食，來上一場說走就走的旅行？從淄博燒烤的火爆，到甘肅天水麻辣燙的風(fēng)靡，再到哈爾...

02-26

在抖音亂搞，大批商家被處理，張一鳴也太狠了

大清洗來臨。1.抖音生服重拳出擊，違規(guī)商家被處理在抖音，每天都有近200萬條探店視頻涌向6億消費者。有人被種草了一碗麻辣燙，有人下單了人生第一次醫(yī)美，但也有人掉進“9.9元低價...

03-01

華軟科技：困境反轉(zhuǎn)，未來可期

金陵華軟科技股份有限公司（以下簡稱“華軟科技”）于2025年1月18日發(fā)布了2024年度業(yè)績預(yù)告。盡管公司預(yù)計2024年凈利潤仍為負值，但從整體情況來看，華軟科技正在逐步擺脫困境，展現(xiàn)...

01-21

海爾生物等在天津成立生物醫(yī)藥產(chǎn)業(yè)基金

【#海爾生物等在天津成立生物醫(yī)藥產(chǎn)業(yè)基金# 出資額5600萬】天眼查App顯示，近日，天津協(xié)禾生物醫(yī)藥產(chǎn)業(yè)基金合伙企業(yè)（有限合伙）成立，執(zhí)行事務(wù)合伙人為天津濱海創(chuàng)投投資管理有限公司...

02-09

《街霸6》不知火舞即將參戰(zhàn) 玩家期待男角色穿招牌性感女忍裝

來自SNK的經(jīng)典角色不知火舞即將于2月5日明天登陸《街霸6》參戰(zhàn)，同時上線的招牌性感女忍裝備受玩家期待，不過玩家似乎更加期待如此大開大合的衣裝被男性格斗家穿...

02-04

《怪物獵人：荒野》制作人辻本良三：不能確定是否登陸Switch 2

近日，在接受西班牙媒體Gamereactor采訪時，《怪物獵人：荒野》制作人辻本良三和總監(jiān)德田優(yōu)也被問及了游戲是否會登陸Switch 2的問題，雖然兩人明顯沒有透露任何有關(guān)Sw...

02-13

又創(chuàng)新高！“金價遠遠超出預(yù)算”，還會越等越貴？

目前在品牌金飾市場，克單價800元以下的商品已很難看到了。2月4日，周大福官網(wǎng)報出的足金飾品價格為846元/克，周生生報出的價格更是達到852元/克，均為品牌足金飾品售價的歷史高位...

02-04

伊朗政府尚無與特朗普“會面或談判”計劃

新華社德黑蘭2月5日電（記者陳霄沙達提）伊朗第一副總統(tǒng)阿雷夫5日在首都德黑蘭接受媒體采訪時表示，伊朗政府目前沒有與美國總統(tǒng)特朗普“會面或談判”的計劃。據(jù)伊朗伊斯蘭共和國...

02-06

日本高清中文字幕一区二区三区a-日本高清专区一区二无线-日本高新1区2区3区-日本国产亚洲-操操操综合网-操操久久

全部導(dǎo)航

解決傳統(tǒng)架構(gòu)記憶瓶頸 MiniMax發(fā)布新一代模型

巨量引擎破局廣告投訴難題：AI審核嚴(yán)打“黑灰產(chǎn)”，賬戶自動處置率提升268%

對話《三國志?戰(zhàn)略版》發(fā)行制作人曾令鵬：敬畏三國文化，五年長跑從未躺平

vivo的2024：回歸常識走出屬于自己的路

年漲387%！“2024年股王”寒武紀(jì)有望單季度扭虧，其他芯片廠商表現(xiàn)如何？

堿基編輯技術(shù)可提高感染朊病毒小鼠生存率

AI工具識別虛假新聞準(zhǔn)確率達99%

江門中微子實驗：從地下深處仰望星辰大海

如同科幻小說中的“巴別魚” “語音到語音”即時翻譯AI模型推出