亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁 科技週邊 人工智慧 來自科技進(jìn)步一等獎的肯定:騰訊破解萬億參數(shù)大模型訓(xùn)練難題

來自科技進(jìn)步一等獎的肯定:騰訊破解萬億參數(shù)大模型訓(xùn)練難題

Mar 27, 2024 pm 09:41 PM
產(chǎn)業(yè) 騰訊雲(yún)

中國電子學(xué)會 2023 科學(xué)技術(shù)獎授獎名單公佈,這次,我們發(fā)現(xiàn)了一個熟悉的身影 —— 騰訊 Angel 機(jī)器學(xué)習(xí)平臺。

在大模型快速發(fā)展的當(dāng)下,科學(xué)技術(shù)獎授予機(jī)器學(xué)習(xí)平臺類研究和應(yīng)用項目,對於模型訓(xùn)練平臺的價值和重要性給予了充分的肯定。

來自科技進(jìn)步一等獎的肯定:騰訊破解萬億參數(shù)大模型訓(xùn)練難題

科學(xué)技術(shù)獎?wù)J可了機(jī)器學(xué)習(xí)平臺類專案的研究和應(yīng)用,特別在大型模型快速發(fā)展的背景下,對模型訓(xùn)練平臺的價值和重要性給予了充分的認(rèn)可。

隨著深度學(xué)習(xí)的興起,各大公司開始意識到機(jī)器學(xué)習(xí)平臺在發(fā)展人工智慧技術(shù)中的重要性。谷歌、微軟、英偉達(dá)等公司都推出了自己的機(jī)器學(xué)習(xí)平臺,以加速人工智慧模式的訓(xùn)練過程。這些平臺為開發(fā)者提供了便利的支持,使他們能夠更快地建構(gòu)和優(yōu)化複雜的人工智慧系統(tǒng)。這種趨勢促使人們更加關(guān)注機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,並為未來的人工智慧應(yīng)用打下了堅實的基礎(chǔ)。

從2023年開始,大型模型的興起進(jìn)一步推動了模型參數(shù)量的提升。各大公司紛紛推出了參數(shù)規(guī)模達(dá)到千億甚至萬億等級的模型,這些模型普遍採用深度神經(jīng)網(wǎng)路結(jié)構(gòu)。然而,這種發(fā)展也帶來了兩個核心痛點:模型分散式訓(xùn)練的困難以及應(yīng)用複雜性所帶來的模型設(shè)計挑戰(zhàn)。

為什麼是 Angel 機(jī)器學(xué)習(xí)平臺?

詳解四大核心技術(shù)突破

由多名院士等權(quán)威專家組成的鑑定委員會認(rèn)為, 騰訊Angel 機(jī)器學(xué)習(xí)平臺技術(shù)複雜度高、研發(fā)難度大、創(chuàng)新性強(qiáng),應(yīng)用前景廣闊,整體技術(shù)達(dá)到國際先進(jìn)水平,其中面向all-to-all 通訊的高效快取調(diào)度與管理技術(shù)、自適應(yīng)預(yù)採樣與圖結(jié)構(gòu)搜尋技術(shù)達(dá)到國際領(lǐng)先水準(zhǔn)。

來自科技進(jìn)步一等獎的肯定:騰訊破解萬億參數(shù)大模型訓(xùn)練難題

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 騰訊Angel 平臺架構(gòu)圖片

來自科技進(jìn)步一等獎的肯定:騰訊破解萬億參數(shù)大模型訓(xùn)練難題

來自科技進(jìn)步一等獎的肯定:騰訊破解萬億參數(shù)大模型訓(xùn)練難題

來自科技進(jìn)步一等獎的肯定:騰訊破解萬億參數(shù)大模型訓(xùn)練難題##地說# * * *->>).架構(gòu),這種架構(gòu)的特點是將儲存模型參數(shù)和執(zhí)行模型計算這兩個任務(wù)分別在不同的伺服器上運行。透過增加更多的伺服器,可以支援更大規(guī)模、運算需求更高的模型。這種架構(gòu)使得模型訓(xùn)練過程更有效率,能夠處理大規(guī)模資料集和複雜模型運算。分散式參數(shù)伺服器的設(shè)計使得系統(tǒng)具有良好的擴(kuò)充性和靈活性,能夠滿足不同規(guī)模和需求的機(jī)器學(xué)習(xí)任務(wù)。這種架構(gòu)的優(yōu)點在於可以有效地利用叢集資源,提高運算效率,並為使用者提供更快速、更

###面對海量資料和超大規(guī)模模型訓(xùn)練需求,騰訊Angel 機(jī)器學(xué)習(xí)平臺在網(wǎng)路通信與快取、模型儲存與調(diào)度、多模態(tài)模型與融合學(xué)習(xí)排序、大規(guī)模圖模型與結(jié)構(gòu)搜尋技術(shù)等核心環(huán)節(jié)取得技術(shù)突破。 ###############為了提高訓(xùn)練效率,TB 級機(jī)器學(xué)習(xí)模型通常採用分散式訓(xùn)練方法,需要大量的參數(shù)和梯度同步,以1.8T 模型千卡訓(xùn)練為例, IO 通訊量達(dá)到25TB, 耗時佔53%,此外,加上不同算力集群間的異質(zhì)網(wǎng)路環(huán)境,通訊網(wǎng)路延遲不一,這些都對模型訓(xùn)練過程中的通訊開銷提出了較高的要求。騰訊Angel 機(jī)器學(xué)習(xí)平臺基於騰訊雲(yún)星脈網(wǎng)路的高效通訊與快取調(diào)度管理技術(shù),可有效解決TB 級模型訓(xùn)練通訊開銷大的問題,實現(xiàn)網(wǎng)路通訊耗時減少80%,分散式訓(xùn)練效能達(dá)業(yè)界主流方案的2.5 倍。 ###############現(xiàn)有的算力條件下,儘管模型達(dá)到 TB 級,而主流 GPU 的顯存仍只有 80G,參數(shù)儲存有瓶頸。針對 TB 級模型訓(xùn)練參數(shù)儲存困難的關(guān)鍵問題, 騰訊 Angel 機(jī)器學(xué)習(xí)平臺提出了顯存主存統(tǒng)一視角儲存管理機(jī)制,實現(xiàn)模型儲存容量比業(yè)界增加 1 倍,訓(xùn)練效能是業(yè)界主流方案 2 倍。 ############

大模型要向通用模型發(fā)展,離不開對多模態(tài)數(shù)據(jù)的處理支持,不同模態(tài),例如文字、圖像、視頻等數(shù)據(jù)的對齊融合理解難度大。在多模態(tài)模型的訓(xùn)練上, 騰訊 Angel 機(jī)器學(xué)習(xí)平臺針對廣告場景,提出多模態(tài)融合學(xué)習(xí)的全連結(jié)排序廣告推薦技術(shù),協(xié)助廣告回想率提升 40% 以上。

來自科技進(jìn)步一等獎的肯定:騰訊破解萬億參數(shù)大模型訓(xùn)練難題

另外,針對推薦系統(tǒng)導(dǎo)向的圖模型訓(xùn)練,騰訊Angel 機(jī)器學(xué)習(xí)平臺設(shè)計了圖節(jié)點特徵自適應(yīng)圖網(wǎng)路結(jié)構(gòu)搜尋技術(shù),可自動輸出最佳結(jié)構(gòu),解決了TB 圖模型應(yīng)用中「圖資料探勘難」 的問題,實現(xiàn)模型訓(xùn)練效能提升28 倍,與業(yè)界比具有最適擴(kuò)展性。

騰訊Angel 機(jī)器學(xué)習(xí)平臺鍛造之路

#騰訊混元大模型擴(kuò)展到萬億規(guī)模

作為騰訊人工智慧技術(shù)的基礎(chǔ)平臺,騰訊Angel 平臺誕生於2015 年,支援PS-Worker 分散式訓(xùn)練, 以及十億參數(shù)LDA 模型的訓(xùn)練。

2017 年,Angel 框架在 Github 開源,向開發(fā)者開放,同時,技術(shù)上,Angel 解決了異質(zhì)網(wǎng)路下的通訊問題,效能進(jìn)一步提升。 2019 年,在可擴(kuò)展圖模型多模態(tài)理解技術(shù)取得突破,解決兆節(jié)點可擴(kuò)展圖模型問題。 2021 年,提出 GPU 顯存統(tǒng)一視角儲存技術(shù),解決大模型 參數(shù)儲存與效能問題。

在騰訊通用人工智慧大模型騰訊混元的打造中,騰訊 Angel 機(jī)器學(xué)習(xí)平臺也扮演了重要角色。

2023 年 9 月,騰訊混元大模型正式對外亮相,預(yù)訓(xùn)練語料超 2 萬億 tokens,具有強(qiáng)大的中文理解與創(chuàng)作能力、邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力。

面對建造騰訊混元大模型的需求,騰訊Angel 機(jī)器學(xué)習(xí)平臺打造了自研的面向大模型訓(xùn)練和推理的機(jī)器學(xué)習(xí)框架Angel PTM 和Angel HCF,支持單任務(wù)萬卡級別超大規(guī)模訓(xùn)練和大規(guī)模推理服務(wù)部署。實現(xiàn)大模型訓(xùn)練效率提升至主流開源框架的 2.6 倍,千億級大模型訓(xùn)練可節(jié)省 50% 算力成本,升級後支援單任務(wù)萬卡級別超大規(guī)模訓(xùn)練。在推理上,騰訊 Angel 機(jī)器學(xué)習(xí)平臺推理速度提高了 1.3 倍,在騰訊混元大模型文生圖的應(yīng)用中,推理耗時從原本的 10 秒縮短至 3 至 4 秒。

此外,Angel 還提供了從模型研發(fā)到應(yīng)用落地的一站式平臺,支援用戶透過API 介面或精調(diào)等方式快速呼叫騰訊混元大模型能力,加速大模型應(yīng)用構(gòu)建,騰訊會議、騰訊新聞、騰訊影片等超過400 個騰訊產(chǎn)品及場景都已接取騰訊混元內(nèi)測。

騰訊混元透過採用混合專家模型 (MoE) 結(jié)構(gòu),已將模型擴(kuò)展至萬億級參數(shù)規(guī)模,推動了性能提升和推理成本下降。作為通用模型,騰訊混元在中文表現(xiàn)上處於業(yè)界領(lǐng)先水平,尤其在文字生成、數(shù)理邏輯和多輪對話中表現(xiàn)表現(xiàn)卓越。目前,騰訊混元也積極發(fā)展多模態(tài)模型,以進(jìn)一步加強(qiáng)文生圖和文生視訊能力。

騰訊大量的應(yīng)用場景,為騰訊 Angel 機(jī)器學(xué)習(xí)平臺的落地提供了實驗地。除了騰訊混元大模型,騰訊 Angel 機(jī)器學(xué)習(xí)平臺也支援了騰訊廣告以及騰訊會議等產(chǎn)品,並透過騰訊雲(yún)端服務(wù)多個產(chǎn)業(yè)和企業(yè)客戶,協(xié)助各行各業(yè)的數(shù)位化和智慧化發(fā)展。

以騰訊廣告為例,採用騰訊Angel 機(jī)器學(xué)習(xí)平分散式訓(xùn)練優(yōu)化、多模態(tài)理解圖資料探勘等創(chuàng)新技術(shù),廣告業(yè)務(wù)場景中的多模態(tài)大模型訓(xùn)練速度提升5 倍,模型規(guī)模提升10 倍,實現(xiàn)廣告回想率大幅提升。

以上是來自科技進(jìn)步一等獎的肯定:騰訊破解萬億參數(shù)大模型訓(xùn)練難題的詳細(xì)內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者 DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者 Aug 09, 2024 pm 04:01 PM

但可能打不過公園裡的老大爺?巴黎奧運正在如火如荼地進(jìn)行中,乒乓球項目備受關(guān)注。同時,機(jī)器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個在競技乒乓球比賽中達(dá)到人類業(yè)餘選手等級的學(xué)習(xí)型機(jī)器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個機(jī)器人打乒乓球什麼程度呢?大概和人類業(yè)餘選手不相上下:正手反手都會:對手採用多種打法,機(jī)器人也能招架得?。航硬煌D(zhuǎn)的發(fā)球:不過,比賽激烈程度似乎不如公園老大爺對戰(zhàn)。對機(jī)器人來說,乒乓球運動

首配機(jī)械爪!元蘿蔔亮相2024世界機(jī)器人大會,發(fā)布首個走進(jìn)家庭的西洋棋機(jī)器人 首配機(jī)械爪!元蘿蔔亮相2024世界機(jī)器人大會,發(fā)布首個走進(jìn)家庭的西洋棋機(jī)器人 Aug 21, 2024 pm 07:33 PM

8月21日,2024世界機(jī)器人大會在北京隆重召開。商湯科技旗下家用機(jī)器人品牌「元蘿蔔SenseRobot」家族全系產(chǎn)品集體亮相,並最新發(fā)布元蘿蔔AI下棋機(jī)器人-國際象棋專業(yè)版(以下簡稱「元蘿蔔國象機(jī)器人」),成為全球首個走進(jìn)家庭的西洋棋機(jī)器人。作為元蘿蔔的第三款下棋機(jī)器人產(chǎn)品,全新的國象機(jī)器人在AI和工程機(jī)械方面進(jìn)行了大量專項技術(shù)升級和創(chuàng)新,首次在家用機(jī)器人上實現(xiàn)了透過機(jī)械爪拾取立體棋子,並進(jìn)行人機(jī)對弈、人人對弈、記譜複盤等功能,

Claude也變懶了!網(wǎng)友:學(xué)會給自己放假了 Claude也變懶了!網(wǎng)友:學(xué)會給自己放假了 Sep 02, 2024 pm 01:56 PM

開學(xué)將至,該收心的不只即將開啟新學(xué)期的同學(xué),可能還有AI大模型。前段時間,Reddit擠滿了吐槽Claude越來越懶的網(wǎng)友。 「它的水平下降了很多,經(jīng)常停頓,甚至輸出也變得很短。在發(fā)布的第一周,它可以一次性翻譯整整4頁文稿,現(xiàn)在連半頁都輸出不了!」https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為“對Claude徹底失望了的帖子裡”,滿滿地

李飛飛團(tuán)隊提出ReKep,讓機(jī)器人具備空間智能,還能整合GPT-4o 李飛飛團(tuán)隊提出ReKep,讓機(jī)器人具備空間智能,還能整合GPT-4o Sep 03, 2024 pm 05:18 PM

視覺與機(jī)器人學(xué)習(xí)的深度融合。當(dāng)兩隻機(jī)器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的1X人形機(jī)器人NEO,你可能會產(chǎn)生一種感覺:我們似乎開始進(jìn)入機(jī)器人時代了。事實上,這些絲滑動作正是先進(jìn)機(jī)器人技術(shù)+精妙框架設(shè)計+多模態(tài)大模型的產(chǎn)物。我們知道,有用的機(jī)器人往往需要與環(huán)境進(jìn)行複雜精妙的交互,而環(huán)境則可被表示成空間域和時間域上的限制。舉個例子,如果要讓機(jī)器人倒茶,那麼機(jī)器人首先需要抓住茶壺手柄並使之保持直立,不潑灑出茶水,然後平穩(wěn)移動,一直到讓壺口與杯口對齊,之後以一定角度傾斜茶壺。這

鴻蒙智行享界S9全場景新品發(fā)表會,多款重磅新品齊發(fā) 鴻蒙智行享界S9全場景新品發(fā)表會,多款重磅新品齊發(fā) Aug 08, 2024 am 07:02 AM

今天下午,鴻蒙智行正式迎來了新品牌與新車。8月6日,華為舉行鴻蒙智行享界S9及華為全場景新品發(fā)布會,帶來了全景智慧旗艦轎車享界S9、問界新M7Pro和華為novaFlip、MatePadPro12.2英寸、全新MatePadAir、華為畢昇激光打印機(jī)X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全場景智慧新品,從智慧出行、智慧辦公到智能穿戴,華為全場景智慧生態(tài)持續(xù)構(gòu)建,為消費者帶來萬物互聯(lián)的智慧體驗。鴻蒙智行:深度賦能,推動智能汽車產(chǎn)業(yè)升級華為聯(lián)合中國汽車產(chǎn)業(yè)伙伴,為

分散式人工智慧盛會DAI 2024徵稿:Agent Day,強(qiáng)化學(xué)習(xí)之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學(xué)家將做主旨報告 分散式人工智慧盛會DAI 2024徵稿:Agent Day,強(qiáng)化學(xué)習(xí)之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學(xué)家將做主旨報告 Aug 22, 2024 pm 08:02 PM

會議簡介隨著科技的快速發(fā)展,人工智慧成為了推動社會進(jìn)步的重要力量。在這個時代,我們有幸見證並參與分散式人工智慧(DistributedArtificialIntelligence,DAI)的創(chuàng)新與應(yīng)用。分散式人工智慧是人工智慧領(lǐng)域的重要分支,這幾年引起了越來越多的關(guān)注?;洞笮驼Z言模型(LLM)的智能體(Agent)異軍突起,透過結(jié)合大模型的強(qiáng)大語言理解和生成能力,展現(xiàn)了在自然語言互動、知識推理、任務(wù)規(guī)劃等方面的巨大潛力。 AIAgent正在接棒大語言模型,成為目前AI圈的熱門話題。 Au

ACL 2024獎項發(fā)表:華科大破解甲骨文最佳論文之一、GloVe時間檢驗獎 ACL 2024獎項發(fā)表:華科大破解甲骨文最佳論文之一、GloVe時間檢驗獎 Aug 15, 2024 pm 04:37 PM

本屆ACL大會,投稿者「收穫滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。 ACL是計算語言學(xué)和自然語言處理領(lǐng)域的頂級國際會議,由國際計算語言學(xué)協(xié)會組織,每年舉辦一次。一直以來,ACL在NLP領(lǐng)域的學(xué)術(shù)影響力都名列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400餘篇NLP領(lǐng)域的前沿工作。昨天下午,大會公佈了最佳論文等獎項。此次,最佳論文獎7篇(兩篇未公開)、最佳主題論文獎1篇、傑出論文獎35篇。大會也評出了資源論文獎(ResourceAward)3篇、社會影響力獎(

世界機(jī)器人大會上,這家承載「未來養(yǎng)老希望」的國產(chǎn)機(jī)器人被包圍了 世界機(jī)器人大會上,這家承載「未來養(yǎng)老希望」的國產(chǎn)機(jī)器人被包圍了 Aug 22, 2024 pm 10:35 PM

在北京舉行的世界機(jī)器人大會上,人形機(jī)器人的展示成為了現(xiàn)場絕對的焦點,在星塵智能的展臺上,由於AI機(jī)器人助理S1在一個展區(qū)上演揚琴、武術(shù)、書法三臺大戲,能文能武,吸引了大量專業(yè)觀眾和媒體的駐足。在有彈性的琴弦上優(yōu)雅的演奏,讓S1展現(xiàn)出速度、力度、精準(zhǔn)度兼具的精細(xì)操作與絕對掌控。央視新聞對「書法」背後的模仿學(xué)習(xí)和智慧控制進(jìn)行了專題報道,公司創(chuàng)始人來傑解釋到,絲滑動作的背後,是硬體側(cè)追求最好力控和最仿人身體指標(biāo)(速度、負(fù)載等),而是在AI側(cè)則採集人的真實動作數(shù)據(jù),讓機(jī)器人遇強(qiáng)則強(qiáng),快速學(xué)習(xí)進(jìn)化。而敏捷

See all articles