亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁 科技周邊 人工智能 快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

Jun 21, 2024 am 01:13 AM
快手 產(chǎn)業(yè) 文生視頻

短短一年后,AI 生成的「吃面條」已經(jīng)如此自然流暢?這讓全球網(wǎng)友都感受到了億點(diǎn)點(diǎn)震撼。

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

? ? ? ? ? ? ? ? ? ? ? ? ? ? 圖源:https://x.com/CharaspowerAI/status/1799494388462063632

右側(cè)的這些生成視頻,都來自快手剛剛推出的文生視頻大模型「可靈」(Kling)。

不是預(yù)發(fā)布、不是純 Demo 合集,而是直接開放測(cè)試的產(chǎn)品級(jí)應(yīng)用,人人都能申請(qǐng)。而且,可靈支持生成最長(zhǎng) 2 分鐘、30fps 的 1080P 視頻,主打從頭腦風(fēng)暴到可發(fā)布作品的「一鍵轉(zhuǎn)化」。(官網(wǎng)地址:https://kling.kuaishou.com/)

最早一批用上的用戶已經(jīng)「真香」:

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 圖源:https://x.com/op7418/status/1799047146089619589

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖源:https://weibo.com/7714861068/Oig1Qm8Or?refer_flag=1001030103_

500 人上限的交流群,很快就滿員了,滿屏都是 tql:

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

還沒用上的外國(guó)友人只能干著急,在社交媒體發(fā)「求求了」:
快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
不夸張地說,可靈現(xiàn)在是「一號(hào)難求」:
快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
消息傳到硅谷創(chuàng)投圈,更是引發(fā)了一場(chǎng)熱議。

Stability AI 前 CEO Emad Mostaque 表示:「中國(guó)的 AI 技術(shù)有自己的優(yōu)勢(shì)?!?/section>
快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
? ? ? ? ? ? ? ? ? ? ? ? ?圖源:https://x.com/EMostaque/status/1799133463003684918

YC CEO 也在 X 平臺(tái)轉(zhuǎn)發(fā)了可靈生成的 Demo:
快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
就圖中這個(gè)「吃漢堡」的案例而言,在相同的提示詞下,可靈的生成效果確實(shí)比 Sora 更生動(dòng)、真實(shí):

Prompt:Une personne tapant son meilleur croc dans son hamburger

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

? ? ? ? ? ? ? ? ? ? 視頻地址:https://x.com/AngryTomtweets/status/1799787209651859910

對(duì)于關(guān)注 AI 的人來說,這幾天一定陸陸續(xù)續(xù)看過很多可靈生成的作品了。本站也是第一時(shí)間就點(diǎn)進(jìn)了申請(qǐng)通道,并拿到了試用資格。

接下來,我們不妨一邊試用、一邊分析可靈爆火的原因。

國(guó)內(nèi)首個(gè)文生視頻產(chǎn)品級(jí)應(yīng)用

或許你還記得這個(gè)曾經(jīng)非?;鸨摹笟馇蛉恕挂曨l。三位創(chuàng)作者花費(fèi)近兩周時(shí)間,使用 Sora 制作了這條 1 分 21 秒的視頻短片,讓人感到十分驚艷。不過,負(fù)責(zé)后期制作的 Patrick Cederberg 坦白了過程中的很多問題,例如氣球的顏色在每次生成中都會(huì)改變、鏡頭中會(huì)出現(xiàn)一些瑕疵等等。

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

? ? ? ? ? ? ? ? ? ? ? ? ? ? ?Sora 生成結(jié)果。完整視頻地址:https://youtu.be/9oryIMNVtto?si=F6oDzvrhzfVcQGeh

對(duì)于此前的視頻生成模型來說,「一氣呵成」生成 1 分鐘以上的內(nèi)容確實(shí)有難度,特別是要求畫面中的各種元素保持前后一致。

獵豹移動(dòng)董事長(zhǎng)兼 CEO、獵戶星空董事長(zhǎng)傅盛公開了自己用可靈制作的「氣球人」視頻,并表示自己僅用了「幾十分鐘」,就做出了連續(xù)性、真實(shí)度、清晰度都很優(yōu)秀的短片。快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
在內(nèi)測(cè)的過程中,我們還發(fā)現(xiàn)了一個(gè)專業(yè)創(chuàng)作者社區(qū)自發(fā)建立的教程與 Demo 文檔,包含了上百個(gè)可靈生成的作品,還提供了測(cè)試維度的指導(dǎo)。

感興趣的讀者請(qǐng)戳:https://waytoagi.feishu.cn/wiki/GevKwyEt1i4SUVk0q2JcqQFtnRd

下面這個(gè) 2 分鐘的公益短片《一個(gè)很遠(yuǎn)的地方》也是完全由可靈生成的,你能看出來嗎?快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求在創(chuàng)作者 @AIGC 十三的作品《瘋狂動(dòng)物城賽車大賽》中,這 20 秒包含了疾速行駛的賽車(大幅度運(yùn)動(dòng))、動(dòng)物駕駛車輛(考驗(yàn)想象力的概念組合)等生成難點(diǎn),但從結(jié)果來看,可靈很好地解決了這些問題:?快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
? ? ? ? ? ? ? ? ? ? ? ? ? ?來源:可靈創(chuàng)作者@AIGC 十三

還有一個(gè)很有趣的案例是 @八級(jí)技工創(chuàng)作的《假期打開方式》,這段 56 秒的短頻共花費(fèi)了 3 小時(shí)制作,包含 23 個(gè)鏡頭。然后在可靈的生成結(jié)果之上添加配音,詼諧的感覺馬上就有了:快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
? ? ? ? ? ? ? ? ? ? ? ? ? ?來源:可靈創(chuàng)作者@八級(jí)技工

看完這些,我們應(yīng)該已經(jīng)意識(shí)到,可靈所代表的視頻生成技術(shù)的影響力,遠(yuǎn)遠(yuǎn)超出了單純的創(chuàng)作。在不同的研究領(lǐng)域和行業(yè)賽道,這一技術(shù)的落地正在加速,為從自動(dòng)內(nèi)容生成到復(fù)雜決策過程的各種任務(wù)提供了變革潛力。

哪些行業(yè)最先被改變?

傳統(tǒng)的游戲開發(fā)通常受到預(yù)先渲染的環(huán)境和腳本事件的限制。一旦將視頻生成模型集成到游戲領(lǐng)域,游戲的開發(fā)、玩耍和體驗(yàn)方式都將得到創(chuàng)新,為講故事、互動(dòng)和沉浸式體驗(yàn)帶來新的可能性。對(duì)于游戲開發(fā)者來說,最直觀的一項(xiàng)玩法是,根據(jù)用戶敘述生成定制的視覺效果甚至角色動(dòng)作。

在下方的 demo 中,我們可以看到,用戶能夠借助可靈創(chuàng)造出無與倫比的身臨其境體驗(yàn):

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

? ? ? ? ? ? ? ? ? ? ? ? ? ? 圖源:https://x.com/dustinhollywood/status/1800056286215553444

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

? ? ? ? ? ? ? ? ? ? ? ? ? ? 圖源:https://x.com/dustinhollywood/status/1800056886693347624

另外一個(gè)將被顛覆的行業(yè)就是影視制作。傳統(tǒng)的電影制作是一個(gè)艱巨而昂貴的過程,往往需要數(shù)年的努力、大量的設(shè)備和資金投入。視頻生成技術(shù)的出現(xiàn)預(yù)示著電影制作進(jìn)入了一個(gè)新的「民主化時(shí)代」,從簡(jiǎn)單的文本輸入中自主生成個(gè)人影視作品的夢(mèng)想正在成為現(xiàn)實(shí)。

現(xiàn)在,我們用可靈生成的是 5 秒的單鏡頭片段,伴隨著技術(shù)的不斷演進(jìn),用戶單次能夠生成的視頻時(shí)長(zhǎng)也會(huì)增加。比如說,我們未來或許能夠一次性生成更長(zhǎng)的視頻內(nèi)容,保持故事場(chǎng)景的連貫性和觀賞性。其中的運(yùn)鏡手法也許會(huì)更高級(jí),比如連貫的長(zhǎng)鏡頭。

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖源:https://x.com/dustinhollywood/status/1800007000849629674

下面這段剪影作品再次印證了一點(diǎn):AI 對(duì)藝術(shù)的理解力與審美水準(zhǔn),絲毫不遜于人類。

Prompt:“A dancer’s silhouette transitions seamlessly through different dance styles, from hip-hop to ballet, in one continuous shot”

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

? ? ? ? ? ? ? ? ? ? ? ? ? ? ?可靈生成作品。圖源:https://x.com/dustinhollywood/status/1799970059957555210

科幻電影的風(fēng)格完全拿捏:快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
? ? ? ? ? ? ? ? ? ? ? ? ? ?來源:可靈創(chuàng)作者 @狗兒李

AI 同樣能為奢侈品大片的制作注入靈感:快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
? ? ? ? ? ? ? ? ? ? ? ? ? ? 來源:可靈創(chuàng)作者 @AI 的小羅

我們可以看一下可靈生成的這段「蜂蜜」廣告片,AI 在模擬傾倒蜂蜜特寫鏡頭中的表現(xiàn)絲毫不輸專業(yè)攝像團(tuán)隊(duì):快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
? ? ? ? ? ? ? ? ? ? ? ? ? 來源:可靈創(chuàng)作者@追圖AIGC

可靈背后有哪些技術(shù)?

我們無法從 OpenAI 簡(jiǎn)略的技術(shù)報(bào)告中獲得足夠的 Sora 研發(fā)細(xì)節(jié),但可靈大模型官網(wǎng)卻披露了更具參考意義的信息,主要包括從數(shù)據(jù)準(zhǔn)備、模型架構(gòu)、訓(xùn)練方案及優(yōu)化策略幾個(gè)方面。

數(shù)據(jù)準(zhǔn)備

依托快手在視頻技術(shù)領(lǐng)域的多年積累,可靈大模型團(tuán)隊(duì)已經(jīng)構(gòu)建了完備的標(biāo)簽體系,包括從視頻基礎(chǔ)質(zhì)量、美學(xué)、自然度等多個(gè)維度對(duì)視頻數(shù)據(jù)質(zhì)量進(jìn)行刻畫,并針對(duì)每一個(gè)維度設(shè)計(jì)多種定制化的標(biāo)簽特征,以此來精細(xì)化篩選訓(xùn)練數(shù)據(jù)或調(diào)整訓(xùn)練數(shù)據(jù)的分布。

為了滿足訓(xùn)練文生視頻模型過程中成對(duì)的視頻和文本描述需求,可靈大模型團(tuán)隊(duì)自研了視頻描述模型,可以生成精確、詳盡、結(jié)構(gòu)化的視頻描述,顯著提升視頻生成模型的文本指令響應(yīng)能力。

模型架構(gòu)

高質(zhì)量的標(biāo)注數(shù)據(jù)準(zhǔn)備完畢后,可靈大模型又是如何獲得模擬物理世界特性與概念組合的能力呢?

在整體架構(gòu)設(shè)計(jì)上,可靈采用了目前火熱的 Diffusion Transformer (DiT) 。傳統(tǒng)的擴(kuò)散模型主要利用包含下采樣和上采樣塊的卷積 U-Net 作為去噪網(wǎng)絡(luò)骨干。但一些研究表明,U-Net 架構(gòu)對(duì)擴(kuò)散模型的良好性能并非至關(guān)重要。通過采用更靈活的 Transformer 架構(gòu),擴(kuò)散模型可以使用更多的訓(xùn)練數(shù)據(jù)和更大的模型參數(shù)。DiT 就是這個(gè)研究思路下的代表作之一。

這幾個(gè)月來,業(yè)內(nèi)形成一個(gè)共識(shí),視頻生成模型的成功,歸根結(jié)底是 Scaling Law 的作用。這一共識(shí)正是基于 DiT 論文的發(fā)現(xiàn),使用 Transformer 能穩(wěn)定地?cái)U(kuò)大模型規(guī)模:隨著訓(xùn)練計(jì)算量的增加(訓(xùn)練模型的時(shí)間延長(zhǎng)或模型增大,或兩者兼而有之),性能也會(huì)隨之提高。

這意味著,對(duì)于視頻生成模型,只要用更多的算力、更多的數(shù)據(jù)去 Scale up,生成質(zhì)量還會(huì)持續(xù)提升。

可靈之所以能夠?qū)⒂脩舻奈谋咎崾巨D(zhuǎn)化為具體的畫面,包括那些真實(shí)世界中不會(huì)出現(xiàn)的虛構(gòu)場(chǎng)景,就是基于對(duì)文本 - 視頻語義的深刻理解和 Diffusion Transformer 架構(gòu)的強(qiáng)大能力。在自研架構(gòu)和 Scaling Law 激發(fā)出的強(qiáng)大建模能力推動(dòng)下,可靈能夠很好地模擬真實(shí)世界的物理特性,生成符合物理規(guī)律的視頻。

與此同時(shí),基于團(tuán)隊(duì)自研的 3D VAE 網(wǎng)絡(luò),可靈大模型能夠生成 1080p 分辨率的電影級(jí)視頻,無論是浩瀚壯闊的宏大場(chǎng)景,還是細(xì)膩入微的特寫鏡頭,都能夠生動(dòng)呈現(xiàn)。

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 自然場(chǎng)景下,光線的變化很流暢。測(cè)試者:@杉杉

當(dāng)然,對(duì)于視頻生成模型來說,另一個(gè)必須考慮的因素是:視頻是一種具有時(shí)間維度的視覺內(nèi)容,不連貫的內(nèi)容會(huì)讓用戶的觀看體驗(yàn)大打折扣。

為了保證畫面中運(yùn)動(dòng)的呈現(xiàn)更加合理,可靈大模型采用 3D 時(shí)空聯(lián)合注意力機(jī)制,更好地建模復(fù)雜時(shí)空運(yùn)動(dòng),即可生成較大幅度運(yùn)動(dòng)的視頻內(nèi)容,同時(shí)能夠符合運(yùn)動(dòng)規(guī)律。

快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

訓(xùn)練及優(yōu)化策略

如果你已經(jīng)親自測(cè)試過,就會(huì)發(fā)現(xiàn)可靈支持推理過程中同樣的內(nèi)容輸出多種視頻寬高比。這是因?yàn)榭伸`采用了可變分辨率的訓(xùn)練策略,目的是滿足更豐富場(chǎng)景中的視頻素材使用需求。

與此同時(shí),得益于高效的訓(xùn)練基礎(chǔ)設(shè)施、極致的推理優(yōu)化和可擴(kuò)展的基礎(chǔ)架構(gòu),可靈大模型能夠生成長(zhǎng)達(dá) 2 分鐘的視頻,且?guī)蔬_(dá)到 30fps。

視頻生成,不再是一場(chǎng)「追趕 OpenAI」的游戲

2024 年被稱為視頻生成技術(shù)的爆發(fā)之年,但在可靈之前,我們始終沒見到 Sora 級(jí)的可用產(chǎn)品,而 Sora 何時(shí)開放也是未知數(shù)。

某種意義上說,可靈是第一個(gè)真正的「中國(guó)版 Sora」,并讓這項(xiàng)技術(shù)真正進(jìn)入了可用、好用、實(shí)用的階段。

正如傅盛所說:「這可能是今天在全世界范圍內(nèi),你能夠使用到的最好的文生視頻產(chǎn)品?!谷魏斡H自試用過可靈的人,都會(huì)明白這絕不是過譽(yù)。

傅盛的視頻還給到了另外一個(gè)觀點(diǎn):「反過來也說明,Sora 并不是一個(gè)技術(shù)性的突破,而是一個(gè)產(chǎn)品型的突破?!?/section>

還記得幾個(gè)月前,Sora 以長(zhǎng)達(dá) 60 秒的連貫視頻、高清畫面質(zhì)感、連貫的鏡頭移動(dòng)、運(yùn)動(dòng)方式等優(yōu)點(diǎn),拉高了整個(gè)視頻生成賽道的技術(shù)水平,掀起了文生視頻賽道的競(jìng)爭(zhēng)浪潮。

我們本以為,視頻生成領(lǐng)域會(huì)像去年的文本大模型一樣,演化為國(guó)內(nèi)對(duì)海外的技術(shù)趕超。但可靈的發(fā)布,意味著國(guó)產(chǎn)文生視頻大模型技術(shù)的探索已經(jīng)達(dá)到了一個(gè)全新的高度,而且在產(chǎn)品落地層面做到了實(shí)質(zhì)領(lǐng)先。我們可能不需要再重新經(jīng)歷一次「追趕 OpenAI」的游戲了。

有人給出判斷:中國(guó)正在人工智能領(lǐng)域超越美國(guó)。
快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求
可靈的誕生,或許意味著一個(gè)新時(shí)代開啟了。在生成式 AI 時(shí)代,生成和編輯視頻或許會(huì)像今天我們用手機(jī) P 圖一樣簡(jiǎn)單,想象力與現(xiàn)實(shí)之間的阻隔將被徹底打破。

由于太過火爆,目前在排隊(duì)測(cè)試可靈的人數(shù)已經(jīng)超過了 5 萬人。如果你對(duì) AI 生成視頻的玩法感興趣,不妨先關(guān)注「可靈 AI 視頻號(hào)」,收獲更多優(yōu)質(zhì)案例。快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求

以上是快手「可靈」爆火:海外AI圈巨震,中國(guó)版Sora一號(hào)難求的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請(qǐng)聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者 DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者 Aug 09, 2024 pm 04:01 PM

但可能打不過公園里的老大爺?巴黎奧運(yùn)會(huì)正在如火如荼地進(jìn)行中,乒乓球項(xiàng)目備受關(guān)注。與此同時(shí),機(jī)器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個(gè)在競(jìng)技乒乓球比賽中達(dá)到人類業(yè)余選手水平的學(xué)習(xí)型機(jī)器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個(gè)機(jī)器人打乒乓球什么水平呢?大概和人類業(yè)余選手不相上下:正手反手都會(huì):對(duì)手采用多種打法,該機(jī)器人也能招架得?。航硬煌D(zhuǎn)的發(fā)球:不過,比賽激烈程度似乎不如公園老大爺對(duì)戰(zhàn)。對(duì)機(jī)器人來說,乒乓球運(yùn)動(dòng)

首配機(jī)械爪!元蘿卜亮相2024世界機(jī)器人大會(huì),發(fā)布首個(gè)走進(jìn)家庭的國(guó)際象棋機(jī)器人 首配機(jī)械爪!元蘿卜亮相2024世界機(jī)器人大會(huì),發(fā)布首個(gè)走進(jìn)家庭的國(guó)際象棋機(jī)器人 Aug 21, 2024 pm 07:33 PM

8月21日,2024世界機(jī)器人大會(huì)在北京隆重召開。商湯科技旗下家用機(jī)器人品牌“元蘿卜SenseRobot”家族全系產(chǎn)品集體亮相,并最新發(fā)布元蘿卜AI下棋機(jī)器人——國(guó)際象棋專業(yè)版(以下簡(jiǎn)稱“元蘿卜國(guó)象機(jī)器人”),成為全球首個(gè)走進(jìn)家庭的國(guó)際象棋機(jī)器人。作為元蘿卜的第三款下棋機(jī)器人產(chǎn)品,全新的國(guó)象機(jī)器人在AI和工程機(jī)械方面進(jìn)行了大量專項(xiàng)技術(shù)升級(jí)和創(chuàng)新,首次在家用機(jī)器人上實(shí)現(xiàn)了通過機(jī)械爪拾取立體棋子,并進(jìn)行人機(jī)對(duì)弈、人人對(duì)弈、記譜復(fù)盤等功能,

Claude也變懶了!網(wǎng)友:學(xué)會(huì)給自己放假了 Claude也變懶了!網(wǎng)友:學(xué)會(huì)給自己放假了 Sep 02, 2024 pm 01:56 PM

開學(xué)將至,該收心的不止有即將開啟新學(xué)期的同學(xué),可能還有AI大模型。前段時(shí)間,Reddit上擠滿了吐槽Claude越來越懶的網(wǎng)友?!杆乃较陆盗撕芏?,經(jīng)常停頓,甚至輸出也變得很短。在發(fā)布的第一周,它可以一次性翻譯整整4頁文稿,現(xiàn)在連半頁都輸出不了了!」https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個(gè)名為「對(duì)Claude徹底失望了的帖子里」,滿滿地

李飛飛團(tuán)隊(duì)提出ReKep,讓機(jī)器人具備空間智能,還能整合GPT-4o 李飛飛團(tuán)隊(duì)提出ReKep,讓機(jī)器人具備空間智能,還能整合GPT-4o Sep 03, 2024 pm 05:18 PM

視覺與機(jī)器人學(xué)習(xí)的深度融合。當(dāng)兩只機(jī)器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時(shí),加上最近老上頭條的1X人形機(jī)器人NEO,你可能會(huì)產(chǎn)生一種感覺:我們似乎開始進(jìn)入機(jī)器人時(shí)代了。事實(shí)上,這些絲滑動(dòng)作正是先進(jìn)機(jī)器人技術(shù)+精妙框架設(shè)計(jì)+多模態(tài)大模型的產(chǎn)物。我們知道,有用的機(jī)器人往往需要與環(huán)境進(jìn)行復(fù)雜精妙的交互,而環(huán)境則可被表示成空間域和時(shí)間域上的約束。舉個(gè)例子,如果要讓機(jī)器人倒茶,那么機(jī)器人首先需要抓住茶壺手柄并使之保持直立,不潑灑出茶水,然后平穩(wěn)移動(dòng),一直到讓壺口與杯口對(duì)齊,之后以一定角度傾斜茶壺。這

鴻蒙智行享界S9及全場(chǎng)景新品發(fā)布會(huì),多款重磅新品齊發(fā) 鴻蒙智行享界S9及全場(chǎng)景新品發(fā)布會(huì),多款重磅新品齊發(fā) Aug 08, 2024 am 07:02 AM

今天下午,鴻蒙智行正式迎來了新品牌與新車。 8月6日,華為舉行鴻蒙智行享界S9及華為全場(chǎng)景新品發(fā)布會(huì),帶來了全景智慧旗艦轎車享界S9、問界新M7Pro和華為novaFlip、MatePadPro12.2英寸、全新MatePadAir、華為畢升激光打印機(jī)X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全場(chǎng)景智慧新品,從智慧出行、智慧辦公到智能穿戴,華為全場(chǎng)景智慧生態(tài)持續(xù)構(gòu)建,為消費(fèi)者帶來萬物互聯(lián)的智慧體驗(yàn)。鴻蒙智行:深度賦能,推動(dòng)智能汽車產(chǎn)業(yè)升級(jí)華為聯(lián)合中國(guó)汽車產(chǎn)業(yè)伙伴,為

分布式人工智能盛會(huì)DAI 2024征稿:Agent Day,強(qiáng)化學(xué)習(xí)之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學(xué)家將做主旨報(bào)告 分布式人工智能盛會(huì)DAI 2024征稿:Agent Day,強(qiáng)化學(xué)習(xí)之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學(xué)家將做主旨報(bào)告 Aug 22, 2024 pm 08:02 PM

會(huì)議簡(jiǎn)介隨著科技的飛速發(fā)展,人工智能已經(jīng)成為了推動(dòng)社會(huì)進(jìn)步的重要力量。在這個(gè)時(shí)代,我們有幸見證并參與到分布式人工智能(DistributedArtificialIntelligence,DAI)的創(chuàng)新與應(yīng)用中。分布式人工智能是人工智能領(lǐng)域的重要分支,這幾年引起了越來越多的關(guān)注?;诖笮驼Z言模型(LLM)的智能體(Agent)異軍突起,通過結(jié)合大模型的強(qiáng)大語言理解和生成能力,展現(xiàn)出了在自然語言交互、知識(shí)推理、任務(wù)規(guī)劃等方面的巨大潛力。AIAgent正在接棒大語言模型,成為當(dāng)前AI圈的熱點(diǎn)話題。Au

ACL 2024獎(jiǎng)項(xiàng)公布:華科大破譯甲骨文最佳論文之一、GloVe時(shí)間檢驗(yàn)獎(jiǎng) ACL 2024獎(jiǎng)項(xiàng)公布:華科大破譯甲骨文最佳論文之一、GloVe時(shí)間檢驗(yàn)獎(jiǎng) Aug 15, 2024 pm 04:37 PM

本屆ACL大會(huì),投稿者「收獲滿滿」。為期六天的ACL2024正在泰國(guó)曼谷舉辦。ACL是計(jì)算語言學(xué)和自然語言處理領(lǐng)域的頂級(jí)國(guó)際會(huì)議,由國(guó)際計(jì)算語言學(xué)協(xié)會(huì)組織,每年舉辦一次。一直以來,ACL在NLP領(lǐng)域的學(xué)術(shù)影響力都位列第一,它也是CCF-A類推薦會(huì)議。今年的ACL大會(huì)已是第62屆,接收了400余篇NLP領(lǐng)域的前沿工作。昨天下午,大會(huì)公布了最佳論文等獎(jiǎng)項(xiàng)。此次,最佳論文獎(jiǎng)7篇(兩篇未公開)、最佳主題論文獎(jiǎng)1篇、杰出論文獎(jiǎng)35篇。大會(huì)還評(píng)出了資源論文獎(jiǎng)(ResourceAward)3篇、社會(huì)影響力獎(jiǎng)(

世界機(jī)器人大會(huì)上,這家承載「未來養(yǎng)老希望」的國(guó)產(chǎn)機(jī)器人被包圍了 世界機(jī)器人大會(huì)上,這家承載「未來養(yǎng)老希望」的國(guó)產(chǎn)機(jī)器人被包圍了 Aug 22, 2024 pm 10:35 PM

正在北京舉行的世界機(jī)器人大會(huì)上,人形機(jī)器人的展示成為了現(xiàn)場(chǎng)絕對(duì)的焦點(diǎn),在星塵智能的展臺(tái)上,由于AI機(jī)器人助理S1在一個(gè)展區(qū)上演揚(yáng)琴、武術(shù)、書法三臺(tái)大戲,能文能武,吸引了大量專業(yè)觀眾和媒體的駐足。在帶彈性的琴弦上的優(yōu)雅演奏,讓S1展現(xiàn)出速度、力度、精度兼具的精細(xì)操作和絕對(duì)掌控。央視新聞對(duì)「書法」背后的模仿學(xué)習(xí)和智能控制進(jìn)行了專題報(bào)道,公司創(chuàng)始人來杰解釋到,絲滑動(dòng)作的背后,是硬件側(cè)追求最好力控和最仿人身體指標(biāo)(速度、負(fù)載等),而是在AI側(cè)則采集人的真實(shí)動(dòng)作數(shù)據(jù),讓機(jī)器人遇強(qiáng)則強(qiáng),快速學(xué)習(xí)進(jìn)化。而敏捷

See all articles