亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

搜索

微信公眾號

首頁文章專題 AI工具學習編程手冊下載最近更新

文章 web3.0 后端開發(fā) web前端數(shù)據(jù)庫開發(fā)工具 php框架常見問題科技 Java 系統(tǒng)教程電腦教程硬件教程手機教程軟件教程游戲教程自媒體新聞

專題后端開發(fā) web前端數(shù)據(jù)庫開發(fā)工具 php框架科技 Java 系統(tǒng)教程電腦教程硬件教程手機教程軟件教程游戲教程新聞

AI工具 AI 聊天問答 Agent智能體 AI 文本寫作 AI 繪畫作圖 AI 設計工具 AI 視頻創(chuàng)作 AI 音頻制作 AI 辦公學習 AI 編程開發(fā) Prompt指令

學習大前端后端開發(fā) 數(shù)據(jù)庫移動端運維開發(fā) UI設計計算機基礎

編程手冊大前端 JavaScript 后端開發(fā) 數(shù)據(jù)庫移動端運維開發(fā) UI設計計算機基礎 XML Web Services

下載 js特效網(wǎng)站源碼工具下載類庫下載網(wǎng)站素材學習資源插件擴展手機/移動開發(fā) 手機游戲

首頁 > 科技周邊 > 人工智能 > 正文

Pika放大招：今天起，視頻和音效可以“一鍋出”了！

WBOY

發(fā)布： 2024-03-11 13:00:15

轉(zhuǎn)載

785人瀏覽過

就在剛剛，Pika發(fā)布了一項新功能：

很抱歉我們之前一直處于靜音狀態(tài)。

今天起，大家可以給視頻無縫生成音效了——Sound Effects！

???AI 智能聊天, 問答助手, AI 智能搜索, 免費無限量使用 DeepSeek R1 模型???

Pika放大招：今天起，視頻和音效可以“一鍋出”了！

生成的方式有兩種：

要么給一句Prompt，描述你想要的聲音；
要么直接讓Pika根據(jù)視頻內(nèi)容自動生成。

并且Pika非常自信地說到：“如果你覺得音效聽起來很棒，那是因為它確實如此”。

車鳴聲、廣播聲、鷹叫聲、刀劍聲、歡呼聲……可謂是聲聲不息，并且從效果上來看，也是高度與視頻畫面匹配。

不僅是發(fā)布的宣傳片，Pika官網(wǎng)現(xiàn)在也放出了多個demo。

例如無需任何prompt，AI只是看了眼烤培根的視頻，便可以配出毫無違和感的音效。

再如給一句prompt：

Super saturated color, fireworks over a field at sunset.
超飽和色彩，日落時田野上的煙火。

Pika便可以在生成視頻的同時配上聲音，從效果中不難看出，煙花綻放的瞬間，聲音卡點也是相當?shù)木珳省?/p>

大周末的發(fā)布這樣一個新功能，網(wǎng)友們在高呼Pika“夠卷、夠Awesome”的同時，也有人認為：

它正在為多模態(tài)AI創(chuàng)作收集所有的“無限寶石”。

Pika放大招：今天起，視頻和音效可以“一鍋出”了！

那么Pika的Sound Effects具體要如何操作，我們繼續(xù)往下看。

給視頻“make some noise”

Pika給視頻生成音效的操作也是極！其！簡！單！

例如只需一句prompt，視頻和音效就能“一鍋出”：

Mdieval trumpet player.
中世紀小號手。

Pika放大招：今天起，視頻和音效可以“一鍋出”了！

相比于此前生成視頻的操作，現(xiàn)在只需開啟下方“Sound effects”按鈕即可。

第二種操作方式，就是在生成了視頻過后，可以單獨給它配音。

例如在下面這個視頻，點擊下方的“Edit”，再選擇“Sound Effects”：

Pika放大招：今天起，視頻和音效可以“一鍋出”了！

然后可以描述一下自己想要的聲音，例如：

Race car revving its engine.
賽車正在發(fā)動引擎。

然后短短幾秒后，Pika就可以根據(jù)描述和視頻生成音效，而且還是6種聲音可選的那種！

值得一提的是，Sound Effects功能目前只對超級合作者（Super Collaborator）和Pro用戶開放測試。

不過Pika也表示：“我們很快就會向所有用戶推出該功能！”

Pika放大招：今天起，視頻和音效可以“一鍋出”了！

然后現(xiàn)在已經(jīng)有一批網(wǎng)友在開始測試這個Beta版本了，并且表示：

音效聽起來和視頻很相配，而且增加了很多氣氛。

什么原理？

至于Sound Effects背后的原理，雖然Pika此次并沒有公開，但在此前Sora大火之后，語音初創(chuàng)公司ElevenLabs就出過類似的配音功能。

當時，英偉達高級科學家Jim Fan就對此做過較為深入的分析。

他認為，AI學習準確的視頻到音頻映射還需要對潛在空間中的一些“隱式”物理進行建模。

Pika放大招：今天起，視頻和音效可以“一鍋出”了！

他詳細說明了端到端Transformer在模擬聲波時需要解決的問題：

識別每個物體的類別、材料和空間位置。
識別物體間的高階互動：例如，是木棍、金屬或是鼓面？以什么速度擊打？
識別環(huán)境：是餐廳、空間站、還是黃石公園？
從模型的內(nèi)部記憶中檢索物體和環(huán)境的典型聲音模式。
使用“軟性”的、通過學習得到的物理規(guī)則來組合和調(diào)整聲音模式的參數(shù)，甚至即時創(chuàng)造全新的聲音。這有點像游戲引擎中的“程序化音頻”。
如果場景很復雜，模型需要根據(jù)物體的空間位置疊加多個聲音軌道。

所有這些都不是顯式的模塊，而是通過大量的（視頻，音頻）對的梯度下降學習來實現(xiàn)的，這些視頻和音頻對在大多數(shù)互聯(lián)網(wǎng)視頻中自然地時間對齊。注意力層將在它們的權(quán)重中實現(xiàn)這些算法，以滿足擴散目標。

除此之外，Jim Fan當時表示英偉達的相關工作并沒有這樣高質(zhì)量的AI音頻引擎，不過他推薦了一篇MIT五年前的論文The Sound of Pixels：

Pika放大招：今天起，視頻和音效可以“一鍋出”了！

感興趣的小伙伴可以戳文末鏈接詳細了解一下。

One More Thing

在多模態(tài)這件事上，LeCun在最新訪談中的觀點也很火爆，他認為：

語言（文本）是低寬帶的：小于12字節(jié)/秒。現(xiàn)代LLM通常使用1x10^13個雙字節(jié)標記（即 2x10^13 字節(jié)）進行訓練。一個人閱讀大約需要 100000 年（每天 12 小時）。

視覺的帶寬要高得多：約20MB/s。兩條視神經(jīng)中的每一條都有 100 萬根神經(jīng)纖維，每根神經(jīng)纖維每秒攜帶約10個字節(jié)。一個4歲的孩子在清醒狀態(tài)下大約是16000小時，換算成字節(jié)大約是1x10^15。

視覺感知的數(shù)據(jù)帶寬大約是文本語言數(shù)據(jù)帶寬的1600萬倍。

一個4歲孩子看到的數(shù)據(jù)，是互聯(lián)網(wǎng)上公開的所有文本訓練的最大LLM數(shù)據(jù)的50倍。

Pika放大招：今天起，視頻和音效可以“一鍋出”了！

因此，LeCun總結(jié)到：

如果不讓機器從高帶寬的感官輸入（如視覺）中學習，我們絕對不可能達到人類水平的人工智能。

那么，你贊成這種觀點嗎？

以上就是Pika放大招：今天起，視頻和音效可以“一鍋出”了！的詳細內(nèi)容，更多請關注php中文網(wǎng)其它相關文章！

相關標簽：

人工智能算法人工智能 transformer prompt

大家都在看：

大智慧app怎么清空緩存數(shù)據(jù)_大智慧app緩存數(shù)據(jù)清理步驟谷歌瀏覽器怎么在開發(fā)者工具中模擬不同的網(wǎng)絡速度_Chrome網(wǎng)頁網(wǎng)絡速度模擬 css工具CSSNano壓縮優(yōu)化樣式文件免費PPT生成支持多人協(xié)作嗎_免費工具實現(xiàn)PPT協(xié)作的指南 vivo Y78T相機功能講解 vivo Y78T防抖設置教程

最佳 Windows 性能的頂級免費優(yōu)化軟件

最佳 Windows 性能的頂級免費優(yōu)化軟件

每個人都需要一臺速度更快、更穩(wěn)定的 PC。隨著時間的推移，垃圾文件、舊注冊表數(shù)據(jù)和不必要的后臺進程會占用資源并降低性能。幸運的是，許多工具可以讓 Windows 保持平穩(wěn)運行。

來源：51CTO.COM網(wǎng)

上一篇：LeCun最新專訪：為什么物理世界終將成為LLM的「死穴」？下一篇：告別繁瑣的手動調(diào)參，Optuna助您輕松實現(xiàn)超參數(shù)優(yōu)化！

本文內(nèi)容由網(wǎng)友自發(fā)貢獻，版權(quán)歸原作者所有，本站不承擔相應法律責任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容，請聯(lián)系admin@php.cn

作者最新文章

提升效率的夸克瀏覽器AI搜索_夸克AI搜索高效使用秘籍

2025-10-17 16:12:05
夸克瀏覽器AI搜索全面評測_夸克AI搜索功能優(yōu)缺點分析

2025-10-17 16:02:02
夸克瀏覽器AI搜索的正確姿勢_夸克AI搜索實用場景案例

2025-10-14 12:54:02
夸克瀏覽器AI搜索設置指南_讓你的夸克AI搜索響應更迅速

2025-10-13 22:31:01
夸克瀏覽器AI搜索指令分享_精通夸克AI搜索的命令與提示

2025-10-13 19:12:02
如何防范Composer依賴混淆攻擊？使用magento/composer-dependency-version-audit-plugin守護你的項目安全

2025-09-16 12:46:02
如何解決PostgreSQL外鍵索引缺失導致的性能瓶頸，使用SprykerIndexGenerator助你輕松優(yōu)化數(shù)據(jù)庫

2025-09-16 12:05:02
如何優(yōu)雅地管理復雜業(yè)務邏輯？jwadhams/json-logic-php助你實現(xiàn)動態(tài)規(guī)則引擎！

2025-09-16 10:22:03
如何高效準確地驗證郵件地址？使用Composer和Egulias/Email-Validator輕松解決！

2025-09-16 10:20:28
如何在Symfony應用中優(yōu)雅集成Vue.js？SymfonyUXVue與Composer助你輕松實現(xiàn)

2025-09-15 11:24:03

最新問題

手機版夸克瀏覽器AI搜索設置_移動端夸克AI搜索使用全攻略關閉AI搜索：打開夸克APP→點擊“三條橫線”→設置→搜索與瀏覽→關閉“AI搜索增強”開關，恢復傳統(tǒng)網(wǎng)頁結(jié)果。2.開啟AI搜索：進入設置→通用→搜索引擎→選擇“AI引擎”作為默認，獲取智能摘要與整合內(nèi)容。3.建議按需調(diào)整：精準查源關閉AI，提效可留糾錯功能，學術研究切換知網(wǎng)等專用通道。操作適用于v7.0及以上版本，建議保持更新以確保功能完整。

2025-10-17 23:58:01

307

AI推文助手如何優(yōu)化推文質(zhì)量 AI推文助手的內(nèi)容質(zhì)量提升策略 AI推文助手通過優(yōu)化語言風格、增強關鍵詞布局、提升情感共鳴、精準安排發(fā)布時間及A/B測試，全面提升推文吸引力與互動率。

2025-10-17 23:56:01

416

虛擬伴侶AI如何實現(xiàn)虛擬擁抱虛擬伴侶AI觸覺反饋技術的應用方法觸覺反饋技術通過可穿戴設備、力反饋機械臂、熱感振動復合刺激及腦機接口協(xié)同模擬虛擬擁抱。首先，佩戴兼容AI的觸覺背心，利用氣囊與振動馬達響應指令產(chǎn)生壓力；其次，機械臂結(jié)合力傳感器實現(xiàn)安全環(huán)抱；再通過加熱元件與低頻振動還原體溫與心跳；最后，EEG頭盔配合神經(jīng)刺激誘導真實觸感，實現(xiàn)多模態(tài)沉浸式情感交互。

2025-10-17 23:51:01

656

靈繪AI提示詞怎么寫_靈繪AI提示詞撰寫的優(yōu)化方法詳解優(yōu)化提示詞需先明確主體與風格，如“一只黑色貓咪在賽博朋克城市屋頂凝視月亮”，再分層構(gòu)建主體、環(huán)境、光照等結(jié)構(gòu)，結(jié)合權(quán)重標記強化重點，如“(發(fā)光的眼睛:1.5)”，并使用負向提示排除“低分辨率”“畸形手指”等問題，最后參考成功案例迭代調(diào)整，提升生成質(zhì)量。

2025-10-17 23:42:01

434

虛擬伴侶AI如何打造記憶宮殿虛擬伴侶AI長期記憶系統(tǒng)的構(gòu)建方法需構(gòu)建分層記憶架構(gòu)以實現(xiàn)AI長期記憶。首先建立短期緩存與長期存儲分離的系統(tǒng)，通過Redis和MongoDB/Neo4j實現(xiàn)；當信息被頻繁引用或具高情感價值時轉(zhuǎn)入長期記憶。其次進行語義編碼，提取實體與情感并關聯(lián)時間、場景等元數(shù)據(jù)形成情境鏈條。再利用BERT等模型將文本轉(zhuǎn)為向量，存入Pinecone等向量數(shù)據(jù)庫，支持語義相似性檢索。同時設計動態(tài)權(quán)重機制，依據(jù)訪問頻率增強記憶、按時間衰減，并定期清理低權(quán)記憶，支持用戶標記重要記憶防刪除。最后通過用戶反饋修正錯誤記憶，更新數(shù)據(jù)庫并提示用戶完成閉環(huán)優(yōu)化。

2025-10-17 23:33:01

345

虛擬伴侶AI如何設置學習伴侶虛擬伴侶AI教育陪伴功能的配置指南首先啟用教育模式，登錄管理控制臺開啟“教育陪伴模式”并保存設置；接著綁定學科知識圖譜，在知識庫管理中添加數(shù)學、物理等學科資源并設置每日同步；然后設定個性化學習計劃接口，通過授權(quán)碼連接學習平臺，配置6小時同步周期與提醒規(guī)則；再訓練對話引導策略，加載教育場景模板，提升反問式回應權(quán)重并上傳引導話術包；最后配置家長或教師監(jiān)督權(quán)限，創(chuàng)建監(jiān)督者賬號，分配數(shù)據(jù)訪問范圍并啟用月度報表與敏感內(nèi)容過濾。

2025-10-17 23:30:05

154

AI推文助手如何設置內(nèi)容分享 AI推文助手的內(nèi)容分發(fā)策略首先綁定社交賬號并授權(quán)發(fā)布權(quán)限，登錄助手后臺在“賬號設置”中連接微博、Twitter等平臺，確認授權(quán)后顯示“已連接”狀態(tài)；接著配置多平臺同步規(guī)則，在“分發(fā)策略”中新建規(guī)則并命名，設置關鍵詞觸發(fā)條件，選擇目標平臺組合實現(xiàn)自動推送；然后設定發(fā)布時間與頻率，啟用定時分發(fā)和智能間隔功能，結(jié)合用戶活躍時段提升曝光；再開啟內(nèi)容適配轉(zhuǎn)換，自動處理字符限制、圖片格式和鏈接長度，確保各平臺合規(guī)展示；最后建立審核與反饋機制，啟用發(fā)布前審批流程，設置通知提醒，分析分發(fā)報告中的互動數(shù)據(jù)，優(yōu)化內(nèi)容策略并降低風險。

2025-10-17 23:24:01

269

豆包電腦網(wǎng)頁版使用指南_豆包網(wǎng)頁版正版下載步驟首先訪問豆包官網(wǎng)https://www.doubao.com/，登錄或注冊賬號后進入主界面，即可使用AI對話、圖像生成、語音輸入及多語言翻譯等功能。

2025-10-17 23:14:01

106

豆包Ai官方網(wǎng)頁版訪問_豆包Ai網(wǎng)頁版使用官網(wǎng) 豆包Ai官方網(wǎng)頁版訪問入口為https://www.doubao.com/chat/，支持智能聊天、圖像生成、文檔互動等功能，用戶可通過網(wǎng)頁、客戶端或移動端使用，建議登錄賬號并分步提問以提升交互效率。

2025-10-17 23:12:01

431

AI推文助手如何設置內(nèi)容標簽 AI推文助手的內(nèi)容分類管理啟用標簽功能并創(chuàng)建自定義類別，通過關鍵詞設置自動推薦規(guī)則，實現(xiàn)推文精準分類與高效管理。

2025-10-17 22:52:02

233

相關專題

更多>

熱門推薦

開源免費商場系統(tǒng)

廣告

熱門教程

更多>

相關推薦

熱門推薦

最新課程

Python+人工智能全棧工程師(Linux基礎篇)

309657次學習
收藏
Vue3.x 工具篇--十天技能課堂

10836次學習
收藏
快速使用API文檔與智能Mock

818次學習
收藏

最新下載

更多>

網(wǎng)站特效

網(wǎng)站源碼

網(wǎng)站素材

前端模板

關于我們免責申明意見反饋講師合作廣告合作最新更新: php中文網(wǎng)：公益在線php培訓，幫助PHP學習者快速成長！; 關注服務號技術交流群

PHP中文網(wǎng)訂閱號: 每天精選資源文章推送

PHP中文網(wǎng)APP: 隨時隨地碎片化學習

PHP中文網(wǎng)抖音號: 發(fā)現(xiàn)有趣的

Copyright 2014-2025 http://ipnx.cn/ All Rights Reserved | php.cn | 湘ICP備2023035733號

PHP學習

技術支持

返回頂部

<em id="cnp4p"><option id="cnp4p"><nobr id="cnp4p"></nobr></option></em>