亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁(yè) 科技周邊 人工智能 Mollick介紹了新圖像生成模型的含義

Mollick介紹了新圖像生成模型的含義

Apr 09, 2025 am 11:26 AM

Mollick Presents The Meaning Of New Image Generation Models

近期,谷歌和OpenAI發(fā)布的全新圖像生成模型引發(fā)廣泛關(guān)注,其核心技術(shù)與以往模型截然不同。 Ethan Mollick在One Useful Thing發(fā)表的文章深入探討了這些新模型的工作機(jī)制及其對(duì)人類(lèi)用戶的影響。本文將對(duì)Mollick的觀點(diǎn)進(jìn)行解讀。

多模態(tài)圖像生成的潛力

Mollick指出,傳統(tǒng)的圖像生成系統(tǒng)是多個(gè)模型協(xié)同工作的產(chǎn)物,并非單一模型完成所有任務(wù)。

他寫(xiě)道:“以往,大型語(yǔ)言模型(LLM)生成圖像并非由LLM直接完成。AI會(huì)將文本提示發(fā)送給獨(dú)立的圖像生成工具,然后顯示結(jié)果。AI負(fù)責(zé)創(chuàng)建文本提示,而另一個(gè)能力較弱的系統(tǒng)負(fù)責(zé)生成圖像?!?/p>

擴(kuò)散模型已成過(guò)去式

舊模型主要依賴擴(kuò)散模型工作。擴(kuò)散模型的工作原理是:將圖像引入噪聲,進(jìn)行抽象處理,然后再去除噪聲,生成與計(jì)算機(jī)已知圖像庫(kù)中匹配提示的圖像。

然而,這種方法的局限性在于:生成的圖像缺乏模型自身的推理和判斷,只是對(duì)現(xiàn)有圖像庫(kù)的簡(jiǎn)單組合,無(wú)法提供有價(jià)值的信息。

多模態(tài)控制的優(yōu)勢(shì)

如今,多模態(tài)控制技術(shù)的出現(xiàn)徹底改變了這一現(xiàn)狀。

Mollick舉例說(shuō)明:提示模型生成“沒(méi)有大象的房間,并標(biāo)注原因”。傳統(tǒng)模型會(huì)生成包含大象的圖像,因?yàn)樗鼰o(wú)法理解提示的語(yǔ)境。生成的文本也可能毫無(wú)意義甚至包含虛構(gòu)字符,因?yàn)槟P蛯?duì)字母的理解也源于訓(xùn)練數(shù)據(jù)。

而多模態(tài)模型則能精準(zhǔn)地生成符合要求的圖像,并添加注釋?zhuān)纭伴T(mén)太小”,解釋為什么房間里沒(méi)有大象。

傳統(tǒng)模型的提示挑戰(zhàn)

傳統(tǒng)模型的一個(gè)顯著缺陷是:一旦要求其排除某個(gè)元素,它反而會(huì)包含該元素,因?yàn)樗鼰o(wú)法理解指令。此外,每次修改或調(diào)整都會(huì)改變圖像的基本結(jié)構(gòu)。例如,修改人物的帽子可能會(huì)導(dǎo)致人物形象完全改變。

多模態(tài)圖像生成模型則能夠在保留原有結(jié)果的基礎(chǔ)上進(jìn)行細(xì)微調(diào)整。

環(huán)境的保持

Mollick還展示了另一個(gè)例子:一只手里拿著特定物品的水獺,然后在不同環(huán)境和不同風(fēng)格的背景下出現(xiàn)。這展現(xiàn)了多模態(tài)圖像生成器的精細(xì)整合能力。

完整的演示文稿

Mollick還展示了如何利用多模態(tài)模型設(shè)計(jì)完整的演示文稿,例如關(guān)于鱷梨醬的推介。只需提供簡(jiǎn)單的指令,模型就能搜索互聯(lián)網(wǎng)上的相關(guān)信息,進(jìn)行整合,并生成最終結(jié)果。

正如Mollick所言,這將迅速導(dǎo)致許多人類(lèi)工作被取代。我們需要認(rèn)真考慮建立相應(yīng)的框架。

以上是Mollick介紹了新圖像生成模型的含義的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請(qǐng)聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開(kāi)發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺(jué)化網(wǎng)頁(yè)開(kāi)發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

熱門(mén)話題

Laravel 教程
1597
29
PHP教程
1488
72
Kimi K2:最強(qiáng)大的開(kāi)源代理模型 Kimi K2:最強(qiáng)大的開(kāi)源代理模型 Jul 12, 2025 am 09:16 AM

還記得今年早些時(shí)候破壞了Genai行業(yè)的大量開(kāi)源中國(guó)模型嗎?盡管DeepSeek占據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

Grok 4 vs Claude 4:哪個(gè)更好? Grok 4 vs Claude 4:哪個(gè)更好? Jul 12, 2025 am 09:37 AM

到2025年中期,AI“軍備競(jìng)賽”正在加熱,XAI和Anthropic都發(fā)布了他們的旗艦車(chē)型Grok 4和Claude 4。這兩種模型處于設(shè)計(jì)理念和部署平臺(tái)的相反端,但他們卻在

今天已經(jīng)在我們中間走了10個(gè)驚人的人形機(jī)器人 今天已經(jīng)在我們中間走了10個(gè)驚人的人形機(jī)器人 Jul 16, 2025 am 11:12 AM

但是我們可能甚至不必等10年就可以看到一個(gè)。實(shí)際上,可以被認(rèn)為是真正有用的,類(lèi)人類(lèi)機(jī)器的第一波。 近年來(lái),有許多原型和生產(chǎn)模型從T中走出來(lái)

上下文工程是' new'及時(shí)的工程 上下文工程是' new'及時(shí)的工程 Jul 12, 2025 am 09:33 AM

直到上一年,迅速的工程被認(rèn)為是與大語(yǔ)言模型(LLM)互動(dòng)的關(guān)鍵技能。然而,最近,LLM在推理和理解能力方面已經(jīng)顯著提高。自然,我們的期望

6個(gè)任務(wù)Manus AI可以在幾分鐘內(nèi)完成 6個(gè)任務(wù)Manus AI可以在幾分鐘內(nèi)完成 Jul 06, 2025 am 09:29 AM

我相信您必須了解通用的AI代理Manus。它是幾個(gè)月前推出的,在過(guò)去的幾個(gè)月中,他們?yōu)橄到y(tǒng)添加了幾個(gè)新功能?,F(xiàn)在,您可以生成視頻,創(chuàng)建網(wǎng)站并做很多MO

Leia的浸入式移動(dòng)應(yīng)用將3D深度帶入日常照片 Leia的浸入式移動(dòng)應(yīng)用將3D深度帶入日常照片 Jul 09, 2025 am 11:17 AM

基于Leia專(zhuān)有的神經(jīng)深度引擎,應(yīng)用程序流程靜止圖像,并添加了自然深度以及模擬運(yùn)動(dòng)(例如Pans,Zooms和Alallax Effects),以創(chuàng)建簡(jiǎn)短的視頻卷軸,從而給人以踏入SCE的印象

7種AI代理的7種類(lèi)型是什么? 7種AI代理的7種類(lèi)型是什么? Jul 11, 2025 am 11:08 AM

想象一些復(fù)雜的東西,例如AI引擎準(zhǔn)備提供有關(guān)米蘭新服裝系列的詳細(xì)反饋,或者自動(dòng)市場(chǎng)分析用于全球運(yùn)營(yíng)的企業(yè),或者智能系統(tǒng)管理大型車(chē)隊(duì)。

這些AI模型沒(méi)有學(xué)習(xí)語(yǔ)言,他們學(xué)習(xí)了策略 這些AI模型沒(méi)有學(xué)習(xí)語(yǔ)言,他們學(xué)習(xí)了策略 Jul 09, 2025 am 11:16 AM

倫敦國(guó)王學(xué)院和牛津大學(xué)的研究人員的一項(xiàng)新研究分享了Openai,Google和Anthropic在基于迭代囚犯的困境基于的cutthroat競(jìng)爭(zhēng)中一起投擲的結(jié)果。這是沒(méi)有的

See all articles