亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁 科技週邊 人工智慧 Mollick介紹了新圖像生成模型的含義

Mollick介紹了新圖像生成模型的含義

Apr 09, 2025 am 11:26 AM

Mollick Presents The Meaning Of New Image Generation Models

近期,谷歌和OpenAI發(fā)布的全新圖像生成模型引發(fā)廣泛關(guān)注,其核心技術(shù)與以往模型截然不同。 Ethan Mollick在One Useful Thing發(fā)表的文章深入探討了這些新模型的工作機制及其對人類用戶的影響。本文將對Mollick的觀點進行解讀。

多模態(tài)圖像生成的潛力

Mollick指出,傳統(tǒng)的圖像生成系統(tǒng)是多個模型協(xié)同工作的產(chǎn)物,並非單一模型完成所有任務。

他寫道:“以往,大型語言模型(LLM)生成圖像並非由LLM直接完成。AI會將文本提示發(fā)送給獨立的圖像生成工具,然後顯示結(jié)果。AI負責創(chuàng)建文本提示,而另一個能力較弱的系統(tǒng)負責生成圖像?!?/p>

擴散模型已成過去式

舊模型主要依賴擴散模型工作。擴散模型的工作原理是:將圖像引入噪聲,進行抽象處理,然後再去除噪聲,生成與計算機已知圖像庫中匹配提示的圖像。

然而,這種方法的局限性在於:生成的圖像缺乏模型自身的推理和判斷,只是對現(xiàn)有圖像庫的簡單組合,無法提供有價值的信息。

多模態(tài)控制的優(yōu)勢

如今,多模態(tài)控制技術(shù)的出現(xiàn)徹底改變了這一現(xiàn)狀。

Mollick舉例說明:提示模型生成“沒有大象的房間,並標註原因”。傳統(tǒng)模型會生成包含大象的圖像,因為它無法理解提示的語境。生成的文本也可能毫無意義甚至包含虛構(gòu)字符,因為模型對字母的理解也源於訓練數(shù)據(jù)。

而多模態(tài)模型則能精準地生成符合要求的圖像,並添加註釋,例如“門太小”,解釋為什麼房間裡沒有大象。

傳統(tǒng)模型的提示挑戰(zhàn)

傳統(tǒng)模型的一個顯著缺陷是:一旦要求其排除某個元素,它反而會包含該元素,因為它無法理解指令。此外,每次修改或調(diào)整都會改變圖像的基本結(jié)構(gòu)。例如,修改人物的帽子可能會導致人物形象完全改變。

多模態(tài)圖像生成模型則能夠在保留原有結(jié)果的基礎(chǔ)上進行細微調(diào)整。

環(huán)境的保持

Mollick還展示了另一個例子:一隻手裡拿著特定物品的水獺,然後在不同環(huán)境和不同風格的背景下出現(xiàn)。這展現(xiàn)了多模態(tài)圖像生成器的精細整合能力。

完整的演示文稿

Mollick還展示瞭如何利用多模態(tài)模型設(shè)計完整的演示文稿,例如關(guān)於鱷梨醬的推介。只需提供簡單的指令,模型就能搜索互聯(lián)網(wǎng)上的相關(guān)信息,進行整合,並生成最終結(jié)果。

正如Mollick所言,這將迅速導致許多人類工作被取代。我們需要認真考慮建立相應的框架。

以上是Mollick介紹了新圖像生成模型的含義的詳細內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔相應的法律責任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
Kimi K2:最強大的開源代理模型 Kimi K2:最強大的開源代理模型 Jul 12, 2025 am 09:16 AM

還記得今年早些時候破壞了Genai行業(yè)的大量開源中國模型嗎?儘管DeepSeek佔據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

Grok 4 vs Claude 4:哪個更好? Grok 4 vs Claude 4:哪個更好? Jul 12, 2025 am 09:37 AM

到2025年中期,AI“軍備競賽”正在加熱,XAI和Anthropic都發(fā)布了他們的旗艦車型Grok 4和Claude 4。這兩種模型處於設(shè)計理念和部署平臺的相反端,但他們卻在

今天已經(jīng)在我們中間走了10個驚人的人形機器人 今天已經(jīng)在我們中間走了10個驚人的人形機器人 Jul 16, 2025 am 11:12 AM

但是我們可能甚至不必等10年就可以看到一個。實際上,可以被認為是真正有用的,類人類機器的第一波。 近年來,有許多原型和生產(chǎn)模型從T中走出來

上下文工程是' new'及時的工程 上下文工程是' new'及時的工程 Jul 12, 2025 am 09:33 AM

直到上一年,迅速的工程被認為是與大語言模型(LLM)互動的關(guān)鍵技能。然而,最近,LLM在推理和理解能力方面已經(jīng)顯著提高。自然,我們的期望

6個任務Manus AI可以在幾分鐘內(nèi)完成 6個任務Manus AI可以在幾分鐘內(nèi)完成 Jul 06, 2025 am 09:29 AM

我相信您必須了解通用的AI代理Manus。它是幾個月前推出的,在過去的幾個月中,他們?yōu)橄到y(tǒng)添加了幾個新功能?,F(xiàn)在,您可以生成視頻,創(chuàng)建網(wǎng)站並做很多MO

Leia的浸入式移動應用將3D深度帶入日常照片 Leia的浸入式移動應用將3D深度帶入日常照片 Jul 09, 2025 am 11:17 AM

基於Leia專有的神經(jīng)深度引擎,應用程序流程靜止圖像,並添加了自然深度以及模擬運動(例如Pans,Zooms和Alallax Effects),以創(chuàng)建簡短的視頻捲軸,從而給人以踏入SCE的印象

這些AI模型沒有學習語言,他們學習了策略 這些AI模型沒有學習語言,他們學習了策略 Jul 09, 2025 am 11:16 AM

倫敦國王學院和牛津大學的研究人員的一項新研究分享了Openai,Google和Anthropic在基於迭代囚犯的困境基於的cutthroat競爭中一起投擲的結(jié)果。這是沒有的

7種AI代理的7種類型是什麼? 7種AI代理的7種類型是什麼? Jul 11, 2025 am 11:08 AM

想像一些複雜的東西,例如AI引擎準備提供有關(guān)米蘭新服裝系列的詳細反饋,或者自動市場分析用於全球運營的企業(yè),或者智能係統(tǒng)管理大型車隊。

See all articles