美圖自研的大模型3.0已經(jīng)正式發(fā)布!
并且全面應(yīng)用于美圖旗下影像與設(shè)計產(chǎn)品。
圖片
這是自美圖大模型面世100天后的最新迭代。
相較于最初版本,3.0版能夠生成更加真實細(xì)膩的畫面細(xì)節(jié)。
圖片
如上這些生成能力,在美圖秀秀上能直接體驗。
圖片
最近正流行的AIGC玩法,在其中都能找到。
圖片
美圖公司的創(chuàng)始人、董事長兼CEO吳欣鴻透露,目前美圖的大部分產(chǎn)品都已經(jīng)融入了自己研發(fā)的大模型
除了影像和設(shè)計領(lǐng)域,美圖自研大模型還將在電商、廣告、游戲、動漫、影視五大行業(yè)發(fā)力。
美圖秀秀可直接體驗
美圖自研大模型名叫MiracleVision(奇想智能)。
其最顯著的特點是更懂美學(xué)。
美圖將長期積累的美學(xué)認(rèn)知融入到MiracleVision視覺大模型中,并建立了基于機器學(xué)習(xí)的美學(xué)評估系統(tǒng),為模型生成的結(jié)果賦予了“美學(xué)分?jǐn)?shù)”,以不斷提升模型對美學(xué)的理解
所以美圖也將自己的大模型稱為是“藝術(shù)生和理科生的結(jié)合”。
目前MiracleVision3.0的最新能力在美圖秀秀上即可體驗。
圖片
操作非常簡單,比如使用涂鴉生成圖,只需幾筆簡單的草圖加上提示詞,就能輕松地創(chuàng)建出復(fù)雜的模型
圖片
在AI視覺創(chuàng)作工具“WHEE”上,可以獲得更加專業(yè)的體驗,并且能夠控制更多的功能
舉個例子,在"圖生圖"功能中,我們可以利用智能聯(lián)想來生成更加完善的提示詞
可以通過文字來控制不希望呈現(xiàn)的內(nèi)容
圖片
更進一步可控制生成圖像風(fēng)格。
圖片
以及可以通過參數(shù)調(diào)整、畫面控制能讓生成圖片更加符合自己的預(yù)期。
美圖大模型MiracleVision現(xiàn)在已經(jīng)涉足電商、游戲、動漫、廣告和影視五大領(lǐng)域,旨在提高工作流程的效率
圖片
MiracleVision自6月份首次發(fā)布以來經(jīng)歷了三次更新
- 1.0版本主要初步構(gòu)建大模型架構(gòu)和基礎(chǔ);
- 2.0版本聯(lián)合了設(shè)計師、藝術(shù)院校老師學(xué)生共同構(gòu)建了高質(zhì)量數(shù)據(jù)集,使得大模型在美學(xué)方面達(dá)到更好狀態(tài);
- 3.0版本更強調(diào)模型的可控性,在細(xì)節(jié)和局部控制上做了提升,使得模型在技術(shù)層面達(dá)到更好效果。
圖片
目前,美圖AI視覺創(chuàng)作工具“WHEE”的AI效果生成數(shù)已超過550萬張,已初步打造設(shè)計師生態(tài);AI口播視頻工具“開拍”月活躍用戶數(shù)已突破35萬;桌面端AI視頻編輯工具“WinkStudio”已累計服務(wù)近10萬名視頻創(chuàng)作者。
美圖吳欣鴻也表示,目前美圖全員都積極 embrace AI。隨著人工智慧與影像運算的融合趨勢,美圖制定了更明確的發(fā)展策略
例如快速推出自研大模型、佈局五大產(chǎn)業(yè),這些動作都基於美圖對於AIGC趨勢的理解和洞察。
上半年投3個億做研發(fā)
最明顯的一個方面是,美圖對當(dāng)前AIGC趨勢活躍用戶的理解
吳欣鴻表示,他們觀察到如今離AIGC趨勢最近的人,不是設(shè)計師,而是「傳播者」。
主要以新媒體營運、電商營運和KOL為主的群體
沒有專業(yè)從業(yè)者的「包袱」和高要求,同時又能向下連結(jié)更多普通人的這群人,是美圖目前的發(fā)力點之一。他們正在逐步開發(fā)更完善的AI工具,建立工作流程
圖片
美圖同時認(rèn)為,在大型模型的趨勢下,它具有一個天生的優(yōu)勢,即能夠迅速獲得用戶的反饋
作為一家成立已有15年的產(chǎn)品公司,美圖已經(jīng)構(gòu)建起了足夠龐大的用戶群體,能夠透過在自身平臺上試水新功能,快速得到市場回饋並快速調(diào)整效果,這樣能讓大模型更有效率地和實際場景結(jié)合。
作為AI能力的提供方,美圖吳欣鴻認(rèn)為,當(dāng)前AI視覺大模型在生產(chǎn)端面臨三個待解決的問題:垂直領(lǐng)域的極致效果、工作流程整合和變現(xiàn)能力
一一對應(yīng)來看,美圖在這三方面已開始發(fā)力。
首先,美圖透過快速迭代自研大模型,在100天內(nèi)改進了模型的生成效果,使其更加豐富且可控。在滿足使用者新鮮體驗的基礎(chǔ)上,美圖能夠提供更實用價值的影像設(shè)計作品
其二,美圖選擇了五大方向,並為生產(chǎn)者提供了AI設(shè)計工具。據(jù)透露,美圖選擇電商、遊戲、動漫、廣告和影視這幾個產(chǎn)業(yè),主要是看重了它們和網(wǎng)路產(chǎn)業(yè)有更原生的關(guān)係。這使得AI工具能更好地融入其工作鏈路,整合工作流程速度更快。
其三,變現(xiàn)能力。美圖目前已經(jīng)建構(gòu)了一個創(chuàng)作者生態(tài),這部分對AI有興趣的創(chuàng)作者,可以將自己原創(chuàng)的AI視覺效果做成配方,在美圖搭建的平臺上販?zhǔn)?。這樣一來,創(chuàng)作者能夠獲得更多收入,同時他們也能起到傳播推廣的作用,吸引更多人來使用AI視覺創(chuàng)作工具。
基於這些理解,今年美圖正式提出了AI產(chǎn)品形態(tài),包括底層、中間層和應(yīng)用層。
底層為MiracleVision自研大模型。
中間層由美圖AI開放平臺、美圖創(chuàng)意平臺、美圖AI助理RoboNeo組合而成,分別負(fù)責(zé)開放共享AI技術(shù)、搭建創(chuàng)作者生態(tài)、聚合美圖影像服務(wù)
應(yīng)用層由一般使用者較熟悉的各類應(yīng)用APP構(gòu)成。
搭建三層架構(gòu)的目的,基本上是從產(chǎn)品的角度出發(fā)的
就以底層研發(fā)為例,美圖旗下的美圖影像研究院(MT Lab)在2010年成立。目前,公司大模型研發(fā)相關(guān)人員約有600人
今年上半年公司研發(fā)投入2.94億元,年增10.8%。
美圖公司表示,他們在進行研發(fā)時遵循更務(wù)實的邏輯,即考慮到是否能夠?qū)嶋H成長用戶和收入。同時,他們相信這一切都可以透過實際業(yè)績來證明
今年上半年,美圖公司實現(xiàn)總收入12.61億元,年增29.8%。月活躍用戶數(shù)達(dá)2.47億,年增2.5%。 VIP會員數(shù)超720萬,創(chuàng)下歷史新高。以VIP訂閱為主的影像與設(shè)計產(chǎn)品業(yè)務(wù)收入6.02億元,年增62.2%;美業(yè)解決方案業(yè)務(wù)收入2.86億元,年增31.1%;廣告業(yè)務(wù)收入3.49億元,年增28.2%;其他業(yè)務(wù)收入2309萬元。
不過回到當(dāng)下,美圖也坦言視覺大模型應(yīng)用仍正處於探索期。當(dāng)下許多應(yīng)用程式開發(fā)都是齊頭並進,各家也都在摸索路徑。
吳欣鴻認(rèn)為,視覺大模型的應(yīng)用普及將經(jīng)歷三個階段:探索期將在2024年之前,高速發(fā)展期將在2024-2025年,成熟期將在2026-2030年
圖片
要成功穿越週期,需要具備審視趨勢的能力,並且需要有實實在在的資金支持
就以當(dāng)下讓廠商們焦慮的算力問題,美圖透露目前正在和多家雲(yún)廠商合作,有充足算力可以使用。
吳欣鴻進一步補充說,美圖很幸運能夠透過訂閱和單獨購買獲得回報
以上是美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗的詳細(xì)內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

熱AI工具

Undress AI Tool
免費脫衣圖片

Undresser.AI Undress
人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6
視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

在PHP中搭建社交分享功能的核心方法是通過動態(tài)生成符合各平臺要求的分享鏈接。 1.首先獲取當(dāng)前頁面或指定的URL及文章信息;2.使用urlencode對參數(shù)進行編碼;3.根據(jù)各平臺協(xié)議拼接生成分享鏈接;4.在前端展示鏈接供用戶點擊分享;5.動態(tài)生成頁面OG標(biāo)籤優(yōu)化分享內(nèi)容展示;6.務(wù)必對用戶輸入進行轉(zhuǎn)義以防止XSS攻擊。該方法無需複雜認(rèn)證,維護成本低,適用於大多數(shù)內(nèi)容分享需求。

用戶語音輸入通過前端JavaScript的MediaRecorderAPI捕獲並發(fā)送至PHP後端;2.PHP將音頻保存為臨時文件後調(diào)用STTAPI(如Google或百度語音識別)轉(zhuǎn)換為文本;3.PHP將文本發(fā)送至AI服務(wù)(如OpenAIGPT)獲取智能回復(fù);4.PHP再調(diào)用TTSAPI(如百度或Google語音合成)將回復(fù)轉(zhuǎn)為語音文件;5.PHP將語音文件流式返回前端播放,完成交互。整個流程由PHP主導(dǎo)數(shù)據(jù)流轉(zhuǎn)與錯誤處理,確保各環(huán)節(jié)無縫銜接。

要實現(xiàn)PHP結(jié)合AI進行文本糾錯與語法優(yōu)化,需按以下步驟操作:1.選擇適合的AI模型或API,如百度、騰訊API或開源NLP庫;2.通過PHP的curl或Guzzle調(diào)用API並處理返回結(jié)果;3.在應(yīng)用中展示糾錯信息並允許用戶選擇是否採納;4.使用php-l和PHP_CodeSniffer進行語法檢測與代碼優(yōu)化;5.持續(xù)收集反饋並更新模型或規(guī)則以提升效果。選擇AIAPI時應(yīng)重點評估準(zhǔn)確率、響應(yīng)速度、價格及對PHP的支持。代碼優(yōu)化應(yīng)遵循PSR規(guī)範(fàn)、合理使用緩存、避免循環(huán)查詢、定期審查代碼,並藉助X

PHP通過數(shù)據(jù)庫事務(wù)與FORUPDATE行鎖確保庫存扣減原子性,防止高並發(fā)超賣;2.多平臺庫存一致性需依賴中心化管理與事件驅(qū)動同步,結(jié)合API/Webhook通知及消息隊列保障數(shù)據(jù)可靠傳遞;3.報警機制應(yīng)分場景設(shè)置低庫存、零/負(fù)庫存、滯銷、補貨週期和異常波動策略,並按緊急程度選擇釘釘、短信或郵件通知責(zé)任人,且報警信息需完整明確,以實現(xiàn)業(yè)務(wù)適配與快速響應(yīng)。

PHP不直接進行AI圖像處理,而是通過API集成,因為它擅長Web開發(fā)而非計算密集型任務(wù),API集成能實現(xiàn)專業(yè)分工、降低成本、提升效率;2.整合關(guān)鍵技術(shù)包括使用Guzzle或cURL發(fā)送HTTP請求、JSON數(shù)據(jù)編解碼、API密鑰安全認(rèn)證、異步隊列處理耗時任務(wù)、健壯錯誤處理與重試機制、圖像存儲與展示;3.常見挑戰(zhàn)有API成本失控、生成結(jié)果不可控、用戶體驗差、安全風(fēng)險和數(shù)據(jù)管理難,應(yīng)對策略分別為設(shè)置用戶配額與緩存、提供prompt指導(dǎo)與多圖選擇、異步通知與進度提示、密鑰環(huán)境變量存儲與內(nèi)容審核、雲(yún)存

選擇合適AI語音識別服務(wù)並集成PHPSDK;2.用PHP調(diào)用ffmpeg將錄音轉(zhuǎn)為API要求格式(如wav);3.上傳文件至雲(yún)存儲並調(diào)用API異步識別;4.解析JSON結(jié)果並用NLP技術(shù)整理文本;5.生成Word或Markdown文檔完成會議記錄自動化,全過程需確保數(shù)據(jù)加密、訪問控制與合規(guī)性以保障隱私安全。

PHP在智能客服中扮演連接器和大腦中樞角色,負(fù)責(zé)串聯(lián)前端輸入、數(shù)據(jù)庫存儲與外部AI服務(wù);2.實現(xiàn)時需構(gòu)建多層架構(gòu):前端接收用戶消息,PHP後端預(yù)處理並路由請求,先匹配本地知識庫,未命中則調(diào)用外部AI服務(wù)如OpenAI或Dialogflow獲取智能回復(fù);3.會話管理由PHP寫入MySQL等數(shù)據(jù)庫,保障上下文連續(xù)性;4.集成AI服務(wù)需用Guzzle發(fā)送HTTP請求,安全存儲APIKey,做好錯誤處理與響應(yīng)解析;5.數(shù)據(jù)庫設(shè)計需包含會話、消息、知識庫、用戶表,合理建索引、保障安全與性能,支撐機器人記憶

選擇AI寫作API需考察穩(wěn)定性、價格、功能匹配度及是否有免費試用;2.PHP用Guzzle發(fā)送POST請求並用json_decode處理返回的JSON數(shù)據(jù),注意捕獲異常和錯誤碼;3.將AI內(nèi)容融入項目需建立審核機制並支持個性化定制;4.優(yōu)化性能可採用緩存、異步隊列和限流技術(shù),避免高並發(fā)下瓶頸。
