豆包圖像創(chuàng)作模型Seedream 4.0正式發(fā)布,并上線豆包App
9月9日,字節(jié)跳動 Seed 團(tuán)隊宣布推出豆包圖像創(chuàng)作模型 Seedream 4.0。該模型支持文生圖、圖像編輯及多圖參考等功能,多模態(tài)生圖效果、速度和可用性在專業(yè)評測中達(dá)到業(yè)界領(lǐng)先水平。
目前,Seedream 4.0 已在豆包App、即夢AI、扣子等產(chǎn)品正式上線,用戶可以免費(fèi)體驗。該模型也已通過火山引擎開放給企業(yè)客戶。
Seed 團(tuán)隊表示,“Seedream 4.0 不僅僅是一個圖像生成模型,更是一個具備知識和思考能力的多模態(tài)創(chuàng)意引擎。”
測試案例顯示,Seedream 4.0 不僅能理解物理規(guī)律與時間約束、三維空間等復(fù)雜語境,還能在解謎、填字、續(xù)寫漫畫等任務(wù)中保持風(fēng)格一致與細(xì)節(jié)精致,邏輯推理和創(chuàng)意生成能力表現(xiàn)出色。
Seedream 4.0 測試效果(Prompt:六個小時后這個圖片的場景是什么樣子)
據(jù)介紹,Seedream 4.0 可靈活支持文本、圖像的組合輸入,抽取不同圖片元素進(jìn)行創(chuàng)作,還可一次生成角色連貫、風(fēng)格統(tǒng)一的組圖,實(shí)現(xiàn)表情包、連環(huán)畫等各類創(chuàng)意玩法。
同時,該模型支持高度自由的藝術(shù)風(fēng)格遷移,最高可生成 4K 分辨率的商用級圖像,并具備出色的文字渲染能力,還可處理基礎(chǔ)的公式、表格、統(tǒng)計圖等復(fù)雜排版,廣泛適用于教育、電商、廣告設(shè)計、影視后期等應(yīng)用場景。
Seedream 4.0測試效果(Prompt:參考圖2的風(fēng)格,將圖1做風(fēng)格轉(zhuǎn)換)
基于高效的模型架構(gòu)和多層推理加速,Seedream 4.0 實(shí)現(xiàn)了高質(zhì)量和高效生成的平衡。Seed 官網(wǎng)顯示,Seedream 4.0 在各維度專業(yè)評測的綜合表現(xiàn)排名業(yè)界前列,視覺美感、速度等關(guān)鍵指標(biāo)成績突出,并展現(xiàn)出較強(qiáng)的可靠性。
圖:MagicBench “文生圖”及“單圖編輯”人工評測基準(zhǔn)(數(shù)據(jù)來源:Seed官網(wǎng))
Seed 團(tuán)隊表示,圖像創(chuàng)作正在從文生圖進(jìn)入多模態(tài)交互的新階段,Seedream 4.0 已具備通用多模態(tài)創(chuàng)意引擎的雛形。團(tuán)隊將繼續(xù)探索更實(shí)時的交互式生成體驗,進(jìn)一步深度融合多模態(tài)推理與世界知識,更好地幫助用戶激發(fā)靈感、實(shí)現(xiàn)創(chuàng)意。