谷歌發(fā)布圖像生成模型Gemini 2.5 Flash Image:多方面優(yōu)于GPT
科技媒體The Decoder8月26日發(fā)布博文,報道稱谷歌DeepMind正式推出其最先進的圖像生成與編輯模型Gemini 2.5 Flash Image,在Gemini應(yīng)用中可根據(jù)文字指令,在保持人物與動物的外觀一致的情況下,提高修改圖片的精度。據(jù)介紹,與此前的原生圖像生成工具相比,它在根據(jù)文字進行圖像修改時的準(zhǔn)確率更高,谷歌表示,Gemini 2.5 Flash Image在多項任務(wù)中優(yōu)于ChatGPT所用的GPT-4o,特別是在編輯圖像時,它可以根據(jù)文字提示進行編輯。
文章評價

發(fā)布
發(fā)布