滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 行業(yè)動(dòng)態(tài) > 正文內(nèi)容

谷歌Gemini 2.5 Flash Image登頂AI圖像編輯，超越GPT-4o等模型

時(shí)間：2025-08-28 01:28 作者：鐘景軒

谷歌近期震撼發(fā)布了其最新的圖像生成與編輯模型——Gemini 2.5 Flash Image。這款模型代表了谷歌在圖像技術(shù)領(lǐng)域的最前沿探索，一經(jīng)推出便引起了廣泛關(guān)注。

Gemini 2.5 Flash Image的核心優(yōu)勢(shì)在于其強(qiáng)大的圖像編輯功能。據(jù)谷歌介紹，該模型能夠?qū)⒍鄠€(gè)圖像無縫融合成一個(gè)，同時(shí)保持角色形象的高度一致性。更令人驚嘆的是，用戶可以通過自然語(yǔ)言指令對(duì)圖像進(jìn)行精確修改，且這一過程能夠充分利用Gemini模型所積累的世界知識(shí)。

為了直觀展示這一功能，谷歌DeepMind的首席執(zhí)行官、諾貝爾獎(jiǎng)得主Demis Hassabis親自上陣，用自己的照片進(jìn)行了演示。他將照片背景更改為古典風(fēng)格，而人物面容卻絲毫未變，完美詮釋了Gemini 2.5 Flash Image的角色一致性。

Gemini 2.5 Flash Image的應(yīng)用場(chǎng)景廣泛且富有創(chuàng)意。例如，用戶可以輕松制作出類似“球星卡”的設(shè)計(jì)，讓普通人也能享受到頂級(jí)運(yùn)動(dòng)員般的待遇。該模型還能與谷歌的視頻生成模型Veo 3完美搭配，共同打造出豐富多樣的視頻效果。海外AI創(chuàng)意平臺(tái)Kera AI已經(jīng)利用類似技術(shù)，成功制作了一部廣告大片。

在發(fā)布前，Gemini 2.5 Flash Image以“nano-banana”的代號(hào)在大模型競(jìng)技場(chǎng)中亮相，并迅速獲得了超過200萬(wàn)用戶的認(rèn)可。正式揭曉后，該模型在文生圖和圖像編輯兩大場(chǎng)景中均取得了全球第一的佳績(jī)，特別是在圖像編輯榜單上，以1362的高分遙遙領(lǐng)先第二名。

在谷歌公布的基準(zhǔn)測(cè)試中，Gemini 2.5 Flash Image在用戶綜合喜好度、人物、創(chuàng)造力、信息圖、物體和環(huán)境的生成等多個(gè)方面均優(yōu)于GPT-4o圖像生成、Flux.1 Kontext（max）、Qwen Image Edit等模型。不過，在風(fēng)格化能力方面，該模型與GPT-4o圖像生成仍存在差距。

作為一款主要面向開發(fā)者的模型，Gemini 2.5 Flash Image目前可在Gemini API、Google AI Studio以及面向企業(yè)的Vertex AI平臺(tái)上獲取。其定價(jià)策略為每100萬(wàn)個(gè)輸出token收費(fèi)30美元，每張圖像包含約1290個(gè)輸出token，因此每張圖像的價(jià)格約為0.039美元（折合人民幣約0.28元）。

為了簡(jiǎn)化AI應(yīng)用的開發(fā)流程，谷歌對(duì)AI Studio的“構(gòu)建模式”進(jìn)行了重大更新。開發(fā)者可以利用這一模式快速測(cè)試Gemini 2.5 Flash Image等新模型的功能，并在準(zhǔn)備好發(fā)布應(yīng)用時(shí)直接從AI Studio進(jìn)行部署或?qū)⒋a保存到GitHub。

谷歌通過幾個(gè)生動(dòng)的案例展示了Gemini 2.5 Flash Image的實(shí)際應(yīng)用。例如，在多輪對(duì)話和編輯中保持角色和對(duì)象外觀的一致性，是圖像生成與編輯的一大挑戰(zhàn)。而谷歌的新模型則允許用戶將同一角色置于不同環(huán)境中，同時(shí)保留其主題和特征。用戶只需上傳一張自拍，就能生成從50年代到00年代的六張寫真，每張都融入了當(dāng)時(shí)的年代風(fēng)格。

Gemini 2.5 Flash Image還支持使用自然語(yǔ)言進(jìn)行圖像轉(zhuǎn)換和編輯。用戶可以模糊圖像背景、去除污漬、刪除人物、改變姿勢(shì)或添加顏色等。谷歌在AI Studio中構(gòu)建了一個(gè)照片編輯模板應(yīng)用，展示了這些功能的實(shí)際應(yīng)用效果。

Gemini 2.5 Flash Image還具備豐富的世界知識(shí)，能夠理解手繪插圖并解答相關(guān)問題。這一特性使得該模型能夠預(yù)測(cè)圖像未來的變化，并具備一定的圖像推理能力。

自Gemini 2.5 Flash Image發(fā)布以來，海外網(wǎng)友紛紛嘗試并分享了他們的創(chuàng)作成果。有用戶利用該模型制作了月餅廣告宣傳照，并稱贊其效果遠(yuǎn)超其他模型。還有用戶結(jié)合Veo 3制作了令人驚艷的視頻作品。

然而，也有用戶反映該模型的審查機(jī)制較為嚴(yán)格，無法生成某些特定場(chǎng)景或物品的畫面。盡管如此，Gemini 2.5 Flash Image仍以其強(qiáng)大的圖像編輯功能和廣泛的應(yīng)用場(chǎng)景贏得了眾多用戶的青睞。

薩塞克斯大學(xué)教授溫弗里德·亨辛格指出，此次突破雖證明了量子計(jì)算機(jī)的潛力，但任務(wù)場(chǎng)景仍較狹隘，且當(dāng)前硬件遠(yuǎn)未達(dá)到實(shí)用要求——實(shí)現(xiàn)革命性應(yīng)用需數(shù)百萬(wàn)甚至數(shù)十億個(gè)量子比特，而谷歌的超導(dǎo)量子硬件不僅數(shù)量有限，還需極…

10-23

優(yōu)必選等新設(shè)科技公司，含多項(xiàng)AI業(yè)務(wù)

10-23

越疆等新設(shè)文化科技公司，含AI及機(jī)器人業(yè)務(wù)

10-23

寧德時(shí)代投資成立新公司，含新能源汽車換電相關(guān)業(yè)務(wù)

10-23

中國(guó)航油集團(tuán)資產(chǎn)發(fā)展公司成立，注冊(cè)資本10億

10-23

瀘州老窖等成立川山通悅投資合伙企業(yè)

10-23

陜西煤業(yè)投資成立新公司，含資源再生利用相關(guān)業(yè)務(wù)

10-23

賽維時(shí)代新設(shè)子公司，含多項(xiàng)AI業(yè)務(wù)

10-23

無人機(jī)制造銷售收入同比大增，前九月相關(guān)企業(yè)注冊(cè)漲超190%

10-23

中國(guó)鐵建等在上海新設(shè)運(yùn)維技術(shù)公司

10-23

杭可科技成立電力制造新公司

10-23

螞蟻集團(tuán)旗下海南信息技術(shù)公司增資至35億

10-23

南京金雨茂物戰(zhàn)新軟信人工智能創(chuàng)投企業(yè)登記成立

10-23

泰康人壽在北京新設(shè)置業(yè)公司

10-23

匯綠生態(tài)等成立綠色環(huán)境生態(tài)科技公司

10-23

點(diǎn)擊查看更多 +

全站最新

優(yōu)必選等新設(shè)科技公司，含多項(xiàng)AI業(yè)務(wù)

越疆等新設(shè)文化科技公司，含AI及機(jī)器人業(yè)務(wù)

寧德時(shí)代投資成立新公司，含新能源汽車換電相關(guān)業(yè)務(wù)

中國(guó)航油集團(tuán)資產(chǎn)發(fā)展公司成立，注冊(cè)資本10億

瀘州老窖等成立川山通悅投資合伙企業(yè)

陜西煤業(yè)投資成立新公司，含資源再生利用相關(guān)業(yè)務(wù)

熱門內(nèi)容

本欄最新

優(yōu)必選等新設(shè)科技公司，含多項(xiàng)AI業(yè)務(wù)

越疆等新設(shè)文化科技公司，含AI及機(jī)器人業(yè)務(wù)

寧德時(shí)代投資成立新公司，含新能源汽車換電相關(guān)業(yè)務(wù)

中國(guó)航油集團(tuán)資產(chǎn)發(fā)展公司成立，注冊(cè)資本10億

瀘州老窖等成立川山通悅投資合伙企業(yè)

陜西煤業(yè)投資成立新公司，含資源再生利用相關(guān)業(yè)務(wù)

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國(guó) · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

谷歌Gemini 2.5 Flash Image登頂AI圖像編輯，超越GPT-4o等模型