亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財(cái)經(jīng)媒體
科技·商業(yè)·財(cái)經(jīng)

谷歌Gemini 2.5 Flash Image登頂AI圖像編輯,超越GPT-4o等模型

   時(shí)間:2025-08-28 01:28 作者:鐘景軒

谷歌近期震撼發(fā)布了其最新的圖像生成與編輯模型——Gemini 2.5 Flash Image。這款模型代表了谷歌在圖像技術(shù)領(lǐng)域的最前沿探索,一經(jīng)推出便引起了廣泛關(guān)注。

Gemini 2.5 Flash Image的核心優(yōu)勢(shì)在于其強(qiáng)大的圖像編輯功能。據(jù)谷歌介紹,該模型能夠?qū)⒍鄠€(gè)圖像無縫融合成一個(gè),同時(shí)保持角色形象的高度一致性。更令人驚嘆的是,用戶可以通過自然語(yǔ)言指令對(duì)圖像進(jìn)行精確修改,且這一過程能夠充分利用Gemini模型所積累的世界知識(shí)。

為了直觀展示這一功能,谷歌DeepMind的首席執(zhí)行官、諾貝爾獎(jiǎng)得主Demis Hassabis親自上陣,用自己的照片進(jìn)行了演示。他將照片背景更改為古典風(fēng)格,而人物面容卻絲毫未變,完美詮釋了Gemini 2.5 Flash Image的角色一致性。

Gemini 2.5 Flash Image的應(yīng)用場(chǎng)景廣泛且富有創(chuàng)意。例如,用戶可以輕松制作出類似“球星卡”的設(shè)計(jì),讓普通人也能享受到頂級(jí)運(yùn)動(dòng)員般的待遇。該模型還能與谷歌的視頻生成模型Veo 3完美搭配,共同打造出豐富多樣的視頻效果。海外AI創(chuàng)意平臺(tái)Kera AI已經(jīng)利用類似技術(shù),成功制作了一部廣告大片。

在發(fā)布前,Gemini 2.5 Flash Image以“nano-banana”的代號(hào)在大模型競(jìng)技場(chǎng)中亮相,并迅速獲得了超過200萬(wàn)用戶的認(rèn)可。正式揭曉后,該模型在文生圖和圖像編輯兩大場(chǎng)景中均取得了全球第一的佳績(jī),特別是在圖像編輯榜單上,以1362的高分遙遙領(lǐng)先第二名。

在谷歌公布的基準(zhǔn)測(cè)試中,Gemini 2.5 Flash Image在用戶綜合喜好度、人物、創(chuàng)造力、信息圖、物體和環(huán)境的生成等多個(gè)方面均優(yōu)于GPT-4o圖像生成、Flux.1 Kontext(max)、Qwen Image Edit等模型。不過,在風(fēng)格化能力方面,該模型與GPT-4o圖像生成仍存在差距。

作為一款主要面向開發(fā)者的模型,Gemini 2.5 Flash Image目前可在Gemini API、Google AI Studio以及面向企業(yè)的Vertex AI平臺(tái)上獲取。其定價(jià)策略為每100萬(wàn)個(gè)輸出token收費(fèi)30美元,每張圖像包含約1290個(gè)輸出token,因此每張圖像的價(jià)格約為0.039美元(折合人民幣約0.28元)。

為了簡(jiǎn)化AI應(yīng)用的開發(fā)流程,谷歌對(duì)AI Studio的“構(gòu)建模式”進(jìn)行了重大更新。開發(fā)者可以利用這一模式快速測(cè)試Gemini 2.5 Flash Image等新模型的功能,并在準(zhǔn)備好發(fā)布應(yīng)用時(shí)直接從AI Studio進(jìn)行部署或?qū)⒋a保存到GitHub。

谷歌通過幾個(gè)生動(dòng)的案例展示了Gemini 2.5 Flash Image的實(shí)際應(yīng)用。例如,在多輪對(duì)話和編輯中保持角色和對(duì)象外觀的一致性,是圖像生成與編輯的一大挑戰(zhàn)。而谷歌的新模型則允許用戶將同一角色置于不同環(huán)境中,同時(shí)保留其主題和特征。用戶只需上傳一張自拍,就能生成從50年代到00年代的六張寫真,每張都融入了當(dāng)時(shí)的年代風(fēng)格。

Gemini 2.5 Flash Image還支持使用自然語(yǔ)言進(jìn)行圖像轉(zhuǎn)換和編輯。用戶可以模糊圖像背景、去除污漬、刪除人物、改變姿勢(shì)或添加顏色等。谷歌在AI Studio中構(gòu)建了一個(gè)照片編輯模板應(yīng)用,展示了這些功能的實(shí)際應(yīng)用效果。

Gemini 2.5 Flash Image還具備豐富的世界知識(shí),能夠理解手繪插圖并解答相關(guān)問題。這一特性使得該模型能夠預(yù)測(cè)圖像未來的變化,并具備一定的圖像推理能力。

自Gemini 2.5 Flash Image發(fā)布以來,海外網(wǎng)友紛紛嘗試并分享了他們的創(chuàng)作成果。有用戶利用該模型制作了月餅廣告宣傳照,并稱贊其效果遠(yuǎn)超其他模型。還有用戶結(jié)合Veo 3制作了令人驚艷的視頻作品。

然而,也有用戶反映該模型的審查機(jī)制較為嚴(yán)格,無法生成某些特定場(chǎng)景或物品的畫面。盡管如此,Gemini 2.5 Flash Image仍以其強(qiáng)大的圖像編輯功能和廣泛的應(yīng)用場(chǎng)景贏得了眾多用戶的青睞。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容