要聞

阿里、字節(jié)同日上新圖像生成模型，對標Nano Banana Pro

每日經濟新聞 2026-02-12 08:50:33

每經記者｜葉曉丹每經編輯｜金冥羽董興生

記者|葉曉丹

編輯|金冥羽?董興生?杜波?校對|許紹航

中美AI競速，角逐正酣。

2月10日，阿里和字節(jié)同一天發(fā)布了新圖像生成模型，兩家大廠均對標谷歌Nano Banana Pro。

其中，阿里Qwen-Image-2.0聚焦語義理解與實用編輯，統(tǒng)一生成與編輯架構，強化中文漢字渲染能力，可更好地理解超長、復雜的實用化指令；字節(jié)Seedream5.0 Preview則主打檢索生圖與精細調控，顯著提升提示詞理解準確率，支持更精細的紋理生成與可控調整，深度適配內容創(chuàng)作全流程。

2月11日，有算力運營商向《每日經濟新聞》記者（以下簡稱每經記者）透露，目前AI在電商場景中有不少應用，一類是數(shù)字人對token（最小文本單元）的消耗量比較明顯，另一類是電商AI生圖的消耗。千問大模型高級解決方案架構師熊撼天在接受每經記者采訪時表示，此次更新的Qwen-Image-2.0模型，也基于電商場景在商品生產細節(jié)和文字可控度、二次編輯等方面進行優(yōu)化。

值得注意的是，當前AI生圖已經不局限于視覺創(chuàng)作，更進一步走向企業(yè)級、規(guī)?；瘧玫馁惖乐?。2025年圖像生成技術逐步滲透到電商場景、漫劇市場中，隨著AI生圖技術進步，2026年能迎來規(guī)?；瘧檬袌鰡?？

對標Nano Banana Pro

國產AI生圖模型再進化

2月10日，阿里和字節(jié)都發(fā)布了圖像生成模型。阿里千問發(fā)布新一代圖像生成及編輯模型Qwen-Image-2.0，字節(jié)跳動旗下剪映、字節(jié)AI創(chuàng)作平臺小云雀等平臺上線圖像生成模型Seedream5.0 Preview，兩款模型都對標谷歌Nano Banana Pro。

據(jù)阿里千問方面介紹，Qwen-Image-2.0支持1K token的超長文字輸入和2K高分辨率，可準確渲染復雜指令，輕松生成專業(yè)的PPT及信息圖。同時，Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit兩大模型基礎上全新升級，首次將圖像生成和編輯統(tǒng)一到一個模型中，以更輕量的模型架構，實現(xiàn)了生圖和改圖性能的大幅提升。

而字節(jié)方面則表示，Seedream 5.0 Preview的圖像支持2K和4K分辨率輸出，目前用戶可以在即夢平臺免費體驗2K輸出效果。

有上市公司資深研發(fā)高管向每經記者表示，此前也經常用AI生圖技術制作PPT和企業(yè)產品圖，但文字細節(jié)和圖片的一致性等問題，仍存在一些瑕疵。

千問Qwen視覺生成負責人吳晨飛表示，AI生圖文字細節(jié)崩潰主要是兩方面原因。其一，當前圖像生成模型普遍采用VAE（變分自動編碼器）技術，而VAE的重構過程對圖像中文字的處理影響顯著，特別是小尺寸文字。這是由于VAE本質上是一種壓縮機制，當圖像中文字內容較多時，生成難度將顯著提升，且受限于VAE的處理能力上限。其二，受限于圖像生成模型的建模能力。VAE決定了模型的能力上限，而生成模型的建模能力則直接影響圖像生成的真實度與細節(jié)還原質量。

AI生圖離企業(yè)級應用還有多遠？

目前，隨著AI生圖模型迭代，其在電商和漫劇市場的應用備受關注，資本市場上AI漫劇概念持續(xù)升溫。

2月11日，艾媒咨詢CEO兼首席分析師張毅在接受每經記者采訪時表示，目前AI漫劇制作，主流途徑是AI生成圖片，由圖片視頻化，再搭配AI配音、字幕，來完成出片，這是目前行業(yè)比較標準的形態(tài)。

東吳證券就在研報中指出，AI可以使漫劇制作成本降低90%。中文在線AI動漫部總經理周立強此前曾表示，AI把傳統(tǒng)漫劇的11個繁復制作流程，精簡為劇本創(chuàng)作、圖片生成、圖轉視頻、后期加工4個步驟，大大提高生產速度。

而問題的癥結之一是AI漫劇極為依賴抽卡生成模式。這一模式最大的問題在于，最終的生成效果幾乎完全取決于AI自身的理解、推理能力，抽卡師唯一能做的只有打磨提示詞。

iMedia Research（艾媒咨詢）數(shù)據(jù)顯示，多數(shù)用戶肯定AI技術在降低制作成本（51.2%）與加快IP轉化（47.7%）方面的價值。同時，近半數(shù)用戶亦指出其在畫面風格統(tǒng)一性（47.1%）與配音情感表現(xiàn)（46.7%）上存在明顯不足。

張毅認為，當前AI漫劇市場迎來爆發(fā)式增長。AI技術對漫劇行業(yè)的影響兼具機遇與挑戰(zhàn)，既通過降低制作成本、加快IP轉化等推動行業(yè)生產效率與內容形態(tài)升級，也因畫風統(tǒng)一度、配音質感及角色塑造等質量問題，倒逼行業(yè)在追求規(guī)?；耐瑫r強化內容創(chuàng)意與品質把控。

AI漫劇之外，AI生圖正在悄然改變的另一大市場是電商場景。

電商購物場景中存在大量圖片使用需求。2月11日，有算力運營商向記者透露，AI生圖是當前除數(shù)字人外，電商客戶消耗token比較大的一個需求。

熊撼天向每經記者表示，電商場景是千問Qwen-Image模型落地的主流場景之一，此次更新的Qwen-Image-2.0也基于電商場景應用，在此前模型基礎上進行了升級和優(yōu)化，有望推動企業(yè)級應用落地。

以電商場景為例，熊撼天表示，商品詳情頁描述圖、模特穿搭效果，可以更好地結合新的圖像生成模型完成。相較于上一代圖像生成模型需要通過二次編輯等完成可控的商品出圖，新模型迭代將圖片編輯和生成任務融合在一個模型中實現(xiàn)，從而實現(xiàn)電商賣家的效率提升。

封面圖片來源：視覺中國