【信報財經新聞】騰訊混元宣布發布混元圖像2.0模型,稱該模型的兩大特點為實時生圖和超寫實畫質。
騰訊混元表示,相比前代模型,騰訊混元圖像2.0模型參數量提升了一個數量級,可實現毫秒級響應,支持用戶可以一邊打字或者一邊說話一邊出圖,改變了傳統抽卡-等待-抽卡的方式。
此外,新模型圖像生成質量提升明顯,生成的圖像可有效避免人工智能內容生成(AIGC)圖像中的AI味,真實感強、細節豐富、可用性高。
騰訊表示,騰訊混元圖像2.0引入多模態大語言模型(MLLM)作為文本編碼器,配合自研的結構化caption系統,不僅能理解在說什麽,更能推測出希望畫面「怎麽表達」。