每日經(jīng)濟(jì)新聞 2025-02-21 12:57:41
每經(jīng)杭州2月21日電(記者葉曉丹)在2月21日開(kāi)幕的全球開(kāi)發(fā)者大會(huì)(GDC)上,阿里云魔搭社區(qū)首發(fā)階躍星辰最新開(kāi)源的兩款多模態(tài)模型,包括全球參數(shù)量最大的開(kāi)源視頻生成模型Step-Video-T2V,以及業(yè)界首款產(chǎn)品級(jí)開(kāi)源語(yǔ)音交互模型Step-Audio。截至目前,魔搭社區(qū)已上架超過(guò)4萬(wàn)個(gè)開(kāi)源模型,涵蓋LLM、對(duì)話、語(yǔ)音、文生圖、圖生視頻等多個(gè)領(lǐng)域,是中國(guó)最大的AI模型社區(qū)。
此次在魔搭社區(qū)開(kāi)源的兩款模型,是近期全球多模態(tài)領(lǐng)域最熱門的開(kāi)源模型。Step-Video-T2V是基于300億參數(shù)的文本轉(zhuǎn)視頻預(yù)訓(xùn)練模型,能夠生成高達(dá)204幀的視頻,在指令遵循、運(yùn)動(dòng)平滑性、物理合理性、美感度等方面表現(xiàn)均顯著超過(guò)市面上既有的開(kāi)源視頻模型。
另一款上架模型Step-Audio,是業(yè)界首個(gè)產(chǎn)品級(jí)開(kāi)源語(yǔ)音模型,參數(shù)規(guī)模多達(dá)1300多億。根據(jù)Llama Question等5大主流公開(kāi)測(cè)試,Step-Audio模型性能均位列第一,并在HSK-6(漢語(yǔ)水平考試六級(jí))的測(cè)評(píng)中表現(xiàn)尤佳。
封面圖片來(lái)源:視覺(jué)中國(guó)-VCG211379091969
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP