当前位置: 当前位置:首页 > 休闲 > 腾讯混元文生图大模子周全开源 正文

腾讯混元文生图大模子周全开源

2024-10-16 21:29:08 来源:五月披裘网 作者:焦点 点击:123次

记者5月25日患上悉,腾讯图腾讯克日宣告旗下混元文生图大模子周全降级,混元并对于外开源。文生

这是模周业内首其中文原生的DiT架构文生图开源模子,具备原生中文化晰能耐以及双语编码能耐,全开参数目15亿。腾讯图这次开源的混元模子包罗模子权重、推理代码、文生模子算法等残缺模子,模周供企业与总体开辟者收费商用,全开当初已经在分心于人造语言解决的腾讯图开源机械学习平台Hugging Face及面向软件开辟者的代码托管平台Github上宣告。

腾讯混元文生图技术负责人芦清林介绍,混元降级后的文生混元文生图大模子接管了与Sora不同的DiT架构,不光可反对于文生图,模周也可作为文生视频等多模态视觉天生的全开根基。

以前,视觉天生份散模子主要基于U-Net架构。随着模子参数目削减,DiT架构展现出更好的扩充性,有助于降职模子天生品质以及功能。

记者懂获取,混元文生图大模子是业界最先探究并将狂语言模子散漫DiT架构的文生图模子之一。2023年7月,腾讯混元文生图团队清晰了基于DiT架构的模子偏差,并启动了新一代模子研发。往年初,混元文生图大模子周全降级为DiT架构。

评测数据呈现,最新腾讯混元文生图模子成果比照前代降职超20%,远超开源的Stable Diffusion模子。

当初,干流文生图开源生态根基环抱英文建树,Stable Diffusion等干流开源模子虽未必水平反对于中文输入,但其中间数据集仍以英文为主。建树中文原生大模子以及响应的开源生态对于国内大模子工业有紧张意思。

混元文生图大模子以中文原生为根基,反对于中英文双语输入及清晰。其文生图能耐已经被宽泛用于素材创作、商品分解、游戏出图等营业场景。

“腾讯混元文生图大模子的研发思路便是适用,连结从事实中来,到事实中去。这次把最新一代模子残缺开源,是愿望与行业同享事实履历以及钻研成果,减速大模子行业发展。”芦清林呈现,当初开源的混元文生图大模子版本,也是腾讯外部正在运用的版本。基于该模子,开辟者以及企业无需重新磨炼,可间接将其用于推理,并可打造专属的AI绘画运用及服务。

此外,当初文生图开源社区主要仍因此Stable Diffusion等为主的英文开源社区。混元文生图大模子的开源,将充实以中文为主的文生图开源生态,增长中文文生图技术研发以及运用。

作者:焦点
------分隔线----------------------------
头条新闻
图片新闻
新闻排行榜