字节发布文生图开放模型SDXL-Lightning

柏纳 2024-02-23 20:46:30
行业观察 2024-02-23 20:46:30 阅读 4929 评论 0

2月23日消息,据界面新闻报道,字节发布文生图开放模型SDXL-Lightning。AI开源社区Hugging Face的最新榜单上,SDXL-Lightning跻身模型趋势榜,同时也成为Hugging Face Spaces上的热门模型。

与SDXL-Lightning一同上榜的,是谷歌新近推出的“最强开放大模型”Gemma系列,以及Stability AI的新一代文生图模型Stable Cascade。

format-jpg

截自界面新闻

在图像生成领域,先进模型的生成技术依赖于扩散过程,就是把噪声逐步转化为图像样本的迭代。这个过程通常需要20到40次调用神经网络,不仅会耗费巨大的计算资源,生成速度也比较慢。生成一张高质量图像,大约需要5秒。

据知情人士透露,字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。

字节跳动智能创作团队对回应称,开源开放的浪潮已成为推动人工智能迅猛发展的关键力量,SDXL-Lightning模型基于已有繁荣生态的文生图开放模型SDXL,设计之初就考虑到与开放模型社区的兼容。SDXL-Lightning可以作为增速插件无缝整合到卡通、动漫等多样风格的SDXL模型中,并支持当前流行的控制插件ControlNet、生成软件 ComfyUI,方便开发者、研究人员和创意从业者结合使用这些工具,助力整个行业的创新和协作。

format-jpg

图源:66秒未来科技公众号

值得一提的是,近日有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型——Boximator。与Gen-2、Pink1.0等模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。

对此,字节跳动相关人士回应称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

format-jpg

截自微博

此外,据Tech星球2月18日报道,目前抖音集团多部门加大AI技术研发,并调集多位高管跟进,现在已有多款AI产品开启内测。

其中,Flow部门是抖音在AI技术研究和产品研发的排头兵,进展最快。该部门已经推出了豆包(Cici)、扣子(Coze)等AI产品外,另有AI角色互动APP“话炉”、AI产品“PicPic”正在内测和研发阶段。

除了Flow,抖音集团的其他重要业务部门也正在加码AI产品服务,包括抖音电商、抖音生活服务、火山引擎、巨量引擎、稀土掘金、今日头条、大力教育、剪映等。

声明:
  1. 该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
  2. 电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
  3. 如对本稿件有异议或投诉,请联系:info@dsb.cn
请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!
讨论数量: 0
暂无评论