字节发布文生图开放模型SDXL-Lightning

柏纳

2024-02-23 20:46

2月23日消息，据界面新闻报道，字节发布文生图开放模型SDXL-Lightning。AI开源社区Hugging Face的最新榜单上，SDXL-Lightning跻身模型趋势榜，同时也成为Hugging Face Spaces上的热门模型。

与SDXL-Lightning一同上榜的，是谷歌新近推出的“最强开放大模型”Gemma系列，以及Stability AI的新一代文生图模型Stable Cascade。

format-jpg

截自界面新闻

在图像生成领域，先进模型的生成技术依赖于扩散过程，就是把噪声逐步转化为图像样本的迭代。这个过程通常需要20到40次调用神经网络，不仅会耗费巨大的计算资源，生成速度也比较慢。生成一张高质量图像，大约需要5秒。

据知情人士透露，字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术，实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像，将生成速度加快十倍，是1024分辨率下速度最快的文生图模型，计算成本则降低为十分之一。

字节跳动智能创作团队对回应称，开源开放的浪潮已成为推动人工智能迅猛发展的关键力量，SDXL-Lightning模型基于已有繁荣生态的文生图开放模型SDXL，设计之初就考虑到与开放模型社区的兼容。SDXL-Lightning可以作为增速插件无缝整合到卡通、动漫等多样风格的SDXL模型中，并支持当前流行的控制插件ControlNet、生成软件 ComfyUI，方便开发者、研究人员和创意从业者结合使用这些工具，助力整个行业的创新和协作。

format-jpg

图源：66秒未来科技公众号

值得一提的是，近日有消息称，在Sora引爆文生视频赛道之前，国内的字节跳动也推出了一款颠覆性视频模型——Boximator。与Gen-2、Pink1.0等模型不同的是，Boximator可以通过文本精准控制生成视频中人物或物体的动作。

对此，字节跳动相关人士回应称，Boximator是视频生成领域控制对象运动的技术方法研究项目，目前还无法作为完善的产品落地，距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

format-jpg

截自微博

此外，据Tech星球2月18日报道，目前抖音集团多部门加大AI技术研发，并调集多位高管跟进，现在已有多款AI产品开启内测。

其中，Flow部门是抖音在AI技术研究和产品研发的排头兵，进展最快。该部门已经推出了豆包（Cici）、扣子（Coze）等AI产品外，另有AI角色互动APP“话炉”、AI产品“PicPic”正在内测和研发阶段。

除了Flow，抖音集团的其他重要业务部门也正在加码AI产品服务，包括抖音电商、抖音生活服务、火山引擎、巨量引擎、稀土掘金、今日头条、大力教育、剪映等。

声明

1、该内容为作者独立观点，不代表电商派观点或立场，文章为作者本人上传，版权归原作者所有，未经允许不得转载。
2、电商号平台仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。
3、如对本稿件有异议或投诉，请联系：info@dsb.cn