字节发布文生图开放模型SDXL-Lightning

柏纳
2024-02-23 20:46

2月23日消息,据界面新闻报道,字节发布文生图开放模型SDXL-Lightning。AI开源社区Hugging Face的最新榜单上,SDXL-Lightning跻身模型趋势榜,同时也成为Hugging Face Spaces上的热门模型。

与SDXL-Lightning一同上榜的,是谷歌新近推出的“最强开放大模型”Gemma系列,以及Stability AI的新一代文生图模型Stable Cascade。

format-jpg

截自界面新闻

在图像生成领域,先进模型的生成技术依赖于扩散过程,就是把噪声逐步转化为图像样本的迭代。这个过程通常需要20到40次调用神经网络,不仅会耗费巨大的计算资源,生成速度也比较慢。生成一张高质量图像,大约需要5秒。

据知情人士透露,字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。

字节跳动智能创作团队对回应称,开源开放的浪潮已成为推动人工智能迅猛发展的关键力量,SDXL-Lightning模型基于已有繁荣生态的文生图开放模型SDXL,设计之初就考虑到与开放模型社区的兼容。SDXL-Lightning可以作为增速插件无缝整合到卡通、动漫等多样风格的SDXL模型中,并支持当前流行的控制插件ControlNet、生成软件 ComfyUI,方便开发者、研究人员和创意从业者结合使用这些工具,助力整个行业的创新和协作。

format-jpg

图源:66秒未来科技公众号

值得一提的是,近日有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型——Boximator。与Gen-2、Pink1.0等模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。

对此,字节跳动相关人士回应称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

format-jpg

截自微博

此外,据Tech星球2月18日报道,目前抖音集团多部门加大AI技术研发,并调集多位高管跟进,现在已有多款AI产品开启内测。

其中,Flow部门是抖音在AI技术研究和产品研发的排头兵,进展最快。该部门已经推出了豆包(Cici)、扣子(Coze)等AI产品外,另有AI角色互动APP“话炉”、AI产品“PicPic”正在内测和研发阶段。

除了Flow,抖音集团的其他重要业务部门也正在加码AI产品服务,包括抖音电商、抖音生活服务、火山引擎、巨量引擎、稀土掘金、今日头条、大力教育、剪映等。

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
5月15日消息,在今日的2024春季火山引擎FORCE原动力大会,字节跳动正式发布自研大模型“豆包大模型”,该大模型包含豆包通用模型、语音合成模型模型等一共9个模型,已在字节跳动内部50多个业务和场景进行过应用。
5月15日消息,火山引擎主办的FORCE原动力大会在京举行。会上发布的数据显示,截至目前,字节跳动旗下大模型豆包App目前总下载量已经突破1亿,双端月活跃用户突破2600万,智能体创建总数800万。会上,字节豆包大模型正式开启对外服务,据悉,豆包大模型包含豆包通用模型Pro、豆包通用模型liti、豆包·角色扮演模型、豆包·语音合成模型、豆包·声音复刻模型、豆包·语音识别模型、豆包·模型、豆包·Function Call模型
火山引擎总裁谭待表示,“国内大模型领域的数十家企业,超过七成已经在火山引擎云”。
6月27日消息,字节跳动发布基于豆包大模型打造的智能开发工具“豆包MarsCode”,面向国内开发者免费开放。豆包MarsCode产品的两种形态分别为编程助手和Cloud IDE,具备项目问答、代码补全、单测生成、Bug Fix等功能。
9月19日消息,火山引擎在其举办的“V-Tech数据驱动科技峰会”宣布,火山引擎数智平台VeDI推出“AI助手”,通过接入人工智能大模型,帮助企业提升数据处理和查询分析的效率。目前,VeDI相关数据产品已启动邀测。
2月1日消息,字节跳动近日正式推出AI聊天机器人构建平台Coze国内版,无论用户是否有编程基础,都可以在Coze平台快速搭建基于AI模型的各类问答Bot,并且平台支持用户将其一键发布到飞书、微信公众号、豆包等渠道。据网友反馈,Coze今日上线时或因流量过大导致崩溃,平台创建界面长时间显示确认中,现在已经恢复正常。另据了解,Coze由字节跳动新成立AI部门Flow开发,此前飞书产品副总裁齐俊元传出转岗至Flow。
字节跳动申请豆包商标
5月22日消息,天眼查知识产权信息显示,近日,北京字跳网络技术有限公司申请注册多枚“DOUBAO”商标,国际分类为网站服务、医疗器械、社会服务等,当前商标状态均为等待实质审查。据报道,近日,字节跳动豆包大模型在火山引擎原动力大会发布。豆包大模型目前日均处理1200亿Tokens文本,生成3000万张图片,主力模型比行业价格低99.3%。