1. 用户在电话界面开启视频画面后,豆包能基于真实场景与用户进行实时问答互动。
  2. 5月23日消息,豆包APP近日上线实时视频通话功能,用户在电话界面开启视频画面后,豆包能基于真实场景与用户进行实时问答互动。例如,用户在故宫参观时,可以通过视频向“豆包”展示景点画面,了解特定宫殿的历史故事、建筑特色,实现“边走边聊”。在博物馆、美术馆等场景,也可以打开视频通话功能,随时问豆包展品的背景信息。
  3. 2月10日消息,豆包大模型团队联合北京交通大学、中国科学技术大学共同开发的视频生成实验模型“VideoWorld”正式开源。不同于Sora 、DALL-E 、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型,即可认知世界。
  4. 9月19日消息,字节跳动宣布将于2024年9月24日发布豆包大模型的视频生成模型,并在同一天在深圳举行的火山引擎AI创新巡展·深圳站大会上进行公布。此次发布会将展示火山引擎的整体介绍、豆包大模型的最新进展以及多个行业企业AI落地实践案例。
  5. 3月5日消息,据媒体消息,抖音App于近期测试接入豆包App的AI能力,并且在抖音App内为豆包App开放了两个超级入口,一个位于短视频界面,与点赞、评论、转发等功能处于同一竖列;另外一个入口则位于抖音App的消息列表内。对此,抖音相关负责人表示,相关能力测试中,主要是希望为用户提供更丰富的AI服务。
  6. 4月17日消息,在火山引擎FORCE LINK AI创新巡展上,火山引擎总裁谭待公布豆包1.5深度思考模型,该模型将正式面向企业提供服务。谭待表示,豆包1.5深度思考模型能够结合视觉理解提供更多功能,例如根据照片分析地貌,或在旅行时辅助点餐、完成企业项目管理流程图。同时,新模型还具备了更强视频搜索能力,模型能够根据用户搜索问题在视频中寻找相应答案。谭待透露,豆包大模型自发布以来日均tokens增长超过106倍,日均tokens使用量超过12.7万亿。
  7. 4月13日消息,知情人士透露,字节跳动正计划推出自研AI智能眼镜,预计将在其智能眼镜中,提供类似自研模型豆包的AI功能。字节跳动自去年起就开始研发AI眼镜项目,公司已招聘具备硬件设计经验的工程师参与开发,正在攻克的技术难题包括:在不牺牲过多电池续航的前提下,确保眼镜能够拍摄出高质量的图像和视频
  8. 豆包方面回应称,河马爱学已经品牌升级为豆包爱学,未来也会基于豆包大模型做更多探索和尝试。
  9. 12月18日消息,截至目前,豆包大模型日均tokens使用量超过4万亿,发布7个月以来增长超过33倍。
  10. 1月20日消息,豆包实时语音大模型于今日正式推出,并在豆包App全量开放,将豆包App升级至7.2.0版本即可体验。据介绍,豆包实时语音大模型,是一款语音理解和生成一体化的模型,实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。
  11. 1月21日消息,豆包APP更新实时语音通话功能,面向所有用户开放。该功能基于最新豆包实时语音大模型(Doubao Realtime Voice Model)。更新后,豆包中文场景的对话能力在语音真实感和“喜怒哀乐”的情绪表现上近乎达到“人机难辨”的AI交互效果,可以模仿不同声线,并且在“逻辑思考”和“情绪感知”上有明显提升。
  12. 1月22日消息,字节跳动发布豆包大模型1.5Pro版本。目前,Doubao-1.5-pro已在豆包APP灰度上线,开发者也可在火山引擎直接调用API。据介绍,该模型具有低训练/推理成本,高效模型结构,全面提升了多模态能力、推理能力。在知识、代码、推理、中文等多项公开测评基准上成绩全球领先。同时,在模型训练过程中,Doubao-1.5-pro未使用任何其他模型生成的数据。
  13. 3月4日消息,豆包大模型团队近日开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系,不仅涵盖主流学科,更将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面学科的覆盖广度,填补了长尾知识评估领域的空白。
  14. 3月19日消息,豆包官微宣布,AI编程功能迎来三项升级,包括HTML预览、Python运行、生成完整项目。目前豆包支持HTML代码实时预览和交互,可以更加直观地制作各类小游戏和网页。豆包目前支持Python代码直接运行,报错可一键修复。最后,豆包还支持生成完整的项目代码再也不用分别生成前后端逻辑后复制粘贴。
  15. 3月28日消息,豆包近日测试新版“深度思考”功能。开启深度思考模式后,豆包在思考过程中可以基于推理多次调用工具、搜索信息,提供更全面,更丰富、准确性更高的结果。AI搜索此前多是“先搜后想”模式,模型根据用户需求先全面搜索信息后,根据统一的搜索结果进行思考。但对于涉及多维度分析、动态信息整合的复杂问题,单一搜索难以覆盖所有变量。
  16. 字节跳动旗下LLM人工智能机器人“豆包”现已开始对外测试,不限名额。
  17. 消息称,目前豆包全球总DAU在300万左右,已经是当前字节跳动旗下AI相关产品Top1的存在。
  18. 字节跳动宣布豆包APP总下载量已达1亿次,将正式开启付费商业化模式,价格相比同行便宜99.3%。
  19. 5月15日消息,火山引擎主办的FORCE原动力大会在京举行。会上发布的数据显示,截至目前,字节跳动旗下大模型豆包App目前总下载量已经突破1亿,双端月活跃用户突破2600万,智能体创建总数800万。会上,字节豆包大模型正式开启对外服务,据悉,豆包大模型包含豆包通用模型Pro、豆包通用模型liti、豆包·角色扮演模型、豆包·语音合成模型、豆包·声音复刻模型、豆包·语音识别模型、豆包·文生图模型、豆包·Function Call模型。