搜索

扎克伯格：Meta正在为元宇宙研发AI语音助手
2022-02-24 09:28:02
据报道，扎克伯格周三谈到，Meta正在推进用语音生成虚拟世界的AI研究。
亚马逊推出全新语音模型Amazon Nova Sonic
2025-04-09 11:09:04
4月9日消息，亚马逊正式宣布推出Amazon Nova Sonic，这是一款全新的基础模型，能够将语音理解和语音生成功能集成至单一模型中，从而在AI应用中实现更接近人类对话的语音交流。该模型可通过Amazon Bedrock服务上的新API获取使用，可简化语音应用的开发流程，这些语音应用涵盖客户服务电话自动化以及适用于旅游、教育、医疗、娱乐等众多行业的AI Agent。
小米任命栾剑为AI实验室大模型团队负责人
2023-04-14 20:20:55
4月14日消息，澎湃新闻编辑从小米内部人士处获悉，近日小米集团发布内部邮件，任命栾剑担任技术委员会AI实验室大模型团队负责人，向技术委员会副主席、AI实验室主任王斌汇报。公开资料显示，栾剑现任小米技术委员会AI实验室语音生成团队负责人，曾任东芝（中国）研究院研究员、微软（中国）工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。
阿里云推出数字人视频生成工具Live Portait
2023-08-16 15:14:23
8月16日消息，阿里云推出数字人视频生成工具Live Portait，上传一张照片和一段文本或语音可生成一段开口说话的数字人视频，可应用于视频直播、聊天机器人、企业营销等场景。目前，该工具已在魔搭社区创空间开放体验。
豆包实时语音大模型上线
2025-01-20 15:52:46
1月20日消息，豆包实时语音大模型于今日正式推出，并在豆包App全量开放，将豆包App升级至7.2.0版本即可体验。据介绍，豆包实时语音大模型，是一款语音理解和生成一体化的模型，实现了端到端语音对话。相比传统级联模式，在语音表现力、控制力、情绪承接方面表现惊艳，并具备低时延、对话中可随时打断等特性。
携程关联公司公开“语音机器人的汉字解释话术生成方法”专利
2021-04-27 09:41:08
4月27日消息，天眼查资料显示，携程关联公司携程计算机技术有限公司4月27日公开一项“语音机器人的汉字解释话术生成方法、系统、设备及介质”专利，公开号为CN112711654A，申请日期为2020年12月25日。股权穿透图显示，携程计算机技术（上海）有限公司由携程投资（上海）有限公司100%全资持股，认缴金额800万美元。
亚马逊推出新款Echo设备计划将生成式AI引入Alexa语音助手
2023-05-18 15:20:13
亚马逊在官网推出了几款新Echo设备，并透露其正准备将生成式AI引入到Alexa语音助手中，今年或将取得成效。
亚马逊推出新版语音助手Alexa+
2025-02-27 09:18:40
2月27日消息，亚马逊宣布使用生成式AI重建Alexa语音助手，命名为Alexa+。据介绍，Alexa+可进行真实自然的流畅对话，它能理解上下文和语义，无需特定“Alexa”指令即可实现无缝互动，并可代为处理各类事务，包括约会安排、礼物选购、旅行规划及学习辅助。
亚马逊升级Alexa语音助手
2023-09-21 09:51:32
9月21日消息，亚马逊在今天举办的活动中，预告了整合生成式AI的全新Alexa，可以在不再次使用唤醒词“Alexa”的情况下继续对话。新版语音助手在大语言模型的加持下，和用户的交流体验更加自然，让Alexa的对话感觉更像与人类交谈。亚马逊还推出了全新的“speech-to-speech”引擎，能够感知用户的情绪和语调，并允许Alexa根据用户情绪做出不同的回应。
阿里推出会议AI助理“听悟” 可秒速生成智能会议纪要
2021-10-22 15:24:31
10月22日消息，在杭州云栖大会上，阿里巴巴达摩院发布软硬件结合语音产品“听悟”。据介绍，“听悟”是面向未来会议的AI助理，集成了达摩院最新语音及自然语言处理技术，不仅“听”得准，且“悟”性高，可秒速生成智能会议纪要及待办。
阿里达摩院上线“文本生成视频大模型”
2023-03-22 16:46:02
3月22日消息，阿里达摩院已在AI模型社区“魔搭”ModelScope上线了“文本生成视频大模型”。根据介绍，整体模型参数约17亿，目前只支持英文输入。扩散模型采用Unet3D结构，通过从纯高斯噪声视频中，迭代去噪的过程，实现视频生成的功能。据了解，“魔搭”是阿里达摩院联手CCF开源发展委员会在2022云栖大会推出的AI模型社区，首批开源模型超过300个，包括视觉、语音、自然语言处理、多模态等AI主要方向。
字节跳动AI-lab智能语音部门负责人梅晓离职
2022-05-19 17:40:04
5月19日消息，Tech星球独家获悉，字节跳动AI-lab智能语音部门的负责人梅晓已经离职。据了解，2018年，梅晓加入字节跳动。梅晓在字节的AI-lab智能语音部门中主要负责人工智能相关数据制作与业务策略制定，主要是语音合成技术方向。梅晓团队的工作主要是为字节系APP提供底层技术支持，具体包括APP的语音识别、抖音或剪映APP在视频的制作过程中可以自动生成字幕风。算上梅晓，这已是AI-lab实验室在近两年时间内，出走的第4位技术大牛。
蚂蚁消金与重庆大学就AI生成技术等领域达成合作
2023-05-30 09:21:36
5月30日消息，据“重庆发布”官方微博，5月29日，重庆蚂蚁消费金融有限公司与重庆大学签署专项合作协议，双方将继续深化在反欺诈联合建模、AI生成技术等领域合作，探索对新型作假手段的提前感知，以及图片、文本、语音的整合判别建模。
百度文心一言APP实现一键生成专属数字分身
2024-02-02 14:52:45
2月2日消息，目前，文心一言APP正在内测数字分身新功能，今日起，iOS和Android用户升级新版本后，均可免费使用该功能。据了解，文心一言APP新功能极大缩短了用户创建数字分身的时间。用户只需一张照片、录制三句语音，即可创建专属数字分身，并且支持个性化定义名称、声音、MBTI性格等。用户可自由选择是否公开自己的数字分身，满足情感陪伴、求知探索、娱乐闲聊等多样化场景需求。
百度地图V18版本发布首次融入生成式AI
2023-04-03 17:49:35
4月3日消息，百度地图下一代版本V18于今日发布，由文心交通大模型和生成式AI提供底层支撑，可面向实时交通实现刻画、感知、预测、调度的端到端优化。据悉，百度地图还上线了领航数字人叶悠悠，是基于多模态交互、3D数字人建模、自然语言处理和大模型等技术开发的数字人，将与车主实现拟人级语音交互。
支付宝推出撒贝宁防骗 “叫醒热线”：超 8 成预约用户为女性
2021-01-22 20:13:45
今日中国警察网联合支付宝的“叫醒计划”服务升级，推出以撒贝宁声音生成的AI语音“叫醒热线”。
阿里回应天猫精灵已接入GPT大模型：是个性化大模型技术DEMO
2023-04-04 15:27:16
4月4日消息，有网友近日展示了利用阿里大模型技术生成脱口秀演员“鸟鸟”AI嘴替的技术，高度模仿了鸟鸟的语调、声音以及文本风格，并介绍了该技术用于智能终端领域的可行性。对此，新浪科技向阿里方面求证获悉，“天猫精灵和达摩院一直在紧密合作，其中包括推进大语言模型、声学模型、语音AI等综合应用”。据悉，天猫精灵的技术内核是AliGenie智能交互系统。2022年7月数据显示，其自研设备的月交互次数超过80亿。
淘宝双11期间新开设人工智能服务一级类目
2023-10-31 14:32:17
从淘宝商家的管理后台可以看到，在商品类目中已经新增了人工智能服务选项，包括AI绘画、AI照片生成、AI四维彩超、AI语音包等。
支付宝推出撒贝宁防骗“叫醒热线”：超8成预约用户为女性
2021-01-22 16:41:07
1月22日消息，今日，中国警察网联合支付宝的“叫醒计划”服务升级，推出以撒贝宁声音生成的AI语音“叫醒热线”：针对遭遇较高风险诈骗而被阻断交易的用户，通过主动外呼的语音电话，向大家揭示骗局风险。支付宝表示，此前试运营的三个月里，已经有300万人预约撒贝宁防骗语音来电提醒，超8成预约用户是女性。从劝阻效果看，50岁以上的中老年女性最听劝。据介绍，用户上
360正式发布AI新产品“360智脑大模型”
2023-06-13 15:29:26
6月13日消息，360正式发布AI新产品“360智脑大模型”。据了解，360大语言模型为360的自研千亿参数大模型，已具备跨模态生成能力，拥有文字、图像、语音、视频处理四大能力，可以应用于文生图、图生图、文生视频等场景。360创始人周鸿祎表示，大模型自身安全是未来大模型的核心竞争力，360也已经通过工信部信通院测评，成为国内首个可信AIGC大模型。