首页
快讯
观察
Toggle theme
扎克伯格:Meta正在为元宇宙研发AI
语音
助手
2022-02-24 09:28:02
据报道,扎克伯格周三谈到,Meta正在推进用
语音
生成
虚拟世界的AI研究。
亚马逊推出全新
语音
模型Amazon Nova Sonic
2025-04-09 11:09:04
4月9日消息,亚马逊正式宣布推出Amazon Nova Sonic,这是一款全新的基础模型,能够将
语音
理解和
语音
生成
功能集成至单一模型中,从而在AI应用中实现更接近人类对话的
语音
交流。该模型可通过Amazon Bedrock服务上的新API获取使用,可简化
语音
应用的开发流程,这些
语音
应用涵盖客户服务电话自动化以及适用于旅游、教育、医疗、娱乐等众多行业的AI Agent。
小米任命栾剑为AI实验室大模型团队负责人
2023-04-14 20:20:55
4月14日消息,澎湃新闻编辑从小米内部人士处获悉,近日小米集团发布内部邮件,任命栾剑担任技术委员会AI实验室大模型团队负责人,向技术委员会副主席、AI实验室主任王斌汇报。公开资料显示,栾剑现任小米技术委员会AI实验室
语音
生成
团队负责人,曾任东芝(中国)研究院研究员、微软(中国)工程院高级
语音
科学家、微软小冰首席
语音
科学家及
语音
团队负责人等职位。
阿里云推出数字人视频
生成
工具Live Portait
2023-08-16 15:14:23
8月16日消息,阿里云推出数字人视频
生成
工具Live Portait,上传一张照片和一段文本或
语音
可
生成
一段开口说话的数字人视频,可应用于视频直播、聊天机器人、企业营销等场景。目前,该工具已在魔搭社区创空间开放体验。
豆包实时
语音
大模型上线
2025-01-20 15:52:46
1月20日消息,豆包实时
语音
大模型于今日正式推出,并在豆包App全量开放,将豆包App升级至7.2.0版本即可体验。据介绍,豆包实时
语音
大模型,是一款
语音
理解和
生成
一体化的模型,实现了端到端
语音
对话。相比传统级联模式,在
语音
表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。
携程关联公司公开“
语音
机器人的汉字解释话术
生成
方法”专利
2021-04-27 09:41:08
4月27日消息,天眼查资料显示,携程关联公司携程计算机技术 有限公司4月27日公开一项“
语音
机器人的汉字解释话术
生成
方法、系统、设备及介质”专利,公开号为CN112711654A,申请日期为2020年12月25日。股权穿透图显示,携程计算机技术(上海)有限公司由携程投资(上海)有限公司100%全资持股,认缴金额800万美元。
亚马逊推出新款Echo设备 计划将
生成
式AI引入Alexa
语音
助手
2023-05-18 15:20:13
亚马逊在官网推出了几款新Echo设备,并透露其正准备将
生成
式AI引入到Alexa
语音
助手中,今年或将取得成效。
亚马逊推出新版
语音
助手Alexa+
2025-02-27 09:18:40
2月27日消息,亚马逊宣布使用
生成
式AI重建Alexa
语音
助手,命名为Alexa+。据介绍,Alexa+可进行真实自然的流畅对话,它能理解上下文和语义,无需特定“Alexa”指令即可实现无缝互动,并可代为处理各类事务,包括约会安排、礼物选购、旅行规划及学习辅助。
亚马逊升级Alexa
语音
助手
2023-09-21 09:51:32
9月21日消息,亚马逊在今天举办的活动中,预告了整合
生成
式AI的全新Alexa,可以在不再次使用唤醒词“Alexa”的情况下继续对话。新版
语音
助手在大
语言
模型的加持下,和用户的交流体验更加自然,让Alexa的对话感觉更像与人类交谈。亚马逊还推出了全新的“speech-to-speech”引擎,能够感知用户的情绪和语调,并允许Alexa根据用户情绪做出不同的回应。
阿里推出会议AI助理“听悟” 可秒速
生成
智能会议纪要
2021-10-22 15:24:31
10月22日消息,在杭州云栖大会上,阿里巴巴达摩院发布软硬件结合
语音
产品“听悟”。据介绍,“听悟”是面向未来会议的AI助理,集成了达摩院最新
语音
及自然语言处理技术,不仅“听”得准,且“悟”性高,可秒速
生成
智能会议纪要及待办。
阿里达摩院上线“文本
生成
视频大模型”
2023-03-22 16:46:02
3月22日消息,阿里达摩院已在AI模型社区“魔搭”ModelScope上线了“文本
生成
视频大模型”。根据介绍,整体模型参数约17亿,目前只支持英文输入。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频
生成
的功能。据了解,“魔搭”是阿里达摩院联手CCF开源发展委员会在2022云栖大会推出的AI模型社区,首批开源模型超过300个,包括视觉、
语音
、自然语言处理、多模态等AI主要方向。
字节跳动AI-lab智能
语音
部门负责人梅晓离职
2022-05-19 17:40:04
5月19日消息,Tech星球独家获悉,字节跳动AI-lab智能
语音
部门的负责人梅晓已经离职。据了解,2018年,梅晓加入字节跳动。梅晓在字节的AI-lab智能
语音
部门中主要负责人工智能相关数据制作与业务策略制定,主要是
语音
合成技术方向。梅晓团队的工作主要是为字节系APP提供底层技术支持,具体包括APP的
语音
识别、抖音或剪映APP在视频的制作过程中可以自动
生成
字幕风。算上梅晓,这已是AI-lab实验室在近两年时间内,出走的第4位技术大牛。
蚂蚁消金与重庆大学就AI
生成
技术等领域达成合作
2023-05-30 09:21:36
5月30日消息,据“重庆发布”官方微博,5月29日,重庆蚂蚁消费金融有限公司与重庆大学签署专项合作协议,双方将继续深化在反欺诈联合建模、AI
生成
技术等领域合作,探索对新型作假手段的提前感知,以及图片、文本、
语音
的整合判别建模。
百度文心一言APP实现一键
生成
专属数字分身
2024-02-02 14:52:45
2月2日消息,目前,文心一言APP正在内测数字分身新功能,今日起,iOS和Android用户升级新版本后,均可免费使用该功能。据了解,文心一言APP新功能极大缩短了用户创建数字分身的时间。用户只需一张照片、录制三句
语音
,即可创建专属数字分身,并且支持个性化定义名称、声音、MBTI性格等。用户可自由选择是否公开自己的数字分身,满足情感陪伴、求知探索、娱乐闲聊等多样化场景需求。
百度地图V18版本发布 首次融入
生成
式AI
2023-04-03 17:49:35
4月3日消息,百度地图下一代版本V18于今日发布,由文心交通大模型和
生成
式AI提供底层支撑,可面向实时交通实现刻画、感知、预测、调度的端到端优化。据悉,百度地图还上线了领航数字人叶悠悠,是基于多模态交互、3D数字人建模、自然语言处理和大模型等技术开发的数字人,将与车主实现拟人级
语音
交互。
支付宝推出撒贝宁防骗 “叫醒热线”:超 8 成预约用户为女性
2021-01-22 20:13:45
今日中国警察网联合支付宝的“叫醒计划”服务升级,推出以撒贝宁声音
生成
的AI
语音
“叫醒热线”。
阿里回应天猫精灵已接入GPT大模型:是个性化大模型技术DEMO
2023-04-04 15:27:16
4月4日消息,有网友近日展示了利用阿里大模型技术
生成
脱口秀演员“鸟鸟”AI嘴替的技术,高度模仿了鸟鸟的语调、声音以及文本风格,并介绍了该技术用于智能终端领域的可行性。对此,新浪科技向阿里方面求证获悉,“天猫精灵和达摩院一直在紧密合作,其中包括推进大
语言
模型、声学模型、
语音
AI等综合应用”。据悉,天猫精灵的技术内核是AliGenie智能交互系统。2022年7月数据显示,其自研设备的月交互次数超过80亿。
淘宝双11期间新开设人工智能服务一级类目
2023-10-31 14:32:17
从淘宝商家的管理后台可以看到,在商品类目中已经新增了人工智能服务选项,包括AI绘画、AI照片
生成
、AI四维彩超、AI
语音
包等。
支付宝推出撒贝宁防骗“叫醒热线”:超8成预约用户为女性
2021-01-22 16:41:07
1月22日消息,今日,中国警察网联合支付宝的“叫醒计划”服务升级,推出以撒贝宁声音
生成
的AI
语音
“叫醒热线”:针对遭遇较高风险诈骗而被阻断交易的用户,通过主动外呼的
语音
电话,向大家揭示骗局风险。支付宝表示,此前试运营的三个月里,已经有300万人预约撒贝宁防骗
语音
来电提醒,超8成预约用户是女性。从劝阻效果看,50岁以上的中老年女性最听劝。据介绍,用户上
360正式发布AI新产品“360智脑大模型”
2023-06-13 15:29:26
6月13日消息,360正式发布AI新产品“360智脑大模型”。据了解,360大
语言
模型为360的自研千亿参数大模型,已具备跨模态
生成
能力,拥有文字、图像、
语音
、视频处理四大能力,可以应用于文生图、图生图、文生视频等场景。360创始人周鸿祎表示,大模型自身安全是未来大模型的核心竞争力,360也已经通过工信部信通院测评,成为国内首个可信AIGC大模型。
‹‹
‹
1
2
›
››