首页
快讯
观察
Toggle theme
字节跳动开源
大
模型
训练
框架veGiantModel
2022-03-17 17:59:00
近日,字节跳动应用机器学习团队开源名为veGiantModel的
大
模型
训练
框架,主要应用于自然语言处理领域的
大
模型
训练
。
腾讯将发布面向
大
模型
训练
的自研向量数据库
2023-07-04 10:14:08
腾讯云将在今日下午正式发布自研向量数据库(Tencent Cloud VectorDB),该数据库面向
大
模型
训练
。
华为:盘古
大
模型
训练
效能已达业界主流GPU的1.1倍
2023-07-31 09:09:44
7月31日消息,华为云数字文娱AI创新峰会2023日前在上海举行。会上,华为云全球Marketing与销售服务总裁石冀琳表示,今年以来,华为基于
大
模型
的AIGC技术在影视、游戏、音频、动漫等多个领域落地应用,给数字文娱产业带来了可预见的巨大价值。在AI算力层面,华为云以昇腾AI云服务的方式提供给行业客户,单集群2000P Flops澎湃算力。石冀琳表示,华为云能够为客户提供全栈AI服务,盘古
大
模型
3.0包括三层架构,完全契合行业应用
大
模型
需求。
字节旗下火山引擎发布
大
模型
训练
云平台
2023-04-19 04:30:48
火山引擎总裁谭待表示,“国内
大
模型
领域的数十家企业,超过七成已经在火山引擎云上”。
百度:文生图功能
大
模型
训练
使用的是互联网公开数据,符合行业惯例
2023-03-23 11:15:02
3月23日消息,百度官博发文称,注意到对文心一言文生图功能的相关反馈。在
大
模型
训练
中,我们使用的是互联网公开数据,符合行业惯例。
字节旗下火山引擎发布
大
模型
训练
云平台
2023-04-18 11:41:00
4月18日消息,火山引擎发布自研DPU等系列云产品,并推出新版机器学习平台:支持万卡级
大
模型
训练
、微秒级延迟网络,弹性计算可节省70%算力成本。同时,火山引擎宣布与字节跳动国内业务并池,抖音等业务的空闲计算资源可极速调度给火山引擎客户使用。火山引擎总裁谭待透露,“国内
大
模型
领域的数十家企业,超过七成已经在火山引擎云上”。
快手在GTC大会发布
大
模型
训练
解决方案
2024-03-22 14:04:58
3月22日消息,近日英伟达GTC大会上,快手公布了
大
模型
训练
解决方案。据悉,通过计算通信重叠、异构存储利用、通信资源管控、算子优化等手段,该方案可支持百万级别超长文本
训练
,并且在
训练
性能上比sota开源方案快30%以上。
字节跳动回应实习生破坏
大
模型
训练
:不涉及
大
模型
等业务
2024-10-19 16:15:48
10月19日消息,字节跳动发布关于“实习生破坏
大
模型
训练
”的事实澄清:近期有媒体称“字节跳动
大
模型
训练
被实习生攻击”,经公司内部核实,确有商业化技术团队实习生发生严重违纪行为,该实习生已被辞退,公司也将其行为同步给行业联盟和所在学校,交由校方处理。
有赞CEO白鸦:将发布基于
大
模型
和垂直
模型
训练
后相关产品
2023-03-29 17:24:55
白鸦坚信,有了AI的SaaS,就会是十倍以上的效率提升,十倍以上的效果提升。
阿里云为地平线端到端智驾
大
模型
训练
提供算力支持
2025-04-09 15:27:51
据了解,地平线的研发数据规模已达到数千PB。为满足海量数据的处理需求,地平线基于阿里云EMR、OSS等技术打造湖仓一体架构,构建“数据流入-存储-挖掘”全链路。依托阿里云万卡智算集群,地平线正在
训练
端到端智驾
模型
。
阿里云周靖人:阿里云已建立完善的AI
大
模型
训练
平台
2023-10-31 11:46:26
在2023云栖大会现场,阿里云首席技术官周靖人发言指出,除了传统的基础设施服务,正在到来的智能时代,阿里云也再一次在这个时代引领了云计算的发展。
阿里云周靖人:阿里云已建立完善的AI
大
模型
训练
平台
2023-10-31 10:55:53
10月31日消息,2023云栖大会现场,阿里云首席技术官周靖人发言指出,“今天整个AI的技术变革正在一个快速的节奏中发展,影响我们社会的方方面面。随着AI变革的发生,智能时代里面云计算的价格、体系也正在发生一系列的变化和创新”。
阿里云与昆仑万维将在智算中心建设、
大
模型
训练
等领域展开合作
2023-04-13 15:10:54
在2023阿里云峰会上,阿里云与昆仑万维共同发布战略合作。
腾讯云发布
大
模型
算力集群
2023-04-14 14:05:54
4月14日消息,腾讯云发布面向
大
模型
训练
的新一代HCC 高性能计算集群,整体性能比过去提升了3倍。据了解,该集群采用腾讯云星星海自研服务器,搭载英伟达最新代次H800 GPU,服务器之间采用3.2T互联带宽,为
大
模型
训练
、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。
豆包
大
模型
1.5Pro发布 已灰度上线
2025-01-22 17:30:25
1月22日消息,字节跳动发布豆包
大
模型
1.5Pro版本。目前,Doubao-1.5-pro已在豆包APP灰度上线,开发者也可在火山引擎直接调用API。据介绍,该
模型
具有低
训练
/推理成本,高效
模型
结构,全面提升了多模态能力、推理能力。在知识、代码、推理、中文等多项公开测评基准上成绩全球领先。同时,在
模型
训练
过程中,Doubao-1.5-pro未使用任何其他
模型
生成的数据。
华为发布
大
模型
时代AI存储新品
2023-07-14 15:21:25
7月14日消息,华为今日发布
大
模型
时代AI存储新品,针对不同行业、不同场景
大
模型
应用,推出OceanStor A310深度学习数据湖存储与FusionCube A3000训/推超融合一体机。FusionCube A3000训/推超融合一体机,面向行业
大
模型
训练
/推理场景,针对百亿级
模型
应用,集成了OceanStor A300高性能存储节点、训/推节点、交换设备、AI平台软件与管理运维软件。
“值得买消费
大
模型
”首次发布
2024-05-11 10:43:33
5月11日消息,昨日在2024值得买科技集团战略发布会上,“值得买消费
大
模型
”首次发布。据官方介绍,该
大
模型
在130亿参数的
模型
基座上,基于300G语料开展全参数的
大
模型
训练
,历经1.2亿次迭代完成。
阿里云在海外市场推出一站式
大
模型
开发服务
2023-09-26 20:38:46
阿里云宣布将向海外
大
模型
开发者和企业提供一站式开发服务,包括
模型
训练
、推理、部署等全流程的工程平台和智能算力。
阿里云推出企业级
大
模型
RAG系统
2024-02-01 10:41:57
阿里云副总裁、计算平台事业部负责人汪军华介绍,通过RAG技术,
大
语言
模型
在回答问题时,可以从企业知识库中检索最新的相关信息来生成内容,从而提高回答的准确性、关联性和新鲜度,并解决幻觉问题。同时,RAG技术外挂的私有数据不参与
大
模型
训练
,保证了企业的数据安全。
华为云CTO:
大
模型
时代需要全新的网络互联技术
2024-02-26 09:06:20
2月26日消息,华为云CTO张宇昕在巴塞罗那华为云峰会表示,
大
模型
时代对算力有着全新的要求:1、联算比。未来需要全新的网络互联技术来解决运算量和GPU算力之间的巨大差距。当前在
模型
训练
过程中,大量的时间消耗在GPU数据加载,造成算力的进一步浪费。基于此,云的系统架构将从“以CPU为中心的主从架构”向“多元算力对等架构” 跃迁,突破算力、存储和网络的边界,实现多元算力的对等全互联。
‹‹
‹
1
2
›
››