搜狗王小川:年底做出中国最好的大语言模型

大佬说 2023-04-13 23:31:27
人物 2023-04-13 23:31:27 阅读 6084 评论 0

一、王小川重新出山

“我们有信心,在年底做出中国最好的大语言模型。”

面对熙熙攘攘的入局者,搜狗创始人王小川气魄雄壮地放下一句豪言。

距离2021年10月腾讯与搜狐完成收购交易、王小川正式卸任搜狗CEO,已经过去了一年半的时间。

这段时间里,王小川身上几乎没有新闻。即使他曾经在马云与马化腾之间周旋谈判,与周鸿祎、李彦宏针锋相对,但互联网已经开始遗忘这位曾经的天才少年。

直到这次,AI的风猛烈吹动,大模型的机会摆在眼前,王小川重新站回了互联网的赛道上。能不能拼进中心,还不得而知。

“只是你们都忘了搜狗是一家AI公司,但我没有忘。”

但摆在王小川面前的,是一个竞争高度激烈的赛道。

百度率先释出了“文心一言”

一众国内厂商中,百度最先推出了大模型产品“文心一言”。这些年来,李彦宏曾在多个场合强盗,百度十年间向人工智能技术的研发投了1000亿资金。

对于逐渐掉队的百度来说,AI领域的技术积累是这家老牌互联网企业仅剩不多的优势项目。无论是因为技术积累足够,还是背水一战没有退路的原因,百度做了第一个吃螃蟹的人。

从观望到转身押注,各大厂商的动作都不算慢。360创始人周鸿祎不想落于人后紧随其后抱出一款“刚出生的孩子”。

逍遥子张勇宣布,阿里旗下所有产品,都将用AI重做一遍。阿里云和达摩院的技术实力,对此志在必读。

format-jpg

此外还有美团联合创始人王慧文带着数亿风投高调入局。商汤科技的“商量”、昆仑万维的“天工”,正在面世的途中一路狂奔。

字节也紧赶慢赶,旗下飞书推出了AI助手“My AI”,能以对话形式提供多种办公功能,支持创建日程、自动汇总会议纪要、优化与续写文字内容......虽然字节在大模型上的进展依然模糊,My AI这款产品也仍处在设计、开发阶段,但字节方面追热点的心思曝露无疑。

国内头部厂商齐聚,各路大佬出山,好不热闹。


二、既是红海,也是蓝海

但另一方面,是每一家厂商的准备,都还不够充足。

李彦宏高调宣布,百度的“文心一言”距离ChatGPT-3.5,只有2个月的差距。

王小川则毫不客气地“打脸”李彦宏,“怎么可能只差2个月!”

format-jpg

“用时间衡量的话,OpenAI比我们应该领先三年时间是有的。之前我们说追上GPT-3.5,可能一年时间是有机会的。但人家已经到4了,还有5在训练当中,所以我觉得有3年。”

王小川在公开信中写道:“这一次,百川智能将借助语言AI的突破,构建中国最好的大模型底座,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠的获取世界知识和专业服务。”

如果要达到这样的高度,目前来看,以OpenAI旗下产品为标准,国内技术水平还处在追赶状态。

除了技术和时间上的落后,更多难题困扰着新入局者。

前段时期牵头联署公开信,呼吁暂停人工智能开发6个月的马斯克,都做起了双面人的准备:马斯克紧急抢购了1万块GPU,用来训练大模型。

显示核心GPU又称图形芯片,是NVIDIA公司推出的一种特殊类型处理器,具有数百或数千个内核,经过优化,可并行运行大量计算。

曾经它被当做游戏和绘图等功能的主力,用来呈现复杂、逼真的视觉效果,但随着互联网时代的新技术爆发,人们对GPU的关注从消费电子领域转移到了更多维度。

挖矿让GPU在大众视角中爆红了一把。随后从加密货币到自动驾驶再到云端AI服务器,GPU的产量愈加走俏,价格水涨船高。

对于有志于训练大模型的互联网公司来说,算力极为关键,GPU是一切梦开始的地方。

“现在还能买到芯片吗?算力、数据对你来说是个困难的事儿吗?”

面对这样的发问,王小川在最近的采访中面露难色:“那太多困难了,你讲的每一个都是难点,都要解决。”

马斯克抢购的1万块GPU,绝不是个小数目。他收购的推特公司为此支付了数千万美元。

根据最近的官宣内容,王小川创立的“百川智能”启动资金为5000万美元,恰好也就是马斯克买GPU的花费。

王小川和王慧文这些官宣大模型创业的互联网大佬,虽然有着还算丰厚的家底和行业资源优势,但相较于投入巨大的大模型项目来说,这些启动资金可能并不够看。

在大语言模型的风口上,王小川也不敢妄言超车:我们首先是要讲先活下来,再追得上去。


三、人、钱、芯片,缺一不可

美团联合创始人王慧文在朋友圈广发英雄帖:“我的人工智能宣言:5000万美元,带资入组,不在意岗位、薪资和title,求组队。”就遭到了行业内人士的批评

format-jpg

海通证券的电子研究首席分析师郑宏达也在朋友圈发文,称:

“5000万美元够干什么的?”

“互联网的人啥都不懂,就只会营销,一点都不踏实。”

这样的评论也不无道理,OpenAI一次大模型训练就花费了500万美元。这意味着5000万美元的资金,只够10次大模型训练。

还有人才。搜狗有着强AI、语言核心的背景,但顶尖人才并不容易寻觅。

“今天大模型的成功,核心是语言方向的成功,AI是贯穿始终的能力。我们做输入法、语音识别、搜索、同传、数字人,背后都是大量的AI的东西,从识别到生成,都在干。”

format-jpg

搜狗曾经走在行业之前,但随着搜索行业见顶,更多人才与王小川失之交臂。挖人,成了当下的难关。如何让人才人尽其才,在一个新创组织中发挥效能,则考验着创业者的管理水平。

“我们是要去挖人,但挖了人不代表能打赢这场仗,不是零零散散凑几个人、收个团队就能做成的。”

“你们能在文章里放上我们的招聘邮箱吗?”在最近的一次采访中,王小川发问媒体。

这个时候,他的幽默和焦虑同时显露无疑。

招人、找钱、买芯片,每一件事都任重而道远。但面对大模型、人工智能奇点这样的宏大图景,一切困难又显得微不足道。


声明:
  1. 该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
  2. 电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
  3. 如对本稿件有异议或投诉,请联系:info@dsb.cn

吴昕

请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!
讨论数量: 0
暂无评论