关闭广告

碾压GPT-4!DeepMind CEO自曝:下一代大模型将与AlphaGo合体

新智元13440人阅读


新智元报道

编辑:编辑部

【新智元导读】谷歌DeepMind CEO Hassabis全新爆料:全新Gemini模型将结合进AlphaGo和大语言模型,成本预计是数千万美元,甚至数亿。

谷歌,是真的破釜沉舟了。

传说中合并了AlphaGo和类GPT-4大模型的Gemini,终于要来了吗?

一个是用强化学习击败人类围棋冠军、创造历史的AI系统,一个是目前霸榜几乎所有大模型榜单、一骑绝尘的最强多模态大模型,两个AI一合体,简直要无敌了!


谷歌DeepMind CEO Hassabis近日对外媒Wired表示,Gemini还在开发中,还需要几个月,而谷歌DeepMind已经准备砸进数千万美元,甚至数亿。

此前,Sam Altman曾透露,创建GPT-4的成本超过了1亿美元。谷歌DeepMind,当然也不能输。


太长不看版

Gemini会将AlphaGo与GPT-4等大模型的语言功能合并,系统解决问题和规划的能力将大大增强。

  • Gemini是一个大语言模型,类似于 GPT-4

  • 预计花费数千万到数亿美元,与开发GPT-4的成本相当

  • 除了AlphaGo,还会有别的创新

Gemini会整合使用了强化学习和树搜索的AlphaGO。

  • 强化学习允许AI通过从反复尝试和反馈中学习,解决挑战性难题

  • 树搜索方法有助于探索和记住场景中可能的移动,比如在游戏场景中

DeepMind在强化学习方面的丰富经验,会为Gemini带来崭新功能。

  • 其他领域技术(如机器人和神经科学)也会整合到Gemini中

下一个算法,要超越ChatGPT

根据OpenAI CEO Sam Altman的说法,GPT-5距离发布尚有时日,至少6个月内不会开始训练。而Gemini的发布时间尚未确定,可能在几个月之内。


尚在开发中的Gemini,也是一个处理文本的大语言模型,性质上和GPT-4类似。

但谷歌DeepMind CEO Demis Hassabis表示,Gemini会结合进AlphaGo中使用的技术,这将赋予系统全新的规划、解决问题的能力。

2016年,AlphaGo击败围棋世界冠军李世石的那一幕,如今依然历历在目。


Hassabis表示,「可以这么说,Gemini把AlphaGo系统的一些优势,和大语言模型惊人的语言能力结合在一起了。并且,我们还有一些其他有趣的创新。」

据说,Gemini具有以前模型中没有的多模态功能,在集成工具和API方面非常高效。而且,Gemini将提供多种规模,旨在支持未来内存和规划上的创新。

在三月份,曾经有这样一个说法:Gemini会像GPT-4一样,具有一万亿个参数。而且,据说Gemini将使用数以万计的谷歌TPU AI芯片进行训练。


在上个月的谷歌开发者I/O大会上,谷歌就曾提到,从一开始,Gemini的目标就是多模态、高效集成工具、API。

而当时谷歌的预告是:「虽然还在早期,但我们已经在Gemini中,看到了在之前的模型中从未见过的多模态能力,这让人印象太深刻了。」

AlphaGo背后的技术,就是强化学习,这是DeepMind首创的技术。


RL代理随着时间的推移与环境交互,通过反复试验来学习策略,从而最大限度地提高长期累积奖励

通过强化学习,AI能够通过反复尝试和接受反馈来调整自己的表现,因而学会处理很棘手的问题,比如在围棋或电子游戏中选择如何采取下一步行动。

另外,AlphaGo还使用了蒙特卡洛树搜索(MCTS)方法,来探索和记住棋盘上所有可能的动作。


这已经不是Hassabis第一次搅动起科技巨头的大规模人工智能淘金热了。

2014年,DeepMind使用强化学习,让AI学会了玩简单的视频游戏,这一成果惊为天人,直接让DeepMind被谷歌收购。

谷歌的注果然押对了。

接下来几年,DeepMind隔一段时间就产出一个惊艳全世界的成果。


深度学习和强化学习正在解决许多经典的人工智能问题,例如逻辑、推理和知识表示

2016年,石破天惊的AlphaGo,直接点燃了深度学习和第一轮AI产业的热潮。

2017年,AlphaGo Zero没有使用人类数据,就迅速超越了AlphaGo。


AlphaGo Zero

2020年,AlphaFold对于蛋白质结构的预测与实验室技术相当,基本解决了蛋白质的折叠问题。

今年6月,AlphaDev创造全新的排序算法,或将彻底改变计算机科学的效率和成果。

相比OpenAI更通用的路线,DeepMind多年来深耕垂直领域。

语言模型的下一个重大飞跃在哪里?Gemini或许指引了下一代语言模型的方向。

背水一战

很明显,Gemini是谷歌的背水一战。

谷歌开创的许多技术,比如Transformer架构,让最近的AI洪流成为可能。

因为对于技术的开发和部署太过谨慎,在ChatGPT和其他生成式AI构成的竞争面前,它反而显得暂时落后。

为了对打ChatGPT,谷歌连续抛出多个动作,比如推出Bard,并且将生成式AI集成到搜索引擎和其他产品中。


为了集中力量办大事,在4月,谷歌干脆把Hassabis的DeepMind和谷歌的主要人工智能实验室谷歌大脑合并,合体为谷歌DeepMind。

对于合体后的全新团队,Haasabis显然非常自信。他表示,全新的团队汇集了两股对最近的人工智能进步至关重要的力量。

「如果你看看我们在人工领域的位置,你会相信,未来80%或90%的创新,就会来自其中一个团队。在过去十年里,两个团队都做出了极其出色的成果。」

新的想法

训练像OpenAI的GPT-4这样的大型语言模型,需要将来自书籍、网页和其他来源的大量精选数据集的输入「Transformer」中。

Transformer使用训练数据中的模式来熟练预测后续文本中应该出现的每一个字母和单词。

这种看似简单的机制,却在回答问题和生成文本或代码方面非常强大。

但这个看似简单的技术原理也被很多行业大佬或者人工智能专家们诟病。


马斯克:目前AI技术的本质就是统计学


OpenAI在GPT系列模型上的突破,就是在Transformer的核心技术之上,很激进地采用了RLHF来强化模型的能力。

而DeepMind在强化学习方面同样有非常丰富的经验。

这就让人有非常充足的理由期待Gemini在未来可能会展现出来的创新能力。


更加关键的是,Hassabis和他的团队也会试图用人工智能其他领域的核心技术来增强大型语言模型的能力。

DeepMind的技术积累非常广泛。

从机器人技术到到神经科学,他们武器库里有各种各样的装备可供他们挑选。


比如像LeCun这样的AI大佬就表示,Transformer将语言模型的能力过度限制在了文本的范围之内。

像人类和动物⼀样,从世界的物理经验中学习可能才是发展人工智能的最优解。

也许在Gemini身上,人工智能将展示出其他方向的潜力。

不确定的未来

Hassabis的任务是加速谷歌的人工智能技术的发展,同时管理未知和潜在的严重的风险险。

大语言模型的飞速进步让许多人工智能专家开始担心这项技术是否会打开潘多拉的魔盒,让人类社会付出无法接受的代价。

Hassabis表示,人工智能可能给人类社会带来的收益不可估量。

人类必须要持续发展这项技术。


强制暂停发展AI技术完全没有可操作性。

但是这并不意味着Hassabis和他领导的DeepMind会不计后果地推进技术的发展。

毕竟,谷歌和DeepMind之所以把AI技术的领袖位置拱手让给OpenAI。

很大一部分原因就是对待AI发展采用了「过于负责任」的态度。

网友:不看好

但是对于未来Gemini的发布,因为考虑到之前谷歌保守的态度,大部分网友似乎都不太看好。


你们觉得这个类似于AGI的模型会在什么时候发布呢?


我赌10块谷歌永远不会发布这个东西。


如果有人关注过谷歌的项目的话,就会发现,他们一般都是先吹一阵牛,然后什么也不发布,一年后再把这个项目给砍了。

不过,对于谷歌在目前大语言模型中做的贡献,网友还是很认可的。


网友A:OpenAI用的大语言模型技术基本都是谷歌发明的

网友B:是的,不过特斯拉发不了财,但是爱迪生可以。


这位网友就很看好DeepMind将利用自己在强化学习方面的经验能在大语言模型上产生的突破。

不过他依然认为可能谷歌只会用改进自己现有产品的思路来推进这个技术,而不是推出全新的产品。

参考资料:

https://the-decoder.com/deepmind-founder-shares-details-on-gemini-googles-next-gen-response-to-gpt-4/

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

冰箱:哈登不愿做脏活累活 这样只能赢几场常规赛不可能夺冠

直播吧 浏览 12338

巴黎高定秀 | 100套绝美礼服,一场看不够的时尚盛宴

LinkFashion 浏览 8329

男子撞男童获刑 称被错误羁押3天向一审法院索赔百万

红星新闻 浏览 73288

范志毅《繁花》出场就是一脚 网友:毫无表演痕迹

新民晚报 浏览 10595

美军花3亿多美元造的加沙码头被冲毁了

观察者网 浏览 8732

美军方拦截"不明高空气球" 美媒硬扯中美"气球事件"

环球网资讯 浏览 10126

俄军缴获的西方装备展览在俄罗斯莫斯科州开幕

看看新闻Knews 浏览 12305

“会打扮”和“不会打扮”的区别在哪里?

时尚搭配师Nicole 浏览 17417

普京是否仍信任俄国防部长绍伊古?克宫这样说

环球网资讯 浏览 13157

只有上海人能看懂《繁花》?

市界 浏览 10920

员工高唱"我妈是董明珠" 格力回应:为了增加幽默气氛

中新经纬 浏览 10251

中国最大城市群,越来越像一个“省”

国民经略 浏览 9217

美军遇重大伤亡 拜登政府发声明:不寻求与伊朗开战

环球网资讯 浏览 10388

Rain东京塔被偶遇,又高又壮又拉风

缘木不求娱 浏览 10252

美一架飞机闯入华盛顿禁飞区:被战机拦截后坠毁

环球网 浏览 14251

记者:米兰免签波波维奇的情况变得复杂,球员也被推荐给拜仁

懂球帝 浏览 10412

新加坡前外长:美国认为他们可以改变中国 但那是幻想

澎湃新闻 浏览 55789

广厦险胜北控!两帅不兴奋,朱俊龙功臣待遇,肘子苦笑,晓宇暖心

篮球资讯达人 浏览 17267

东方甄选的困局,还得靠字节跳动给解药

连线Insight 浏览 10568

身家600亿富豪提议,给员工发现金红包:在职1人1万

证券时报e公司 浏览 10515

火了40年的刘德华,没想到是这种人

GirlDaily 浏览 10610
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1