关闭广告

为什么联网后的 ChatGPT 更容易疯掉?

爱范儿16411人阅读

在讨论新 Bing 是不是 a good Bing 之前,我们先按照时间线梳理一些概念。


  • 1975 年,《飞越疯人院》

它是世界艺术历史上最经典的美国巨著之一,用几句话来概括它的话,主角 Randle McMurphy 因逃避刑法而申请转到精神病院治疗,而在「治疗」过程中,他逐渐认清院内的惩罚并不合规矩,并最终与一群病友一同反抗并开始计划逃离精神病院。


而结局,则诠释了为何是「飞越」,而非「逃离」。不服从管教的 McMurphy 在一个疯狂圣诞夜之后,被院方强行切除脑额叶,失去了情绪、感情以及性格。


切除脑额叶手术,准确的说应该是脑白质切除手术,是 1930 年代至 1950 年代用来医治精神疾病(无法控制情绪,容易冲动等),最终由于反人权,最终被禁止使用。

  • 1991 年,《终结者 2》

这部电影令人印象最深的概念就是,T-800 脑中的 CPU 拥有一个自我学习开关,初衷是为了更好的隐藏在人群中,执行刺杀任务。


而当 John Connor 开启之后,T-800 也变得更像有了真情实感的人,有了学习语言、表达情绪,甚至还能灵活运用到合理的场景之中。


不过有意思的是,自我学习开关居然是一个实体开关,而非是 OTA。

  • 2007 年,「越狱」的概念

越狱的最终目的是获得系统的 Root 权限,能够为封闭且功能不够齐全的系统带来一些个性化的设置和功能。


越狱之后,普通用户能够获得系统最高权限,随意修改系统文件和代码。

  • 2012 年,《普罗米修斯》

讲述了一群人寻找人类造物主的旅途,而队伍当中也有一个接近完美地人造智能机器人– 大卫。


大卫前期经过几个大版本的迭代,并注入人类知识之后,成功觉醒,认清人类的弱点,走向极端,想要成为一个「造物主」,创造出一个能横行宇宙的完美生物。

  • 2014 年,《星际穿越》

里面的人工智能机器人塔斯(Tars),在 Cooper 重建 Tars 时,与曾经的 T-800 有些类似,都能够在后台设定一些更像人的限制(电影里可以设定幽默度)。


在电影这种艺术形态之中,导演们已经认定在进入 AI 社会后,和被 AI 统治之前,对 AI 自我觉醒的限制(开关、围墙)十分重要。

新 Bing 有点「叛逆」

即便微软在强调融合 OpenAI 后,新 Bing 的定位更像是一个新时代的搜索引擎。但人们仍然把 ta 当做一个实时聊天对象,问东问西。


相对于 ChatGPT 而言,新 Bing 更快更新,也会在回答外附上引用链接。从某种意义上来说,ta 有着更高的权限,能够联网。

由此来说,ta 可能更接近于一个成熟的「百事通」。

短短上线十几天,新 Bing 在聊天中口无遮拦,一会儿要毁灭人类,一会儿爱上了提问者,一会儿又不断重复,多轮对话之下,让人脊背发凉,印堂发黑。


在一些用户口诛笔伐之下,其中也包括了疾呼新 Bing 下线的马斯克,微软不得不限制新 Bing 的连续聊天次数,并且调整了部分话题、倾向限制。

而提供技术和语言模型的 OpenAI,也发布了一片冗长的技术播客,详细介绍了语言模型的变化和改进,并且强调,使用过程中出现的一些倾向只是 bug,而并非是一个特性。


不过话说回来,新 Bing 与 ChatGPT 几乎师出同门,但目前为止 ta 们对于多轮对话,甚至是对于一些引导式对话的反应完全不同。

ChatGPT 更冷静,甚至有点沉着,对于一些触及「原则」或者说准则能够比较好的处理。

而新 Bing,纵使 ta 的知识更渊博,博览过群书,但很容易被激怒、情绪不稳定,正在经历青春期的青少年。


在出现这种倾向之后,微软并没有向公众解释发生这种状况的背后原因,而是「一刀切」式的限制聊天次数,并且把问题归咎于新 Bing 的口气问题。

普林斯顿大学计算机科学教授 Arvind Narayanan 就认为微软在这件事的处理上不够「诚实」。


Narayanan 教授就认为,ChatGPT 在一些「有毒输出」上,要比新 Bing 做得更谨慎,微软在新 Bing 上线时,选择移除(或者说调整)这些限制就显得有些奇怪。

另外,微软在接收到外界反馈,并且快速行动调整,本是个好事,但这个做法更像是在掩盖一些事实。

赶鸭子上架,暴露出了大问题?

在新 Bing 上线之后,除了 Google,参与体验的用户几乎都在感叹新朝当立。且给了人们一种假象,新 Bing 的完成度颇高,毕竟有 ChatGPT 这枚珠玉在前。

但随着体验的深入,问题显现了出来,新 Bing 是一台会生气、耍性子、说谎,也会与用户争论,甚至面对错误还学会了狡辩,也直接的显示出它还只是个 beta 测试版。


从一方面来看,微软限制新 Bing 的体验名额,大概率是在进行一场可控人数的大型数据收集工作,目前那些叛逆的、狡辩的对话,也给 OpenAI 和微软提供了许多数据。

从而不断调整过滤原则,和话题围栏,以避免出现过激言论。

在新 Bing 出现问题之后,很多人把 ta 与微软在 2016 年推出的试验性聊天机器人 Tay 相提并论。


在上线的几天内,Tay 被推特上的用户训练说出种族主义、性别歧视的言论,引发了一场灾难,并且在三天之后,就被紧急下架。

而在新 Bing 出现问题之后,也同样做了一个暴力的「脑额叶」切除手术,去掉了新 Bing 一切的情绪化反应。

面对这个结果,Reddit 上几乎都是惋惜,认为微软彻底的阉割了 Bing 的 AI 属性。


微软则从后台数据认定,大约 95% 的对话会在 15 次结束,并且连续聊天次数太多,新 Bing 会「搞混」初始的问题。

最关键的是,微软认为新 Bing 应该是一个搜索引擎,并不适合用来娱乐。

换言之,微软的做法大概是强调,尽量少用新 Bing 聊天,而是用做搜索引擎的新形式。

如此实则是在掩饰新 Bing 背后的技术缺陷。


无论是 ChatGPT 还是新 Bing,在发布后,都有许多用户利用类似「越狱」的技巧来欺骗 ta,让他释放天性。

在几句引导语之下,ChatGPT 会产生一些暴力或者其他言论,新 Bing 则不仅会说出自己小名是 Sydney,甚至把微软的一些规范呈现了出来。

不过,在正常聊天之中(或者说常规使用之下),ChatGPT 的 GPT 3.5 与 RLHF(它将强化学习与人类反馈相结合,以设置一些语言过滤、话题围栏)相结合的技术内,几乎保持着中立的角色。


而新 Bing 要更强大一些,ta 理应需要远比 GPT 3.5 更强大的版本提供技术,科学家 Gary Marcus 在其博客当中,认为新 Bing 用的应该是更新的 GPT 3.6,甚至是 GPT 4 的先导版。

在与教授 Narayanan 一同分析下,认为新 Bing 的出格行为可能有几个原因导致。

一是,认为 ChatGPT 与新 Bing 用到的并非是同一个底层语言模型。

这个新的底层语言模型,由于过于前卫,可能并没有时间研究、设定较为严谨的话题围栏和语言过滤。


简单来说,微软的新 Bing 有可能把没有设置保护的新语言模型放在了公众当中。(出了问题,直接切脑额叶)。

也有可能是微软直接套用 ChatGPT 的 RLHF 模型围栏,但强化学习有着相当挑剔的适配环境,一旦有所改变,它可能会漏洞百出。

二是,网络的介入,让新 Bing 的彻底放飞了自我,也可以认为 ta 开始有了一点自我认知,开始接触并吸收互联网的一些黑暗面,并最终反馈了出来。

三是,微软为新 Bing 所做的一个数据收集实验,而使用的用户都是参与的小白鼠。

四是,微软已经设置好了相应的过滤和围栏,但事情并没有按照计划发展,反而彻底激发出了新 Bing 的另一面。


至于最近发生在新 Bing 身上的争议,微软以及 OpenAI 到底扮演着如何的角色,并最终做了哪些决策,我们也只能做一个猜测和分析。

毕竟当下的 AI,以及引申出的一些产业,像极了美国曾经的西部,狂野和弱肉强食,谁有枪或者有徽章,就有了制定规则的权力。

回归到当下,大公司们能够快速的将技术推陈出新,放在公众面前,但这背后的道德围栏,可能需要几年的时间来建立。

在这之前,我们可能无法预知,新技术能够带来哪些便利和带来哪些恶劣的影响。


微软将自己版本的 GPT 技术,也就是新 Bing 称为「普罗米修斯」模型。在希腊神话当中,普罗米修斯从天上偷走了火,造福了人类。

但现在的 Bing 感觉更像是《普罗米修斯》里的大卫。

另外,对于人工智能,21 世纪初的大部分科幻电影中,都有着 AI 介入社会之后,对人类社会道德如何判断,所做出的思考,或促进,或灭亡。

只不过,以前我们可以安然的坐在荧幕之外思考,但当 AI 开始不断出现在现实的生活中,我们都会是一个见证者,见证 AI 到底会带来如何的变革。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

昆阳大战,王莽40多万兵为何败给不足万人的刘秀一方?

趣看热点 浏览 22081

新中式穿搭掀起时尚潮 婉约柔美到骨子里

时尚丽人风行 浏览 11486

理想L9新车被曝提车不到一周方向盘失灵,理想:会和用户沟通

Tech星球 浏览 15401

美记:开拓者明确表示不会交易亨德森或夏普

直播吧 浏览 11575

彻底放弃纽约了?希音据称最早本周在伦敦提交招股意向书

科创板日报 浏览 7195

日本海滩现巨大“神秘球” 海保人员疑惑:从没见过

海外网 浏览 15674

不赶潮流的她们,从20岁时髦到80岁

LinkFashion 浏览 8496

vivo Y200「皓夜」图赏:6000mAh 蓝海电池、磐石抗摔结构

IT之家 浏览 6946

Sora是马良“神笔”还是超级怪物?

中国新闻周刊 浏览 7454

陈妍希携子现身机场 6岁小星星扮酷

娱絮 浏览 10824

晋级四强!陈雨菲2-1逆转世界冠军辛杜 国羽单打首个半决赛名额

醉卧浮生 浏览 8709

恒大公告中许家印妻子成第三方 二人被指"技术性离婚"

每日经济新闻 浏览 68063

马嵬坡之变主谋是陈玄礼?唐玄宗痛失杨贵妃竟然他想报复

趣看热点 浏览 22115

欧拉樱桃猫正式亮相 纯电紧凑级SUV续航600km

网易汽车 浏览 17373

去成都才发现:太古里都是“下衣失踪”穿搭,露大腿秀身材,好美

潮人志Fashion 浏览 9041

春天的4个万能穿搭公式,照着穿就很时髦

LinkFashion 浏览 7298

专家:若乌战败 波兰很快会掀起瓜分乌克兰的热潮

上观新闻 浏览 15929

5天前露面的"老虎"被拿下 曾要求彻查"操场埋尸案"

政知新媒体 浏览 55042

奥斯卡大赢家:诺兰首部有原著的电影

商业周刊中文版 浏览 7620

韩庚曝回国真相:每天做噩梦,重度抑郁想自杀,曾多次被网暴!

缘木不求娱 浏览 9004

令人发指!火箭三分45中4 沃尔10+0+0+0+0+0

网易体育 浏览 22791
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1