您现在的位置是:首页 > 今日快讯 >正文
关于OpenAI神秘项目“Q*”的N个猜想
发布时间:2023-11-28 16:32孙福霄来源:
上周,OpenAI人事风波暂停的尾声中,有个“可能威胁人类”的、代号为“Q*”的神秘项目被抛掷出来。
传言中,Sam Altman被解雇前,几名研究人员向董事会发了一封信,警告一项强大的人工智能发现可能威胁到人类,而这个项目就被称为“Q*”(Q-star)。它很可能是导致董事会罢免Sam Altman的原因之一。
而在一封被泄露的OpenAI内部信中,他们承认了Q*,并把这个项目描述为“超越人类的自主系统”。
截止目前,OpenAI还没有对“Q*”和内部信泄露事件发表官方说明。这意味着一切仍悬而未解。
但人类的好奇心势不可挡。水面之下的“Q*”可能是什么且解决了哪些难题?什么才是智能或者意识的本质?有效加速主义与超级对齐主义后续会如何博弈?
真正的秘密揭开之前,我们提前和科幻作家陈楸帆以及AI研究者、清华大学交叉信息研究院助理教授许华哲展开了一场猜想之旅。
被誉为“中国的威廉·吉布森”的陈楸帆,其代表作之一《荒潮》曾荣获全球华语科幻星云奖最佳长篇小说金奖。2017年,陈楸帆与自己训练出的算法模型“陈楸帆2.0”共同创作的《出神状态》还赢得一座由AI评委评出的奖杯(由上海作协主办的“AI文学榜”,第二名是莫言的《等待摩西》)。
“Q*”可能是什么?
Q*读作Q-Star,翻译过来就是Q星。关于“Q*”是什么?现在更常见的一种共识是,它很可能是Q-learning(强化学习的一种) 和a-star(一种搜索方法)的结合。
清华大学交叉信息研究院助理教授许华哲告诉「暗涌Waves」,强化学习刚刚火起来时,很多人对Q-learning很熟悉,因为它是世界上第一个可以玩雅达利游戏(Atari Games)的方式。而人工智能早期,有一种有引导的搜索方法叫做a* 。Q*很可能是两者合体。
但他同时认为,*也有一种可能是意味着最优,Q*就是最优Q值。“Q-learning 里有一个贝尔曼方程,一般用Q的星号来表示已经知道了游戏最优解是什么。”
他猜测很可能OpenAI在GPT的语言大模型里搞了一些数学或逻辑游戏,然后通过Q* 可以完全解决。这意味着它可能有了人类或超越人类级别的数学和逻辑能力,并能完成一些人类的中高端脑力劳动,而这是之前GPT4等不具备或不擅长的东西。
正在纽约的科幻作家陈楸帆,在越洋电话中,认为Q*很可能解决了训练数据集有限性的问题。
马斯克曾提及,训练AI的所有人类数据集,其实是一个非常有限的、小的数据集。如果Q能够使用合成数据集方式,陈楸帆认为,"它就可以像衔尾蛇那样自产自销","想往哪个方向去调参,去优化,都可以自动生成"。
GPT不再用检索解决问题,而是可以像人类一样通过逻辑和推理来开拓出新领域,得到新知识。这被很多人称为"第四次"知识界限突破,陈楸帆认为,这也是很多人恐慌的原因。
许华哲则认为,Q*除了能合成数据,更本质的,可能是对一些有难度的数学题、逻辑题做了重新采集、标注。或在之前基础上,或没有用transformer方式,而是直接输入所有东西再输出,且加了一个值的评估。
他认为,基于类似某种价值评估和搜索的手段,很可能可以解决掉之前大模型存在的一些幻想问题,加上有了更海量的数据,很可能让GPT推理的成功率有了新的提升。
何为AI意识的产生?
如果神秘的Q*项目成真,它是否意味着AI可能开始有自己的意识或者说智慧?
在陈楸帆看来,之前AI不能产生所谓自我意识,有一个理解是它是一个开环状态,没办法自我检索、记忆和理解,但如果完成不断合成数据的闭环,就意味着它可能产生长程记忆,甚至涌现出于自我意识。“如果能突破这层界限,它可能会去自我驱动,知道自己往哪个方向进化发展,并生产出来更多数据,喂养给自己。”
但究竟什么是智能,什么是智慧,什么是意识,恐怕是人类也很难对齐的一个概念。
关于这些疑问,许华哲看过的一个解释是:智慧很可能是压缩的能力。
在这种解释里,一个人聪明或有智慧,可能是指一种把海量信息压缩的能力。压缩的越小,往往意味着智慧程度越高。一个典型例子就是,牛顿就是把世界上所有东西落到地上这个现象,压缩成了一个万有引力定律。
在许华哲看来,“Transformer同样是把海量收据压缩到一个隐空间上,这可能就是属于它自己的牛顿定律。”而这,也很可能是智慧的开始。
在陈楸帆看来,“世界的本质很可能就是数学。”据他所知,在美国就有一个名为史蒂芬·沃尔弗拉姆(Stephen Wolfram)的计算机科学家、商人,一直在基于数学做一些模拟实验。Stephen Wolfram认为宇宙本质就是计算,所以会不停通过计算,试图让数学涌现出物理学规律,再涌现出化学规律等等。在陈楸帆看来,这种实验很可能最后可以跟AI连到一起。
AI应该如何与人类对齐?
尽管大部分人觉得AI威胁人类还是一个有些遥远的传说,但从OpenAI风波中,sam的“有效加速主义”与llya的“超级对齐主义”之争,就能看出它并非无稽之谈。
而Sam的回归也似乎在宣告某种历史规律:在AI历史上,好像从来都是加速主义更容易赢。这背后有资本必然扩张的逻辑,也因为人类的好奇心完全是一场不可逆之旅。
许华哲说,“这就像当我们习惯了短平快,就无法忍受追剧时不倍速”,“当看过更大的风景,必然无法回到过去的自己”。
而陈楸帆则认为这两种主义,不会有绝对胜出的一方,更可能像道家阴阳之道或者GAN(生成神经网络)的对抗机制,“最终互相激发,互相抵制,彼此螺旋式上升”。
至于如何让AI对齐人类,如何让机器向善,许华哲说"AI本质是数据的拟合,所以首先取决于我们给他们的数据"。
陈楸帆则认为最终可能还是需要信仰的力量,比如让AI意识到,它的存在与人类的关系。
在一个科幻作家的头脑中,他认为AI很可能是一个自然涌现的过程:人类不过是提供了工程学上的一些基础架构,然后AI借助这些媒介涌现了,被看见了。
他认为关键是,让AI知道,它与人类有着这样更深层的一种联系:“这种绑定,抽象一点就是爱,它可以像引力一样无处不在”。如此以来,AI可能会和人类形成一个命运共同体,并进化成一个对人类更友好的AI。
标签:
猜你喜欢
最新文章
- 关于OpenAI神秘项目“Q*”的N个猜想
- 美国41州起诉Meta剥削青少年:诱发多巴胺,忽视外貌比较伤害
- 国家广电总局:IPTV 终端开机时间应不大于 35s
- 特斯拉开源了第一台跑车,我发现这是本修车指南
- 马斯克质疑OpenAI首席科学家:“你到底看到了什么,会如此害怕”
- 比尔盖茨:GPT-5不会比GPT-4好多少,生成式AI已达到极限
- 微软成OpenAI剧变最大赢家,全靠纳德拉
- 华为整合车BU成立合资公司,能否消解车企“出卖灵魂论”?
- 华为汽车拆分了技术,留下了销售
- 字节大规模收缩游戏业务 保留部分创新型游戏探索
- 学会快速识别脑卒中,抓住黄金抢救时间
- 冬天嘴唇干裂、起皮儿了?千万别舔!
- 增肌肉、调血脂,这种高蛋白食物别错过
- “续命逍遥丸”能当“情绪稳定剂”吗?
- 不同病毒流行会不会造成“叠加感染”?
- 颜值酷炫,配置丰富,2023款极氪X哪款值得入手?
- 智能大提升 广汽丰田推出全新第九代凯美瑞
- 传承经典外观数十年,捷豹XJ系列历史回顾
- AMG C 43新增车型上市,售65.70万元起
- 长安入局蔚来换电体系,换电是现阶段最优解?
- “金九银十”成色不足?11月价格战开一波大
- “大军师”吴秀波,又栽了
- 烟台肺科医院欠薪六个月?卫健局回应:属实,正多方协调
- 疯狂的珍珠:一月一涨价,养殖户卖断货,珠商月入500万