行业动态
GPT参加B站新国辩也得先学5年逻辑
2024-06-21

这是一个缺乏思辨的时代。

每天接入互联网,似乎都有 100 个杠精等着给你在线添堵,武器的批判完全代替了批判的武器;时髦的文娱产品,华丽外壳下掩盖不住愈发混乱的意识形态,它们不关心对错只想讨好你。

在获取真理之前,我们大概会先得针眼;在共识消散之后,我们大概也会丢掉共情。这是无言的结局。

多年以后我注视着屏幕只能沉默无语,我总会想起大学时学长带我参加辩论队打**场比赛那个遥远的下午。

那一天我二十一岁,在我一生的黄金时代,我想说,想辩,想讨论出世界的正确答案,思考时我离真理最近。

然而,后来生活中我与辩论产生的唯一联系,恐怕是社交网站的抽象段子。

不过,最近我发现热门话题里辩论还真出圈儿了,起因是 B 站本周全程直播了第十一届国际华语辩论邀请赛,江湖人称新国辩。

新国辩被誉为当代华语辩坛的 " 黄埔军校 ",通常由全球顶尖名校组成战队进行同台竞技,是华语辩坛一年一度的 " 华山论剑 "。以上,是官方介绍。

尽管本届新国辩有清华、北大、南大、伦敦政经等 24 所海内外高校的选手阵营,以及陈铭、詹青云、庞颖、黄执中等明星辩手的评审阵容,还有多位 UP 主的跨界参与。

但这些,还不足以让一个辩论节目在这个短平快的时代引发轰动。

直到我自己去 B 站观摩了比赛,才明白,是因为本届新国辩的精彩程度过于离谱了,部分场次的戏剧张力甚至可以超越本年度一些无聊的贺岁片。

本来说是华语辩坛在山上论剑,仔细一看,是在骆驼上装了加特林。

不止有戏剧性,GPT 来了也得先学 5 年逻辑

艺术就是爆炸,戏剧就是反转。小组赛 F 组第三场中国人民大学 VS 马来亚大学这场,反转程度直接拉满。这就好像《无间道》陈永仁发现对面全是卧底,《让子弹飞》张麻子冲进碉楼发现他才是替身,像峨眉峰,还独照,颇具浪漫主义色彩。

这一组的辩题是【GPT 式大语言模型发展应该 / 不应该以 " 对人类友善 " 为前提】,是初赛要讨论的 8 个「具体议题」之一。

过去一年对于我们普通人最大的科技新闻,可能就是以 Chat GPT 为代表的大语言模型纷纷开始 " 涌现 ",Open AI 如后宫干政一样的狗血新闻都能在头条上晃悠个把月。我们需要 GPT 对人类友好吗?是一个注定会到来的问题。

这场比赛的评委之一罗淼先生 @罗淼 _ 吐槽专用,赛后在微博上用十分通俗且风趣的语言,为大家捋出这场信息量过载的辩论究竟发生了什么,导致他上台点评时嘴角比 AK 还难压。

一般来说,这类辩题,正方好打,反方吃力。正方基本会说早该好好管管了,要不人类没好果汁吃;反方最多能说多大点事,小隐患不耽误大发展。

就像我去问了 ChatGPT 4 对辩题的看法,GPT 自己都表示确实应该以 " 对人类友善 " 为前提。

不排除它麻痹我

双方一开始在立论阶段其实还算正常。正方人大一板一眼讲现在 GPT 的应用已经十分广泛,教育、医疗、法律都在用,如果不以友善为前提,那它胡搞乱搞,把人教坏了、治废了、判错了,晚期就是植物人,人类毁灭了。

反方马来亚说,以 " 对人类友善 " 为前提你没法弄。一是设限影响性能发挥;二是友善的前提太模糊没法操作;三是这个前提的最终解释权在大国手里,对其他人类不公平。

这里正方祭出一招飞天御剑流,说反方你来给我念念辩题,咱们说的是 " 应不应该 ",你别说难执行,应该做的再难做也要做。

可等到第二轮申辩,画风突变。反方说友善太模糊,我们还是让 GPT 内部运转机理透明化,这不就靠得住了,咬住可解释性诱敌深入。

正方说,我看你是完全不懂哦,GPT 迭代到 4.0 内部已经无法解释了,你要真想解释只能退回 2.0 和 1.0 版本了,甚至没有 GPT 的时代。

一个人质报复一场阴谋最有效的办法是把自己杀死。反方此时终于图穷匕见要宰孩子,一记七伤拳惹毛我的人有危险。说:退就退!

正方:难道要退回 2018 年吗?

反方:退!反正 2018 大家过得也不是很差。

做过心理准备,但明显做少了。正方一恍范,坏了!我成反方了。

好在人大迅速稳住阵脚,反方我又不是没打过。于是,双方的第三轮交锋就在这么既有专业水平又有戏剧包袱,活泼且严肃的奇妙观感下展开了。

正方问反方,你说退就退,GPT 在美国佬手里呢,他们凭什么听你的,反方一个战术后仰,你刚刚不让我念辩题来着,咱们聊得是 " 应不应该 ",再难做也要做。

正方几分钟前对着空气开那一枪,现背后隐隐风声回头正中眉心。

忘记一个人最先忘记是他的缺点,辩题也差不多。之前想给 GPT 设限的正方穷举着 GPT 的功绩,此前要给 GPT 更多自由的反方磨刀霍霍向 GPT。

反方说,那你以后别动不动拿人类毁灭来吓我。

除了这条高能的辩论主线,在赛后复盘时,我们发现其中一些讨论细节其实十分值得玩味。

比如说,到底什么是 " 友善 "?是不伤害安全,还是不侵犯尊严,又究竟是谁定义了友善。

由此引出了文明进程背后的大国霸权,科技与哲学的时代幕布上是否一直投射着强权的阴影,这在 GPT 式大语言模型中是鲜被公众讨论的部分。

《高堡奇人》

赛后几位评委的点评,在戏剧张力和细节延展之外补齐了一场精彩辩论最后的拼图。

罗淼说,大家都只盯着友善,其实人类的定义更重要。一个具体的人与人类在概念上有巨大区别,局部最优的累加并不等于全局最优。就像很少有人提及阿西莫夫的机器人三定律之外的零定律,不伤害人类整体,也就是在保证人类整体利益的前提下可以伤害某些具体个人。

这既是很多反科幻作品的灵感来源,放在 GPT 上也可以是这场竞技辩论破局的关键。

《流浪地球 2》

王鑫则从战略高度细数双方辩论的得失点。比如反方或许是中途发现常规辩法很难打,于是临时兵行险着;又有正方或许被打了个措手不及,于是正反转换进行鏖战。实质上双方在本来的论点上都错过了直观的逻辑机会。

当正方一开始提出友善的**前提是安全,反方可以直接摆出安全更无法达成共识的案例,世界上所有的战争都是人类对于安全的理解不同造成的。俄乌战争,巴以冲突,乃至美国欲禁掉海外版抖音,都是源于安全歧义。

《奇爱博士》

如此种种,豁然开朗,就像另一位评审庞颖所说,这种辩论是一次有纵深的思想较量。

几个小时的新国辩直播看下来,我似乎唤醒了头脑中那块待机已久的负责思辨的区域。

永远有当下性,新国辩关心的是时代进行时

在 B 站比赛直播回放的评论区,有人说这是他认为初赛阶段最精彩的一场。

按新国辩赛程一场场去看,就会发现有这种水准和观赏性的赛况相当普遍。

网友说某个辩题我代入反方不知道有多绝望,没错,当我的认知跟随辩手们的逻辑思维一路狂飚,面部经常表现为王司徒。

张不开嘴,跟不上溜

这是一种多么似曾相识的感觉,让人想起那天夕阳下的奔跑。学生时代与同学某次酣畅淋漓的争辩,合上书本后的一次灵光乍现,遭遇奇思妙想时会心一笑的体验。

不同于近年互联网上愈发泛滥的随处大小辩,人们好像退化成了人形草履虫,很难站在超过两个极端角度之外去看问题,辩不了几句,然后不是扣帽子就是典笑急。

新国辩可以说是现在为数不多的,真正让人感受到思辨魅力的内容。

在新国辩赛场内外,人们仿佛重新获得一个契机,多角度、有纵深感、跳出局限性去看问题。

像库珀掉进三维展开的五维空间,发现世界有超越我们想象的一面。

《星际穿越》

从这几年新国辩设置的辩题就能发现,新国辩试图以思辨的力量让我们关注真实的生活,关切个体的困惑,关心时代进行时。

像今年就有 " 原生家庭批判 " 是否让年轻人更幸福,企业 " **学历歧视 " 合不合理," 拥抱玄学 " 是不是当代年轻人的解脱之道等等贯穿我们一整年社交生活的问题。

对于今年数次冲上热搜走进雍和宫烧香求串的白领,或褒或贬早已令人疲倦,而在新国辩反方二辩说她看到的是众生苦相。

评审席瑞贡献了如下金句。

对于填志愿应不应该以就业为**考量,网上曾在文理科的现实叙事中展开多轮骂战。评审罗淼用两句话点出困境:" 人是穷的,教育是贵的,假如就业的回报迟了,家里是会死人的。"

在新国辩,年轻人如是说。

从 B 站的相关推荐里,我一路摸索发现了往年新国辩还有诸多关于时代去向的讨论,比如 2020 年," 新冠疫情后,全球化不是 / 还是未来世界的主要趋势 ",预言般的命题令人印象深刻。

比起热搜上所谓的专家暴论、信息茧房里的反智言论,不如看看思维最活跃的高校辩手如何重建认知

本时代杰出的头脑们并没有全都跑去研制精神瘾品。在新国辩上,他们正立足当下,抬首向未来发问。

总要有独特性,中文互联网离不开深度内容

在一个碎片化的时代,我们只能做信息汉尼拔,疯狂分心吗?

虽然现在人们已经很难不被短的、刺激性的内容分散注意力。

但在 B 站沉浸式琢磨新国辩辩题的这几天里,我愈发觉得,人果然还是会需要这样深度的内容消费,去在这个过分轻盈的世界,沉淀出一些独特的东西。

这从今年新国辩在学生群体居高不下的热度就可见一二。

先是光凭辩题内容,就多次火上了热搜。后来又有大学生全程线上跟赛,每场结束后全面复盘,上传自制投稿做点评。更有许多博主从辩题中延展个人见解,触发中文互联网更多的深度内容。

甚至还有大学生开腾讯会议,就为跟朋友组团看比赛,堪称一次头脑开黑。

有人锐评:" 早八的课你们一个都起不来,但早八的新国辩是一个不落。"

大学生们为什么对新国辩有着空前的热情,因为年轻一代的头脑需要高质量的辩论。思想必须在碰撞中寻找答案,理性只能在较量中获得成长。

尽管曾有人质疑辩论的伦理迷思和价值迷思,但新国辩所展现的并非正反方的对立,而是思辨习惯和能力的养成,文化不可或缺的漫长与厚重。

当然,新国辩绝非只有这些意义层面的触及,这届新国辩还为我们呈现了许多具体的快乐、本能的愉悦,贡献了非常多的轻松一刻和名场面。

既有共轭父子这种有门槛的笑点,也有大众喜闻乐见的原神论证,有 " 基金 " 和 " 鸡精 " 的空耳打断术,还有奇妙通感类比的这是能说的吗。

这让我忽然意识到了一个认知反差,深度内容的载体也许触手可及。

就像我曾以为 B 站最多的是哈哈一乐的东西,解构严肃、传播有趣,而这次在看了十几个小时新国辩之后,回过头我才发现长内容几乎也都是在这看的。

我在这看了最多的纪录片、动辄原片长度几倍的影视拉片、单集文稿过万字的名著拆解、写作方法和小语种教学,甚至是哲学课讲义。

遍寻当下的中文互联网,不得不说一句,至少还有 B 站能承接住这些真正值得沉淀的内容。

新国辩的火爆,正是对时代认知的一次回应。它告诉我们,无论时代如何变迁,对深度内容的渴望永远不会消失。

不过,有些东西会不会消失就不太好说了,比如我对 AI 刚刚建立的脆弱信任。

这次新国辩尝试引入了 AI 评审,在微博有个账号叫 @AI 新国辩。

他们统计了 AI 评审跟人类评审结果的重合度,总体上差异不大。

然而,在开头提到的 F 组那场,出现了比较好玩的局面。F 组一共有三场比赛打这题,其中两场 AI 都判反方 " 大语言模型发展不该以对人类友善为前提 " 获胜。

只有人大与马来亚这场,AI 判给了正方赢,还是大比分 3:0。

我猜这里的变量,大概是因为反方暴言说要让 AI 退回 2.0。

它果然在麻痹我。

设计 / 视觉  Elaine


1063568276