当我看到AI玩宝可梦时:技术与怀旧的奇妙交织

回想一下GBA游戏的黄金时代 - 你在深夜宿舍的台灯下,黑白屏幕的微光照亮你疲惫又兴奋的脸,不知不觉又打通了一个道馆,明明说好只玩十分钟的… 只是现在你已经不记得到底这款游戏的名字应该是宝可梦、口袋妖怪、神奇宝贝还是宠物小精灵了…

而现在:一个AI正在玩着同样的游戏,也在挑战同样的道馆,甚至给自己的杰尼龟起了个拼写错误但意外可爱的名字”TSUNMAI!”(大概是想拼tsunami/海啸来反映水系宝可梦的特性,但是AI也会有“手抖”拼写错误的时候?)。

当我在社交媒体上看到Google CEO Sundar Pichai宣布旗下的最强AI - Gemini 2.5 Pro成功通关《宝可梦蓝》的消息时,内心泛起的不仅是对技术的惊叹,更是一种奇特的情感混合物- 我们当年玩的游戏,现在竟然成了评估顶尖AI能力的标杆?

这不能不说是条神奇的时间线…

AI转战宝可梦:不只是”玩游戏”那么简单

2025年的AI世界有了两位新晋宝可梦训练师:Google的Gemini 2.5 Pro模型和Anthropic的Claude 3.7 Sonnet模型。

Gemini已经成功挑战联盟,用一只166级的妙蛙花击败了冠军216级的水箭龟(这么看AI也喜欢练级?)。而Claude则刚刚在关东地区小有成就,已经获得了两枚徽章,正朝着成为宝可梦大师的路上稳步前进。

虽然你可能会想:”能打通这款游戏很难嘛?”

但这恰恰是重点所在。对于AI来说,宝可梦游戏作为一款宠物养成对战RPG游戏,是个极具挑战性的目标 – 它不是规则明确的国际象棋/围棋,而是一个开放世界,充满了随机遭遇、复杂的对战系统(属性相克、招式组合)、道具管理、非线性探索路径(寻找隐藏物品、解决谜题)… AI需要同时处理短期战术(该用什么招式对战)和长期战略(如何培养精灵队伍、探索哪条路线)。

更不用说,AI必须理解游戏中模糊的人类语言指示和隐含的文化知识。要知道,即使是已经很聪明的Claude 3.5版本都会在游戏中做出令人啼笑皆非的行为,比如不停地尝试逃离必须进行的战斗,或者在城市中迷路打转。

“它是怎么做到的?” - AI训练师的秘密武器

如果你好奇这些AI是如何玩转宝可梦的,这里有个简单解释:

Claude 3.7 Sonnet采用了所谓的”延展思考模式” - 这有点像我们人类在面对复杂问题时会先停下来,深呼吸,然后系统地思考。AI不再仅仅给出瞬时反应,而是会分配更多”思考时间”来规划未来行动,记住游戏目标,甚至学习从失败中吸取教训。

就像一个有经验的宝可梦玩家和一个新手的区别:新手可能看到草丛就冲,而老玩家会先检查队伍状态,考虑是否需要先去补给中心。Claude就是在学习成为那个”老玩家”。

至于Gemini和其他AI项目,它们大多采用了强化学习/RL的方法 - 简单来说,就是通过大量的尝试与错误来学习。例如名为Peter Whidden的软件工程师训练了一个AI专门玩《宝可梦红》超过50,000小时(相当于人类玩了5年不睡觉!)。通过不断尝试不同策略并从结果中学习,AI逐渐掌握了游戏的窍门。

这些技术听起来很高深,但其实和我们学习打游戏的过程惊人地相似 - 都是从菜鸟开始,通过反复实践和总结经验,最终成为大师。区别在于,AI的”菜鸟阶段”可以压缩成几天或几周,而且它永远不会因为熬夜打游戏而第二天上课打瞌睡。

此外,视觉工具(用于”看到”游戏屏幕)、功能调用(用于模拟按钮按压)和知识库(用于存储笔记)等辅助工具使得持续游戏成为可能。上面所有这些技术共同构成了 AI 玩宝可梦的基础架构。

“AI本应该取代我的工作,而不是我的游戏!”

当Sundar Pichai在社交媒体上分享Gemini的宝可梦通关成就时,下面一位用户的这条评论得到大量点赞。因为其完美捕捉了大家对AI玩宝可梦的复杂情绪 - 既有对技术进步的惊叹,又有一丝玩笑式的”领地被入侵”的感觉。

纵观各大社交媒体上大家的反应,我发现形成了这么几个有趣的阵营:

🔍技术爱好者:他们深入分析训练方法,讨论为什么真实的宝可梦游戏比简化版的对战模拟器更具挑战性,甚至尝试复制这些实验;

🕹️怀旧玩家:像我一样,他们被带回了童年的记忆 - 那个交换连接线、分享攻略秘籍、为了捕捉稀有精灵熬夜的年代。看到AI玩着同样的游戏,产生了一种奇特的跨时代连结感;

🤔哲学思考者:他们挑战的是更深层次的问题 - 当AI开始玩我们的游戏,理解并享受我们的文化产物,人类独特性的边界在哪里?

最有趣的是,Claude在Twitch(海外知名游戏直播平台)上的直播吸引了一群热情的观众,他们会为AI的每一个小进步欢呼,为它的失误感到焦虑,甚至对它给宝可梦起的名字产生情感连接 - “TSUNMAI!”这个拼写错误的名字成了粉丝们的爱称。

在2014年曾经出现过一次”Twitch Plays Pokémon”的现象 - 当时数千名观众集体控制一个宝可梦角色,创造了混乱又神奇的游戏体验和丰富的社区文化。而现在,我们似乎正在见证”AI Plays Pokémon”的新时代,只是这次的操作者是算法而非人类集体。

从关东地区到现实世界

宝可梦游戏提供了一个很独特的复杂性测试场 – 这个挑战一方面不像井字棋那么简单,另一方面又不像现实世界那么难以捉摸。在这个环境中,AI需要处理不确定性、长期规划和多目标优化 - 这些能力恰恰是现实世界任务所必需的。

延展一下思考的话,一个能够在宝可梦世界中导航的AI,或许有朝一日能帮助自动驾驶汽车在复杂的城市环境中行驶,或协助医生制定综合治疗计划,甚至帮助科学家处理气候模型中的复杂变量关系?

但在技术意义之外,AI玩宝可梦可能还有一层文化意义 - 它标志着AI不再仅仅是解决实际问题的工具,而是开始进入我们的文化空间,开始能成为我们集体记忆和共享体验的参与者。

写在最后

回到我深夜宿舍在GBA上打宝可梦的记忆。那时的我绝不会想到,二十年后,我会看着一个AI挑战同样的道馆,面对同样的选择 - “皮卡丘,使用十万伏特!”

无论如何,当我看到那只名为’TSUNMAI!’的杰尼龟在关东地区冒险时,我忍不住想:或许AI理解了游戏的规则,但它能体会到我们当年熬夜打游戏时的那份纯粹快乐吗?