说句好话:gpu驱动的填字游戏对人类的表现最好

通过 布莱恩·考尔菲德

"视频处理芯片"的三个字母缩写是什么?当然是GPU。然而,谁知道这些并行处理的强大力量也能处理文字呢?

继计算机在1997年的国际象棋、2016年的围棋和2019年的德州扑克等其他游戏中取得一系列胜利之后,一个由gpu驱动的人工智能在每周日报纸的主要内容填字游戏中击败了世界上一些最具竞争力的文字书呆子。

马特·金斯伯格(Matt Ginsberg)是一位连续创业家、人工智能研究先驱和前研究教授,他创造的填字游戏人工智能Dr.Fill在上个月的美国填字游戏锦标赛上得分高于任何人类。

菲尔博士与1300多名填字游戏爱好者进行了十年的年度比赛。

金斯伯格解释说,这种竞争性的游戏可以测试计算机思维的极限,并帮助研究人员更好地理解人类的思维方式。他说道:“游戏是一个很棒的环境。

Dr.Fill边缘?加州大学伯克利分校的自然语言处理团队开发了一个复杂的神经网络——在NVIDIA DGX-1系统上训练了几天,并部署在配备了一对NVIDIA GeForce RTX 2080 Ti gpu的PC上——直接嵌入到金斯伯格多年来一直在改进的系统中。

文字的一种方式:一对NVIDIA RTX 2080 Tis为加州大学伯克利分校自然语言处理团队开发的复杂神经网络提供了动力。

“填字游戏需要你与语言进行创造性的多跳横向连接,”自然语言处理团队的负责人丹·克莱因教授说。“我认为这将是一个很好的测试,看看我们在这个领域创造的技术如何处理这种创造性的语言使用。”

考虑到这种非结构化的特性,计算机能够与之竞争实在令人惊讶。可以肯定的是,Dr.Fill并不一定是最好的,这不仅仅是因为美国填字游戏锦标赛的官方冠军只保留给人类。

比赛的组织者,《纽约时报》谜题编辑Will Shortz指出,Dr.Fill最大的优势是速度:它可以在瞬间填写人类必须输入的答案。然而,单从准确性来判断,Dr.Fill仍然不是最好的,他在比赛中犯了三次错误,比几位人类选手还糟糕。

肖特兹承认,尽管如此,Dr.Fill在挑战中的表现还是非常出色的。与象棋或围棋等更结构化的游戏不同,Dr.Fill在挑战中非常依赖现实世界的知识和文字游戏。

肖特兹说:“他们给计算机编程来解决填字游戏,尤其是一些棘手的难题,这真是太神奇了。”

文字之道

金斯伯格拥有牛津大学数学博士学位,拥有100篇技术论文,14项专利和多本著作,自45年前上大学以来,他一直是填字游戏迷。

但十多年前,当他参加一场比赛却没有获胜时,他的痴迷开始起飞。

金斯伯格说:“其他竞争对手都比我强得多,这让我很恼火,所以我想,‘好吧,我应该写一个程序,’于是我开始了Dr.Fill。”

由Shortz组织的美国填字游戏锦标赛挤满了熟悉单词的人。

Dr.Fill在2012年的比赛中首次亮相。尽管期望值很高,但Dr.Fill在600名参赛者中仅排名141。Dr.Fill直到今年才进入前10名。

在某种程度上,这是因为填字游戏并没有吸引到那种资金雄厚的努力,从而在国际象棋和围棋方面击败了最优秀的人类。

部分原因是填字游戏是独特的。金斯伯格说:“在围棋、国际象棋和跳棋中,规则非常明确。“填字游戏非常有趣。”

纵横字谜通常依赖于神秘的线索,这需要深厚的文化知识和广泛的词汇量,以及在每个谜题重叠的行和列中找到最佳答案的能力。

“这是一件混乱的事情,”肖特说。“它不像国际象棋或拼字游戏(Scrabble)那样纯粹的逻辑,你有一个单词列表,每个单词都值很多分。”

纵横字谜通常依赖于神秘的线索,需要深厚的文化知识和广泛的词汇量。

成功的组合

改变吗?来自自然语言处理团队的帮助。在他的努力的鼓舞下,团队在比赛开始前一个月联系了金斯伯格。

事实证明,这是一个成功的组合。

伯克利的研究小组专注于理解每个谜题的线索,并寻找潜在的答案。克莱因的团队由三名研究生和两名本科生组成,他们收集了金斯伯格收集的600多万份纵横字谜线索和答案,并将它们倒入一个复杂的神经网络中。

金斯伯格的软件经过了多年的改进,然后处理了对符合每个谜题网格范围的所有答案进行排序的任务,并将它们与其他答案的重叠字母组合在一起——这是一个经典的约束满足问题。

虽然他们的系统依赖于非常不同的技术,但他们都说的是概率的共同语言。结果,它们几乎完美地结合在一起。

克莱因说:“我们很快意识到,我们有非常互补的拼图。”

克莱因说,总的来说,他们的模型与人们的一些思维方式相似。人类做出决定的方式要么是记住过去的成功经验,要么是使用一个模型来模拟未来可能的成功经验。

克莱因说:“当我看到系统两者兼而有之时,我很兴奋。”

结合这两种方法的结果:Dr.Fill几乎完美地发挥了作用。

人工智能在比赛中只犯了3个错误。然而,它最大的优势是速度。它在一分钟内解决了大部分的谜题。

AI霸权毫无保证

但与国际象棋或围棋不同,填字游戏是不断变化的,所以不能保证再出现这样的节目。

Shortz说:“施工人员很可能会抛出一些难题。”

金斯伯格表示,他已经在努力改进Dr.Fill。“看谁进步更大。”

结果可能会出现比以往任何时候都更吸引人的填字游戏。

克莱因说:“事实证明,那些能难倒电脑的东西真的很有创意。”