如果AI能做科研同行评审,那它就什么都能做了

充斥着被动句式的科学论文晦涩至极,即便是在人脑看来也很难理解。所描述的对象经常隐身于层层前述之后,被动句式在日常语言面前显得深奥难懂。语言学家将任何人类所写的东西称为“自然语言”,而自然语言在计算机科学家看来实在是一团乱麻。

“自然语言给AI带来的一大难题是其模糊性”纽约大学计算机科学家Ernest Davis说。斯坦福大学名誉计算机科学家Terry Winograd有一个经典的歧义例子:

市议会拒绝给示威者许可,因为他们(担心/主张)暴力。

(The city councilmen refused the demonstrators a permit because they [feared/advocated] violence.)

这句子你我都能看明白,动词“担心”暗示了“他们”指的是“市议会”而非示威者。我们轻而易举地明白:示威者“主张”暴力;市议会“担心”暴力。但是一个计算机大脑可是会在此花费经年累月的时间最终也还是搞不清楚到底哪个动词指向哪个代词。这种类型的歧义只是自然语言缠结的一个缩影,同形异义词和叙事逻辑将让AI更加困扰。

这还没涉及科学论文中的具体问题,比如将文本论点同数据模式进行连接等。即便在纯数学论文中这一需求也很常见。“从英语到数学中的形式逻辑不是我们可以自动化的。”Davis说。“这是最简单的工作之一。它是高度限制性的,而我们理解目标。”心理学等同数学比较远的学科更是如此。”在心理学论文中,我们几乎无法检查其论证的合理性。”Davis说。“我们不知道如何以计算机的方式来表达一个实验。”

当然,一个完全自动的AI同行评审不仅需要对人类有所了解,还必须对其进行深入思考。“当你考虑AI问题时,同行评审可能是最难的一部分。因为同行评审最重要的职责是确保研究是新颖的,没有重复前人老路。”沃伦说。计算机程序能够查阅文献,找出那些问题仍然悬而未决。但是它却可能无力辨认出颠覆性的科学新发现。

俄勒冈州立大学AI研究员Tom Dietterich说:“也许我么只是需要改变我们做科学出版的方式。不是将我们的研究用英语写成一个故事,而是将我们的意见和论据链接到一个正式化的结构中。比如一个涵盖人类在某主题下所有知识的数据库。”换句话说,将同行评审的程序电脑化,而不是其解决方案。在这一点上,人们所要重新编程的不是计算机,而是人类行为。

登陆|注册欢迎登陆本站,认识更多朋友,获得更多精彩内容推荐!