集智科学家张江解析:为什么复杂性需要深度学习?

  具体的,让我们考虑这样一种所谓的图分类问题(Graph classification problem)。如果我给你一张网络,没有任何其它辅助信息,你能不能告诉我它属于哪一类?是社交网络还是生物网络?是无标度网还是小世界网?这个问题有什么实际背景呢?我们知道,复杂网络可以看做是复杂系统的骨架(backbone),那么当我们处理不同的复杂系统时,我们便可以通过它们的骨架来进行识别、分类和预测。比如,我们可以将一个社群的社交网络看做社群的骨架,那么我们就能否根据它预测网络的运行状况;再比如,如果将一个国家的投入产出网看做是国家经济系统的骨架,那么我们就能给国家的产业结构进行“诊脉”。

  这些问题的背后需要一种新的突破,它在5年前刚刚开始萌芽,这就是图卷积神经网络技术(Graph convolutional neural network,GNN)11。该套技术通过扩展基于图像的卷积神经网络(Convolutional neural network,CNN),来处理大量的网络数据。并有可能达到和CNN同等的精确程度。

物联网

  GNN模型的架构,类似于图像处理中的CNN,GNN可以对一个网络进行卷积操作,并做粗粒化,从而实现多层信号处理,摘自文献12

  在很多文献中,人们不仅用CNN来识别图像,更多的是用它来提取图片中物体的特征。例如在前面讲述的用卫星遥感图像预测贫困的工作中,研究者用CNN的最主要目的是提取出图像中屋顶、道路等特征。有了这些机器自动学习得到的特征之后,我们便可以将学好的网络用于各种领域。例如,我们可以将CNN和LSTM结合,从而实现 “看图说话”;将CNN配上强大的强化学习,就能实现让计算机和人类一样看着视频打游戏;将CNN配上强大的蒙特卡洛搜索,就能实现战胜人类大师的AlphaGo。

  与此类似,一旦GNN技术实现突破,那么我们就真的可以通过网络来对宏观复杂系统进行诊脉。城市的规划很糟糕吗?让我们利用GNN扫描一下城市的道路网络,就能给城市规划打分;美国和中国的金融市场哪一个更容易崩盘?让GNN扫描一下它们各自的股票相关网络就能给出答案;今天Facebook的心情如何?让GNN扫描一下社交网络就能给出类似这样的描述:“今天的Facebook心情很糟,因为微信又挖走了五千万用户……囧”。

  展望

  复杂系统需要深度学习吗?我的回答当然是需要。这是因为深度学习可以自动化提取对象中的隐藏特征,这将结束几十年来复杂性科学家手工发明特征指标的历史。人类的智慧虽然闪烁着灵光,但面对庞大的数据,人工智能还是更胜一筹。一旦GNN、网络嵌入等技术获得突破,所有的特征发现就全部变成了自动化流水线,我们便可以站在一个更高的层次来理解复杂系统。

  深度学习在图像领域中的大量突破告诉我们,一旦机器可以学会自动提取特征,我们就可以以一种人类难以想象的精准度来进行预测和识别。例如,现在深度学习在人脸识别的准确率已经高达99%了,而人类的准确率也仅仅只有97%。所以,在未来,精确地认识、调控复杂系统并非完全不可能。

  而更有意思的是,当我们把深度学习和传统技术,包括多主体模拟、系统动力学相结合,就可能实现对复杂系统的自动建模。我们可以设想这样一种机器,你只要不断地喂给它大量的数据,它就有可能自动吐出来一个多主体模型,并告诉你精确调控系统的方案。如果能实现这一步的话,人工智能就真的可以管理社会了。

  然而,反对论者批评深度学习是一个黑箱模型:尽管它可以很好地工作,但我们人类仍然无法理解。这就好像中医看病,完全凭借老医师的个人经验和感悟,无法给你一套符合西医科学标准的解释。但是,也许复杂系统就需要这种中医式的思维方式。因为就像小蚂蚁无法理解蚁群的行为一样,超级复杂的相互作用关系也许压根就不是我们人脑智慧可以处理得了的。我们只能借助更加强大的机器来应付超大规模的复杂性。

  反过来讲,复杂性科学也可以帮助我们更好地理解深度学习模型。例如,最近的一批物理学家就在尝试用变分重整化群(Variational renormalization group)的方法来理解深度学习网络13,每增加一层神经元节点就是在对原问题进行更高层次的粗粒化。所以,层次的加深有助于我们从更高的尺度去把握数据中的规律。