说到商业、金融,一般人想到的金融是期货、债券、基金,智能投资就会想到利用人工智能的方法预测投资市场走势,从而量化配置资产。对此,在日前由KDD China和通联数据合办的AI金融研习班上,微软亚洲研究院城市计算领域负责人郑宇博士表示,这个部分是可以做的,但是这个数据是三手数据,是一个结果。但市场更多应该关注,在此环节之前的一手数据、二手数据的结果带来的表现。
往前推一步,一般而言,投资会根据一家公司的财报进行业绩调研,预判股价,这算是对二手数据的利用。而郑宇指出,从业者还应该再往前多对一手数据进行分析,“一手数据其实决定了公司运营情况和财报,这个数据在我们现实生活之中。”
来自日常生活的数据带来的先知
关于人工智能的技术原理在此我们不必过多科普,雷锋网(公众号:雷锋网)此前已有相当详细的报道讲述,现在可直接从案例进行观察。以万科为例,要判断万科未来走势,除了看财报之外更往前看:拿的地是否都在增值?已建房产销售情况如何?周边配套是否越来越好、人气是不是越来越旺?租金是否在上涨?……“如果知道公司旗下产业都在增值,你可以预期未来财报比较好,可以更早地预判股价会上升。”反之可看空。
摩拜、滴滴的融资成果也是一样的道理。在这些企业尚未开始盈利的情况下,投资人是根据用户量、日活用户、有效历程等数据分析,对公司进行的价值预估。
反过来,如果真的在一手数据里面挖掘出可利用价值,那么久未必非要在股票上谋求利益点。根据从一手数据分析出来的信息,直接就可以计算商业利益和价值。
投资价值预判
仍是以商业地产为例,根据郑宇的研究,我们很难预测房地产价格,但是可以对房产相对价值进行评估和排序,以数据进行量化,找出高价值的房产——并非高价格,而是在同一个市场中,房产价格涨得比别人更快,而跌的时候会跌得更慢。
“比如说分成五个离散化等级之后,根据北京市2013年的数据观察一类房的分布,发现涨得最快、跌得最慢的一类房,并不是大家所理想当然地认为都应该在市中心。很可能隔两个街区一个是一类房、一个是五类房。为什么有这样的现象呢?房屋价值又是什么决定的呢?如果大家听过李嘉诚说过房地产价值怎么决定的,三个因素:地段、地段、地段。”
据雷锋网了解,郑宇的报告显示,如果用大数据量化,会有以下的结果:
第一个地段是周边的配套、交通、基础设施。周边有多少商尝学校、医院以及周边的地铁、公交、便利程度,这都是地段。第一个地段,同样是一个学校,好的学校、好的学区对房屋价值拉动比一个普通学校价值拉动要大。同样是一个商场,好的商尝精品商场,破旧不堪的商场对地段价值拉动也是不一样的。
第二个地段可以用好几个来量化,社交媒体对它的评价,以及人们的出行规律等非常重要——多少人打车进来、开车进来,什么时候进来,什么时候出去等等都反映了这个地段的价值。如果有两个区域,一个区域都是早上七八点坐公交地铁出去,晚上七八点坐公交地铁回来。另外一个区域出门的时间非常的自由和松散,不规律,多半以开车或者坐计程车出去的,觉得哪一个地方的品质更高一点?应该是后者。所以这需要以人们出行规律、公交地铁、出租,社交媒体等人文地理信息对此进行评价。
第三个地段是我们理解的商圈,如果房子在一个好的商圈里面对这个房子有带动作用的,但是还要考虑前面两个因素。
这里面我们会用到学习排序的方法来做。根据以上三个地段的数据变量,我们可以做一些回归算法,进行线性回归分析,但这个方法并不是很好,必然会有冗余性,有什么样的路网结构决定有什么样的交通流量。所以这里面变成一个学习排序,这是跟以前方法不一样的地方。