国美云运维自动化实践

图 15 资源使用率APP

5. 结尾

以上是这些年我在运维自动化方面的一些实践和思考。除了上面介绍到的,我还在监控系统、发布系统、kubernetes等很多产品上有一些经验。另外这两年比较火的人工智,我们也尝试和运维做结合,实现AIOPS,比如磁盘故障预测,根据大量磁盘的历史监控数据进行学习,对现有的磁盘进行故障预测,并能做一些简单的修复工作,我们已经尝试在做。再比如,在流量调度方面也可以通过机器学习达到提前调度。由于篇幅有限,这里就不一一赘述,后续有机会还希望和大家做做分享交流。

整体而言随着互联网的不断发展,运维开发人员也要不断用新技术武装自己,技术不论好坏,只要是适合公司业务的,能提升公司效率,就值得我们去深究,另外运维开发人员应该更多的去了解业务,这样才有利于做出更多助力业务快速发展的产品。

作者简介:闫振凯,目前就职国美云,担任平台开发经理,曾就职阿里云、平安。互联网运维开发老兵。