Google云端机器学习和Tensor Flow的Alpha测试版本发布

上个月末,Google发布了alpha版本的TensorFlow(TF)集成云端机器学习服务,为回应不断增长的大规模在Google云端平台(GCP)运行Tensor Flow库的需要。

Google描述了一些有关建立TF使用规模的新功能,其中集成了一些GCP的模块,例如Dataproc,是一个托管的Hadoop和Spark服务。开源机器学习系统TF和GCP的集成“使用户能够在托管的云服务上运行自定义的分布式学习算法”,作为发布的一部分,并与大数据和分析平台以及机器学习领域紧密地结合起来。

PaaS将TF和若干预先为语言翻译、图片与语音辨识训练的模型连接起来。TF服务现在集成了Kubernets以利用它的负载平衡器和Docker的pod编制语义来“有规模地训练成千上万的内核”。这个例子通过复制包装过的TF资源记下了运行一个训练过的Inception-v3模型的过程,包括TF基于服务的gRPC服务器和跨pod模型属性,以及在一个集群过程中“超过2700万的参数和每次推理进行的57亿浮点运算”。

Docker集成进一步支持了新模型作为持续训练管道的版本打包和部署,这是一个TF服务目标在今年早些时候公布的。一个为展示和学习的TF和Kubernetes教程允许用户再现一个基于Inception的TF和Kubernetes管道。

这次通告还提及了Apache Beam,这是一个新的数据处理管道项目方案,它可以潜在地满足一定规模的TF对传递学习数据集的管道需要,提供了批处理和流处理选项,同时也兼容Spark、Flink和基于Dataflow的系统。Google提供了与紧密耦合的ML系统相关的分析,根据可维护性和随着时间而产生的技术债而来,其中的技术债可能会指向ML更远的标准化可能性和通过观看TF贯穿于GCP中渐增的普遍性。

查看英文原文:Google Cloud Machine Learning and Tensor Flow Alpha Release