谷歌开源大规模语言建模库，10亿+数据，探索RNN极限_大数据_计算头条_中国计算网——工业互联网一站式服务平台—

出于这一目的，我们把自己的模型和训练内容进行开源。

我们聚焦在一个著名的大型LM 基准：One Billion Word Benchmark 数据集。这一数据集比PTB要大很多，同时挑战也多很多。与计算机视觉领域的Imagenet类似，我们认为，在大型数据集上研究，并且在清晰的基准上进行建模将能提上语言建模。

我们工作的贡献主要有以下几个：

在论文的第二部分，我们将会对语言建模中的重要概念和前人研究进行综述。第三部分，我们会提出对神经语言建模这一领域的贡献，重点在大规模递归神经网络的训练。第4和第5部分的目的是尽可能地描述我们的经验和对项目的理解，同时把我们的工作与其他相关的研究方法进行对比。

评价及讨论

Reddit、HN 和 Twitter 上的反响都挺好，不过也有人指出了这项研究的一些缺点。根据 shortscience.org 上的留言；