图:pixabay
原文来源:arxiv
作者:Tao Lei Yu Zhang
「机器人圈」编译:嗯~阿童木呀、多啦A亮
相信大家都知道,由于在并行化其状态计算时所存在的固有困难,循环神经网络的规模状态相对来说比较差。例如,直到ht-1的整个计算完成之后,ht的前向计算才开始执行,这就是并行计算村子的主要瓶颈问题。在这项工作中,我们提出了一种可替代的RNN实现方法,即故意简化状态计算并展现更多的并行性。而我们在此处所提出的循环单元的运行速度与卷积层一样快,甚至要比经cuDNN优化的LSTM快5至10倍。我们展示了该单元在广泛应用中所展现的有效性,包括分类,问答,语言建模,翻译以及语音识别。而我们将开源用PyTorch和CNTK1实现的代码资源。