2018深度学习硬件脱颖而出需哪些条件?
【资讯】随着Titan V的发布,现在进入了深度学习硬件的时代。目前尚不清楚NVIDIA能否在2018年保持其作为主要的深度学习硬件供应商的地位,而AMD和Intel Nervana将有望超越NVIDIA。那么,现在为什么才刚刚进入深度学习硬件的时代呢? NVIDIA认为,在出现大规模的竞争之前,需要兑现它的垄断地位。它需要现金才能在未来1 - 2年内使自己的地位更加牢固。Titan V的价格为3000美元,在Tensor内核中, Titan V有了一个新的亮点的深度学习特性,但同时,其成本、性能比是较差,这使得Titan V的吸引力较弱。 竞争对手是十分强大的,比如AMD的硬件,而NVIDIA的可以采取现金优势,这将有助于与AMD抗衡,以便可以看到非常便宜的NVIDIA显卡。只有在AMD能够推进良好软件的情况下,才会发生这种情况,如果AMD也动摇,NVIDIA的显卡将会保持昂贵。 除此之外,还有一个新的竞争者:神经网络处理器(NNP)形成了Intel 的Nervana。它具有几个独特的功能。这些新功能正是想要的CUDA开发人员。当想编写针对深度学习优化的CUDA内核时,NNP可以解决面临的大多数问题。这个芯片是第一个真正的深度学习芯片。 一般来说,对于1-chip和1-chip的排名,我们会看到Nervana> AMD> NVIDIA,因为NVIDIA必须同时服务于游戏/深度学习/高性能计算,而AMD只需要为游戏/深度服务学习,而Nervana可以专注于深度学习,而这是一个巨大的优势。设计的架构越集中,深度学习上的芯片就越少。 然而,赢家不是由纯粹的表现决定的,甚至不是纯粹的成本/表现。这是由成本/性能+社区+深度学习框架决定的。 接下来让我们仔细看看Nervana、AMD和NVIDIA的具体内容。 Nervana的神经网络处理器 Nervana的设计非常特别,主要是由于其大型可编程缓存(类似于CUDA共享内存),与GPU相比,每个芯片的尺寸是其10倍,每个计算单元的尺寸是GPU的50倍。有了这个将能够设计缓存中的算法和模型。这将加速至少一个数量级的推理,并且将能够轻松训练带有小型高速缓存深度学习模型(例如具有200个单元的多层LSTM)的千兆字节数据。这将使这个芯片对初创公司和大公司都非常有吸引力。由于Flexpoint的特殊数据类型,可以将更多数据存储在缓存/ RAM中,并且计算速度更快,从而产生更多的好处。所有这些都可能意味着比起现在的NVIDIA GPU来,每个人都可以加速10倍左右。但是,只有这样才可以克服主要的障碍:社区和软件。 对于普通用户和研究人员来说,这一切都取决于社区。没有社区,我们不会看到缓存中的算法。没有社区,不会看到好的软件框架,并且很难与芯片一起工作。每个人都想要使用扎实的深度学习框架。软件在硬件之前。如果Nervana只运行芯片,并没有有效地推动软件和社区,那么它就会输给AMD和NVIDIA。 社区和软件问题与价格紧密相关。如果价格太高,学生们不能负担得起NNP,那么社区的表现就不会太好。仅仅为工业提供服务,你就无法获得健壮的社区。虽然工业是硬件公司的主要收入来源,但学生是社区的主要驱动力。所以如果价格合适,学生可以负担得起,那么社区和软件就会随之而来。 任何超过3000美元的东西都不行,通常2000元以上的任何东西是至关重要的,并且需要特殊的折扣让学生创建一个强大的社区。一个价格为2000美元的NNP将是可控的,并且能够被采用。低于1500美元的任何东西都将使Nervana成为至少2 - 3年的市场领导者。一个价值1000美元的NNP会让NVIDIA和AMD之间的竞争变得非常艰难,软件在这里甚至不是一个问题,它会自动跟踪产生。 对于平常的消费者来说,不仅价格是重要的,而且社区是如何处理也很重要。如果我们没有看到英特尔立即向社区注入资源来启动一个坚实的软件机器,那么NNP很可能会停滞不前。不幸的是,英特尔在社区管理不善方面有着悠久的历史。 总之,如果Nervana的NNP价格低于2000美元,并且在发布之后的前几个月内能看到强大的社区和软件开发,我们将看到Nervana的NNP将成为一个明显的赢家。以更高的价格和更少的社区支持,NNP将会很强大,但是在成本/性能和便利性方面可能无法超越其他解决方案。如果软件和社区的努力失败,或者如果NNP的价格是4000美元,它可能会失败。 2000美元以上的价格要求NNP的学生有可观的折扣。 AMD:便宜又强大 AMD的显卡具有不可思议的力量。 Vega Frontier Edition系列显然与NVIDIA的同类产品不相上下,而从Volta和Pascal的不偏不倚的基准来看,如果液态冷却的话,Vega Frontier与Titan V相比将会更好。请注意,Vega是基于一个旧架构,而Titan V是全新的。将于2018年第三季度发布的全新AMD架构将进一步提升性能。 AMD希望通过从32位浮点数转换到16位浮点数来提升深度学习硬件。这是一个非常简单而强大的策略。这些芯片对于高性能计算不会有用,但是对于游戏玩家和深度学习社区来说,这些芯片是稳的,因为16位浮点运算非常简单,开发成本也会很低。 问题是软件。即使你有这个强大的AMD GPU,你也几乎不能使用它,因为没有一个主要的框架支持AMD GPU。 AMD在软件的不确定状态中处于边缘状态,甚至希望放弃OpenCL for HIP,但目前他们仍然在官方的推动和支持OpenCL道路。如果他们推出HIP,并且如果他们在未来9个月内在市场上投放了一些好的深度学习软件(不仅包括用于卷积和矩阵乘法的库,还有完整的深度学习框架,例如HIP对PyTorch的支持)他们在2018年第三季度的新GPU就有可能拆除所有竞争对手。 所以总的来说,如果AMD在软件方面得到一致的话,它可能成为主流的深度学习硬件解决方案。 NVIDIA:Titan NVIDIA的立场是坚实的,有好的软件、好的工具、他们的硬件、社区很好的集成在一起。 它的主要问题是,他们必须服务于多个社区:高性能计算人员、深度学习人员和玩家,这对他们的硬件来说是一个巨大的压力。设计这些社区定制的芯片代价昂贵,NVIDIA的战略目前正在设计一种适合所有人的架构。 (编辑:好传媒网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |