2020年深度学习框架对比速读
有TensorFlow的“宏大蓝图”在前,PyTorch能如此快速崛起,主要原因在于:支持动态计算图,提供了很好的灵活性;易用性强,近乎傻瓜式操作非常亲民;有非常详尽清晰的官方教程,吸引了大量开发者和研究人员,社区迅速壮大。目前许多新发表的论文都采用PyTorch作为论文实现的工具。如果你是一名科研工作者,PyTorch或许会是你的首选。 优势归因: 简洁。PyTorch在设计上更直观,追求尽量少的封装,建模过程透明,代码易于理解; 易用。应用十分灵活,接口沿用Torch,契合用户思维,尽可能地让用户实现“所思即所得”,不过多顾虑框架本身的束缚; 社区。提供完整的文档和指南,用户可以通过全面的教程完成从入门到进阶,有疑问也可以在社区中获得各种及时交流的机会。 踩坑预警: 生产环境部署仍存在大问题。PyTorch能在学界一枝独秀,主要是因为“研究”更注重快速实现、验证自己的想法,而不太注重部署的问题,一般“怎么快怎么来”。但在业界,部署的快速和稳定是必要的。否则做实验时节省下来的时间,都要在生产上线时加倍还回去。 小结:PyTorch的易用性是毋庸置疑的“王牌”。越来越多的人因为这一点开始学习PyTorch,不过其在工业界的部署问题也不容回避。显然,当你充分了解到这些利弊时,就应该明白这些深度学习框架都是工具,学的越多,可选择的余地越大。 官方网站:https://pytorch.org/ 国内深度学习框架自研之路 2020年上半年,华为Mindspore、旷视MegEngine、腾讯TNN、清华Jittor等数个国产AI框架渐次宣布开源,讨论的热度一直在持续。最近一流科技的OneFlow又首创性地引入Actor模型和SBP机制,以其独特设计引起关注。很多人也开始思考:在已有成熟的开源深度学习框架并拥有完整生态的情况下,中国企业和机构是否有必要再另造一套框架?自研深度学习框架的创新空间又有多大? 近几年,基础技术的“卡脖子”问题逐渐浮出水面。不久前美国政府发布的“芯片禁令”将华为逼到了非常被动的境地。前事不忘后事之师,中国要想发展好新一代的人工智能,通过自主研发来掌握AI底层技术无疑是未雨绸缪的重要举措。因此自研深度学习框架是非常必要的。不过局中人也都知道要超越那些已有的成熟的框架也是很难的,那么出路何在? 虽然很多人认为深度学习框架的融合是时之所趋势,TensorFlow2.0和PyTorch也的确是越来越像了,但实际上深度学习框架的市场是很大的,用户需求也是多样的,这就注定不可能由某个企业、某个产品垄断。就像TensorFlow也曾一家独大,但PyTorch横空出世后迅速形成两强对峙的局面,关键就在于两者设计初衷的差异。TensorFlow面向工业界,侧重推理,在部署上实现了工业级的稳定;PyTorch面向学术界,侧重训练,足够简单易用,能达成快速实现和验证。最终两者在各自面向的领域都确立了王者地位。 差异化可能将是深度学习框架自研之路上的制胜关键。单纯依靠模仿的框架肯定是没有出路的,如何与现存的成熟的深度学习框架区别开来进而打造自身亮点是众多开发团队所要考虑的。PaddlePaddle模型库丰富,MegEngine追求训练推理一体化,Mindspore深耕自动并行的训练能力,OneFlow专注分布式环境下的性能提升……相比“一枝独秀”,“百花齐放”无疑更有利于国内深度学习框架的长足发展。 【结语】深度学习框架作为AI底层工具,对个人而言是进入深度学习世界的一把钥匙,掌握深度学习框架并不等于理解了深度学习,要在AI开发中有所作为,关键还是要真正理解框架背后的技术、实践和生态。
(编辑:好传媒网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |