深圳市康汇世纪科技有限公司
0755-82048877
  1. 首页 > 解决方案 > 行业解决方案

已到第一张图片了。

重新播放

已到最后一张图片了。

重新播放

GPU深度学习平台解决方案

作者:深圳康汇2020-12-28 11:42:43
支持键翻阅图片
|列表查看

GPU深度学习平台解决方案

互联网大数据和数据共享平台的发展,获得了海量的数据积累,也为深度学习的发展提供了强大的推动力。而由于深度学习的网络模型复杂、参数多、收敛困难和样本数量庞大等特点,对深度学习硬件系统的计算能力提出了更高的要求。曙光GPU深度学习平台解决方案从计算加速、存储系统、网络系统、作业调度系统、集群管理及软件框架等方面进行整体的设计和优化,帮助用户解决深度学习在训练过程中所面临的海量计算问题,简化构建深度学习平台的难度,降低业务投入成本,赋能用户深度学习研究。可广泛应用于图像识别、人脸识别、语音识别、自然语言处理等应用场景。

GPU深度学习平台解决方案(图1)

强大的计算能力

面向深度学习用户设计的曙光Xmachine ,具有高并行、高吞吐、低时延等特点,各场景下输出强大运算能力。

GPU深度学习平台解决方案(图2)

分布式存储架构

存储系统采用曙光ParaStor分布式存储,提供充足的I/O聚合带宽,存储系统稳定可靠、具有线性扩展能力。

GPU深度学习平台解决方案(图3)

容器化深度学习平台

容器化学习平台实现快速环境部署及作业指派,有效降低多应用程序安装、迁移复杂度。

GPU深度学习平台解决方案(图4)

强大的作业调度能力

兼顾AI和HPC环境,丰富的调度策略,灵活的调度资源,优化集群资源利用,使训练过程更加高效、弹性。

GPU深度学习平台解决方案(图1)

强大的计算能力

面向深度学习用户设计的曙光Xmachine ,具有高并行、高吞吐、低时延等特点,各场景下输出强大运算能力。

GPU深度学习平台解决方案(图2)

分布式存储架构

存储系统采用曙光ParaStor分布式存储,提供充足的I/O聚合带宽,存储系统稳定可靠、具有线性扩展能力。

GPU深度学习平台解决方案(图3)

容器化深度学习平台

容器化学习平台实现快速环境部署及作业指派,有效降低多应用程序安装、迁移复杂度。

GPU深度学习平台解决方案(图4)

强大的作业调度能力

兼顾AI和HPC环境,丰富的调度策略,灵活的调度资源,优化集群资源利用,使训练过程更加高效、弹性。

GPU深度学习平台解决方案(图1)

强大的计算能力

面向深度学习用户设计的曙光Xmachine ,具有高并行、高吞吐、低时延等特点,各场景下输出强大运算能力。

GPU深度学习平台解决方案(图2)

分布式存储架构

存储系统采用曙光ParaStor分布式存储,提供充足的I/O聚合带宽,存储系统稳定可靠、具有线性扩展能力。

GPU深度学习平台解决方案(图3)

容器化深度学习平台

容器化学习平台实现快速环境部署及作业指派,有效降低多应用程序安装、迁移复杂度。

GPU深度学习平台解决方案(图4)

强大的作业调度能力

兼顾AI和HPC环境,丰富的调度策略,灵活的调度资源,优化集群资源利用,使训练过程更加高效、弹性。

方案架构

GPU机器学习平台解决方案.jpg

曙光GPU深度学习平台计算系统采用曙光新一代 XMachine高性能GPU服务器组成大规模GPU训练、推理集群,输出强大算力;计算数据、日志log和模型数据等统一存储在曙光ParaStor300分布式并行存储中,能够实现全局文件的统一访问和并发读写;该系统支持Caffe/TensorFlow等多种主流深度学习框架、应用容器技术,提供数据集管理、模型管理、训练等服务。帮助用户解决多用户组资源分配、开发环境快速搭建、应用程序灵活迁移等技术需求。使用户在集群上轻松部署深度学习应用、跟踪试验和训练、发布模型,无需关心繁琐部署运维,专注于核心业务


GPU深度学习平台解决方案(图14)