高性能计算（CPU/GPU）解决方案应用班预约报名-活动-活动行

活动内容收起 展开

随着人工智能AI、大数据Big Data、云计算Cloud Computing等计算机科学技术的发展和应用的普及，深度学习DL和人工智能AI成为当下最炙手可热的技术趋势，将成为技术行业基础设施的核心组成部分。GPU的价值不止体现在深度学习，在高性能计算、物联网、人工智能、生物信息、分子模拟、计算化学、材料力学、系统仿真、流体力学、机械设计、生物制药、航空动力、地质勘探、气候模拟等领域，算法越来越复杂，需要处理的海量数据越来越巨大，高性能计算能力就显得尤为重要。如今，乎所有的深度学习(机器学习)研究者都在使用GPU进行相关的研究，NVIDIA针对深度学习的计算，有一套完整的解决方案，cuDNN已经成为主流深度学习框架调用的深度学习GPU函数库，包含完整的矩阵乘法和卷积计算的实现。因此我单位举办“高性能计算（CPU/GPU）解决方案应用班”,具体由北京中科软培科技有限公司举办，本次培训班由权威师资主讲。

一、培训目的：

现有硬件资源最大化利用，提供多种并行优化方案组合策略,提高并行程序设计与开发水平，熟悉常见的并行计算模式,了解深度学习的主流GPU加速解决方案；实际体验高性能计算环境，能够应对主流的超算环境；提供符合自身特点的工程计算解决方案，了解高性能计算和深度学习应用场景

二、主讲专家：

刘老师 中科院系统，研究领域：高性能计算，并行编程，生物医学图像处理。多年MPI/OpenMP/CUDA/OpenCL/OpenACC优化加速经验，

高性能计算——并行计算基础

1、并行计算的应用场景和实际意义（战略、经济和成本）；

2、并行计算机体系结构：处理器、内存和互连网，常用的并行计算机系统；

3、性能分析模型：如何测量并行性能和扩展性；

4、 CPU/GPU体系结构对比介绍：流水线、多核、缓存、访存、通信模型、分支预测等；

基本的MPI编程技术

1、 MPI编程基本概念：

2、基本编程语句

3、主要点到点通信函数：

① 阻塞通信

② 非阻塞通信

上机实操：

1、两个进程间相互传递并打印消息

2、用不同方法实现结点间的循环消息传递（阻塞、非阻塞、发送-接收函数）

3、超松弛迭代法（SOR）的并行实现

高级MPI编程技术

1、自定义新的数据类型：

① 连续数据类型

② 向量数据类型

③ 索引数据类型

④ 结构数据类型

2、集合通信方法

广播、归约、收集、发散

3、通信域和虚拟拓扑

4、并行算法设计一般性方法：

① 划分 ② 通信 ③ 组合 ④ 映射

上机实操：

1、矩阵向量乘法

2、计算圆周率

多核编程技术——OpenMP和Pthread

1、多核、众核编程模型及其发展趋势

2、 Pthread编程

3、 OpenMP多线程编程

上机实操：

1、用不同的OpenMP制导语句实现计算圆周率

2、用MPI+OpenMP实现超松弛迭代法的并行

GPU高性能计算——OpenACC编程基础与优化进阶

1、 OpenACC基础：概念，与CUDA区别，编译器，生态；

2、 OpenACC开发环境搭建配置；

3、 OpenACC四步开发流程：判断并行性，并行化表达，显式数据传递，优化

3.1判断并行性：Profile工具pgprof；

3.2并行化表达：引导关键字Kernerls和Parallel Loop；

3.3显式管理数据的拷贝：引导关键字Data；

3.4优化：统一内存管理，线程并行层级，collapse，tile

OpenACC上机实操：

1. Hellow world；

2．矢量点乘；

GPU高性能计算——CUDA编程基础与优化进阶

1、 CUDA基础：API、数据并行、线程模型、存储模型、控制、同步、并发和通信、加速比；

2、 CUDA开发环境搭建和工具配置；

3、 CUDA优化进阶：线程组织调度，分支语句，访存优化，数据传输，原子操作；

4、 GPU并行计算模式及案例分析：

分析调试：parallel nsight，visual profiler，cuda-gdb；

5、 CUDA生态系统和相关专业领域软件介绍；

CUDA上机实操：

1、 Helloworld，向量加，cuda库的使用（cuBLAS、cuFFT ）；

2、矩阵乘，直方图，卷积，规约；

大规模并行开发：多GPU开发

1、 GPU异步编程，多GPU编程（混合OpenMP和MPI）及调试调优工具；

2、 OpenACC互操作性：OpenMP，MPI，CUDA；

OpenACC上机实操：

1、 Jacobi迭代

GPU高性能计算——深度学习

1、深度学习GPU解决方案：

1.1基于GPU的交互式深度学习训练平台：DIGITS；

1.2深度学习框架的GPU加速：TensorFlow，Caffe等；

1.3 NVIDIA深度学习SDK：cuDNN，TensorRT，NCCL；

1.4深度学习显卡选择；

深度学习上机实操：

1、 Caffe，TensorFlow，Theano等通用深度学习框架的GPU加速库cuDNN的使用；

2、深度学习前端推理引擎TensorRT的使用；

GPU技术前沿

1、 CUDA 9新特性

2、 Pascal，Volta显卡新架构

四、时间地点：

2018年1月26日-29日 25日报到北京

五、培训对象：

从事高性能计算、GPU加速、并行计算、CUDA编程、openCV、石油、气象、化工、人工智能、深度学习、计算机视觉、人脸识别、图像处理、行人检测、自然语言处理等领域相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生等相关技术人员；
六、报名方式及费用：

报名人员可直接回复报名回执表至邮箱。或与会务组电话联系咨询。¥RMB:4300元/人含报名费、培训费、教材费、资料费）食宿统一安排费用自理。

七、颁发证书：

颁发人社部中国职协“高性能计算开发与应用工程师”（高级）培训证书、证书可在官网（http://cx.cnhr.org/）查询，可作为能力评价、考核和任职的重要依据。证书费用（可选）：500元/人

举报活动

活动标签

IT互联网 IT

您还可能感兴趣

您有任何问题，在这里提问！

为营造良好网络环境，评价信息将在审核通过后显示，请规范用语。

全部讨论

还木有人评论，赶快抢个沙发！

	活动日历 04月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	1	2	3	4	5

热门站点

精选推荐

更多服务

您查看的活动已结束

哎呀～主办方的活动已经结束啦，为您推荐更多活动

活动内容收起 展开

活动标签

最近参与

您还可能感兴趣

周天财富流游戏

财富罗盘资产配置落地班：让你打开财富之门，走向幸福之路

第51期，深圳云海广场公园徒步（周天）

深圳线下宝藏女性社交蜡烛冥想等你来

博思（BOSS）六人茶居

【邀请函】北京大学·商业哲学班

前海石公园晨跑

海外抖音TikTok跨境电商外贸总裁班

您有任何问题，在这里提问！

全部讨论

	活动日历 04月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	1	2	3	4	5

	活动日历 04月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	1	2	3	4	5

您查看的活动已结束

哎呀～主办方的活动已经结束啦，为您推荐更多活动

活动内容收起展开

活动标签

最近参与

您还可能感兴趣

周天财富流游戏

财富罗盘资产配置落地班：让你打开财富之门，走向幸福之路

第51期，深圳云海广场公园徒步（周天）

深圳线下宝藏女性社交 蜡烛冥想等你来

博思（BOSS）六人茶居

【邀请函】北京大学·商业哲学班

前海石公园晨跑

海外抖音TikTok跨境电商外贸总裁班

您有任何问题，在这里提问！

全部讨论

使用第三方账号登录

使用手机号/邮箱登录

举报

让批评和口水来的更猛烈些吧！

深圳线下宝藏女性社交蜡烛冥想等你来

	活动日历 04月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	1	2	3	4	5