请选择 进入手机版 | 继续访问电脑版

开源计算机图形学社区(Open Source Computer Graphics Community) |OpenGPU Forum (2007-2013)| OpenGPU Project

 找回密码
 注册
搜索
查看: 832|回复: 10

咨询C++ AMP性能问题,好像没有帖子谈论。 [复制链接]

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2010-3-27
积分
6034
发表于 2017-6-21 16:49:15 |显示全部楼层
1.C++ AMP与CUDA、OpenCL性能差距有多大?看评测有1.1-10倍差距?见http://codinggorilla.domemtech.com/?p=1135
2.Win10下比Win7有性能提升?差距有缩小,缩小到多少?没有帖子比较
这家伙什么也没有留下

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2010-3-27
积分
6034
发表于 2017-6-22 11:35:19 |显示全部楼层

大致结论:使用C++ AMP测试了下CPU与GPU在不同维数矩阵的乘积,在上大矩阵才有优势。256*256的矩阵乘积性能相同,1024*1024有20倍的性能提升。
测试环境:WIN7下,4核(2.2GHz),程序只用了1核,GPU是AMD7400(0.8GHz),总线只有64位宽。更好点的显卡还未测试,双精度也还未测试。
感觉使用AMP比较方便,学习成本不是很高。
这家伙什么也没有留下

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2010-3-27
积分
6034
发表于 2017-6-23 08:59:11 |显示全部楼层
这家伙什么也没有留下

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2010-3-27
积分
6034
发表于 2017-6-23 09:03:37 |显示全部楼层
有近300倍的提高。

使用道具 举报

Rank: 28Rank: 28Rank: 28Rank: 28Rank: 28Rank: 28Rank: 28

注册时间
2007-6-11
积分
29698
发表于 2017-6-24 10:12:04 |显示全部楼层
其实我对CUDA CL C++AMP这些的态度就是都是Runtime那边的,底层都还是一样。

计算还有一般都是double,因为误差小收敛快,但是FP64之后一般GPU下降很多。

要规模非常大,GPU就比CPU有优势多了,否则Latency覆盖不了,就失去意义了。

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2010-3-27
积分
6034
发表于 2017-7-4 16:10:11 |显示全部楼层
1、学习成本的确较低(一星期),基本能写了;深入的还不太熟悉。
2、感觉线程维度切换耗时,即从n*n的线程切换到m*m的线程计算耗时。

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2010-3-27
积分
6034
发表于 2017-7-5 16:43:35 |显示全部楼层
8x8的矩阵花0.05秒,优化的路很长。可能部分计算还必须交给CPU,不能全交GPU。

这家伙什么也没有留下

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2010-3-27
积分
6034
发表于 2017-7-5 16:55:00 |显示全部楼层
CPU主要0.3毫秒,差距也太大了。

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2010-3-27
积分
6034
发表于 2017-7-11 09:36:04 |显示全部楼层
矩阵乘法未优化(分块),在460卡上的加速比就近20倍,原来还是笔记本的卡太low
维数        CPU总耗时        GPU总耗时        加速比
16        0.004825        0.036365        0.132682524
24        0.02762        0.058741        0.47019969
32        0.102631        0.100828        1.017881938
40        0.299787        0.169205        1.771738424
48        0.66983        0.275941        2.427439199
56        1.395483        0.390727        3.571503889
64        2.602454        0.577452        4.506788443
72        4.572721        0.77134        5.928281951
80        7.581364        1.104215        6.865840439
88        12.074077        1.439228        8.389273277
96        18.777152        2.104669        8.921665117
104        27.711997        3.246451        8.536089718
112        39.772785        4.53593        8.768385976
120        55.384852        5.623118        9.849491332
128        115.822046        6.841531        16.92925838

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2010-3-27
积分
6034
发表于 2017-7-11 14:32:24 |显示全部楼层
本帖最后由 ljb 于 2017-7-11 14:35 编辑

不支持表格,只能上图了,红色表示最差,绿色最优。

这家伙什么也没有留下

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2010-3-27
积分
6034
发表于 2017-7-11 14:36:26 |显示全部楼层
第一张删不掉?

使用道具 举报

最近看过此主题的会员

您需要登录后才可以回帖 登录 | 注册

‹‹
我的工具栏

关于我们|手机版|Archiver|开源计算机图形学社区(Open Source Computer Graphics Community) | OpenGPU Project | OpenGPU Forum (2007-2013)

GMT+8, 2017-9-23 00:49 , Processed in 0.060552 second(s), 12 queries .

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部