中文第一计算机图形学社区OpenGPU 版权所有2007-2018

 找回密码
 注册

扫一扫,访问微社区

搜索
查看: 1729|回复: 10

My PhD Thesis: GPU Performance Modeling and Optimization

[复制链接]
发表于 2017-2-1 04:50:59 | 显示全部楼层 |阅读模式
本帖最后由 Uling 于 2017-2-1 04:53 编辑

帮自己promote下,这是我的博士论文,主要是有关GPU性能模型和软件方法优化的,欢迎讨论。

https://scholarbank.nus.edu.sg/bitstream/handle/10635/132114/LiA.PDF?sequence=1

评分

1

查看全部评分

 楼主| 发表于 2017-2-1 04:54:29 | 显示全部楼层
附件太大不好上传,不知道这个link国内能访问不
发表于 2017-2-2 12:27:42 | 显示全部楼层
帮楼主顶下。BTW,楼主可以凭脸吃饭了。
 楼主| 发表于 2017-2-3 00:53:56 | 显示全部楼层
有人去开今年HPCA或者ASPLOS的话可以交流交流
发表于 2017-2-5 22:00:52 | 显示全部楼层
LZ 的文章把GPU中重要的点都做了相关的研究,在最后讲解share memory这部分居然还添加了dataflow computing,这个在国内还是比较少看到的。如果再加上互联这部分就更完善了。
等有足够时间了,再仔细研读研读LZ的杰作。  LZ回国发展了吗?
发表于 2017-2-6 08:19:43 | 显示全部楼层
帮楼主顶下
 楼主| 发表于 2017-2-12 08:29:49 | 显示全部楼层
microtiger1989 发表于 2017-2-5 22:00
LZ 的文章把GPU中重要的点都做了相关的研究,在最后讲解share memory这部分居然还添加了dataflow computing ...

我师兄做过互联,在SM之间搭个快速通信网络,用来做wavefront这种规则依赖的问题很好。有兴趣的话我可以给你发点文章。我现在人在美国。
发表于 2017-2-13 05:51:33 | 显示全部楼层
Uling 发表于 2017-2-12 08:29
我师兄做过互联,在SM之间搭个快速通信网络,用来做wavefront这种规则依赖的问题很好。有兴趣的话我可以 ...

好啊,我正在研究这个方面的技术,起初用的是自己定的一个总线结构,结果性能满足不了,尝试了一个crossbar结构,但是还不够深入,准备研究一个新的通信结构。  多谢LZ!
 楼主| 发表于 2017-2-13 11:24:15 | 显示全部楼层
microtiger1989 发表于 2017-2-13 05:51
好啊,我正在研究这个方面的技术,起初用的是自己定的一个总线结构,结果性能满足不了,尝试了一个crossb ...

R-GPU: A Reconfigurable GPU Architecture

不过这都是architecture level的东西,我感觉你做的更底层些
发表于 2017-2-14 20:50:11 | 显示全部楼层
Uling 发表于 2017-2-13 11:24
R-GPU: A Reconfigurable GPU Architecture

不过这都是architecture level的东西,我感觉你做的更底层 ...

你提供的这篇文章,一个基本的要点是在之前GPU的每个SM中添加core与core之间的通信,而文中提到的通信机制采用的类似于dataflow,在R-GPU模式下,每个core的执行通过源操作数的有效性来作为驱动源,这种方式在编程架构上需要对现有的compiler添加很多有关数据流的具体处理,与此同时,在runtime进行指令mapping时也存在很多挑战。 LZ的论文中,没有介绍的那个部分也就是你师兄论文中提到的SMs与L2 cache之间的片上互联网络。这一部分的技术点还是很过瘾的。
发表于 2017-2-14 20:52:13 | 显示全部楼层
Uling 发表于 2017-2-13 11:24
R-GPU: A Reconfigurable GPU Architecture

不过这都是architecture level的东西,我感觉你做的更底层 ...

architecture level以及更底层的也都做的。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们|小黑屋|Archiver|手机版|中文第一计算机图形学社区OpenGPU

GMT+8, 2018-6-23 14:29 , Processed in 0.046757 second(s), 20 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表