请选择 进入手机版 | 继续访问电脑版

开源计算机图形学社区(Open Source Computer Graphics Community) |OpenGPU Forum (2007-2013)| OpenGPU Project

 找回密码
 注册
搜索
查看: 1293|回复: 10

My PhD Thesis: GPU Performance Modeling and Optimization [复制链接]

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2011-4-19
积分
2081
发表于 2017-2-1 04:50:59 |显示全部楼层
本帖最后由 Uling 于 2017-2-1 04:53 编辑

帮自己promote下,这是我的博士论文,主要是有关GPU性能模型和软件方法优化的,欢迎讨论。

https://scholarbank.nus.edu.sg/bitstream/handle/10635/132114/LiA.PDF?sequence=1
1

查看全部评分

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2011-4-19
积分
2081
发表于 2017-2-1 04:54:29 |显示全部楼层
附件太大不好上传,不知道这个link国内能访问不

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2010-3-27
积分
6036
发表于 2017-2-2 12:27:42 |显示全部楼层
帮楼主顶下。BTW,楼主可以凭脸吃饭了。

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2011-4-19
积分
2081
发表于 2017-2-3 00:53:56 |显示全部楼层
有人去开今年HPCA或者ASPLOS的话可以交流交流

使用道具 举报

Rank: 8Rank: 8

注册时间
2017-2-2
积分
140
发表于 2017-2-5 22:00:52 |显示全部楼层
LZ 的文章把GPU中重要的点都做了相关的研究,在最后讲解share memory这部分居然还添加了dataflow computing,这个在国内还是比较少看到的。如果再加上互联这部分就更完善了。
等有足够时间了,再仔细研读研读LZ的杰作。  LZ回国发展了吗?

使用道具 举报

Rank: 16Rank: 16Rank: 16Rank: 16

注册时间
2016-9-22
积分
2566
发表于 2017-2-6 08:19:43 |显示全部楼层
帮楼主顶下

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2011-4-19
积分
2081
发表于 2017-2-12 08:29:49 |显示全部楼层
microtiger1989 发表于 2017-2-5 22:00
LZ 的文章把GPU中重要的点都做了相关的研究,在最后讲解share memory这部分居然还添加了dataflow computing ...

我师兄做过互联,在SM之间搭个快速通信网络,用来做wavefront这种规则依赖的问题很好。有兴趣的话我可以给你发点文章。我现在人在美国。

使用道具 举报

Rank: 8Rank: 8

注册时间
2017-2-2
积分
140
发表于 2017-2-13 05:51:33 |显示全部楼层
Uling 发表于 2017-2-12 08:29
我师兄做过互联,在SM之间搭个快速通信网络,用来做wavefront这种规则依赖的问题很好。有兴趣的话我可以 ...

好啊,我正在研究这个方面的技术,起初用的是自己定的一个总线结构,结果性能满足不了,尝试了一个crossbar结构,但是还不够深入,准备研究一个新的通信结构。  多谢LZ!

使用道具 举报

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2011-4-19
积分
2081
发表于 2017-2-13 11:24:15 |显示全部楼层
microtiger1989 发表于 2017-2-13 05:51
好啊,我正在研究这个方面的技术,起初用的是自己定的一个总线结构,结果性能满足不了,尝试了一个crossb ...

R-GPU: A Reconfigurable GPU Architecture

不过这都是architecture level的东西,我感觉你做的更底层些

使用道具 举报

Rank: 8Rank: 8

注册时间
2017-2-2
积分
140
发表于 2017-2-14 20:50:11 |显示全部楼层
Uling 发表于 2017-2-13 11:24
R-GPU: A Reconfigurable GPU Architecture

不过这都是architecture level的东西,我感觉你做的更底层 ...

你提供的这篇文章,一个基本的要点是在之前GPU的每个SM中添加core与core之间的通信,而文中提到的通信机制采用的类似于dataflow,在R-GPU模式下,每个core的执行通过源操作数的有效性来作为驱动源,这种方式在编程架构上需要对现有的compiler添加很多有关数据流的具体处理,与此同时,在runtime进行指令mapping时也存在很多挑战。 LZ的论文中,没有介绍的那个部分也就是你师兄论文中提到的SMs与L2 cache之间的片上互联网络。这一部分的技术点还是很过瘾的。

使用道具 举报

Rank: 8Rank: 8

注册时间
2017-2-2
积分
140
发表于 2017-2-14 20:52:13 |显示全部楼层
Uling 发表于 2017-2-13 11:24
R-GPU: A Reconfigurable GPU Architecture

不过这都是architecture level的东西,我感觉你做的更底层 ...

architecture level以及更底层的也都做的。

使用道具 举报

最近看过此主题的会员

您需要登录后才可以回帖 登录 | 注册

‹‹
我的工具栏

关于我们|手机版|Archiver|开源计算机图形学社区(Open Source Computer Graphics Community) | OpenGPU Project | OpenGPU Forum (2007-2013)

GMT+8, 2017-9-25 17:56 , Processed in 0.146621 second(s), 12 queries .

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部