中文第一计算机图形学社区OpenGPU 版权所有2007-2018

 找回密码
 注册

扫一扫,访问微社区

搜索
查看: 7108|回复: 6

GTX680与GTX580实验对比结果

[复制链接]
发表于 2013-12-26 09:55:33 | 显示全部楼层 |阅读模式
本帖最后由 edog 于 2013-12-26 09:58 编辑

有GTX580 与 GTX680同品牌显卡各一颗,为验证680的通用计算能力,进行本次对比测试。
测试采用了计算量较大的高清视频编码,测试序列采用1080高清序列,二进制程序为英伟达自带的cuda sample中的cudaEncode。搭载显卡的平台为相同品牌工作站,CPU i7,内存8G。
测试结果的主要数据如下:

表1. GTX580显卡实际信息读取
GPU Device 0 (SM 2.0) : GeForce GTX 580  Total Memory          = 1536 MBytes
  GPU Clock             = 1544.00 MHz
  MultiProcessors/Cores = 16 MPs (512 Cores)
  Maximum Offload Mode  = GPU: Full Offload

表2. GTX680显卡实际信息读取
GPU Device 0 (SM 3.0) : GeForce GTX 680  Total Memory          = 2048 MBytes
  GPU Clock             = 705.50 MHz
  MultiProcessors/Cores = 8 MPs (1536 Cores)
  Maximum Offload Mode  = GPU: Full Offload

表3. GTX580编码信息显示
[cudaEncode.exe] - [Frame: 0016, 113.1 fps, frame time: 8.85 (ms)] [cudaEncode.exe] - [Frame: 0032, 89.8 fps, frame time: 11.13 (ms) ]
[cudaEncode.exe] - [Frame: 0048, 91.0 fps, frame time: 10.99 (ms) ]
[cudaEncode.exe] - [Frame: 0064, 85.0 fps, frame time: 11.76 (ms) ]
[cudaEncode.exe] - [Frame: 0080, 105.7 fps, frame time: 9.46 (ms) ]
[cudaEncode.exe] - [Frame: 0096, 98.0 fps, frame time: 10.21 (ms) ]
[cudaEncode.exe] - [Frame: 0112, 88.7 fps, frame time: 11.27 (ms) ]
[cudaEncode.exe] - [Frame: 0128, 106.6 fps, frame time: 9.38 (ms) ]
[cudaEncode.exe] - [Frame: 0144, 105.1 fps, frame time: 9.52 (ms) ]
[cudaEncode.exe] - [Frame: 0160, 90.6 fps, frame time: 11.04 (ms) ]
[cudaEncode.exe] - [Frame: 0176, 100.3 fps, frame time: 9.97 (ms) ]
[cudaEncode.exe] - [Frame: 0192, 94.9 fps, frame time: 10.54 (ms) ]
[cudaEncode.exe] - [Frame: 0208, 78.7 fps, frame time: 12.71 (ms) ]
[cudaEncode.exe] - [Frame: 0224, 99.4 fps, frame time: 10.06 (ms) ]
[cudaEncode.exe] - [Frame: 0240, 100.8 fps, frame time: 9.92 (ms) ]
[H.264 Encoding Statistics]
        Number of Coded Frames     : 250
        Elapsed time (hh:mm:ss:ms) : 00:00:02.663
        Average FPS (end to end)   : 93.879082
        CPU utilization (8 cores)  : 43.72% (user:339.77%, kernel: 9.96%)



表4. GTX680编码信息显示
[cudaEncode.exe] - [Frame: 0016, 32.9 fps, frame time: 30.37 (ms)] [cudaEncode.exe] - [Frame: 0032, 34.0 fps, frame time: 29.39 (ms) ]
[cudaEncode.exe] - [Frame: 0048, 32.0 fps, frame time: 31.24 (ms) ]
[cudaEncode.exe] - [Frame: 0064, 40.1 fps, frame time: 24.94 (ms) ]
[cudaEncode.exe] - [Frame: 0080, 38.9 fps, frame time: 25.69 (ms) ]
[cudaEncode.exe] - [Frame: 0096, 35.0 fps, frame time: 28.55 (ms) ]
[cudaEncode.exe] - [Frame: 0112, 29.6 fps, frame time: 33.78 (ms) ]
[cudaEncode.exe] - [Frame: 0128, 42.2 fps, frame time: 23.68 (ms) ]
[cudaEncode.exe] - [Frame: 0144, 42.7 fps, frame time: 23.44 (ms) ]
[cudaEncode.exe] - [Frame: 0160, 37.9 fps, frame time: 26.41 (ms) ]
[cudaEncode.exe] - [Frame: 0176, 29.3 fps, frame time: 34.16 (ms) ]
[cudaEncode.exe] - [Frame: 0192, 32.1 fps, frame time: 31.15 (ms) ]
[cudaEncode.exe] - [Frame: 0208, 34.8 fps, frame time: 28.76 (ms) ]
[cudaEncode.exe] - [Frame: 0224, 39.1 fps, frame time: 25.56 (ms) ]
[cudaEncode.exe] - [Frame: 0240, 38.4 fps, frame time: 26.06 (ms) ]
[H.264 Encoding Statistics]
        Number of Coded Frames     : 250
        Elapsed time (hh:mm:ss:ms) : 00:00:07.058
        Average FPS (end to end)   : 35.420799
        CPU utilization (8 cores)  : 17.30% (user:131.51%, kernel: 6.85%)



在读取出显卡实际信息就可以看出GTX680主频远远低于GTX580,而且多处理器的数量也从580的16个下降到680的8个,cuda核心数是680多一倍。即使视频处理这么大的数据量也用不到1GB内存空间,memory空间大小并不重要。

从运行结果看,GTX680远远不如GTX580,编码时间长了数倍,关键的帧率也以35.42远远低于580的93.87。

总结,对于通用计算,GTX680是一款极失败的产品,比上一代的GTX580差了太多,而且就其价格而言没有任何性价比。如果打算进行GPU开发以及通用计算研究的知识分子们谨慎购买此显卡。



发表于 2014-2-15 00:25:46 | 显示全部楼层
这个也是针对不同的应用吧 6系列的卡确实不怎样
但也不是一无是处
下面有个 横向的比较
http://www.clbenchmark.com/compa ... p;config_1=11905948
发表于 2014-2-15 14:20:44 | 显示全部楼层
680就是个低功耗版本的过渡产品,当然不是想当然的那样越来越好。
发表于 2014-2-24 13:06:51 | 显示全部楼层
titan black 才是没有阉割通用计算的完整版
发表于 2014-2-27 15:00:58 | 显示全部楼层
Kepler和Fermi架构差别非常大,仅一个sample说明不了什么。你把CUDA Sample都跑一遍基本会发现一会680强一会580强,而且往往差距都很悬殊。不过不否认GK104在这方面确实没优势,但综合起来也不至于比GF110差太多。

ps. 你的GPU频率读取有问题,680实际运行频率比这个要高,高负载时一般为1006~1097MHZ,你可以找实时监控软件查看。至于Multi-Processor数量两者没有直接的可比性,Kepler的SMX单个性能远高于Fermi的SM。
发表于 2014-3-5 10:01:48 | 显示全部楼层
780会是怎么一个样子
发表于 2018-10-17 17:15:32 | 显示全部楼层
680就是个低功耗版本的过渡产品,当然不是想当然的那样越来越好。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|关于我们|小黑屋|Archiver|手机版|中文第一计算机图形学社区OpenGPU

GMT+8, 2019-1-23 16:26 , Processed in 0.101774 second(s), 19 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表