gk210核心挖矿
㈠ 显卡核心GK104与GK106有什么区别吗
GK104是当前开普勒架构的最高核心,8组SMX单元,1536CUDA,256bit显存控制器,32光栅。
而GTX660ti则是阉割了一组SMX单元,流处理器变为1344个,与GTX670相同,位宽阉割为192bit,因此带宽有明显缩减,光栅也成比例缩减为24个。
而GTX660则是完整GK106核心,有5组SMX单元,960CUDA,192bit显存控制器,24个光栅。可以看到GTX660与GTX660ti主要差别就是在CUDA数目不同。
真实性能差别没有CUDA这么明显,GTX660的高频也弥补了性能差距,因此两者也只是隔了一个档次的性能差别20%而已。
应该说,当前GTX660的价格非常合理,非公版1500左右,GTX660ti非公版都在2000左右,公版的做工用料太渣。也即是两者价格相差33%。考虑到两者价格差,GTX660的性价比无疑更高。当然,谈性价比无疑是在预算不是特别充足的前提下,如果楼主预算其实是够的,那就上GTX660ti
㈡ 同样的程序Tesla K80为什么比GTX970慢
这个应该是他自身程序对于硬件的“贴合度”问题吧 你看看K80上跑GPU上是什么状态 GTX970上跑又是什么状态 用NV自带的工具分析下就可以知晓了 关键是K80有没有被充分利用。
Tesla K80架构很老了,是Kepler GK210,K80作为HPC用卡相比970这种游戏卡有着么几大优点:,集成两个GK210核心,但我猜你只用了其中一个。
nvprof一下,看看fp efficiency,或者手动算一下flops(2*m*k*n/runtime),sgemm对于大矩阵一般可以跑到90%+的peak performance,然后对比一下官方给出的gpu的peakperformance,1/3倍搏厅羡速双精基拍度(GM204只有1/32)。
但你跑的是SGEMM,不是伏轮DGEMM,所以并不会受益,Shared memory和Register file巨大,但如果你的程序这里不是瓶颈时也并没有什么卵用。
显存多,同上,Cache/显存ECC,为可靠性服务的,如果用不到上述优点,这核心跑SGEMM比970的GM204慢也不足为奇。