当前位置:首页 » 挖矿知识 » gk210核心挖矿

gk210核心挖矿

发布时间: 2023-04-03 22:42:53

㈠ 显卡核心GK104与GK106有什么区别吗

GK104是当前开普勒架构的最高核心,8组SMX单元,1536CUDA,256bit显存控制器,32光栅。
而GTX660ti则是阉割了一组SMX单元,流处理器变为1344个,与GTX670相同,位宽阉割为192bit,因此带宽有明显缩减,光栅也成比例缩减为24个。
而GTX660则是完整GK106核心,有5组SMX单元,960CUDA,192bit显存控制器,24个光栅。可以看到GTX660与GTX660ti主要差别就是在CUDA数目不同。
真实性能差别没有CUDA这么明显,GTX660的高频也弥补了性能差距,因此两者也只是隔了一个档次的性能差别20%而已。
应该说,当前GTX660的价格非常合理,非公版1500左右,GTX660ti非公版都在2000左右,公版的做工用料太渣。也即是两者价格相差33%。考虑到两者价格差,GTX660的性价比无疑更高。当然,谈性价比无疑是在预算不是特别充足的前提下,如果楼主预算其实是够的,那就上GTX660ti

㈡ 同样的程序Tesla K80为什么比GTX970慢

这个应该是他自身程序对于硬件的“贴合度”问题吧 你看看K80上跑GPU上是什么状态 GTX970上跑又是什么状态 用NV自带的工具分析下就可以知晓了 关键是K80有没有被充分利用。

Tesla K80架构很老了,是Kepler GK210,K80作为HPC用卡相比970这种游戏卡有着么几大优点:,集成两个GK210核心,但我猜你只用了其中一个。

nvprof一下,看看fp efficiency,或者手动算一下flops(2*m*k*n/runtime),sgemm对于大矩阵一般可以跑到90%+的peak performance,然后对比一下官方给出的gpu的peakperformance,1/3倍搏厅羡速双精基拍度(GM204只有1/32)。

但你跑的是SGEMM,不是伏轮DGEMM,所以并不会受益,Shared memory和Register file巨大,但如果你的程序这里不是瓶颈时也并没有什么卵用。

显存多,同上,Cache/显存ECC,为可靠性服务的,如果用不到上述优点,这核心跑SGEMM比970的GM204慢也不足为奇。


    热点内容
    比特币挖矿必须去矿池吗 发布:2025-09-27 03:59:21 浏览:299
    比特币挖矿手机版10 发布:2025-09-27 03:21:24 浏览:795
    区块链无政府主义 发布:2025-09-27 02:32:02 浏览:813
    区块链挖矿系统定制开发 发布:2025-09-27 01:47:38 浏览:948
    福田口岸怎么去湾仔会展中心 发布:2025-09-27 01:32:22 浏览:652
    gusdt和usdt 发布:2025-09-27 01:10:32 浏览:855
    usdt什么链最好 发布:2025-09-27 00:54:10 浏览:695
    ubank区块链 发布:2025-09-27 00:42:37 浏览:293
    以太坊上芝商所 发布:2025-09-26 23:53:09 浏览:552
    一台S17矿机一月收入 发布:2025-09-26 23:04:19 浏览:840