当前位置:首页 » 挖矿知识 » gk210核心挖矿

gk210核心挖矿

发布时间: 2023-04-03 22:42:53

㈠ 显卡核心GK104与GK106有什么区别吗

GK104是当前开普勒架构的最高核心,8组SMX单元,1536CUDA,256bit显存控制器,32光栅。
而GTX660ti则是阉割了一组SMX单元,流处理器变为1344个,与GTX670相同,位宽阉割为192bit,因此带宽有明显缩减,光栅也成比例缩减为24个。
而GTX660则是完整GK106核心,有5组SMX单元,960CUDA,192bit显存控制器,24个光栅。可以看到GTX660与GTX660ti主要差别就是在CUDA数目不同。
真实性能差别没有CUDA这么明显,GTX660的高频也弥补了性能差距,因此两者也只是隔了一个档次的性能差别20%而已。
应该说,当前GTX660的价格非常合理,非公版1500左右,GTX660ti非公版都在2000左右,公版的做工用料太渣。也即是两者价格相差33%。考虑到两者价格差,GTX660的性价比无疑更高。当然,谈性价比无疑是在预算不是特别充足的前提下,如果楼主预算其实是够的,那就上GTX660ti

㈡ 同样的程序Tesla K80为什么比GTX970慢

这个应该是他自身程序对于硬件的“贴合度”问题吧 你看看K80上跑GPU上是什么状态 GTX970上跑又是什么状态 用NV自带的工具分析下就可以知晓了 关键是K80有没有被充分利用。

Tesla K80架构很老了,是Kepler GK210,K80作为HPC用卡相比970这种游戏卡有着么几大优点:,集成两个GK210核心,但我猜你只用了其中一个。

nvprof一下,看看fp efficiency,或者手动算一下flops(2*m*k*n/runtime),sgemm对于大矩阵一般可以跑到90%+的peak performance,然后对比一下官方给出的gpu的peakperformance,1/3倍搏厅羡速双精基拍度(GM204只有1/32)。

但你跑的是SGEMM,不是伏轮DGEMM,所以并不会受益,Shared memory和Register file巨大,但如果你的程序这里不是瓶颈时也并没有什么卵用。

显存多,同上,Cache/显存ECC,为可靠性服务的,如果用不到上述优点,这核心跑SGEMM比970的GM204慢也不足为奇。


    热点内容
    收到假eth币 发布:2025-10-20 08:58:16 浏览:973
    暗黑破坏神2eth打孔 发布:2025-10-20 08:42:58 浏览:105
    BTC和CBT是一样的吗 发布:2025-10-20 08:42:57 浏览:233
    华硕trx40Pro供电 发布:2025-10-20 08:33:26 浏览:432
    晒人民币编号的朋友圈 发布:2025-10-20 08:25:32 浏览:687
    doge格式 发布:2025-10-20 08:02:00 浏览:382
    以太坊会爆发吗 发布:2025-10-20 08:01:59 浏览:772
    一台比特币矿机的功率 发布:2025-10-20 07:39:24 浏览:925
    trx辅助带 发布:2025-10-20 07:35:29 浏览:48
    比特币哈希值有多少位 发布:2025-10-20 07:31:20 浏览:633