p106吧 关注:28,000贴子:263,148

回复:全网首测CMP 50HX 20G显存版本

只看楼主收藏回复

咱只能说,老黄刀法精准,且越来越娴熟😏。


IP属地:山东来自Android客户端32楼2025-04-02 12:19
回复
    可能是和40hx一样半精度相关单元阉割?


    IP属地:黑龙江来自Android客户端33楼2025-04-02 14:07
    回复
      广告
      立即查看
      可以帮试试pr和剪映能正常调用吗?


      IP属地:湖北来自手机贴吧34楼2025-04-02 20:16
      回复
        @杜家山人 占用刚好19g


        IP属地:江苏来自Android客户端35楼2025-04-02 22:09
        收起回复
          tensor core阉割完了,魔改20g意义不大


          IP属地:云南来自iPhone客户端36楼2025-04-03 15:55
          收起回复
            借了一张2080ti 22g用来测试,单卡能跑的模型都跑了,然后给我50hx 20g显存带宽超频到跟2080ti 22g相同的水平后,又做了测试,主要是测试q8量化的模型:
            按q8模型计算,2080ti 22g比50hx 20g的推理速度快18%,将50hx显存带宽超频到跟2080ti 22g相同后,推理速度差距缩小到11%,同时因为2080ti核心规模本来就比50hx大26%,这个速度差距我认为是正常的。
            结论就是跑q8模型可以发挥50hx 20g该有的理论性能水平,我查到两张2080ti 22g跑32b q8模型的推论速度大概是13tok/s,这样算的话,要是有两张50hx 20g跑32b q8,速度也能有11tok/s



            IP属地:河北来自Android客户端37楼2025-04-03 20:54
            回复
              2080ti和50hx两张组一起,跑一下32B


              IP属地:四川来自Android客户端38楼2025-04-04 02:34
              收起回复
                技术帖


                IP属地:湖南来自Android客户端39楼2025-04-04 09:06
                回复
                  广告
                  立即查看
                  单卡t10 7b q4 55.53tok/s,楼主用的是不是unsloth的模型?倒是7b q8能37.39tok/s和50hx差不多,14b q4 31.96tok/s,14b q8 20.83tok/s,不知道50hx多少功耗t10只有150w,如果模型相同的情况下可能就是矿卡阉割东西了


                  IP属地:云南来自iPhone客户端40楼2025-04-05 04:33
                  收起回复
                    原来还有些兴趣,以为相比我的p106有些不少提升,毕竟也升到了x16通道,但是看你一评测,只能说适合玩AI、挖矿的人了,我这种没钱的游戏党还是没必要来碰这个了


                    IP属地:安徽来自Android客户端41楼2025-04-05 06:08
                    回复