围棋吧 关注:349,860贴子:10,630,896

我把评价指标换成相对胜率波动再用崔灿的数据跑

只看楼主收藏回复

好像棋手排名更符合常识一点了(除了日古三圣)


IP属地:北京1楼2021-08-22 21:35回复
    跟这个贴
    https://tieba.baidu.com/p/7506785088
    的指标相比,没有考虑绝对胜率波动,对一边倒的情况会有所改善


    IP属地:北京2楼2021-08-22 21:36
    收起回复
      2025-07-22 04:56:42
      广告
      不感兴趣
      开通SVIP免广告
      基于规则的指标比起神经网络的好处就是换起来方便
      @飞鸟的祈愿


      IP属地:北京5楼2021-08-22 21:39
      回复
        评价最高的十局棋

        评价最低的十局棋


        IP属地:北京6楼2021-08-22 21:41
        回复
          顶一下吧。
          虽然作为一个日吹看到换作不同的标准日本棋手排到了前面很是得意。
          不过客观来讲,日古三位棋圣还是不可能下的过本因坊文裕的,可能是棋风的关系吧。


          IP属地:西藏来自Android客户端8楼2021-08-22 22:34
          收起回复
            秀策丈和这么强的吗


            IP属地:陕西10楼2021-08-22 22:39
            回复
              感觉这个指标里面还是存在一定的噪声。
              日古三圣和付利刘钧明星偏高。
              这个偏高的主要因素可能是由于对手水平偏低。
              所以无法避免的问题就是其他棋手有没有同样因素导致的偏高,当然如果数据量足够可能会稀释这个噪声。
              总体上说实在的可能不如崔的吻合度指标,但是崔的指标无法对职业棋手进行排名。
              因为存在棋谱选择的偶然性问题,可能选谱不同就会导致名单大变。


              IP属地:河南11楼2021-08-22 22:52
              收起回复



                IP属地:北京12楼2021-08-22 22:59
                回复
                  2025-07-22 04:50:42
                  广告
                  不感兴趣
                  开通SVIP免广告
                  考虑到不同时代棋局贴目(子)并不一致,开局的胜率起点存在较大差别,另外胜率类指标也受对手给予压力大小的影响,使用该指标比对时严谨性难以保证,故仅作为辅助参考之用。
                  =============崔灿原文==================
                  ……这些评价标准固然有趣,但与棋力的关联性尚未得到确认,不同因子的权重如何设置也是一大难题。另外,由于这类指标在设置上有很大的随意性,不但难以服众,在研究中也很难做到完全撇清“先射箭后画靶”的嫌疑。因此,与相对固定,且受众更广的吻合度、AI评分等“默认标准”相比,提出其他一些特定的指标,或用几种指标组合建立模型作为评价棋力的标准,需要详细阐明其内在合理性,以及指标或模型能够区分棋手水平的依据。
                  =============崔灿原文==================
                  崔文中对LZ的方法的观点


                  IP属地:山东13楼2021-08-22 23:08
                  收起回复
                    我为什么要发写代码算这两个指标;提出新的指标不是主要目的。
                    只是有人说崔灿的指标经过了大样本检验(表7,职业与业余棋手能通过前180手吻合度被显著区分)
                    所以吻合度指标很可靠
                    而我提出了另外的指标,计算显示,职业与业余的区分度不比他小(我的P值小于等于他的P值)
                    那是不是说明我的指标跟他的一样可靠或者说不可靠?


                    IP属地:北京14楼2021-08-22 23:23
                    收起回复



                      IP属地:北京15楼2021-08-22 23:26
                      回复
                        付丽刘均的排名明显不对,不是指标有问题就是样本有问题


                        IP属地:广西来自Android客户端16楼2021-08-22 23:55
                        收起回复
                          用崔灿的方法也会出现一楼类似 “付利刘钧” 的情况
                          看他表9表10的极大极小值即可知


                          只是他没把排名放出来,就看不到这个瑕疵


                          IP属地:北京17楼2021-08-23 00:04
                          收起回复
                            我佩服你的小数点位数,手算的?祖冲之啊祖冲之


                            来自Android客户端18楼2021-08-23 08:04
                            回复
                              2025-07-22 04:44:42
                              广告
                              不感兴趣
                              开通SVIP免广告
                              以前我说秀策能让我4子以上,我是野狐8,有人说我假8


                              IP属地:上海来自iPhone客户端20楼2021-08-23 09:06
                              收起回复