请问评估一个多分类模型使用什么参数好,网上的无非都是 roc 曲线 auc 指标,但是这个是针对二分类的,我使用了一下对多分类的模型得分很低,但是在交叉表也就是实际效果很好,明显不符合,有大佬知道的么?