常用机器学习100例

作者:边叔暖 | 发布日期:2024-09-20 02:59:01


≥﹏≤机器学习中roc曲线的accuracy怎么求考虑二项式问题,即将情况分为积极类别或消极类别。 对于二元问题,会出现四种情况。 如果一个例子是正类并且也假设为正类,则称为真正类;(误报)。 类似地,如果一个例子是一个否定部分并且假定为一个否定部分,那么它称为真否定部分;)。 列联表如下表所示,1代表正类别,0代表负类别。 预测总数10正确率1真阳性率(TP)假阴性率(FN)真阳性率(TP+FN)0假阳性率(FP)等待表中的两个新术语一个是真阳性率(TPR),另一个是假阳性率(TPR)。 还有TrueNegativeRate,TNR,也称为具体公式TNR=TN/(FP+TN)=1-FPR,如果将阈值降低到0.5,则绝对可以识别。 所有正例的正类,即TPR,但同时,您还将对待正例,即改进的FPR,为了可化这种变化,接收者作特征,定义为接收者作特征曲线,用两个变量绘,1-特异性和1-特异性=FPR。 敏感性是TPR(Truepositiverate),它结合了1-方差和敏感性,下表是逻辑回归的结果,将其分为10部分。 相同数量的。 病例百分比阳性病例数1-方差(%)敏感性(%)10618048792.7334.6420618028049.8054.55306180216518.2269.92406180150618.6960618052950.7491.3870618036562.9393.9780618029475.2696.0690618029787.5998.171006177258100.0010是一个正数。 本节的类别数。 也就是说,逻辑回归得到的结果是从大到小排序的,如果用前面10%的值作为阈值,那么10%的事例就会归入正类,即6180。 。 其中,正确数为4879,为4879/14084*100%=34.64%所有正类,即敏感度,此外,还有6180-4879=1301个负例误分类为正类。 ,所有负情况下的资产负债表为1301/47713*100%=2.73%,即1-difference。 将这两组值分别作为x值和y值,并在Excel中作散点图。 得到ROC曲线如下