Аналитика: темы
Precision, recall
precision, recall, F1, ROC-AUC
8 формул
Таблица формул
| Формула | Запись | Тема | Для чего нужна |
|---|---|---|---|
| Accuracy как доля правильных классификаций | $\mathrm{Accuracy}=\frac{TP+TN}{TP+TN+FP+FN}$ | Precision, recall | Accuracy - доля верных ответов среди всех объектов. Метрика быстро показывает общий уровень классификации, но хорошо читается только при сопоставимых классах и близкой цене ложных тревог и пропусков. |
| Precision для положительного класса | $\mathrm{Precision}=\frac{TP}{TP+FP}$ | Precision, recall | Precision показывает, какая часть объектов, помеченных моделью как положительные, действительно положительна. Метрика важна, когда ложные срабатывания дороги: модерация, лиды, диагностика, ручная проверка. |
| Recall для положительного класса | $\mathrm{Recall}=\frac{TP}{TP+FN}$ | Precision, recall | Recall показывает, какую долю настоящих положительных объектов модель нашла. Метрика важна, когда опаснее пропустить нужный случай, чем получить лишнее срабатывание: риск, дефекты, заявки. |
| F1-мера классификации для баланса precision и recall | $F_1=\frac{2\cdot Precision\cdot Recall}{Precision+Recall}$ | Precision, recall | F1 объединяет precision и recall через гармоническое среднее. Метрика полезна, когда нужно одним числом балансировать ложные срабатывания и пропуски, но true negative в расчет не входит. |
| Specificity классификатора | $\mathrm{Specificity}=\frac{TN}{TN+FP}$ | Precision, recall | Specificity показывает, какую долю настоящих отрицательных объектов модель оставила отрицательными. Метрика дополняет recall и важна там, где надо ограничить ложные тревоги при фиксированном положительном классе. |
| ROC AUC через пары объектов | $\mathrm{AUC}=\frac{N_{concordant}+0.5N_{tied}}{N_{positive}N_{negative}}$ | Precision, recall | ROC AUC оценивает ранжирование: насколько часто положительный объект получает скор выше отрицательного. Метрика не зависит от одного порога, но требует корректных скорингов и выбранного положительного класса. |
| Lift модели классификации | $\mathrm{Lift}=\frac{\text{response rate in selected group}}{\text{overall response rate}}$ | Precision, recall | Lift показывает, во сколько раз выбранный моделью сегмент богаче целевыми объектами, чем вся база. Метрика полезна для CRM, маркетинга и скоринга, где важен верхний процент списка, а не общий порог. |
| Матрица ошибок бинарной классификации | $N=TP+TN+FP+FN$ | Precision, recall | Матрица ошибок раскладывает бинарные решения на TP, TN, FP и FN. Это исходная таблица для accuracy, precision, recall, specificity и F1, поэтому сначала проверяют класс, порог и сумму ячеек. |