Аналитика: темы
Линейная регрессия, коэффициенты
линейная регрессия, коэффициенты, R-squared
5 формул
Таблица формул
| Формула | Запись | Тема | Для чего нужна |
|---|---|---|---|
| Линейная регрессия по методу наименьших квадратов | $\hat{\beta}_1=\frac{\sum (x_i-\bar{x})(y_i-\bar{y})}{\sum (x_i-\bar{x})^2},\quad \hat{\beta}_0=\bar{y}-\hat{\beta}_1\bar{x}$ | Линейная регрессия, коэффициенты | OLS подбирает коэффициенты линейной регрессии так, чтобы сумма квадратов остатков была минимальной. Формула нужна, чтобы оценить связь факторов с числовой целью и получить воспроизводимый линейный прогноз. |
| Коэффициент детерминации R-squared | $R^2=1-\frac{SS_{res}}{SS_{tot}}$ | Линейная регрессия, коэффициенты | R² показывает, какая доля разброса целевой переменной объяснена регрессионной моделью по сравнению с ее средним уровнем. Метрика полезна для одной выборки и спецификации, но сама по себе не доказывает причинность. |
| Стандартная ошибка регрессии | $s=\sqrt{\frac{SS_{res}}{n-p}}$ | Линейная регрессия, коэффициенты | Стандартная ошибка регрессии оценивает типичный разброс остатков вокруг линии модели в единицах целевой переменной. Ее используют рядом с R², чтобы видеть не только долю объясненной вариации, но и размер промаха. |
| t-статистика коэффициента регрессии | $t=\frac{\hat{\beta}_j-\beta_{j,0}}{SE(\hat{\beta}_j)}$ | Линейная регрессия, коэффициенты | t-статистика делит коэффициент регрессии на его стандартную ошибку и показывает, насколько оценка далека от нуля в масштабе неопределенности. Ее читают с учетом степеней свободы, p-value и спецификации модели. |
| Логистическая функция вероятности | $p=\frac{1}{1+e^{-z}},\quad z=\beta_0+\beta_1x_1+\ldots+\beta_kx_k}$ | Линейная регрессия, коэффициенты | Логистическая функция переводит линейный скор в вероятность от 0 до 1 по S-образной кривой. В аналитике бинарных событий она связывает факторы с шансом наступления класса и помогает выбрать порог решения. |