Аналитика: темы
Описательная статистика
Среднее, медиана, дисперсия, стандартное отклонение и распределения.
18 формул
Таблица формул
| Формула | Запись | Тема | Для чего нужна |
|---|---|---|---|
| Среднее арифметическое | $\bar{x}=\frac{x_1+x_2+\dots+x_n}{n}$ | Описательная статистика | Среднее арифметическое показывает типичный уровень числового показателя как сумму всех значений, деленную на количество наблюдений. |
| Медиана | $Me=x_{(\frac{n+1}{2})}\quad\text{для нечетного }n$ | Описательная статистика | Медиана делит упорядоченный набор данных пополам: половина значений не больше медианы, а половина не меньше ее. Это устойчивая мера типичного значения. |
| Мода | $Mo=\text{значение с максимальной частотой}$ | Описательная статистика | Мода — это значение, которое встречается в наборе данных чаще всего. Она полезна для категорий, популярных вариантов и повторяющихся числовых значений. |
| Размах вариации | $R=x_{max}-x_{min}$ | Описательная статистика | Размах вариации показывает расстояние между максимальным и минимальным значением набора данных. Это самый простой показатель разброса. |
| Выборочная дисперсия | $s^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}$ | Описательная статистика | Выборочная дисперсия с делением на n−1 оценивает дисперсию генеральной совокупности по выборке и измеряет средний квадрат отклонений от выборочного среднего. |
| Выборочное стандартное отклонение | $s=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$ | Описательная статистика | Выборочное стандартное отклонение показывает типичный масштаб отклонения значений от среднего в исходных единицах показателя. |
| Квартили и межквартильный размах | $IQR=Q_3-Q_1$ | Описательная статистика | Межквартильный размах, или IQR, показывает ширину средней половины данных: это разница между третьим и первым квартилем. Формула: IQR = Q3 - Q1. |
| Правило выбросов по IQR | $x<Q_1-1.5\cdot IQR\quad\text{или}\quad x>Q_3+1.5\cdot IQR$ | Описательная статистика | Правило 1,5 IQR помечает возможные выбросы: значение считают необычным, если оно меньше Q1 - 1,5*IQR или больше Q3 + 1,5*IQR. Это правило для первичной проверки, а не автоматического удаления строк. |
| Коэффициент вариации | $CV=\frac{s}{\bar{x}}\cdot100\%$ | Описательная статистика | Коэффициент вариации показывает относительный разброс: стандартное отклонение делят на среднее и выражают результат в процентах. |
| Z-оценка | $z=\frac{x-\bar{x}}{s}$ | Описательная статистика | Z-оценка показывает, на сколько стандартных отклонений наблюдение находится выше или ниже среднего значения, и помогает сравнивать разные шкалы. |
| Размер выборки для одной доли | $n=\frac{z^2p(1-p)}{E^2}$ | Описательная статистика | Размер выборки для одной доли: формула n=\frac{z^2p(1-p)}{E^2} помогает величины n, z, p, E заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата. |
| t-тест для сравнения двух средних | $t=\frac{\bar x_1-\bar x_2}{s_p\sqrt{1/n_1+1/n_2}}$ | Описательная статистика | t-тест для сравнения двух средних: формула t=\frac{\bar x_1-\bar x_2}{s_p\sqrt{1/n_1+1/n_2}} помогает величины t, x_1, x_2, s_p заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата. |
| t-тест Уэлча для средних с разными дисперсиями | $t=\frac{\bar x_1-\bar x_2}{\sqrt{s_1^2/n_1+s_2^2/n_2}}$ | Описательная статистика | t-тест Уэлча для средних с разными дисперсиями: формула t=\frac{\bar x_1-\bar x_2}{\sqrt{s_1^2/n_1+s_2^2/n_2}} помогает величины t, x_1, x_2, s_1 заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата. |
| Критерий хи-квадрат независимости | $\chi^2=\sum\frac{(O-E)^2}{E}$ | Описательная статистика | Критерий хи-квадрат независимости: формула \chi^2=\sum\frac{(O-E)^2}{E} помогает величины chi, O, E заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата. |
| Доверительный интервал для доли | $\hat p\pm z\sqrt{\frac{\hat p(1-\hat p)}{n}}$ | Описательная статистика | Доверительный интервал для доли: формула \hat p\pm z\sqrt{\frac{\hat p(1-\hat p)}{n}} помогает величины p, z, n заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата. |
| Размер эффекта Cohen's d для двух средних | $d=\frac{\bar x_1-\bar x_2}{s_p}$ | Описательная статистика | Размер эффекта Cohen's d для двух средних: формула d=\frac{\bar x_1-\bar x_2}{s_p} помогает величины d, x_1, x_2, s_p заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата. |
| Коэффициент V Крамера для таблицы сопряженности | $V=\sqrt{\frac{\chi^2}{n(k-1)}}$ | Описательная статистика | Коэффициент V Крамера для таблицы сопряженности: формула V=\sqrt{\frac{\chi^2}{n(k-1)}} помогает требуется требуется требуется требуется требуется требуется оценить силу связи в категориальной таблице. В тексте есть условия, пример, ошибки и проверка результата. |
| Автокорреляция временного ряда на лаге k | $r_k=\frac{\sum(y_t-\bar y)(y_{t-k}-\bar y)}{\sum(y_t-\bar y)^2}$ | Прогнозирование | Автокорреляция временного ряда на лаге k: формула r_k=\frac{\sum(y_t-\bar y)(y_{t-k}-\bar y)}{\sum(y_t-\bar y)^2} помогает требуется требуется требуется требуется требуется требуется проверить, повторяется ли ряд с задержкой k. В тексте есть условия, пример, ошибки и проверка результата. |