Аналитика: темы

Описательная статистика

Среднее, медиана, дисперсия, стандартное отклонение и распределения.

18 формул

Таблица формул

Формула Запись Тема Для чего нужна
Среднее арифметическое $\bar{x}=\frac{x_1+x_2+\dots+x_n}{n}$ Описательная статистика Среднее арифметическое показывает типичный уровень числового показателя как сумму всех значений, деленную на количество наблюдений.
Медиана $Me=x_{(\frac{n+1}{2})}\quad\text{для нечетного }n$ Описательная статистика Медиана делит упорядоченный набор данных пополам: половина значений не больше медианы, а половина не меньше ее. Это устойчивая мера типичного значения.
Мода $Mo=\text{значение с максимальной частотой}$ Описательная статистика Мода — это значение, которое встречается в наборе данных чаще всего. Она полезна для категорий, популярных вариантов и повторяющихся числовых значений.
Размах вариации $R=x_{max}-x_{min}$ Описательная статистика Размах вариации показывает расстояние между максимальным и минимальным значением набора данных. Это самый простой показатель разброса.
Выборочная дисперсия $s^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}$ Описательная статистика Выборочная дисперсия с делением на n−1 оценивает дисперсию генеральной совокупности по выборке и измеряет средний квадрат отклонений от выборочного среднего.
Выборочное стандартное отклонение $s=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$ Описательная статистика Выборочное стандартное отклонение показывает типичный масштаб отклонения значений от среднего в исходных единицах показателя.
Квартили и межквартильный размах $IQR=Q_3-Q_1$ Описательная статистика Межквартильный размах, или IQR, показывает ширину средней половины данных: это разница между третьим и первым квартилем. Формула: IQR = Q3 - Q1.
Правило выбросов по IQR $x<Q_1-1.5\cdot IQR\quad\text{или}\quad x>Q_3+1.5\cdot IQR$ Описательная статистика Правило 1,5 IQR помечает возможные выбросы: значение считают необычным, если оно меньше Q1 - 1,5*IQR или больше Q3 + 1,5*IQR. Это правило для первичной проверки, а не автоматического удаления строк.
Коэффициент вариации $CV=\frac{s}{\bar{x}}\cdot100\%$ Описательная статистика Коэффициент вариации показывает относительный разброс: стандартное отклонение делят на среднее и выражают результат в процентах.
Z-оценка $z=\frac{x-\bar{x}}{s}$ Описательная статистика Z-оценка показывает, на сколько стандартных отклонений наблюдение находится выше или ниже среднего значения, и помогает сравнивать разные шкалы.
Размер выборки для одной доли $n=\frac{z^2p(1-p)}{E^2}$ Описательная статистика Размер выборки для одной доли: формула n=\frac{z^2p(1-p)}{E^2} помогает величины n, z, p, E заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.
t-тест для сравнения двух средних $t=\frac{\bar x_1-\bar x_2}{s_p\sqrt{1/n_1+1/n_2}}$ Описательная статистика t-тест для сравнения двух средних: формула t=\frac{\bar x_1-\bar x_2}{s_p\sqrt{1/n_1+1/n_2}} помогает величины t, x_1, x_2, s_p заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.
t-тест Уэлча для средних с разными дисперсиями $t=\frac{\bar x_1-\bar x_2}{\sqrt{s_1^2/n_1+s_2^2/n_2}}$ Описательная статистика t-тест Уэлча для средних с разными дисперсиями: формула t=\frac{\bar x_1-\bar x_2}{\sqrt{s_1^2/n_1+s_2^2/n_2}} помогает величины t, x_1, x_2, s_1 заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.
Критерий хи-квадрат независимости $\chi^2=\sum\frac{(O-E)^2}{E}$ Описательная статистика Критерий хи-квадрат независимости: формула \chi^2=\sum\frac{(O-E)^2}{E} помогает величины chi, O, E заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.
Доверительный интервал для доли $\hat p\pm z\sqrt{\frac{\hat p(1-\hat p)}{n}}$ Описательная статистика Доверительный интервал для доли: формула \hat p\pm z\sqrt{\frac{\hat p(1-\hat p)}{n}} помогает величины p, z, n заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.
Размер эффекта Cohen's d для двух средних $d=\frac{\bar x_1-\bar x_2}{s_p}$ Описательная статистика Размер эффекта Cohen's d для двух средних: формула d=\frac{\bar x_1-\bar x_2}{s_p} помогает величины d, x_1, x_2, s_p заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.
Коэффициент V Крамера для таблицы сопряженности $V=\sqrt{\frac{\chi^2}{n(k-1)}}$ Описательная статистика Коэффициент V Крамера для таблицы сопряженности: формула V=\sqrt{\frac{\chi^2}{n(k-1)}} помогает требуется требуется требуется требуется требуется требуется оценить силу связи в категориальной таблице. В тексте есть условия, пример, ошибки и проверка результата.
Автокорреляция временного ряда на лаге k $r_k=\frac{\sum(y_t-\bar y)(y_{t-k}-\bar y)}{\sum(y_t-\bar y)^2}$ Прогнозирование Автокорреляция временного ряда на лаге k: формула r_k=\frac{\sum(y_t-\bar y)(y_{t-k}-\bar y)}{\sum(y_t-\bar y)^2} помогает требуется требуется требуется требуется требуется требуется проверить, повторяется ли ряд с задержкой k. В тексте есть условия, пример, ошибки и проверка результата.