Аналитика

Описательная статистика

Среднее, медиана, дисперсия, стандартное отклонение и распределения.

17 формул

Формулы темы

Среднее арифметическое

Среднее арифметическое показывает типичный уровень числового показателя как сумму всех значений, деленную на количество наблюдений.

$\bar{x}=\frac{x_1+x_2+\dots+x_n}{n}$

Медиана

Медиана делит упорядоченный набор данных пополам: половина значений не больше медианы, а половина не меньше ее. Это устойчивая мера типичного значения.

$Me=x_{(\frac{n+1}{2})}\quad\text{для нечетного }n$

Мода

Мода — это значение, которое встречается в наборе данных чаще всего. Она полезна для категорий, популярных вариантов и повторяющихся числовых значений.

$Mo=\text{значение с максимальной частотой}$

Размах вариации

Размах вариации показывает расстояние между максимальным и минимальным значением набора данных. Это самый простой показатель разброса.

$R=x_{max}-x_{min}$

Выборочная дисперсия

Выборочная дисперсия с делением на n−1 оценивает дисперсию генеральной совокупности по выборке и измеряет средний квадрат отклонений от выборочного среднего.

$s^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}$

Выборочное стандартное отклонение

Выборочное стандартное отклонение показывает типичный масштаб отклонения значений от среднего в исходных единицах показателя.

$s=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$

Квартили и межквартильный размах

Межквартильный размах, или IQR, показывает ширину средней половины данных: это разница между третьим и первым квартилем. Формула: IQR = Q3 - Q1.

$IQR=Q_3-Q_1$

Правило выбросов по IQR

Правило 1,5 IQR помечает возможные выбросы: значение считают необычным, если оно меньше Q1 - 1,5*IQR или больше Q3 + 1,5*IQR. Это правило для первичной проверки, а не автоматического удаления строк.

$x<Q_1-1.5\cdot IQR\quad\text{или}\quad x>Q_3+1.5\cdot IQR$

Коэффициент вариации

Коэффициент вариации показывает относительный разброс: стандартное отклонение делят на среднее и выражают результат в процентах.

$CV=\frac{s}{\bar{x}}\cdot100\%$

Z-оценка

Z-оценка показывает, на сколько стандартных отклонений наблюдение находится выше или ниже среднего значения, и помогает сравнивать разные шкалы.

$z=\frac{x-\bar{x}}{s}$

Размер выборки для одной доли

Размер выборки для одной доли: формула n=\frac{z^2p(1-p)}{E^2} помогает величины n, z, p, E заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.

$n=\frac{z^2p(1-p)}{E^2}$

t-тест для сравнения двух средних

t-тест для сравнения двух средних: формула t=\frac{\bar x_1-\bar x_2}{s_p\sqrt{1/n_1+1/n_2}} помогает величины t, x_1, x_2, s_p заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.

$t=\frac{\bar x_1-\bar x_2}{s_p\sqrt{1/n_1+1/n_2}}$

t-тест Уэлча для средних с разными дисперсиями

t-тест Уэлча для средних с разными дисперсиями: формула t=\frac{\bar x_1-\bar x_2}{\sqrt{s_1^2/n_1+s_2^2/n_2}} помогает величины t, x_1, x_2, s_1 заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.

$t=\frac{\bar x_1-\bar x_2}{\sqrt{s_1^2/n_1+s_2^2/n_2}}$

Критерий хи-квадрат независимости

Критерий хи-квадрат независимости: формула \chi^2=\sum\frac{(O-E)^2}{E} помогает величины chi, O, E заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.

$\chi^2=\sum\frac{(O-E)^2}{E}$

Доверительный интервал для доли

Доверительный интервал для доли: формула \hat p\pm z\sqrt{\frac{\hat p(1-\hat p)}{n}} помогает величины p, z, n заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.

$\hat p\pm z\sqrt{\frac{\hat p(1-\hat p)}{n}}$

Размер эффекта Cohen's d для двух средних

Размер эффекта Cohen's d для двух средних: формула d=\frac{\bar x_1-\bar x_2}{s_p} помогает величины d, x_1, x_2, s_p заданы для одной и той же ситуации, периода или объекта. В тексте есть условия, пример, ошибки и проверка результата.

$d=\frac{\bar x_1-\bar x_2}{s_p}$

Коэффициент V Крамера для таблицы сопряженности

Коэффициент V Крамера для таблицы сопряженности: формула V=\sqrt{\frac{\chi^2}{n(k-1)}} помогает требуется требуется требуется требуется требуется требуется оценить силу связи в категориальной таблице. В тексте есть условия, пример, ошибки и проверка результата.

$V=\sqrt{\frac{\chi^2}{n(k-1)}}$