Аналитика / Описательная статистика

Коэффициент вариации

Коэффициент вариации показывает относительный разброс: стандартное отклонение делят на среднее и выражают результат в процентах.

Опубликовано: Обновлено:

Формула

$$CV=\frac{s}{\bar{x}}\cdot100\%$$
Сравнение двух процессов Абсолютный и относительный разброс

Две группы с разными средними показаны рядом: у крупной группы больше абсолютное s, но меньший относительный CV.

CV сравнивает разброс относительно среднего уровня.

Обозначения

$CV$
коэффициент вариации, %
$s$
выборочное стандартное отклонение, единица исходного показателя
$\bar{x}$
среднее арифметическое, единица исходного показателя

Условия применения

  • Среднее должно быть положительным и достаточно далеко от нуля.
  • Показатель должен иметь осмысленный ноль, например деньги, время, масса, количество.
  • Стандартное отклонение и среднее рассчитаны по одному и тому же набору данных.

Ограничения

  • CV плохо работает, если среднее близко к нулю: показатель становится огромным и нестабильным.
  • Для шкал без естественного нуля, например температуры в градусах Цельсия, CV может быть некорректным.
  • Коэффициент чувствителен к выбросам через стандартное отклонение и среднее.

Подробное объяснение

Стандартное отклонение показывает абсолютный разброс в единицах показателя. Но абсолютный разброс не всегда удобно сравнивать. Отклонение 10 000 рублей может быть большим для малого магазина и небольшим для крупного. Коэффициент вариации решает эту задачу: он делит разброс на средний уровень.

Если CV равен 10%, типичный масштаб отклонения составляет около одной десятой среднего значения. Это не означает, что все значения лежат в пределах 10%, но дает понятное относительное представление о стабильности.

CV особенно полезен для сравнения процессов с разным масштабом. Можно сравнивать стабильность продаж маленького и большого филиала, расхода сырья на разных линиях или времени операций у команд с разной средней нагрузкой.

Однако показатель требует осторожности. Если среднее близко к нулю, деление делает CV нестабильным. Если шкала не имеет осмысленного нуля, относительный разброс теряет смысл. Поэтому перед расчетом нужно проверить природу метрики, а не только подставить числа.

Как пользоваться формулой

  1. Рассчитайте среднее арифметическое.
  2. Рассчитайте выборочное стандартное отклонение.
  3. Проверьте, что среднее положительно и не близко к нулю.
  4. Разделите стандартное отклонение на среднее.
  5. Умножьте результат на 100%.

Историческая справка

Коэффициент вариации появился как способ сравнивать вариативность на разных шкалах. Абсолютные меры разброса не всегда сопоставимы: стандартное отклонение в 5 единиц может быть большим или маленьким в зависимости от среднего уровня. Относительная форма s/x̄ делает показатель безразмерным и удобным для сравнения. В статистике, биологии, экономике, контроле качества и аналитике CV используют там, где важна стабильность относительно масштаба процесса. Со временем показатель стал популярным в отчетах, но вместе с этим выросла важность оговорок: он требует положительного осмысленного среднего и плохо работает около нуля. Поэтому современные учебники обычно подают CV вместе с условиями применимости, а не как универсальную меру риска.

Историческая линия формулы

У коэффициента вариации нет одного прикладного автора. Это относительная мера разброса, развивавшаяся в статистической практике сравнения вариативности. Ее корректно связывать с описательной статистикой и контролем качества.

Пример

У магазина A средний дневной оборот 100 000 рублей, стандартное отклонение 10 000 рублей. CV_A = 10 000 / 100 000 * 100% = 10%. У магазина B средний дневной оборот 20 000 рублей, стандартное отклонение 4 000 рублей. CV_B = 4 000 / 20 000 * 100% = 20%. В абсолютных рублях разброс магазина A больше, но относительно своего масштаба магазин B менее стабилен. Поэтому коэффициент вариации полезен, когда нельзя сравнивать стандартные отклонения напрямую из-за разных уровней показателя. В выводе лучше писать не только проценты, но и исходные средние.

Частая ошибка

Частая ошибка - сравнивать CV для показателей, где среднее может быть нулевым или отрицательным. Вторая ошибка - применять коэффициент к шкалам без естественного нуля: температура 20°C не означает в два раза больше тепла, чем 10°C. Третья ошибка - забывать умножение на 100%, из-за чего 0,12 и 12% начинают путаться в отчете. Также нельзя использовать CV как замену графику распределения, если данные скошены или содержат выбросы.

Практика

Задачи с решением

Сравнить стабильность

Условие. У процесса A среднее 50, s = 5. У процесса B среднее 200, s = 30. Найдите CV и сравните.

Решение. CV_A = 5/50*100% = 10%. CV_B = 30/200*100% = 15%. Относительно среднего процесс A стабильнее.

Ответ. A: 10%, B: 15%; стабильнее A

Проверка применимости

Условие. Среднее изменение баланса равно 0,5 рубля, стандартное отклонение 20 рублей. Стоит ли полагаться на CV?

Решение. CV = 20/0,5*100% = 4000%, но среднее близко к нулю. Такой CV нестабилен и плохо интерпретируется.

Ответ. нет, среднее слишком близко к нулю

Дополнительные источники

  • NIST/SEMATECH e-Handbook of Statistical Methods, разделы о relative variation
  • OpenStax Introductory Statistics, раздел Measures of the Spread of the Data
  • Учебная статистика: коэффициент вариации как относительная мера разброса

Связанные формулы

Аналитика

Выборочное стандартное отклонение

$s=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$

Выборочное стандартное отклонение показывает типичный масштаб отклонения значений от среднего в исходных единицах показателя.

Аналитика

Среднее арифметическое

$\bar{x}=\frac{x_1+x_2+\dots+x_n}{n}$

Среднее арифметическое показывает типичный уровень числового показателя как сумму всех значений, деленную на количество наблюдений.

Аналитика

Выборочная дисперсия

$s^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}$

Выборочная дисперсия измеряет средний квадрат отклонений значений от среднего с поправкой на n−1 для оценки разброса по выборке.