Аналитика / Описательная статистика
Коэффициент вариации
Коэффициент вариации показывает относительный разброс: стандартное отклонение делят на среднее и выражают результат в процентах.
Формула
Две группы с разными средними показаны рядом: у крупной группы больше абсолютное s, но меньший относительный CV.
CV сравнивает разброс относительно среднего уровня.
Обозначения
- $CV$
- коэффициент вариации, %
- $s$
- выборочное стандартное отклонение, единица исходного показателя
- $\bar{x}$
- среднее арифметическое, единица исходного показателя
Условия применения
- Среднее должно быть положительным и достаточно далеко от нуля.
- Показатель должен иметь осмысленный ноль, например деньги, время, масса, количество.
- Стандартное отклонение и среднее рассчитаны по одному и тому же набору данных.
Ограничения
- CV плохо работает, если среднее близко к нулю: показатель становится огромным и нестабильным.
- Для шкал без естественного нуля, например температуры в градусах Цельсия, CV может быть некорректным.
- Коэффициент чувствителен к выбросам через стандартное отклонение и среднее.
Подробное объяснение
Стандартное отклонение показывает абсолютный разброс в единицах показателя. Но абсолютный разброс не всегда удобно сравнивать. Отклонение 10 000 рублей может быть большим для малого магазина и небольшим для крупного. Коэффициент вариации решает эту задачу: он делит разброс на средний уровень.
Если CV равен 10%, типичный масштаб отклонения составляет около одной десятой среднего значения. Это не означает, что все значения лежат в пределах 10%, но дает понятное относительное представление о стабильности.
CV особенно полезен для сравнения процессов с разным масштабом. Можно сравнивать стабильность продаж маленького и большого филиала, расхода сырья на разных линиях или времени операций у команд с разной средней нагрузкой.
Однако показатель требует осторожности. Если среднее близко к нулю, деление делает CV нестабильным. Если шкала не имеет осмысленного нуля, относительный разброс теряет смысл. Поэтому перед расчетом нужно проверить природу метрики, а не только подставить числа.
Как пользоваться формулой
- Рассчитайте среднее арифметическое.
- Рассчитайте выборочное стандартное отклонение.
- Проверьте, что среднее положительно и не близко к нулю.
- Разделите стандартное отклонение на среднее.
- Умножьте результат на 100%.
Историческая справка
Коэффициент вариации появился как способ сравнивать вариативность на разных шкалах. Абсолютные меры разброса не всегда сопоставимы: стандартное отклонение в 5 единиц может быть большим или маленьким в зависимости от среднего уровня. Относительная форма s/x̄ делает показатель безразмерным и удобным для сравнения. В статистике, биологии, экономике, контроле качества и аналитике CV используют там, где важна стабильность относительно масштаба процесса. Со временем показатель стал популярным в отчетах, но вместе с этим выросла важность оговорок: он требует положительного осмысленного среднего и плохо работает около нуля. Поэтому современные учебники обычно подают CV вместе с условиями применимости, а не как универсальную меру риска.
Историческая линия формулы
У коэффициента вариации нет одного прикладного автора. Это относительная мера разброса, развивавшаяся в статистической практике сравнения вариативности. Ее корректно связывать с описательной статистикой и контролем качества.
Пример
У магазина A средний дневной оборот 100 000 рублей, стандартное отклонение 10 000 рублей. CV_A = 10 000 / 100 000 * 100% = 10%. У магазина B средний дневной оборот 20 000 рублей, стандартное отклонение 4 000 рублей. CV_B = 4 000 / 20 000 * 100% = 20%. В абсолютных рублях разброс магазина A больше, но относительно своего масштаба магазин B менее стабилен. Поэтому коэффициент вариации полезен, когда нельзя сравнивать стандартные отклонения напрямую из-за разных уровней показателя. В выводе лучше писать не только проценты, но и исходные средние.
Частая ошибка
Частая ошибка - сравнивать CV для показателей, где среднее может быть нулевым или отрицательным. Вторая ошибка - применять коэффициент к шкалам без естественного нуля: температура 20°C не означает в два раза больше тепла, чем 10°C. Третья ошибка - забывать умножение на 100%, из-за чего 0,12 и 12% начинают путаться в отчете. Также нельзя использовать CV как замену графику распределения, если данные скошены или содержат выбросы.
Практика
Задачи с решением
Сравнить стабильность
Условие. У процесса A среднее 50, s = 5. У процесса B среднее 200, s = 30. Найдите CV и сравните.
Решение. CV_A = 5/50*100% = 10%. CV_B = 30/200*100% = 15%. Относительно среднего процесс A стабильнее.
Ответ. A: 10%, B: 15%; стабильнее A
Проверка применимости
Условие. Среднее изменение баланса равно 0,5 рубля, стандартное отклонение 20 рублей. Стоит ли полагаться на CV?
Решение. CV = 20/0,5*100% = 4000%, но среднее близко к нулю. Такой CV нестабилен и плохо интерпретируется.
Ответ. нет, среднее слишком близко к нулю
Дополнительные источники
- NIST/SEMATECH e-Handbook of Statistical Methods, разделы о relative variation
- OpenStax Introductory Statistics, раздел Measures of the Spread of the Data
- Учебная статистика: коэффициент вариации как относительная мера разброса
Связанные формулы
Аналитика
Выборочное стандартное отклонение
Выборочное стандартное отклонение показывает типичный масштаб отклонения значений от среднего в исходных единицах показателя.
Аналитика
Среднее арифметическое
Среднее арифметическое показывает типичный уровень числового показателя как сумму всех значений, деленную на количество наблюдений.
Аналитика
Выборочная дисперсия
Выборочная дисперсия измеряет средний квадрат отклонений значений от среднего с поправкой на n−1 для оценки разброса по выборке.