Аналитика / Описательная статистика
Коэффициент вариации
Коэффициент вариации показывает относительный разброс: стандартное отклонение делят на среднее и выражают результат в процентах.
Формула
Две группы с разными средними показаны рядом: у крупной группы больше абсолютное s, но меньший относительный CV.
CV сравнивает разброс относительно среднего уровня.
Обозначения
- $CV$
- коэффициент вариации, %
- $s$
- выборочное стандартное отклонение, единица исходного показателя
- $\bar{x}$
- среднее арифметическое, единица исходного показателя
Условия применения
- Среднее должно быть положительным и достаточно далеко от нуля.
- Показатель должен иметь осмысленный ноль, например деньги, время, масса, количество.
- Стандартное отклонение и среднее рассчитаны по одному и тому же набору данных.
Ограничения
- CV плохо работает, если среднее близко к нулю: показатель становится огромным и нестабильным.
- Для шкал без естественного нуля, например температуры в градусах Цельсия, CV может быть некорректным.
- Коэффициент чувствителен к выбросам через стандартное отклонение и среднее.
Подробное объяснение
Стандартное отклонение показывает абсолютный разброс в единицах показателя. Но абсолютный разброс не всегда удобно сравнивать. Отклонение 10 000 рублей может быть большим для малого магазина и небольшим для крупного. Коэффициент вариации решает эту задачу: он делит разброс на средний уровень. Если CV равен 10%, типичный масштаб отклонения составляет около одной десятой среднего значения. Это не означает, что все значения лежат в пределах 10%, но дает понятное относительное представление о стабильности. CV особенно полезен для сравнения процессов с разным масштабом. Можно сравнивать стабильность продаж маленького и большого филиала, расхода сырья на разных линиях или времени операций у команд с разной средней нагрузкой. Однако показатель требует осторожности. Если среднее близко к нулю, деление делает CV нестабильным. Если шкала не имеет осмысленного нуля, относительный разброс теряет смысл. Поэтому перед расчетом нужно проверить природу метрики, а не только подставить числа.
Как пользоваться формулой
- Рассчитайте среднее арифметическое.
- Рассчитайте выборочное стандартное отклонение.
- Проверьте, что среднее положительно и не близко к нулю.
- Разделите стандартное отклонение на среднее.
- Умножьте результат на 100%.
Историческая справка
Коэффициент вариации появился как способ сравнивать вариативность на разных шкалах. Абсолютные меры разброса не всегда сопоставимы: стандартное отклонение в 5 единиц может быть большим или маленьким в зависимости от среднего уровня. Относительная форма s/x̄ делает показатель безразмерным и удобным для сравнения. В статистике, биологии, экономике, контроле качества и аналитике CV используют там, где важна стабильность относительно масштаба процесса. Со временем показатель стал популярным в отчетах, но вместе с этим выросла важность оговорок: он требует положительного осмысленного среднего и плохо работает около нуля. Поэтому современные учебники обычно подают CV вместе с условиями применимости, а не как универсальную меру риска.
Историческая линия формулы
У коэффициента вариации нет одного прикладного автора. Это относительная мера разброса, развивавшаяся в статистической практике сравнения вариативности. Ее корректно связывать с описательной статистикой и контролем качества.
Пример
У магазина A средний дневной оборот 100 000 рублей, стандартное отклонение 10 000 рублей. CV_A = 10 000 / 100 000 * 100% = 10%. У магазина B средний дневной оборот 20 000 рублей, стандартное отклонение 4 000 рублей. CV_B = 4 000 / 20 000 * 100% = 20%. В абсолютных рублях разброс магазина A больше, но относительно своего масштаба магазин B менее стабилен. Поэтому коэффициент вариации полезен, когда нельзя сравнивать стандартные отклонения напрямую из-за разных уровней показателя. В выводе лучше писать не только проценты, но и исходные средние.
Частая ошибка
Частая ошибка - сравнивать CV для показателей, где среднее может быть нулевым или отрицательным. Вторая ошибка - применять коэффициент к шкалам без естественного нуля: температура 20°C не означает в два раза больше тепла, чем 10°C. Третья ошибка - забывать умножение на 100%, из-за чего 0,12 и 12% начинают путаться в отчете. Также нельзя использовать CV как замену графику распределения, если данные скошены или содержат выбросы.
Практика
Задачи с решением
Сравнить стабильность
Условие. У процесса A среднее 50, s = 5. У процесса B среднее 200, s = 30. Найдите CV и сравните.
Решение. CV_A = 5/50*100% = 10%. CV_B = 30/200*100% = 15%. Относительно среднего процесс A стабильнее.
Ответ. A: 10%, B: 15%; стабильнее A
Проверка применимости
Условие. Среднее изменение баланса равно 0,5 рубля, стандартное отклонение 20 рублей. Стоит ли полагаться на CV?
Решение. CV = 20/0,5*100% = 4000%, но среднее близко к нулю. Такой CV нестабилен и плохо интерпретируется.
Ответ. нет, среднее слишком близко к нулю
Дополнительные источники
- NIST/SEMATECH e-Handbook of Statistical Methods, разделы о relative variation
- OpenStax Introductory Statistics, раздел Measures of the Spread of the Data
- Учебная статистика: коэффициент вариации как относительная мера разброса
Связанные формулы
Аналитика
Выборочное стандартное отклонение
Выборочное стандартное отклонение показывает типичный масштаб отклонения значений от среднего в исходных единицах показателя.
Аналитика
Среднее арифметическое
Среднее арифметическое показывает типичный уровень числового показателя как сумму всех значений, деленную на количество наблюдений.
Аналитика
Выборочная дисперсия
Выборочная дисперсия с делением на n−1 оценивает дисперсию генеральной совокупности по выборке и измеряет средний квадрат отклонений от выборочного среднего.