Аналитика

Аналитика

Формулы для анализа данных, метрик, выборок, распределений и отчетов.

38 формул

Таблица формул

Формула Запись Тема Для чего нужна
Conversion rate (конверсия) $\hat{p}=\frac{X}{n}$ A/B-тесты Конверсия показывает долю пользователей, для которых событие (например, покупка или клик) произошло в группе.
Относительный uplift (относительный прирост) $\text{uplift}_{\%}=\frac{\hat p_B-\hat p_A}{\hat p_A}\cdot 100\%$ A/B-тесты Относительный uplift показывает, насколько тест улучшил конверсию относительно контроля в процентах.
Абсолютный uplift (разница конверсий) $\Delta = \hat p_B-\hat p_A$ A/B-тесты Абсолютный uplift — это простая разница между конверсиями B и A.
Стандартная ошибка доли $SE(\hat p)=\sqrt{\frac{\hat p(1-\hat p)}{n}}$ A/B-тесты SE конверсии показывает, насколько оценка доли может «плавать» из-за случайного разброса выборки.
Z-статистика для двух долей $z = \frac{\hat p_B-\hat p_A}{SE_{\Delta}}$ A/B-тесты Z-статистика показывает, насколько наблюдаемая разница конверсий удалена от нуля относительно дисперсии.
p-value без калькулятора: ориентиры по z p \approx 2\,(1-\Phi(|z|)),\; \text{а без калькулятора: }|z|\approx1{,}64\Rightarrow p\approx0{,}10,\;1{,}96\Rightarrow0{,}05,\;2{,}58\Rightarrow0{,}01 A/B-тесты Если нет точного калькулятора, используйте фиксированные пороговые значения |z| для быстрой оценки значимости.
Доверительный интервал разницы конверсий $(\hat p_B-\hat p_A)\pm z_{1-\alpha/2}\cdot SE_{\Delta}$ A/B-тесты Интервал показывает диапазон значимых значений разницы между группами на заданном уровне надежности.
Минимальный размер выборки для двух долей (базовый) n \approx \frac{(z_{1-\alpha/2}+z_{1-\beta})^2\left[p_A(1-p_A)+p_B(1-p_B)\right]}{MDE^2},\; n_A=n_B=n A/B-тесты Базовая оценка числа участников в каждой группе для обнаружения минимально значимого эффекта с заданными \alpha и power.
MDE (минимально детектируемый эффект) $MDE = (z_{1-\alpha/2}+z_{1-\beta})\sqrt{\frac{\hat p_A(1-\hat p_A)}{n_A}+\frac{\hat p_B(1-\hat p_B)}{n_B}}$ A/B-тесты MDE показывает минимальную разницу конверсий, которую тест сможет обнаружить с заданным α и power.
Мощность теста (power) для разности долей — концепт \text{Power} \approx 1-\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right),\;\beta\approx\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right) A/B-тесты Power отвечает на вопрос: с какой вероятностью тест обнаружит реальный эффект \Delta при заданном дизайне.
Среднее арифметическое $\bar{x}=\frac{x_1+x_2+\dots+x_n}{n}$ Описательная статистика Среднее арифметическое показывает типичный уровень числового показателя как сумму всех значений, деленную на количество наблюдений.
Медиана $Me=x_{(\frac{n+1}{2})}\quad\text{для нечетного }n$ Описательная статистика Медиана делит упорядоченный набор данных пополам: половина значений не больше медианы, а половина не меньше ее. Это устойчивая мера типичного значения.
Мода $Mo=\text{значение с максимальной частотой}$ Описательная статистика Мода — это значение, которое встречается в наборе данных чаще всего. Она полезна для категорий, популярных вариантов и повторяющихся числовых значений.
Размах вариации $R=x_{max}-x_{min}$ Описательная статистика Размах вариации показывает расстояние между максимальным и минимальным значением набора данных. Это самый простой показатель разброса.
Выборочная дисперсия $s^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}$ Описательная статистика Выборочная дисперсия измеряет средний квадрат отклонений значений от среднего с поправкой на n−1 для оценки разброса по выборке.
Выборочное стандартное отклонение $s=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$ Описательная статистика Выборочное стандартное отклонение показывает типичный масштаб отклонения значений от среднего в исходных единицах показателя.
Квартили и межквартильный размах $IQR=Q_3-Q_1$ Описательная статистика Межквартильный размах показывает ширину средней половины данных: это разница между третьим и первым квартилем, устойчивее полного размаха.
Правило выбросов по IQR $x<Q_1-1.5\cdot IQR\quad\text{или}\quad x>Q_3+1.5\cdot IQR$ Описательная статистика Правило 1,5 IQR помечает значения как возможные выбросы, если они лежат ниже Q1−1,5·IQR или выше Q3+1,5·IQR, без предположения о нормальности.
Коэффициент вариации $CV=\frac{s}{\bar{x}}\cdot100\%$ Описательная статистика Коэффициент вариации показывает относительный разброс: стандартное отклонение делят на среднее и выражают результат в процентах.
Z-оценка $z=\frac{x-\bar{x}}{s}$ Описательная статистика Z-оценка показывает, на сколько стандартных отклонений наблюдение находится выше или ниже среднего значения, и помогает сравнивать разные шкалы.
DAU to MAU ratio $\text{DAU/MAU} = \frac{\text{DAU}}{\text{MAU}}\cdot 100\%$ Продуктовые метрики The DAU/MAU ratio shows what share of monthly active users visit your product on an average day.
Cohort retention rate $\text{Retention} = \frac{N_{\text{active at end}}}{N_{\text{cohort start}}}\cdot 100\%$ Продуктовые метрики Retention rate measures what percentage of a cohort remains active after a chosen period.
Churn rate $\text{Churn} = \frac{N_{\text{churned}}}{N_{\text{period start}}}\cdot 100\%$ Продуктовые метрики Churn rate shows the proportion of users or customers that stop being active/paying during a period.
ARPU $\text{ARPU} = \frac{R}{\text{MAU}}$ Продуктовые метрики ARPU is average revenue produced per active user in a period.
ARPPU $\text{ARPPU} = \frac{R}{N_{\text{paying}}}$ Продуктовые метрики ARPPU indicates average revenue for paying users only.
Basic LTV $\text{LTV} \approx \text{ARPU} \cdot \text{Gross Margin} \cdot L$ Продуктовые метрики A practical LTV estimate multiplies average revenue per user by gross margin and average customer life.
Customer Acquisition Cost (CAC) $\text{CAC} = \frac{C_{\text{marketing}} + C_{\text{sales}}}{N_{\text{new customers}}}$ Продуктовые метрики CAC shows how much marketing and sales spending is needed to acquire one new customer.
Conversion funnel step rate $\text{CR}_{i\to i+1}=\frac{U_{i+1}}{U_i}\cdot100\%$ Продуктовые метрики Step conversion shows how efficiently users move from one funnel stage to the next.
Activation rate $\text{Activation Rate} = \frac{N_{\text{activated}}}{N_{\text{registered}}}\cdot100\%$ Продуктовые метрики Activation rate tracks how many new registrants reach a predefined value moment.
Базовая формула процентного изменения $\frac{X_2 - X_1}{X_1} \times 100\%$ Эластичность Процентное изменение показывает, на сколько процентов новая величина отличается от исходной. В эластичности эта базовая запись нужна для расчета реакции количества, цены, дохода или цены связанного товара.
Ценовая эластичность спроса $E_d = \left|\frac{\%\Delta Q_d}{\%\Delta P}\right|$ Эластичность Ценовая эластичность спроса измеряет, насколько сильно меняется спрос при изменении цены. В учебной практике результат обычно читают по модулю, чтобы не путать знак закона спроса с силой реакции.
Ценовая эластичность предложения $E_s = \frac{\%\Delta Q_s}{\%\Delta P}$ Эластичность Ценовая эластичность предложения показывает, насколько сильно производители меняют объем выпуска при изменении цены. В отличие от спроса, коэффициент предложения обычно читают без модуля, потому что связь цены и выпуска положительная.
Дуговая эластичность $E_{arc} = \frac{\frac{Q_2 - Q_1}{(Q_2 + Q_1)/2}}{\frac{P_2 - P_1}{(P_2 + P_1)/2}}$ Эластичность Дуговая эластичность сравнивает две точки на кривой и использует средние значения как базу. Это удобный способ убрать зависимость ответа от того, с какой стороны вы считаете изменение.
Точечная эластичность $E = \frac{dQ}{dP} \cdot \frac{P}{Q}$ Эластичность Точечная эластичность измеряет чувствительность в конкретной точке кривой. Она опирается на производную и удобна там, где нужно понять локальную реакцию на очень малое изменение цены.
Перекрестная эластичность спроса $E_{xy} = \frac{\%\Delta Q_x}{\%\Delta P_y}$ Эластичность Перекрестная эластичность показывает, как спрос на один товар реагирует на изменение цены другого товара. Она помогает отличить заменители от дополняющих товаров и оценить силу связи между рынками.
Эластичность спроса по доходу $E_Y = \frac{\%\Delta Q_d}{\%\Delta Y}$ Эластичность Эластичность спроса по доходу показывает, как меняется спрос при изменении дохода потребителя. Она помогает отличить нормальные товары от низших и понять, насколько товар связан с ростом благосостояния.
Выручка и эластичность $TR = P \cdot Q$ Эластичность Выручка равна цене, умноженной на количество. Связь с эластичностью помогает понять, когда снижение цены может увеличить выручку, а когда выгоднее поднять цену.
Интерпретация |E| > 1, |E| < 1 и |E| = 1 $\left|E\right| = \left|\frac{\%\Delta Q}{\%\Delta X}\right|$ Эластичность Интерпретация по модулю позволяет быстро понять, сильна или слаба реакция одной переменной на другую. Порог 1 делит коэффициенты на эластичные, неэластичные и единичные.