Аналитика
Аналитика
Формулы для анализа данных, метрик, выборок, распределений и отчетов.
38 формул
Таблица формул
| Формула | Запись | Тема | Для чего нужна |
|---|---|---|---|
| Conversion rate (конверсия) | $\hat{p}=\frac{X}{n}$ | A/B-тесты | Конверсия показывает долю пользователей, для которых событие (например, покупка или клик) произошло в группе. |
| Относительный uplift (относительный прирост) | $\text{uplift}_{\%}=\frac{\hat p_B-\hat p_A}{\hat p_A}\cdot 100\%$ | A/B-тесты | Относительный uplift показывает, насколько тест улучшил конверсию относительно контроля в процентах. |
| Абсолютный uplift (разница конверсий) | $\Delta = \hat p_B-\hat p_A$ | A/B-тесты | Абсолютный uplift — это простая разница между конверсиями B и A. |
| Стандартная ошибка доли | $SE(\hat p)=\sqrt{\frac{\hat p(1-\hat p)}{n}}$ | A/B-тесты | SE конверсии показывает, насколько оценка доли может «плавать» из-за случайного разброса выборки. |
| Z-статистика для двух долей | $z = \frac{\hat p_B-\hat p_A}{SE_{\Delta}}$ | A/B-тесты | Z-статистика показывает, насколько наблюдаемая разница конверсий удалена от нуля относительно дисперсии. |
| p-value без калькулятора: ориентиры по z | p \approx 2\,(1-\Phi(|z|)),\; \text{а без калькулятора: }|z|\approx1{,}64\Rightarrow p\approx0{,}10,\;1{,}96\Rightarrow0{,}05,\;2{,}58\Rightarrow0{,}01 |
A/B-тесты | Если нет точного калькулятора, используйте фиксированные пороговые значения |z| для быстрой оценки значимости. |
| Доверительный интервал разницы конверсий | $(\hat p_B-\hat p_A)\pm z_{1-\alpha/2}\cdot SE_{\Delta}$ | A/B-тесты | Интервал показывает диапазон значимых значений разницы между группами на заданном уровне надежности. |
| Минимальный размер выборки для двух долей (базовый) | n \approx \frac{(z_{1-\alpha/2}+z_{1-\beta})^2\left[p_A(1-p_A)+p_B(1-p_B)\right]}{MDE^2},\; n_A=n_B=n |
A/B-тесты | Базовая оценка числа участников в каждой группе для обнаружения минимально значимого эффекта с заданными \alpha и power. |
| MDE (минимально детектируемый эффект) | $MDE = (z_{1-\alpha/2}+z_{1-\beta})\sqrt{\frac{\hat p_A(1-\hat p_A)}{n_A}+\frac{\hat p_B(1-\hat p_B)}{n_B}}$ | A/B-тесты | MDE показывает минимальную разницу конверсий, которую тест сможет обнаружить с заданным α и power. |
| Мощность теста (power) для разности долей — концепт | \text{Power} \approx 1-\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right),\;\beta\approx\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right) |
A/B-тесты | Power отвечает на вопрос: с какой вероятностью тест обнаружит реальный эффект \Delta при заданном дизайне. |
| Среднее арифметическое | $\bar{x}=\frac{x_1+x_2+\dots+x_n}{n}$ | Описательная статистика | Среднее арифметическое показывает типичный уровень числового показателя как сумму всех значений, деленную на количество наблюдений. |
| Медиана | $Me=x_{(\frac{n+1}{2})}\quad\text{для нечетного }n$ | Описательная статистика | Медиана делит упорядоченный набор данных пополам: половина значений не больше медианы, а половина не меньше ее. Это устойчивая мера типичного значения. |
| Мода | $Mo=\text{значение с максимальной частотой}$ | Описательная статистика | Мода — это значение, которое встречается в наборе данных чаще всего. Она полезна для категорий, популярных вариантов и повторяющихся числовых значений. |
| Размах вариации | $R=x_{max}-x_{min}$ | Описательная статистика | Размах вариации показывает расстояние между максимальным и минимальным значением набора данных. Это самый простой показатель разброса. |
| Выборочная дисперсия | $s^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}$ | Описательная статистика | Выборочная дисперсия измеряет средний квадрат отклонений значений от среднего с поправкой на n−1 для оценки разброса по выборке. |
| Выборочное стандартное отклонение | $s=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$ | Описательная статистика | Выборочное стандартное отклонение показывает типичный масштаб отклонения значений от среднего в исходных единицах показателя. |
| Квартили и межквартильный размах | $IQR=Q_3-Q_1$ | Описательная статистика | Межквартильный размах показывает ширину средней половины данных: это разница между третьим и первым квартилем, устойчивее полного размаха. |
| Правило выбросов по IQR | $x<Q_1-1.5\cdot IQR\quad\text{или}\quad x>Q_3+1.5\cdot IQR$ | Описательная статистика | Правило 1,5 IQR помечает значения как возможные выбросы, если они лежат ниже Q1−1,5·IQR или выше Q3+1,5·IQR, без предположения о нормальности. |
| Коэффициент вариации | $CV=\frac{s}{\bar{x}}\cdot100\%$ | Описательная статистика | Коэффициент вариации показывает относительный разброс: стандартное отклонение делят на среднее и выражают результат в процентах. |
| Z-оценка | $z=\frac{x-\bar{x}}{s}$ | Описательная статистика | Z-оценка показывает, на сколько стандартных отклонений наблюдение находится выше или ниже среднего значения, и помогает сравнивать разные шкалы. |
| DAU to MAU ratio | $\text{DAU/MAU} = \frac{\text{DAU}}{\text{MAU}}\cdot 100\%$ | Продуктовые метрики | The DAU/MAU ratio shows what share of monthly active users visit your product on an average day. |
| Cohort retention rate | $\text{Retention} = \frac{N_{\text{active at end}}}{N_{\text{cohort start}}}\cdot 100\%$ | Продуктовые метрики | Retention rate measures what percentage of a cohort remains active after a chosen period. |
| Churn rate | $\text{Churn} = \frac{N_{\text{churned}}}{N_{\text{period start}}}\cdot 100\%$ | Продуктовые метрики | Churn rate shows the proportion of users or customers that stop being active/paying during a period. |
| ARPU | $\text{ARPU} = \frac{R}{\text{MAU}}$ | Продуктовые метрики | ARPU is average revenue produced per active user in a period. |
| ARPPU | $\text{ARPPU} = \frac{R}{N_{\text{paying}}}$ | Продуктовые метрики | ARPPU indicates average revenue for paying users only. |
| Basic LTV | $\text{LTV} \approx \text{ARPU} \cdot \text{Gross Margin} \cdot L$ | Продуктовые метрики | A practical LTV estimate multiplies average revenue per user by gross margin and average customer life. |
| Customer Acquisition Cost (CAC) | $\text{CAC} = \frac{C_{\text{marketing}} + C_{\text{sales}}}{N_{\text{new customers}}}$ | Продуктовые метрики | CAC shows how much marketing and sales spending is needed to acquire one new customer. |
| Conversion funnel step rate | $\text{CR}_{i\to i+1}=\frac{U_{i+1}}{U_i}\cdot100\%$ | Продуктовые метрики | Step conversion shows how efficiently users move from one funnel stage to the next. |
| Activation rate | $\text{Activation Rate} = \frac{N_{\text{activated}}}{N_{\text{registered}}}\cdot100\%$ | Продуктовые метрики | Activation rate tracks how many new registrants reach a predefined value moment. |
| Базовая формула процентного изменения | $\frac{X_2 - X_1}{X_1} \times 100\%$ | Эластичность | Процентное изменение показывает, на сколько процентов новая величина отличается от исходной. В эластичности эта базовая запись нужна для расчета реакции количества, цены, дохода или цены связанного товара. |
| Ценовая эластичность спроса | $E_d = \left|\frac{\%\Delta Q_d}{\%\Delta P}\right|$ | Эластичность | Ценовая эластичность спроса измеряет, насколько сильно меняется спрос при изменении цены. В учебной практике результат обычно читают по модулю, чтобы не путать знак закона спроса с силой реакции. |
| Ценовая эластичность предложения | $E_s = \frac{\%\Delta Q_s}{\%\Delta P}$ | Эластичность | Ценовая эластичность предложения показывает, насколько сильно производители меняют объем выпуска при изменении цены. В отличие от спроса, коэффициент предложения обычно читают без модуля, потому что связь цены и выпуска положительная. |
| Дуговая эластичность | $E_{arc} = \frac{\frac{Q_2 - Q_1}{(Q_2 + Q_1)/2}}{\frac{P_2 - P_1}{(P_2 + P_1)/2}}$ | Эластичность | Дуговая эластичность сравнивает две точки на кривой и использует средние значения как базу. Это удобный способ убрать зависимость ответа от того, с какой стороны вы считаете изменение. |
| Точечная эластичность | $E = \frac{dQ}{dP} \cdot \frac{P}{Q}$ | Эластичность | Точечная эластичность измеряет чувствительность в конкретной точке кривой. Она опирается на производную и удобна там, где нужно понять локальную реакцию на очень малое изменение цены. |
| Перекрестная эластичность спроса | $E_{xy} = \frac{\%\Delta Q_x}{\%\Delta P_y}$ | Эластичность | Перекрестная эластичность показывает, как спрос на один товар реагирует на изменение цены другого товара. Она помогает отличить заменители от дополняющих товаров и оценить силу связи между рынками. |
| Эластичность спроса по доходу | $E_Y = \frac{\%\Delta Q_d}{\%\Delta Y}$ | Эластичность | Эластичность спроса по доходу показывает, как меняется спрос при изменении дохода потребителя. Она помогает отличить нормальные товары от низших и понять, насколько товар связан с ростом благосостояния. |
| Выручка и эластичность | $TR = P \cdot Q$ | Эластичность | Выручка равна цене, умноженной на количество. Связь с эластичностью помогает понять, когда снижение цены может увеличить выручку, а когда выгоднее поднять цену. |
| Интерпретация |E| > 1, |E| < 1 и |E| = 1 | $\left|E\right| = \left|\frac{\%\Delta Q}{\%\Delta X}\right|$ | Эластичность | Интерпретация по модулю позволяет быстро понять, сильна или слаба реакция одной переменной на другую. Порог 1 делит коэффициенты на эластичные, неэластичные и единичные. |