Аналитика

Анализ данных

Базовые вычисления для описания, сравнения и проверки наборов данных.

138 формул

Таблица формул

Показаны 1-60 из 138. Остальные формулы доступны на соседних страницах подборки.

Формула Запись Тема Для чего нужна
Conversion rate (конверсия) $\hat{p}=\frac{X}{n}$ A/B-тесты Conversion rate (конверсия): формула \hat{p}=\frac{X}{n} помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата.
Относительный uplift (относительный прирост) $\text{uplift}_{\%}=\frac{\hat p_B-\hat p_A}{\hat p_A}\cdot 100\%$ A/B-тесты Относительный uplift (относительный прирост): формула \text{uplift}_{\%}=\frac{\hat p_B-\hat p_A}{\hat p_A}\cdot 100\% помогает требуется требуется требуется требуется требуется требуется требуется посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверк...
Абсолютный uplift (разница конверсий) $\Delta = \hat p_B-\hat p_A$ A/B-тесты Абсолютный uplift (разница конверсий): формула \Delta = \hat p_B-\hat p_A помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата.
Стандартная ошибка доли $SE(\hat p)=\sqrt{\frac{\hat p(1-\hat p)}{n}}$ A/B-тесты Стандартная ошибка доли: формула SE(\hat p)=\sqrt{\frac{\hat p(1-\hat p)}{n}} помогает требуется требуется требуется требуется требуется требуется требуется посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата.
Z-статистика для двух долей $z = \frac{\hat p_B-\hat p_A}{SE_{\Delta}}$ A/B-тесты Z-статистика для двух долей: формула z = \frac{\hat p_B-\hat p_A}{SE_{\Delta}} помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата.
p-value без калькулятора: ориентиры по z $p \approx 2\,(1-\Phi(|z|)),\; \text{а без калькулятора: }|z|\approx1{,}64\Rightarrow p\approx0{,}10,\;1{,}96\Rightarrow0{,}05,\;2{,}58\Rightarrow0{,}01$ A/B-тесты p-value без калькулятора: ориентиры по z: формула p \approx 2\,(1-\Phi(|z|)),\; \text{а без калькулятора: }|z|\approx1{,}64\Rightarrow p\approx0{,}10,\;1{,}96\Rightarrow0{,}05,\;2{,}58\Rightarrow0{,}01 помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, оши...
Доверительный интервал разницы конверсий $(\hat p_B-\hat p_A)\pm z_{1-\alpha/2}\cdot SE_{\Delta}$ A/B-тесты Доверительный интервал разницы конверсий: формула (\hat p_B-\hat p_A)\pm z_{1-\alpha/2}\cdot SE_{\Delta} помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата.
Минимальный размер выборки для двух долей (базовый) $n \approx \frac{(z_{1-\alpha/2}+z_{1-\beta})^2\left[p_A(1-p_A)+p_B(1-p_B)\right]}{MDE^2},\; n_A=n_B=n$ A/B-тесты Минимальный размер выборки для двух долей (базовый): формула n \approx \frac{(z_{1-\alpha/2}+z_{1-\beta})^2\left[p_A(1-p_A)+p_B(1-p_B)\right]}{MDE^2},\; n_A=n_B=n помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата.
MDE в статистике и A/B-тестах $MDE = (z_{1-\alpha/2}+z_{1-\beta})\sqrt{\frac{\hat p_A(1-\hat p_A)}{n_A}+\frac{\hat p_B(1-\hat p_B)}{n_B}}$ A/B-тесты MDE в статистике и A/B-тестах: формула MDE = (z_{1-\alpha/2}+z_{1-\beta})\sqrt{\frac{\hat p_A(1-\hat p_A)}{n_A}+\frac{\hat p_B(1-\hat p_B)}{n_B}} помогает требуется требуется требуется требуется требуется требуется требуется посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть услови...
Мощность теста (power) для разности долей — концепт $\text{Power} \approx 1-\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right),\;\beta\approx\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right)$ A/B-тесты Мощность теста (power) для разности долей — концепт: формула \text{Power} \approx 1-\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right),\;\beta\approx\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right) помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть ус...
Среднее арифметическое $\bar{x}=\frac{x_1+x_2+\dots+x_n}{n}$ Описательная статистика Среднее арифметическое показывает типичный уровень числового показателя как сумму всех значений, деленную на количество наблюдений.
Медиана $Me=x_{(\frac{n+1}{2})}\quad\text{для нечетного }n$ Описательная статистика Медиана делит упорядоченный набор данных пополам: половина значений не больше медианы, а половина не меньше ее. Это устойчивая мера типичного значения.
Мода $Mo=\text{значение с максимальной частотой}$ Описательная статистика Мода — это значение, которое встречается в наборе данных чаще всего. Она полезна для категорий, популярных вариантов и повторяющихся числовых значений.
Размах вариации $R=x_{max}-x_{min}$ Описательная статистика Размах вариации показывает расстояние между максимальным и минимальным значением набора данных. Это самый простой показатель разброса.
Выборочная дисперсия $s^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}$ Описательная статистика Выборочная дисперсия с делением на n−1 оценивает дисперсию генеральной совокупности по выборке и измеряет средний квадрат отклонений от выборочного среднего.
Выборочное стандартное отклонение $s=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$ Описательная статистика Выборочное стандартное отклонение показывает типичный масштаб отклонения значений от среднего в исходных единицах показателя.
Квартили и межквартильный размах $IQR=Q_3-Q_1$ Описательная статистика Межквартильный размах, или IQR, показывает ширину средней половины данных: это разница между третьим и первым квартилем. Формула: IQR = Q3 - Q1.
Правило выбросов по IQR $x<Q_1-1.5\cdot IQR\quad\text{или}\quad x>Q_3+1.5\cdot IQR$ Описательная статистика Правило 1,5 IQR помечает возможные выбросы: значение считают необычным, если оно меньше Q1 - 1,5*IQR или больше Q3 + 1,5*IQR. Это правило для первичной проверки, а не автоматического удаления строк.
Коэффициент вариации $CV=\frac{s}{\bar{x}}\cdot100\%$ Описательная статистика Коэффициент вариации показывает относительный разброс: стандартное отклонение делят на среднее и выражают результат в процентах.
Z-оценка $z=\frac{x-\bar{x}}{s}$ Описательная статистика Z-оценка показывает, на сколько стандартных отклонений наблюдение находится выше или ниже среднего значения, и помогает сравнивать разные шкалы.
Отношение DAU к MAU $\text{DAU/MAU} = \frac{\text{DAU}}{\text{MAU}}\cdot 100\%$ Продуктовые метрики Отношение DAU к MAU: формула \text{DAU/MAU} = \frac{\text{DAU}}{\text{MAU}}\cdot 100\% помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата.
Когортное удержание клиентов $\text{Retention} = \frac{N_{\text{active at end}}}{N_{\text{cohort start}}}\cdot 100\%$ Продуктовые метрики Когортное удержание клиентов: формула \text{Retention} = \frac{N_{\text{active at end}}}{N_{\text{cohort start}}}\cdot 100\% помогает требуется требуется требуется требуется требуется требуется важно перевести сырые счетчики продукта в процент, который можно сравнивать по периодам, когортам или каналам. В тексте е...
Churn rate: отток клиентов $\text{Churn} = \frac{N_{\text{churned}}}{N_{\text{period start}}}\cdot 100\%$ Продуктовые метрики Churn rate: отток клиентов: формула \text{Churn} = \frac{N_{\text{churned}}}{N_{\text{period start}}}\cdot 100\% помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата.
ARPU: средняя выручка на клиента $\text{ARPU} = \frac{R}{\text{MAU}}$ Продуктовые метрики ARPU: средняя выручка на клиента: формула \text{ARPU} = \frac{R}{\text{MAU}} помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата.
ARPPU: выручка на платящего клиента $\text{ARPPU} = \frac{R}{N_{\text{paying}}}$ Продуктовые метрики ARPPU: выручка на платящего клиента: формула \text{ARPPU} = \frac{R}{N_{\text{paying}}} помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата.
Базовый LTV клиента $\text{LTV} \approx \text{ARPU} \cdot \text{Gross Margin} \cdot L$ Продуктовые метрики Базовый LTV клиента: формула \text{LTV} \approx \text{ARPU} \cdot \text{Gross Margin} \cdot L помогает требуется требуется требуется требуется требуется требуется важно перевести сырые счетчики продукта в процент, который можно сравнивать по периодам, когортам или каналам. В тексте есть условия, пример, ошибки и п...
CAC: стоимость привлечения клиента $\text{CAC} = \frac{C_{\text{marketing}} + C_{\text{sales}}}{N_{\text{new customers}}}$ Продуктовые метрики CAC: стоимость привлечения клиента: формула \text{CAC} = \frac{C_{\text{маркетинговой аналитики}} + C_{\text{sales}}}{N_{\text{new customers}}} помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата.
Конверсия шага воронки $\text{CR}_{i\to i+1}=\frac{U_{i+1}}{U_i}\cdot100\%$ Продуктовые метрики Конверсия шага воронки: формула \text{CR}_{i\to i+1}=\frac{U_{i+1}}{U_i}\cdot100\% помогает требуется требуется требуется требуется требуется требуется важно перевести сырые счетчики продукта в процент, который можно сравнивать по периодам, когортам или каналам. В тексте есть условия, пример, ошибки и проверка рез...
Activation rate: доля активированных клиентов $\text{Activation Rate} = \frac{N_{\text{activated}}}{N_{\text{registered}}}\cdot100\%$ Продуктовые метрики Activation rate: доля активированных клиентов: формула \text{Activation Rate} = \frac{N_{\text{activated}}}{N_{\text{registered}}}\cdot100\% помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата.
Проекция вектора на ненормированный вектор $\operatorname{proj}_{u}(v)=\frac{u^{\top}v}{u^{\top}u}\,u$ Матрицы, определители Проекция вектора v на направление u вычисляется через скалярное произведение с нормированием на длину u. Эта формула связывает вычисление с геометрическим смыслом ортогонального разложения: она показывает, какая часть вектора идет вдоль выбранного направления, а какая остается поперек него.
Разложение вектора на параллельную и перпендикулярную части $v=\operatorname{proj}_{u}(v)+\left(v-\operatorname{proj}_{u}(v)\right),\quad u^{\top}\left(v-\operatorname{proj}_{u}(v)\right)=0$ Матрицы, определители Любой вектор раскладывается на компоненту вдоль u и ортогональную остаточную часть. Эта формула связывает вычисление с геометрическим смыслом ортогонального разложения: она показывает, какая часть вектора идет вдоль выбранного направления, а какая остается поперек него.
Первый вектор в Gram-Schmidt $q_1=\frac{a_1}{\|a_1\|}$ Матрицы, определители Нормировка первого столбца задает первый ортонормированный вектор. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.
k-й шаг алгоритма Gram-Schmidt $u_k=a_k-\sum_{j=1}^{k-1}(q_j^{\top}a_k)\,q_j,\quad q_k=\frac{u_k}{\|u_k\|}$ Матрицы, определители Для каждого нового столбца убирают вклад уже построенных ортонормированных направлений, затем нормируют остаток. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.
Коэффициенты R через скалярные произведения $R_{ij}=q_i^{\top}a_j,\quad a_j=\sum_{i=1}^{j}R_{ij}q_i,\quad R_{ij}=0\ (i>j)$ Матрицы, определители После построения Q каждую колонку a_j раскладывают по уже найденным q_i. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.
Формула QR-разложения $A = QR,\quad Q^{\top}Q=I_r,\quad R \text{ верхнетреугольная}$ Матрицы, определители Матрица A раскладывается в произведение ортонормированной матрицы Q и верхнетреугольной R. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.
Проектор на span(Q) $P=QQ^{\top},\quad P^2=P,\quad P^{\top}=P$ Матрицы, определители Проецирование на пространство столбцов Q удобно через матрицу QQ^T. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.
Наименьшие квадраты через QR $\hat{x}=R^{-1}Q^{\top}b,\quad A=QR$ Матрицы, определители После QR-раскладывания задача минимизации сводится к решению треугольной системы. Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений.
Нормальные уравнения в QR-форме $A^T A x = A^T b,\quad R^T R x = R^T Q^T b$ Матрицы, определители Из A=QR получаем эквивалентное равенство через R, сохраняя идею нормальных уравнений. Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений.
Остаток в задаче ЛС и его ортогональность $r=b-A\hat{x},\quad A^T r=0,\quad Q^T r=0$ Матрицы, определители Оптимальный LS-решение дает остаток, перпендикулярный всем столбцам A (и столбцам Q). Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений.
Сингулярное разложение матрицы $A=U\Sigma V^T,\quad U^TU=I,\quad V^TV=I$ Матрицы, определители Сингулярное разложение представляет матрицу как произведение двух ортогональных матриц и диагональной матрицы сингулярных чисел. Это универсальная форма разложения, которая работает для прямоугольных матриц и показывает главные направления действия линейного отображения.
Ранг матрицы через сингулярные числа $\operatorname{rank}(A)=\#\{i:\sigma_i>0\}$ Матрицы, определители Ранг матрицы равен количеству ненулевых сингулярных чисел. Эта формула связывает алгебраическое понятие размерности образа с численной диагностикой зависимости строк и столбцов.
Спектральная норма через сингулярные числа $\|A\|_2=\sigma_{\max}(A)=\sqrt{\lambda_{\max}(A^TA)}$ Матрицы, определители Спектральная норма матрицы равна ее наибольшему сингулярному числу. Она показывает максимальный коэффициент растяжения вектора при действии линейного отображения.
Норма Фробениуса через след и сингулярные числа $\|A\|_F^2=\operatorname{tr}(A^TA)=\sum_{i,j}a_{ij}^2=\sum_k\sigma_k^2$ Матрицы, определители Квадрат нормы Фробениуса равен следу матрицы A^T A, сумме квадратов всех элементов и сумме квадратов сингулярных чисел. Это удобная мера общего размера матрицы.
Циклическое свойство следа матрицы $\operatorname{tr}(AB)=\operatorname{tr}(BA),\quad \operatorname{tr}(ABC)=\operatorname{tr}(BCA)=\operatorname{tr}(CAB)$ Матрицы, определители След произведения матриц не меняется при циклической перестановке множителей, если все произведения определены. Это свойство помогает упрощать доказательства, производные матричных функций и выражения с нормами.
Дополнение Шура $S=D-CA^{-1}B$ Матрицы, определители Дополнение Шура выражает эффективный блок матрицы после исключения другого блока. Оно появляется при блочном обращении матриц, решении систем, вычислении определителей и условных распределениях в статистике.
Обратная блочной матрицы через дополнение Шура $\begin{pmatrix}A&B\\C&D\end{pmatrix}^{-1}=\begin{pmatrix}A^{-1}+A^{-1}BS^{-1}CA^{-1}&-A^{-1}BS^{-1}\\-S^{-1}CA^{-1}&S^{-1}\end{pmatrix},\quad S=D-CA^{-1}B$ Матрицы, определители Формула обращает блочную матрицу через обратный блок A и обратное дополнение Шура. Она показывает, как получить обратную матрицу без обращения всей матрицы целиком.
Лемма об определителе матрицы $\det(A+uv^T)=\det(A)\left(1+v^TA^{-1}u\right)$ Матрицы, определители Лемма об определителе показывает, как меняется определитель обратимой матрицы при ранговом обновлении uv^T. Вместо пересчета всего определителя достаточно вычислить один скаляр.
Формула Шермана-Моррисона $(A+uv^T)^{-1}=A^{-1}-\frac{A^{-1}uv^TA^{-1}}{1+v^TA^{-1}u}$ Матрицы, определители Формула Шермана-Моррисона дает обратную матрицу после рангового обновления A+uv^T. Она позволяет обновить уже известную обратную матрицу без полного повторного обращения.
Формула Вудбери $(A+UCV)^{-1}=A^{-1}-A^{-1}U(C^{-1}+VA^{-1}U)^{-1}VA^{-1}$ Матрицы, определители Формула Вудбери обобщает обновление обратной матрицы на добавку малого ранга UCV. Она позволяет заменить обращение большой матрицы обращением меньшей матрицы.
Средняя абсолютная ошибка MAE $\mathrm{MAE}=\frac{1}{n}\sum_{i=1}^{n}|y_i-\hat{y}_i|$ Прогнозирование MAE усредняет модули отклонений факта от прогноза и показывает типичный промах в исходных единицах. Метрика удобна для понятного сравнения моделей на одном горизонте, но не усиливает крупные ошибки.
Средняя квадратичная ошибка MSE $\mathrm{MSE}=\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2$ Прогнозирование MSE усредняет квадраты ошибок прогноза, поэтому крупные промахи влияют на итог сильнее мелких. Результат измеряется в квадрате исходных единиц и подходит для сравнения моделей на одной проверочной выборке.
Корень из среднеквадратичной ошибки RMSE $\mathrm{RMSE}=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2}$ Прогнозирование RMSE - корень из MSE: он сохраняет штраф за крупные ошибки, но возвращает результат в исходные единицы. Метрика показывает типичный размер промаха модели на фиксированном горизонте и наборе фактов.
Средняя абсолютная процентная ошибка MAPE $\mathrm{MAPE}=\frac{100\%}{n}\sum_{i=1}^{n}\left|\frac{y_i-\hat{y}_i}{y_i}\right|$ Прогнозирование MAPE показывает среднюю абсолютную ошибку прогноза в процентах от фактических значений. Метрика удобна для рядов разного масштаба, но требует аккуратности при нулевых и очень малых фактах.
Взвешенная абсолютная процентная ошибка WAPE $\mathrm{WAPE}=\frac{\sum_{i=1}^{n}|y_i-\hat{y}_i|}{\sum_{i=1}^{n}|y_i|}\cdot100\%$ Прогнозирование WAPE делит суммарную абсолютную ошибку на общий фактический объем. Метрика показывает долю промаха в процентах от всего спроса или оборота и сильнее отражает строки с большим весом.
Простое скользящее среднее $\mathrm{SMA}_t=\frac{x_{t-k+1}+x_{t-k+2}+\ldots+x_t}{k}$ Прогнозирование SMA заменяет текущее значение средним по последним k наблюдениям. Это простая база для сглаживания шума и краткосрочного прогноза, но она запаздывает на трендах и резких разворотах.
Экспоненциальное сглаживание прогноза $\hat{y}_{t+1}=\alpha y_t+(1-\alpha)\hat{y}_t$ Прогнозирование Экспоненциальное сглаживание обновляет прогноз как смесь последнего факта и прошлого сглаженного уровня. Коэффициент α задает, насколько быстро модель реагирует на свежие изменения ряда.
Линейная регрессия по методу наименьших квадратов $\hat{\beta}_1=\frac{\sum (x_i-\bar{x})(y_i-\bar{y})}{\sum (x_i-\bar{x})^2},\quad \hat{\beta}_0=\bar{y}-\hat{\beta}_1\bar{x}$ Линейная регрессия, коэффициенты OLS подбирает коэффициенты линейной регрессии так, чтобы сумма квадратов остатков была минимальной. Формула нужна, чтобы оценить связь факторов с числовой целью и получить воспроизводимый линейный прогноз.
Коэффициент детерминации R-squared $R^2=1-\frac{SS_{res}}{SS_{tot}}$ Линейная регрессия, коэффициенты R² показывает, какая доля разброса целевой переменной объяснена регрессионной моделью по сравнению с ее средним уровнем. Метрика полезна для одной выборки и спецификации, но сама по себе не доказывает причинность.
Стандартная ошибка регрессии $s=\sqrt{\frac{SS_{res}}{n-p}}$ Линейная регрессия, коэффициенты Стандартная ошибка регрессии оценивает типичный разброс остатков вокруг линии модели в единицах целевой переменной. Ее используют рядом с R², чтобы видеть не только долю объясненной вариации, но и размер промаха.
t-статистика коэффициента регрессии $t=\frac{\hat{\beta}_j-\beta_{j,0}}{SE(\hat{\beta}_j)}$ Линейная регрессия, коэффициенты t-статистика делит коэффициент регрессии на его стандартную ошибку и показывает, насколько оценка далека от нуля в масштабе неопределенности. Ее читают с учетом степеней свободы, p-value и спецификации модели.