Аналитика
Анализ данных
Базовые вычисления для описания, сравнения и проверки наборов данных.
138 формул
Таблица формул
Показаны 1-60 из 138. Остальные формулы доступны на соседних страницах подборки.
| Формула | Запись | Тема | Для чего нужна |
|---|---|---|---|
| Conversion rate (конверсия) | $\hat{p}=\frac{X}{n}$ | A/B-тесты | Conversion rate (конверсия): формула \hat{p}=\frac{X}{n} помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата. |
| Относительный uplift (относительный прирост) | $\text{uplift}_{\%}=\frac{\hat p_B-\hat p_A}{\hat p_A}\cdot 100\%$ | A/B-тесты | Относительный uplift (относительный прирост): формула \text{uplift}_{\%}=\frac{\hat p_B-\hat p_A}{\hat p_A}\cdot 100\% помогает требуется требуется требуется требуется требуется требуется требуется посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверк... |
| Абсолютный uplift (разница конверсий) | $\Delta = \hat p_B-\hat p_A$ | A/B-тесты | Абсолютный uplift (разница конверсий): формула \Delta = \hat p_B-\hat p_A помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата. |
| Стандартная ошибка доли | $SE(\hat p)=\sqrt{\frac{\hat p(1-\hat p)}{n}}$ | A/B-тесты | Стандартная ошибка доли: формула SE(\hat p)=\sqrt{\frac{\hat p(1-\hat p)}{n}} помогает требуется требуется требуется требуется требуется требуется требуется посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата. |
| Z-статистика для двух долей | $z = \frac{\hat p_B-\hat p_A}{SE_{\Delta}}$ | A/B-тесты | Z-статистика для двух долей: формула z = \frac{\hat p_B-\hat p_A}{SE_{\Delta}} помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата. |
| p-value без калькулятора: ориентиры по z | $p \approx 2\,(1-\Phi(|z|)),\; \text{а без калькулятора: }|z|\approx1{,}64\Rightarrow p\approx0{,}10,\;1{,}96\Rightarrow0{,}05,\;2{,}58\Rightarrow0{,}01$ | A/B-тесты | p-value без калькулятора: ориентиры по z: формула p \approx 2\,(1-\Phi(|z|)),\; \text{а без калькулятора: }|z|\approx1{,}64\Rightarrow p\approx0{,}10,\;1{,}96\Rightarrow0{,}05,\;2{,}58\Rightarrow0{,}01 помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, оши... |
| Доверительный интервал разницы конверсий | $(\hat p_B-\hat p_A)\pm z_{1-\alpha/2}\cdot SE_{\Delta}$ | A/B-тесты | Доверительный интервал разницы конверсий: формула (\hat p_B-\hat p_A)\pm z_{1-\alpha/2}\cdot SE_{\Delta} помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата. |
| Минимальный размер выборки для двух долей (базовый) | $n \approx \frac{(z_{1-\alpha/2}+z_{1-\beta})^2\left[p_A(1-p_A)+p_B(1-p_B)\right]}{MDE^2},\; n_A=n_B=n$ | A/B-тесты | Минимальный размер выборки для двух долей (базовый): формула n \approx \frac{(z_{1-\alpha/2}+z_{1-\beta})^2\left[p_A(1-p_A)+p_B(1-p_B)\right]}{MDE^2},\; n_A=n_B=n помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть условия, пример, ошибки и проверка результата. |
| MDE в статистике и A/B-тестах | $MDE = (z_{1-\alpha/2}+z_{1-\beta})\sqrt{\frac{\hat p_A(1-\hat p_A)}{n_A}+\frac{\hat p_B(1-\hat p_B)}{n_B}}$ | A/B-тесты | MDE в статистике и A/B-тестах: формула MDE = (z_{1-\alpha/2}+z_{1-\beta})\sqrt{\frac{\hat p_A(1-\hat p_A)}{n_A}+\frac{\hat p_B(1-\hat p_B)}{n_B}} помогает требуется требуется требуется требуется требуется требуется требуется посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть услови... |
| Мощность теста (power) для разности долей — концепт | $\text{Power} \approx 1-\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right),\;\beta\approx\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right)$ | A/B-тесты | Мощность теста (power) для разности долей — концепт: формула \text{Power} \approx 1-\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right),\;\beta\approx\Phi\left(z_{1-\alpha/2}-\frac{|\Delta|}{SE_{\Delta}}\right) помогает посчитать метрику или статистическую проверку по данным эксперимента. В тексте есть ус... |
| Среднее арифметическое | $\bar{x}=\frac{x_1+x_2+\dots+x_n}{n}$ | Описательная статистика | Среднее арифметическое показывает типичный уровень числового показателя как сумму всех значений, деленную на количество наблюдений. |
| Медиана | $Me=x_{(\frac{n+1}{2})}\quad\text{для нечетного }n$ | Описательная статистика | Медиана делит упорядоченный набор данных пополам: половина значений не больше медианы, а половина не меньше ее. Это устойчивая мера типичного значения. |
| Мода | $Mo=\text{значение с максимальной частотой}$ | Описательная статистика | Мода — это значение, которое встречается в наборе данных чаще всего. Она полезна для категорий, популярных вариантов и повторяющихся числовых значений. |
| Размах вариации | $R=x_{max}-x_{min}$ | Описательная статистика | Размах вариации показывает расстояние между максимальным и минимальным значением набора данных. Это самый простой показатель разброса. |
| Выборочная дисперсия | $s^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}$ | Описательная статистика | Выборочная дисперсия с делением на n−1 оценивает дисперсию генеральной совокупности по выборке и измеряет средний квадрат отклонений от выборочного среднего. |
| Выборочное стандартное отклонение | $s=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$ | Описательная статистика | Выборочное стандартное отклонение показывает типичный масштаб отклонения значений от среднего в исходных единицах показателя. |
| Квартили и межквартильный размах | $IQR=Q_3-Q_1$ | Описательная статистика | Межквартильный размах, или IQR, показывает ширину средней половины данных: это разница между третьим и первым квартилем. Формула: IQR = Q3 - Q1. |
| Правило выбросов по IQR | $x<Q_1-1.5\cdot IQR\quad\text{или}\quad x>Q_3+1.5\cdot IQR$ | Описательная статистика | Правило 1,5 IQR помечает возможные выбросы: значение считают необычным, если оно меньше Q1 - 1,5*IQR или больше Q3 + 1,5*IQR. Это правило для первичной проверки, а не автоматического удаления строк. |
| Коэффициент вариации | $CV=\frac{s}{\bar{x}}\cdot100\%$ | Описательная статистика | Коэффициент вариации показывает относительный разброс: стандартное отклонение делят на среднее и выражают результат в процентах. |
| Z-оценка | $z=\frac{x-\bar{x}}{s}$ | Описательная статистика | Z-оценка показывает, на сколько стандартных отклонений наблюдение находится выше или ниже среднего значения, и помогает сравнивать разные шкалы. |
| Отношение DAU к MAU | $\text{DAU/MAU} = \frac{\text{DAU}}{\text{MAU}}\cdot 100\%$ | Продуктовые метрики | Отношение DAU к MAU: формула \text{DAU/MAU} = \frac{\text{DAU}}{\text{MAU}}\cdot 100\% помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата. |
| Когортное удержание клиентов | $\text{Retention} = \frac{N_{\text{active at end}}}{N_{\text{cohort start}}}\cdot 100\%$ | Продуктовые метрики | Когортное удержание клиентов: формула \text{Retention} = \frac{N_{\text{active at end}}}{N_{\text{cohort start}}}\cdot 100\% помогает требуется требуется требуется требуется требуется требуется важно перевести сырые счетчики продукта в процент, который можно сравнивать по периодам, когортам или каналам. В тексте е... |
| Churn rate: отток клиентов | $\text{Churn} = \frac{N_{\text{churned}}}{N_{\text{period start}}}\cdot 100\%$ | Продуктовые метрики | Churn rate: отток клиентов: формула \text{Churn} = \frac{N_{\text{churned}}}{N_{\text{period start}}}\cdot 100\% помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата. |
| ARPU: средняя выручка на клиента | $\text{ARPU} = \frac{R}{\text{MAU}}$ | Продуктовые метрики | ARPU: средняя выручка на клиента: формула \text{ARPU} = \frac{R}{\text{MAU}} помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата. |
| ARPPU: выручка на платящего клиента | $\text{ARPPU} = \frac{R}{N_{\text{paying}}}$ | Продуктовые метрики | ARPPU: выручка на платящего клиента: формула \text{ARPPU} = \frac{R}{N_{\text{paying}}} помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата. |
| Базовый LTV клиента | $\text{LTV} \approx \text{ARPU} \cdot \text{Gross Margin} \cdot L$ | Продуктовые метрики | Базовый LTV клиента: формула \text{LTV} \approx \text{ARPU} \cdot \text{Gross Margin} \cdot L помогает требуется требуется требуется требуется требуется требуется важно перевести сырые счетчики продукта в процент, который можно сравнивать по периодам, когортам или каналам. В тексте есть условия, пример, ошибки и п... |
| CAC: стоимость привлечения клиента | $\text{CAC} = \frac{C_{\text{marketing}} + C_{\text{sales}}}{N_{\text{new customers}}}$ | Продуктовые метрики | CAC: стоимость привлечения клиента: формула \text{CAC} = \frac{C_{\text{маркетинговой аналитики}} + C_{\text{sales}}}{N_{\text{new customers}}} помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата. |
| Конверсия шага воронки | $\text{CR}_{i\to i+1}=\frac{U_{i+1}}{U_i}\cdot100\%$ | Продуктовые метрики | Конверсия шага воронки: формула \text{CR}_{i\to i+1}=\frac{U_{i+1}}{U_i}\cdot100\% помогает требуется требуется требуется требуется требуется требуется важно перевести сырые счетчики продукта в процент, который можно сравнивать по периодам, когортам или каналам. В тексте есть условия, пример, ошибки и проверка рез... |
| Activation rate: доля активированных клиентов | $\text{Activation Rate} = \frac{N_{\text{activated}}}{N_{\text{registered}}}\cdot100\%$ | Продуктовые метрики | Activation rate: доля активированных клиентов: формула \text{Activation Rate} = \frac{N_{\text{activated}}}{N_{\text{registered}}}\cdot100\% помогает посчитать продуктовую метрику на согласованной базе событий. В тексте есть условия, пример, ошибки и проверка результата. |
| Проекция вектора на ненормированный вектор | $\operatorname{proj}_{u}(v)=\frac{u^{\top}v}{u^{\top}u}\,u$ | Матрицы, определители | Проекция вектора v на направление u вычисляется через скалярное произведение с нормированием на длину u. Эта формула связывает вычисление с геометрическим смыслом ортогонального разложения: она показывает, какая часть вектора идет вдоль выбранного направления, а какая остается поперек него. |
| Разложение вектора на параллельную и перпендикулярную части | $v=\operatorname{proj}_{u}(v)+\left(v-\operatorname{proj}_{u}(v)\right),\quad u^{\top}\left(v-\operatorname{proj}_{u}(v)\right)=0$ | Матрицы, определители | Любой вектор раскладывается на компоненту вдоль u и ортогональную остаточную часть. Эта формула связывает вычисление с геометрическим смыслом ортогонального разложения: она показывает, какая часть вектора идет вдоль выбранного направления, а какая остается поперек него. |
| Первый вектор в Gram-Schmidt | $q_1=\frac{a_1}{\|a_1\|}$ | Матрицы, определители | Нормировка первого столбца задает первый ортонормированный вектор. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода. |
| k-й шаг алгоритма Gram-Schmidt | $u_k=a_k-\sum_{j=1}^{k-1}(q_j^{\top}a_k)\,q_j,\quad q_k=\frac{u_k}{\|u_k\|}$ | Матрицы, определители | Для каждого нового столбца убирают вклад уже построенных ортонормированных направлений, затем нормируют остаток. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода. |
| Коэффициенты R через скалярные произведения | $R_{ij}=q_i^{\top}a_j,\quad a_j=\sum_{i=1}^{j}R_{ij}q_i,\quad R_{ij}=0\ (i>j)$ | Матрицы, определители | После построения Q каждую колонку a_j раскладывают по уже найденным q_i. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода. |
| Формула QR-разложения | $A = QR,\quad Q^{\top}Q=I_r,\quad R \text{ верхнетреугольная}$ | Матрицы, определители | Матрица A раскладывается в произведение ортонормированной матрицы Q и верхнетреугольной R. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода. |
| Проектор на span(Q) | $P=QQ^{\top},\quad P^2=P,\quad P^{\top}=P$ | Матрицы, определители | Проецирование на пространство столбцов Q удобно через матрицу QQ^T. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода. |
| Наименьшие квадраты через QR | $\hat{x}=R^{-1}Q^{\top}b,\quad A=QR$ | Матрицы, определители | После QR-раскладывания задача минимизации сводится к решению треугольной системы. Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений. |
| Нормальные уравнения в QR-форме | $A^T A x = A^T b,\quad R^T R x = R^T Q^T b$ | Матрицы, определители | Из A=QR получаем эквивалентное равенство через R, сохраняя идею нормальных уравнений. Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений. |
| Остаток в задаче ЛС и его ортогональность | $r=b-A\hat{x},\quad A^T r=0,\quad Q^T r=0$ | Матрицы, определители | Оптимальный LS-решение дает остаток, перпендикулярный всем столбцам A (и столбцам Q). Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений. |
| Сингулярное разложение матрицы | $A=U\Sigma V^T,\quad U^TU=I,\quad V^TV=I$ | Матрицы, определители | Сингулярное разложение представляет матрицу как произведение двух ортогональных матриц и диагональной матрицы сингулярных чисел. Это универсальная форма разложения, которая работает для прямоугольных матриц и показывает главные направления действия линейного отображения. |
| Ранг матрицы через сингулярные числа | $\operatorname{rank}(A)=\#\{i:\sigma_i>0\}$ | Матрицы, определители | Ранг матрицы равен количеству ненулевых сингулярных чисел. Эта формула связывает алгебраическое понятие размерности образа с численной диагностикой зависимости строк и столбцов. |
| Спектральная норма через сингулярные числа | $\|A\|_2=\sigma_{\max}(A)=\sqrt{\lambda_{\max}(A^TA)}$ | Матрицы, определители | Спектральная норма матрицы равна ее наибольшему сингулярному числу. Она показывает максимальный коэффициент растяжения вектора при действии линейного отображения. |
| Норма Фробениуса через след и сингулярные числа | $\|A\|_F^2=\operatorname{tr}(A^TA)=\sum_{i,j}a_{ij}^2=\sum_k\sigma_k^2$ | Матрицы, определители | Квадрат нормы Фробениуса равен следу матрицы A^T A, сумме квадратов всех элементов и сумме квадратов сингулярных чисел. Это удобная мера общего размера матрицы. |
| Циклическое свойство следа матрицы | $\operatorname{tr}(AB)=\operatorname{tr}(BA),\quad \operatorname{tr}(ABC)=\operatorname{tr}(BCA)=\operatorname{tr}(CAB)$ | Матрицы, определители | След произведения матриц не меняется при циклической перестановке множителей, если все произведения определены. Это свойство помогает упрощать доказательства, производные матричных функций и выражения с нормами. |
| Дополнение Шура | $S=D-CA^{-1}B$ | Матрицы, определители | Дополнение Шура выражает эффективный блок матрицы после исключения другого блока. Оно появляется при блочном обращении матриц, решении систем, вычислении определителей и условных распределениях в статистике. |
| Обратная блочной матрицы через дополнение Шура | $\begin{pmatrix}A&B\\C&D\end{pmatrix}^{-1}=\begin{pmatrix}A^{-1}+A^{-1}BS^{-1}CA^{-1}&-A^{-1}BS^{-1}\\-S^{-1}CA^{-1}&S^{-1}\end{pmatrix},\quad S=D-CA^{-1}B$ | Матрицы, определители | Формула обращает блочную матрицу через обратный блок A и обратное дополнение Шура. Она показывает, как получить обратную матрицу без обращения всей матрицы целиком. |
| Лемма об определителе матрицы | $\det(A+uv^T)=\det(A)\left(1+v^TA^{-1}u\right)$ | Матрицы, определители | Лемма об определителе показывает, как меняется определитель обратимой матрицы при ранговом обновлении uv^T. Вместо пересчета всего определителя достаточно вычислить один скаляр. |
| Формула Шермана-Моррисона | $(A+uv^T)^{-1}=A^{-1}-\frac{A^{-1}uv^TA^{-1}}{1+v^TA^{-1}u}$ | Матрицы, определители | Формула Шермана-Моррисона дает обратную матрицу после рангового обновления A+uv^T. Она позволяет обновить уже известную обратную матрицу без полного повторного обращения. |
| Формула Вудбери | $(A+UCV)^{-1}=A^{-1}-A^{-1}U(C^{-1}+VA^{-1}U)^{-1}VA^{-1}$ | Матрицы, определители | Формула Вудбери обобщает обновление обратной матрицы на добавку малого ранга UCV. Она позволяет заменить обращение большой матрицы обращением меньшей матрицы. |
| Средняя абсолютная ошибка MAE | $\mathrm{MAE}=\frac{1}{n}\sum_{i=1}^{n}|y_i-\hat{y}_i|$ | Прогнозирование | MAE усредняет модули отклонений факта от прогноза и показывает типичный промах в исходных единицах. Метрика удобна для понятного сравнения моделей на одном горизонте, но не усиливает крупные ошибки. |
| Средняя квадратичная ошибка MSE | $\mathrm{MSE}=\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2$ | Прогнозирование | MSE усредняет квадраты ошибок прогноза, поэтому крупные промахи влияют на итог сильнее мелких. Результат измеряется в квадрате исходных единиц и подходит для сравнения моделей на одной проверочной выборке. |
| Корень из среднеквадратичной ошибки RMSE | $\mathrm{RMSE}=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2}$ | Прогнозирование | RMSE - корень из MSE: он сохраняет штраф за крупные ошибки, но возвращает результат в исходные единицы. Метрика показывает типичный размер промаха модели на фиксированном горизонте и наборе фактов. |
| Средняя абсолютная процентная ошибка MAPE | $\mathrm{MAPE}=\frac{100\%}{n}\sum_{i=1}^{n}\left|\frac{y_i-\hat{y}_i}{y_i}\right|$ | Прогнозирование | MAPE показывает среднюю абсолютную ошибку прогноза в процентах от фактических значений. Метрика удобна для рядов разного масштаба, но требует аккуратности при нулевых и очень малых фактах. |
| Взвешенная абсолютная процентная ошибка WAPE | $\mathrm{WAPE}=\frac{\sum_{i=1}^{n}|y_i-\hat{y}_i|}{\sum_{i=1}^{n}|y_i|}\cdot100\%$ | Прогнозирование | WAPE делит суммарную абсолютную ошибку на общий фактический объем. Метрика показывает долю промаха в процентах от всего спроса или оборота и сильнее отражает строки с большим весом. |
| Простое скользящее среднее | $\mathrm{SMA}_t=\frac{x_{t-k+1}+x_{t-k+2}+\ldots+x_t}{k}$ | Прогнозирование | SMA заменяет текущее значение средним по последним k наблюдениям. Это простая база для сглаживания шума и краткосрочного прогноза, но она запаздывает на трендах и резких разворотах. |
| Экспоненциальное сглаживание прогноза | $\hat{y}_{t+1}=\alpha y_t+(1-\alpha)\hat{y}_t$ | Прогнозирование | Экспоненциальное сглаживание обновляет прогноз как смесь последнего факта и прошлого сглаженного уровня. Коэффициент α задает, насколько быстро модель реагирует на свежие изменения ряда. |
| Линейная регрессия по методу наименьших квадратов | $\hat{\beta}_1=\frac{\sum (x_i-\bar{x})(y_i-\bar{y})}{\sum (x_i-\bar{x})^2},\quad \hat{\beta}_0=\bar{y}-\hat{\beta}_1\bar{x}$ | Линейная регрессия, коэффициенты | OLS подбирает коэффициенты линейной регрессии так, чтобы сумма квадратов остатков была минимальной. Формула нужна, чтобы оценить связь факторов с числовой целью и получить воспроизводимый линейный прогноз. |
| Коэффициент детерминации R-squared | $R^2=1-\frac{SS_{res}}{SS_{tot}}$ | Линейная регрессия, коэффициенты | R² показывает, какая доля разброса целевой переменной объяснена регрессионной моделью по сравнению с ее средним уровнем. Метрика полезна для одной выборки и спецификации, но сама по себе не доказывает причинность. |
| Стандартная ошибка регрессии | $s=\sqrt{\frac{SS_{res}}{n-p}}$ | Линейная регрессия, коэффициенты | Стандартная ошибка регрессии оценивает типичный разброс остатков вокруг линии модели в единицах целевой переменной. Ее используют рядом с R², чтобы видеть не только долю объясненной вариации, но и размер промаха. |
| t-статистика коэффициента регрессии | $t=\frac{\hat{\beta}_j-\beta_{j,0}}{SE(\hat{\beta}_j)}$ | Линейная регрессия, коэффициенты | t-статистика делит коэффициент регрессии на его стандартную ошибку и показывает, насколько оценка далека от нуля в масштабе неопределенности. Ее читают с учетом степеней свободы, p-value и спецификации модели. |