Математика / Матрицы, определители

Формула QR-разложения

Матрица A раскладывается в произведение ортонормированной матрицы Q и верхнетреугольной R. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.

Опубликовано: Обновлено:

Формула

$$A = QR,\quad Q^{\top}Q=I_r,\quad R \text{ верхнетреугольная}$$
orthogonal-matrix-rotation Матрица как вращение и масштаб

Q — ортогональная часть, R — треугольная

Такой разбор стабилизирует решение систем.

Обозначения

$A$
исходная матрица, матрица
$Q$
ортонормированная матрица, матрица
$R$
верхнетреугольная матрица, матрица
$I_r$
единичная матрица, матрица

Условия применения

  • Q^TQ=I
  • R треугольная

Ограничения

  • классическая версия чувствительна к зависимости столбцов
  • для прямоугольной A учитывают ранг

Подробное объяснение

Формула QR-разложения задает конкретную связь между величинами: A - исходная матрица (матрица); Q - ортонормированная матрица (матрица); R - верхнетреугольная матрица (матрица); I_r - единичная матрица (матрица). Запись A = QR,\quad Q^{\top}Q=I_r,\quad R \text{ верхнетреугольная} показывает, какие данные входят в расчет и какая величина получается на выходе. Поэтому сначала нужно определить смысл каждого символа, а уже затем выполнять арифметику или алгебраическое преобразование. Идея формулы опирается на определение или модель из темы «linear-algebra». В простых случаях результат получается прямой подстановкой, а в более сложных - после выбора корректного диапазона, направления, знака, интервала или базовой величины. Если поменять исходное допущение, меняется и интерпретация ответа, даже когда сама запись формулы выглядит той же. Поведение результата нужно проверять по зависимости от входных данных. Если один множитель растет, итог может увеличиваться пропорционально; если величина стоит в знаменателе, рост этой величины уменьшает результат; если используются степени, площади, объемы, вероятности или проценты, эффект становится нелинейным. Такая проверка помогает заметить ошибку знака, единиц или масштаба еще до окончательного ответа. На практике формула qr-разложения используют для расчетной проверки, сравнения сценариев и объяснения, почему полученное число имеет именно такой порядок. В учебной задаче это дает ход решения, в отчете - прозрачный контроль исходных данных, а в прикладной модели - понятную связь между формулой и решением. Перед подстановкой полезно отдельно записать условия: какие величины известны, какие единицы используются, нет ли деления на ноль, отрицательных значений там, где они невозможны, или смешения относительных и абсолютных показателей. После вычисления ответ проверяют обратной подстановкой, оценкой размерности или сравнением с крайним случаем.

Как пользоваться формулой

  1. Выполните Gram-Schmidt для столбцов A.
  2. Соберите Q и R.
  3. Проверьте A=QR численно.
  4. После вычисления проверьте одновременно два равенства: Q^T Q=I и QR=A с допустимой численной погрешностью.

Историческая справка

QR-разложение стало базовым блоком почти всех современных решателей СЛАУ и LS. Ортогонализация как вычислительная идея выросла из работ по векторам, проекциям и методу наименьших квадратов. В современном виде QR-разложение стало особенно важным после появления машинных вычислений, когда стало ясно, что нормальные уравнения могут ухудшать обусловленность. Методы Грама-Шмидта, Хаусхолдера и Гивенса дали разные способы получить ту же структуру Q и R, но с разной численной устойчивостью. В послевоенной численной математике ортогональные разложения стали одним из ответов на ограниченную точность машинных вычислений. QR-разложение оказалось удобным компромиссом: оно сохраняет геометрию задачи и приводит ее к треугольной системе, которую можно надежно решать.

Историческая линия формулы

Связано с развитием численных методов на основе ортогонализации в XX веке. Связь с процессом Грама-Шмидта относится к построению ортонормированного базиса. Современная вычислительная роль QR-разложения сформировалась в численной линейной алгебре XX века и не сводится к одному автору.

Пример

Для A=[[1,2],[1,3]] выбирают Q=[[1/√2,-1/√2],[1/√2,1/√2]], R=[[√2,3/√2],[0,1]]. Тогда A=QR. В вычислительном примере для "Формула QR-разложения" важно контролировать два свойства одновременно. Во-первых, столбцы Q должны иметь единичную длину и быть попарно ортогональны, то есть Q^T Q близко к единичной матрице. Во-вторых, произведение QR должно восстанавливать исходную матрицу A с допустимой погрешностью. Если первое свойство выполнено, но A не восстанавливается, ошибка вероятна в коэффициентах R. Если A восстанавливается, но Q^T Q заметно отличается от I, разложение может быть непригодным для устойчивых расчетов.

Частая ошибка

Перепутать порядок Q и R (A=RQ неверно). Частая ошибка - воспринимать QR как обычное разложение на любые две матрицы. Смысл QR именно в ортонормированности Q и верхнетреугольности R. Также нельзя забывать, что классический процесс Грама-Шмидта может быть численно нестабилен для почти зависимых столбцов; в практических вычислениях часто используют модифицированный вариант, отражения Хаусхолдера или вращения Гивенса.

Практика

Задачи с решением

Проверить разложение для 2x2

Условие. A=[[1,2],[1,3]

Решение. Берут Q и R как в примере выше и проверяют произведение.

Ответ. A=QR

Определить тип Q

Условие. Чему равно Q^TQ при QR-разложении?

Решение. Q^TQ=I.

Ответ. I

Дополнительные источники

  • Golub & Van Loan, Matrix Computations
  • MIT OCW 18.06SC QR Factorization
  • Demmel, Applied Numerical Linear Algebra
  • Gilbert Strang. Introduction to Linear Algebra, Wellesley-Cambridge Press
  • Sheldon Axler. Linear Algebra Done Right, Springer

Связанные формулы

Математика

k-й шаг алгоритма Gram-Schmidt

$u_k=a_k-\sum_{j=1}^{k-1}(q_j^{\top}a_k)\,q_j,\quad q_k=\frac{u_k}{\|u_k\|}$

Для каждого нового столбца убирают вклад уже построенных ортонормированных направлений, затем нормируют остаток. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.

Математика

Коэффициенты R через скалярные произведения

$R_{ij}=q_i^{\top}a_j,\quad a_j=\sum_{i=1}^{j}R_{ij}q_i,\quad R_{ij}=0\ (i>j)$

После построения Q каждую колонку a_j раскладывают по уже найденным q_i. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.

Математика

Наименьшие квадраты через QR

$\hat{x}=R^{-1}Q^{\top}b,\quad A=QR$

После QR-раскладывания задача минимизации сводится к решению треугольной системы. Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений.

Математика

Определитель матрицы 2x2

$\det\begin{pmatrix}a&b\\c&d\end{pmatrix}=ad-bc$

Определитель матрицы 2x2 равен разности произведений диагоналей. Он показывает, во сколько раз линейное преобразование меняет ориентированную площадь.