Математика / Матрицы, определители

Формула QR-разложения

Матрица A раскладывается в произведение ортонормированной матрицы Q и верхнетреугольной R. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.

Опубликовано: Обновлено:

Формула

$$A = QR,\quad Q^{\top}Q=I_r,\quad R \text{ верхнетреугольная}$$
orthogonal-matrix-rotation Матрица как вращение и масштаб

Q — ортогональная часть, R — треугольная

Такой разбор стабилизирует решение систем.

Обозначения

$A$
исходная матрица, матрица
$Q$
ортонормированная матрица, матрица
$R$
верхнетреугольная матрица, матрица
$I_r$
единичная матрица, матрица

Условия применения

  • Q^TQ=I
  • R треугольная

Ограничения

  • классическая версия чувствительна к зависимости столбцов
  • для прямоугольной A учитывают ранг

Подробное объяснение

Q задает ориентацию пространства без изменения норм, R аккуратно хранит масштабы и связи между координатами.

QR-разложение превращает столбцы исходной матрицы в ортонормированный базис того же столбцового пространства. Матрица Q хранит направления, а R показывает, как каждый исходный столбец выражается через уже построенные ортонормированные направления. Верхнетреугольная форма R появляется потому, что j-й столбец зависит только от первых j направлений, если процесс идет слева направо. Это делает разложение удобным для решения систем: ортогональное умножение не усиливает длину ошибки, а треугольную систему с R можно решить обратным ходом. Для страницы "Формула QR-разложения" ключевая польза не в механическом запоминании формулы, а в понимании роли двух частей: Q отвечает за устойчивую геометрию, R - за координаты в этой геометрии.

Дополнительно важно различать теоретическую и вычислительную сторону темы "Формула QR-разложения". В точной алгебре достаточно записать ортогональность и треугольную структуру, но в численном расчете проверяют потерю ортогональности, масштаб столбцов и устойчивость к почти линейной зависимости. Поэтому корректная страница должна объяснять не только саму формулу, но и то, почему она предпочтительнее прямого обращения матрицы.

Как пользоваться формулой

  1. Выполните Gram-Schmidt для столбцов A.
  2. Соберите Q и R.
  3. Проверьте A=QR численно.
  4. После вычисления проверьте одновременно два равенства: Q^T Q=I и QR=A с допустимой численной погрешностью.

Историческая справка

QR-разложение стало базовым блоком почти всех современных решателей СЛАУ и LS.

Ортогонализация как вычислительная идея выросла из работ по векторам, проекциям и методу наименьших квадратов. В современном виде QR-разложение стало особенно важным после появления машинных вычислений, когда стало ясно, что нормальные уравнения могут ухудшать обусловленность. Методы Грама-Шмидта, Хаусхолдера и Гивенса дали разные способы получить ту же структуру Q и R, но с разной численной устойчивостью.

В послевоенной численной математике ортогональные разложения стали одним из ответов на ограниченную точность машинных вычислений. QR-разложение оказалось удобным компромиссом: оно сохраняет геометрию задачи и приводит ее к треугольной системе, которую можно надежно решать.

Историческая линия формулы

Связано с развитием численных методов на основе ортогонализации в XX веке. Связь с процессом Грама-Шмидта относится к построению ортонормированного базиса. Современная вычислительная роль QR-разложения сформировалась в численной линейной алгебре XX века и не сводится к одному автору.

Пример

Для A=[[1,2],[1,3]] выбирают Q=[[1/√2,-1/√2],[1/√2,1/√2]], R=[[√2,3/√2],[0,1]]. Тогда A=QR. В вычислительном примере для "Формула QR-разложения" важно контролировать два свойства одновременно. Во-первых, столбцы Q должны иметь единичную длину и быть попарно ортогональны, то есть Q^T Q близко к единичной матрице. Во-вторых, произведение QR должно восстанавливать исходную матрицу A с допустимой погрешностью. Если первое свойство выполнено, но A не восстанавливается, ошибка вероятна в коэффициентах R. Если A восстанавливается, но Q^T Q заметно отличается от I, разложение может быть непригодным для устойчивых расчетов.

Частая ошибка

Перепутать порядок Q и R (A=RQ неверно). Частая ошибка - воспринимать QR как обычное разложение на любые две матрицы. Смысл QR именно в ортонормированности Q и верхнетреугольности R. Также нельзя забывать, что классический процесс Грама-Шмидта может быть численно нестабилен для почти зависимых столбцов; в практических вычислениях часто используют модифицированный вариант, отражения Хаусхолдера или вращения Гивенса.

Практика

Задачи с решением

Проверить разложение для 2x2

Условие. A=[[1,2],[1,3]

Решение. Берут Q и R как в примере выше и проверяют произведение.

Ответ. A=QR

Определить тип Q

Условие. Чему равно Q^TQ при QR-разложении?

Решение. Q^TQ=I.

Ответ. I

Дополнительные источники

  • Golub & Van Loan, Matrix Computations
  • MIT OCW 18.06SC QR Factorization
  • Demmel, Applied Numerical Linear Algebra

Связанные формулы

Математика

k-й шаг алгоритма Gram-Schmidt

$u_k=a_k-\sum_{j=1}^{k-1}(q_j^{\top}a_k)\,q_j,\quad q_k=\frac{u_k}{\|u_k\|}$

Для каждого нового столбца убирают вклад уже построенных ортонормированных направлений, затем нормируют остаток. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.

Математика

Коэффициенты R через скалярные произведения

$R_{ij}=q_i^{\top}a_j,\quad a_j=\sum_{i=1}^{j}R_{ij}q_i,\quad R_{ij}=0\ (i>j)$

После построения Q каждую колонку a_j раскладывают по уже найденным q_i. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.

Математика

Наименьшие квадраты через QR

$\hat{x}=R^{-1}Q^{\top}b,\quad A=QR$

После QR-раскладывания задача минимизации сводится к решению треугольной системы. Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений.

Математика

Определитель матрицы 2x2

$\det\begin{pmatrix}a&b\\c&d\end{pmatrix}=ad-bc$

Определитель матрицы 2x2 равен разности произведений диагоналей. Он показывает, во сколько раз линейное преобразование меняет ориентированную площадь.