Enrique R. Aznar Dpto. de Álgebra MATRICES SIMÉTRICAS Y ORTOGONALES. ¿Cómo diagonalizar eficientemente? Página web personal 1. 2. 3. Autovalores de matrices reales. Lema 1 Lema 2 Lema 3 Ejemplo 1 Ejemplo 2 Matrices simétricas reales. Definición 1 Lema 4 Lema 5 Ejemplo 3 Teorema 1 Lema 6 Congruencia-semejanza. Definición 2 6 7 7 8 9 9 9 9 10 10 11 12 12 13 13 Página de Abertura Contenido Página 1 de 64 Atrás Pantalla grande/pequeña Cerrar 4. 5. Corolario 1 Lema 7 Definición 3 Corolario 2 Ejemplo 4 El grupo ortogonal O(n). Definición 4 Corolario 3 Ejemplo 5 Definición 5 Interpretación geométrica de O(2). Corolario 4 Lema 8 Ejemplo 6 Definición 6 Definición 7 Corolario 5 Lema 9 Ejemplo 7 Definición 8 Corolario 6 Definición 9 Ejemplo 8 13 14 14 14 15 16 16 18 19 20 20 20 21 21 23 23 23 24 24 26 26 26 26 Enrique R. Aznar Dpto. de Álgebra Página web personal Página de Abertura Contenido Página 2 de 64 Atrás Pantalla grande/pequeña Cerrar 6. 7. 8. Matrices de Givens y de Householder. Definición 10 Ejemplo 9 Lema 10 Corolario 7 Definición 11 Corolario 8 Ejemplo 10 Descomposición por valores singulares (SVD). Teorema 2 Ejemplo 11 Definición 12 Corolario 9 Definición 13 Corolario 10 Ejemplo 12 Lema 11 Definición 14 Corolario 11 Lema 12 Seudoinversa de Moore-Penrose. Definición 15 Lema 13 27 27 27 28 29 29 29 29 30 30 31 33 33 33 34 34 35 36 37 37 37 37 38 Enrique R. Aznar Dpto. de Álgebra Página web personal Página de Abertura Contenido Página 3 de 64 Atrás Pantalla grande/pequeña Cerrar 9. 10. 11. 12. 13. Definición 16 Teorema 3 Ejemplo 13 Ejemplo 14 Ejemplo 15 Área de paralelogramos. Lema 14 Lema 15 Ejemplo 16 Ejemplo 17 Número de condición de una matriz. Definición 17 Ejemplo 18 Ejemplo 19 Lema 16 Ejemplo 20 Apéndice 1. Valores propios de un producto de matrices. Ejemplo 21 Teorema 4 Ejemplo 22 Apéndice 2. Una aplicación estadística de la SVD. Ejemplo 23 Ejercicios. 38 38 38 39 39 40 41 42 43 43 44 44 44 45 46 47 48 48 53 53 55 57 59 Enrique R. Aznar Dpto. de Álgebra Página web personal Página de Abertura Contenido Página 4 de 64 Atrás Pantalla grande/pequeña Cerrar Ejercicio 1 Ejercicio 2 Ejercicio 3 Ejercicio 4 Ejercicio 5 Ejercicio 6 Ejercicio 7 Ejercicio 8 Ejercicio 9 Ejercicio 10 14. Test de repaso. 59 59 59 60 60 60 60 61 61 61 61 Enrique R. Aznar Dpto. de Álgebra Página web personal Página de Abertura Contenido Página 5 de 64 Atrás Pantalla grande/pequeña Cerrar Enrique R. Aznar Dpto. de Álgebra 1. AUTOVALORES DE MATRICES REALES . Dada una matriz cuadrada real, A = (ai j ) ∈ Mn (R), sus autovalores son las raíces de su polinomio característico p(λ) = |A − λI | = a 11 − λ a 12 ... a 21 a 22 − λ . . . .. . .. . a n1 a n2 .. a 1n a 2n .. . . = . . . a nn − λ Página web personal Página de Abertura = (−1)n λn + (−1)n−1 p n−1 λn−1 + · · · + p 0 Contenido Por desarrollo directo, el coeficiente p n−1 = t r (A) = a11 + · · · + ann coincide con la suma de la diagonal principal de A y se le llama la traza de la matriz. Haciendo λ = 0, en ambos lados, se ve que el coeficiente p 0 = det(A) ∈ R coincide con el determinante de la matriz1. Página 6 de 64 Como p(λ) ∈ R(λ), es un polinomio real de grado n , sabemos por el Teorema Fundamental del Álgebra2 que tiene exactamente n raíces complejas. O sea, n autovalores (contados con su multiplicidad), λ1 , . . . , λn ∈ C, y se tiene n n p(λ) = (−1) λ + (−1) n−1 n−1 p n−1 λ Atrás Pantalla grande/pequeña n + · · · + p 0 = (−1) (λ − λ1 ) · · · (λ − λn ) 1Hay fórmulas para los demás coeficientes aunque son mas complicadas. 2Todas sus demostraciones tienen una parte que cae fuera del alcance de estas notas. Cerrar Igualando coeficientes, en ambos miembros, se obtiene Enrique R. Aznar Dpto. de Álgebra p n−1 = t r (A) = a 11 + · · · + a nn = λ1 + · · · + λn p 0 = det(A) = λ1 · · · λn Así, dada una matriz cuadrada real A , hemos demostrado que Lema 1. La suma de autovalores da la traza y su producto el determinante. Página web personal Si λ ∈ C es un valor propio de A , el s.l. (A − λI )X = 0 tiene solución distinta de cero y existe un vector, 0 = v ∈ Cn tal que Av = λv . v se dice un autovector asociado a λ. El par (λ, v) es una autopareja de A . Así, si (λ, v) es una autopareja de A , se verifican las siguientes. Página de Abertura Contenido Lema 2. [Propiedades de los autovalores y autovectores] 1) 2) 3) 4) 5) (λ, µv) es una autopareja de A , para todo µ ∈ R. (µλ, v) es una autopareja de µA , para todo µ ∈ R. (1/λ, v) es una autopareja de A −1 (si existe). (λk , v) es una autopareja de A k , para todo k ∈ N. λ es un autovalor de A t . Demostración: 1) Av = λv implica A(µv) = λ(µv). 2) Av = λv implica (µA)v = (µλ)v . Página 7 de 64 Atrás Pantalla grande/pequeña Cerrar 1 λ v. 3) Av = λv implica v = λ(A v) =⇒ A v = 4) Av = λv implica, por inducción, A k v = λk v . 5) |A − λI | = |(A − λI )t | = |A t − λI |. −1 −1 Enrique R. Aznar Dpto. de Álgebra Aunque, A y su traspuesta A t tienen los mismos autovalores, no tienen los mismos autovectores. Los de A t se llaman autovectores por la izquierda3. Si A, B ∈ Mn (R) y B es una matriz regular, entonces |AB − λI | = 0 ⇐⇒|B ||AB − λI | = 0 ⇐⇒ |B AB − λB | = 0 ⇐⇒ |B A − λI ||B | = 0 Página web personal Página de Abertura ⇐⇒|B A − λI | = 0 Contenido O sea, si son cuadradas y A o B es regular, hemos demostrado Lema 3. AB y B A tienen exactamente los mismos autovalores. Aunque no sean cuadradas, si existen ambos productos AB y B A . Estas son matrices cuadradas y coinciden sus autovalores distintos de cero4. 1 1 1 , AB = (2) y B A = cuyo 1 1 1 polinomio característico es p(λ) = (1−λ)2 −1 = λ2 −2λ = λ(λ−2) y tiene los autovalores 0 y 2. Luego coincide el autovalor (2) distinto de cero. Un caso muy simple es A = (1, 1), B = 3Cuando A es simétrica, si coinciden los autovectores por la izquierda y derecha. 4Si A de dimensión mxn , B de dimensión nxm . La demostración es diferente. Página 8 de 64 Atrás Pantalla grande/pequeña Cerrar 1 1 1 1 1 Ejemplo 1. Dadas las matrices A = y B = 0 −1, 0 0 1 0 1 1 1 2 1 1 sus productos son AB = , y B A = 0 0 −1 0 1 0 0 1 Sus polinomios son respectivamente p 1 (λ) = (1 − λ)2 y p 2 (λ) = −λ(1 − λ)2 . De nuevo, coinciden sus autovalores distintos de cero (λ = 1 doble). 1 0 1 −2 1 Ejemplo 2. Dadas las matrices A = y B = 0 1, 0 1 −1 −1 1 1 −2 1 0 −1 sus productos son AB = , y B A = 0 1 −1 1 0 −1 3 −2 2 Sus polinomios son respectivamente p 1 (λ) = λ + 1 y p 2 (λ) = −λ3 − λ. De nuevo, coinciden sus dos autovalores distintos de cero, i , −i . 2. M ATRICES SIMÉTRICAS REALES . Enrique R. Aznar Dpto. de Álgebra Página web personal Página de Abertura Contenido Página 9 de 64 Atrás Pantalla grande/pequeña Dado un esp. vect. euclídeo, (V, •), y una a.l. f : V → V , decimos que Definición 1. f es autoadjunta5 si f (u) • v = u • f (v), para todo u, v ∈ V . 5Algunos autores lo llaman endomorfismo simétrico. Cerrar Dada una base, B = {e 1 , . . . , e n } de V , por definición, la matriz de un endomorfismo, A = (ai j ), por columnas son las coordenadas de f (e 1 ), . . . , f (e n ) respecto de la propia base. Enrique R. Aznar Dpto. de Álgebra Si f (e j ) = a1 j e 1 + · · · + an j e n y B es ortonormal. Los coeficientes de Fourier son ai j = f (e j ) • e i , ∀i , j = 1, . . . , n . Entonces, si f es autoadjunta la matriz a i j = f (e j ) • e i = e j • f (e i ) = f (e i ) • e j = a j i Página web personal es simétrica. Recíprocamente, si A es simétrica y B ortonormal6 Página de Abertura f (x) • y = (AX )t Y = X t A t Y = X t AY = X t f (Y ) = x • f (y) Contenido y hemos demostrado, que respecto a una base B ortonormal Lema 4. f es autoadjunta (simétrico) si, y sólo si su matriz es simétrica. En lo que sigue, A = (ai j ) ∈ Mn (R), será una matriz simétrica real. Página 10 de 64 Lema 5. Los autovalores de A son todos números reales. Atrás Demostración: Sea (λ, v) una autopareja compleja. O sea, un autovector v = x + yi ∈ Cn , dondex, y ∈ Rn , y un autovalor λ = a +bi ∈ C, donde a, b ∈ R Ax + i Ay = A(x + yi ) = Av = λv = (a + bi )(x + yi ) = (ax − b y) + i (bx + a y) 6En este caso, el producto escalar se calcula como el usual, x • y = X t Y . Pantalla grande/pequeña Cerrar Enrique R. Aznar Dpto. de Álgebra Igualando, partes reales e imaginarias, se tiene Ax = ax − b y, Ay = bx + a y Entonces Ax • y = (ax − b y) • y = a(x • y) − b y x • Ay = x • (bx + a y) = b x 2 2 + a(x • y) Página web personal restando 2 2 0 = x • Ay − Ax • y = b( x + y ) finalmente, como x 2 + y 2 = 0, b = 0 y λ = a ∈ R es real. Página de Abertura 10 −6 Ejemplo 3. Dada la matriz, A = , su polinomio característico es −6 5 10 − λ −6 p(λ) = = λ2 − 15λ + 14 = (λ − 1)(λ − 14) =⇒ 1, 14 ∈ R. −6 5 − λ Contenido Sean {λ1 , . . . , λr } ⊂ R, los autovalores distintos de A 7. Para toda matriz cuadrada, espacios propios, Vλi , correspondientes a autovalores distintos dan intersección cero. O sea, su suma es directa Página 11 de 64 U = Vλ1 ⊕ · · · ⊕ Vλr ⊂ V = Rn Pantalla grande/pequeña Por el teorema espectral, sabemos que A es diagonalizable por semejanza si, y sólo si U = Rn . Pero U = Rn ⇐⇒ U ⊥ = 0. Cerrar 7El espectro tiene tamaño r ≤ n . Pero contados con su multiplicidad, en total, dan n . Atrás Como, para todo autovector f (u) = Au = λu , se tiene f (U ) ⊂ U . Si su complemento ortogonal U ⊥ = 0, se tiene para todo u ∈ U y v ∈ U ⊥ Enrique R. Aznar Dpto. de Álgebra f (v) • u = v • f (u) = 0 O sea, f (U ⊥ ) ⊂ U ⊥ y f : U ⊥ → U ⊥ será un endomorfismo. Tendrá al menos un autovector 0 = v ∈ U ⊥ y entonces, f (v) = λv ⇒ v ∈ U contradiciendo que U ∩U ⊥ = {0}. Por tanto, U = Vλ1 ⊕ · · · ⊕ Vλr = Rn el endomorfismo será diagonalizable por semejanza y hemos demostrado el Teorema 1. [espectral para matrices simétricas] Toda matriz simétrica real es diagonalizable en R. Página web personal Página de Abertura Contenido O sea, A es diagonalizable por semejanza. Pero se puede decir algo mas. Lema 6. Si λ, µ ∈ R son autovalores distintos de f A , entonces Vλ ⊥Vµ . Demostración: Para todo u ∈ Vλ y u ∈ Vµ Página 12 de 64 Atrás f (u) • v = (λu) • v = λ(u • v) Pantalla grande/pequeña u • f (v) = u • (µv) = µ(u • v) Cerrar Como f = f A es simétrico, ambos son iguales, y (λ − µ)(u • v) =⇒ u • v = 0 3. C ONGRUENCIA - SEMEJANZA . Enrique R. Aznar Dpto. de Álgebra Por lo anterior, dada una matriz simétrica real A , podemos aplicar el método de Gram-Schmidt, para obtener una base ortonormal para cada Vλ . Por el lema anterior, su unión será una base de Rn , formada por autovectores ortonormales. La matriz por columnas de estos vectores, P , es una matriz ortogonal, P t = P −1 , tal que diagonaliza A . O sea, λ1 .. P AP = D = . 0 t ... 0 .. .. . . Página web personal . . . λr Página de Abertura Contenido donde cada autovalor λi se repite con su multiplicidad. Asi, dadas matrices cuadradas, A, B, P ∈ Mn (R), se dice que Definición 2. A y B son congruentes-semejantes si A = P t B P y P t = P −1 . A P , se le llama una matriz ortogonal o una semejanza-ortogonal. Por lo anterior, para toda matriz simétrica real A ∈ Mn (R) Corolario 1. A es congruente-semejante con la diagonal de sus autovalores. Página 13 de 64 Atrás Pantalla grande/pequeña Cerrar Así, toda matriz simétrica real es diagonalizable por una semejanza-ortogonal. Toda semejanza P representa un cambio de base, g : Rn −→ Rn , tal que g (u) = Pu . Si además P t = P −1 , se tiene Enrique R. Aznar Dpto. de Álgebra u • v = u t v = u t P t P v = (Pu)t (P v) = g (u) • g (v) =⇒ =⇒ u 2 = u • u = g (u) • g (u) = g (u) =⇒ cos(α(u, v)) = 2 =⇒ u•v g (u) • g (v) = = cos(α(g (u), g (v))) u v g (u) g (v) O sea, hemos demostrado que Página web personal Lema 7. Toda semejanza-ortogonal preserva productos escalares. Por tanto, también normas y ángulos. Página de Abertura Contenido Si una a.l., g , preserva normas también preserva productos escalares, ya que u+v u•v = u+v 2 2( u 2 + v 2 2 = u 2) = + 2(u • v) + v 2 =⇒ g (u) + g (v) 2 = g (u) • g (v) 2( g (u) 2 + g (v) 2 ) Definición 3. Decimos que una a.l., g : Rn −→ Rn , es una isometria si preserva normas. Por tanto, también productos escalares y ángulos8. Corolario 2. Una semejanza es ortogonal si, y sólo si es una isometría. 8Si una a.l. preserva ángulos se llama conforme y puede no preservar normas. Por ejemplo, una homotecia o dilatación Página 14 de 64 Atrás Pantalla grande/pequeña Cerrar Ejemplo 4. Dada la curva de R , C = (x, y) ∈ R : 10x − 12x y + 5y = 1 , se puede comprobar que 2 2 10x 2 − 12x y + 5y 2 = (x, y) con A = 10 −6 −6 5 2 2 Enrique R. Aznar Dpto. de Álgebra x = X t AX y 10 −6 una matriz simétrica real. −6 5 Página web personal Por el ejemplo 3, sabemos que sus autovalores son 1 y 14. Resolviendo el s.l., (A − 14I )X = 0, se obtiene el autovector v 1 = Resolviendo el otro s.l., (A − I )X = 0, se obtiene el autovector 1 (3, −2). 13 v 2 = 1 (2, 3). 13 Escribiendolos por columnas, la semejanza-ortogonal es P = Por tanto, el cambio de base es X = x = y 1 13 3 2 −2 3 1 13 Página de Abertura Contenido 3 2 . −2 3 x =PX y Así, diagonalizamos Página 15 de 64 10x 2 −12x y+5y 2 = X t AX = (P X )t AP X = X t P t AP X = (x , y ) 14 0 0 1 x y O sea, con el cambio de base (sistema de referencia) la curva se ve que es una elipse C = (x , y ) ∈ R2 : 14x 2 + y 2 = 1 inclinada según tan( 32 ) y semiejes 1 14 y 1. Atrás Pantalla grande/pequeña Cerrar 4. E L GRUPO ORTOGONAL O(n). Enrique R. Aznar Dpto. de Álgebra Dadas matrices, A, B ∈ Mn (R), cuadradas reales, si ambas son regulares, se tiene que el producto AB −1 es de nuevo una matriz regular. A un subconjunto G ⊂ Mn (R) tal que, dadas A, B ∈ G , se tenga que AB −1 ∈ G , se le llama un grupo de matrices. Definición 4. Al conjunto de las matrices regulares reales se le denota, GL n (R), y se le llama el grupo general lineal de orden n 9. GL n (R) tiene 3 subgrupos de matrices interesantes, ya que Página web personal Página de Abertura Contenido • Si A, B tienen determinantes uno, |A| = 1 = |B |, también |AB −1 | = |A||B |−1 = 1 Así, el conjunto de las matrices de determinante uno, denotado SL(n), se le llama el grupo especial lineal de orden n . • Si A, B son matrices ortogonales, A t = A −1 , B t = B −1 , también (AB −1 )t = B A t = (AB −1 )−1 Así, el conjunto de la matrices ortogonales, denotado O(n), se le llama el grupo ortogonal de orden n . 9O simplemente, grupo de las matrices regulares de orden n . Página 16 de 64 Atrás Pantalla grande/pequeña Cerrar • El conjunto de las matrices ortogonales, de determinante uno, es la Enrique R. Aznar Dpto. de Álgebra intersección de los dos anteriores, SO(n) = SL(n) ∩ O(n) se le llama el grupo especial ortogonal de orden n . La importancia de estos grupos de matrices, está en que admiten interpretación geométrica y además permiten procesos algorítmicos10. n Página web personal n A ∈ O(n), nos define una isometría, f : R → R , tal que f (u) = Au , ya que u • v = u t v = u t A t Av = (Au)t Av = f (u) • f (v) Recíprocamente, si una aplicación verifica que u•v = f (u)• f (v), ∀u, v ∈ Rn . Para la base canónica, {e 1 , . . . , e n }, se tiene que los coeficientes de Fourier y i = f (u) • f (e i ) = u • e i = x i son iguales. O sea, u = x 1 e 1 + · · · + x n e n , y x1 Página de Abertura Contenido . f (u) = y 1 f (e 1 ) + · · · + y n f (e n ) = ( f (e 1 ), . . . , f (e n )) .. = Au xn Página 17 de 64 Atrás a 11 ... a 1n donde A = ( f (e 1 ), . . . , f (e n )) = .. . . .. . . . es la matriz ortogonal cuyas colum- Pantalla grande/pequeña a n1 ... a nn nas son las coordenadas de f (e j ) = a1 j e 1 + · · · + an j e n 11. 10Computacionalmente buenos o eficientes. Por ejemplo, para diagonalizar. 11Que son vectores ortonormales, por preservar f productos escalares. Cerrar Hemos encontrado unas ecu. matriciales. Así, f es lineal e isometría. Enrique R. Aznar Dpto. de Álgebra Corolario 3. [caracterización de isometrías] f : Rn → Rn isometría ⇔ f preserva prod. esc. ⇔ f (u) = Au , con A ∈ O(n). En lo que sigue, vamos a clasificar el grupo ortogonal a b ∈ M 2 (R) : A t = A −1 c d O(2) = A = Para eso, primero observamos que 2 t Página web personal Página de Abertura t |A| = |A ||A| = |A A| = |I | = 1 ⇐⇒ |A| = 1 O |A| = −1 Contenido Por tanto, distinguimos dos casos: 1) Isometría directa: A ortogonal y |A| = 1. O sea, A ∈ SL(2). 2) Isometría inversa: A ortogonal y |A| = −1. O sea, A ∈ O(2) − SL(2). Página 18 de 64 Ahora, si A ∈ O(2) 1 0 a b = I = A At = 0 1 c d a c a 2 + b 2 ac + bd = ⇐⇒ b d ac + bd c 2 + d 2 ⇐⇒ a 2 + b 2 = 1 = c 2 + d 2 , ac + bd = 0, ac = −bd Estas ecuaciones determinan completamente las matrices. Así Caso 1): ad − bc = 1 implica a = a 2 d − bac = a 2 d + b 2 d = (a 2 + b 2 )d = d . Análogamente, b = abd − b 2 c = −a 2 c − b 2 c = −(a 2 + b 2 )c = −c . Atrás Pantalla grande/pequeña Cerrar Enrique R. Aznar Dpto. de Álgebra a b O sea, se tiene que A ∈ SL(2) si, y sólo si a + b = 1 y A = −b a 2 SO(2) = 2 a b ∈ M 2 (R) : a 2 + b 2 = 1 −b a Caso 2): ad −bc = −1 implica −a = a 2 d −bac = a 2 d +b 2 d = (a 2 +b 2 )d = d . Análogamente, −b = abd − b 2 c = −a 2 c − b 2 c = −(a 2 + b 2 )c = −c ⇔ b = c . O sea, se tiene que A ∉ SL(2), A ∈ O(2) si, y sólo si a 2 +b 2 = 1 y A = O(2) − SO(2) = a b b −a a b ∈ M 2 (R) : a 2 + b 2 = 1 b −a Página web personal Página de Abertura Contenido En particular, si hay ceros, se obtienen un número finito de matrices 0 −1 0 1 1 0 −1 0 , , , ∈ SO(2) 1 0 −1 0 0 1 0 −1 0 1 0 −1 1 0 −1 0 , , , ∈ O(2) − SO(2) 1 0 −1 0 0 −1 0 1 Ejemplo 5. Para cualquier valor de un ángulo, θ ∈ R, la matriz A= cos(θ) − sin(θ) ∈ SO(2) sin(θ) cos(θ) claramente es una isometría directa, ya que cos(θ)2 + (− sin(θ))2 = 1. Página 19 de 64 Atrás Pantalla grande/pequeña Cerrar Además, la primera columna, f (e 1 ) = (cos(θ), sin(θ)), representa gráficamente el vector e 1 (eje x ), girado θ grados en sentido levógiro12. Enrique R. Aznar Dpto. de Álgebra Análogamente, la segunda columna, f (e 2 ) = (− sin(θ), cos(θ)), representa gráficamente el vector e 2 (eje y ), girado θ grados en el mismo sentido. Definición 5. Una isometría definida por la matriz ortogonal A = es llamada una rotación levógira de ángulo θ . cos(θ) − sin(θ) sin(θ) cos(θ) 5. I NTERPRETACIÓN GEOMÉTRICA DE O(2). Dados a, b ∈ R, tales que a 2 + b 2 = 1, siempre existe un ángulo θ ∈ R tal que a = cos(θ), b = − sin(θ)13, y A ∈ SO(2) determina una rotación levógira. a b ∈ SO(2), se puede interpretar también como un −b a giro en sentido dextrógiro. Basta tomar θ , tal que a = cos(θ) y b = sin(θ)14. Página web personal Página de Abertura Contenido En realidad, A = Corolario 4. Las isometrías directas de R2 son las rotaciones. La última interpretación permite diagonalizar una matriz arbitraria, B . 12Contrario a las agujas de un reloj. 13Por las propiedades de las funciones trigonométricas. 14Toda rotación es levógira y dextrógira, la diferencia está en tomar ángulos opuestos. Página 20 de 64 Atrás Pantalla grande/pequeña Cerrar x x En efecto, si B = 1 2 , elegimos el único ángulo θ ∈ [0, π] tal que y1 y2 y1 x1 , sin(θ) = , con r = r r O sea, tomamos la rotación R tal que cos(θ) = RB = x 1 /r −y 1 /r y 1 /r x 1 /r Enrique R. Aznar Dpto. de Álgebra x 12 + y 12 = (x 1 , y 1 ) x1 x2 r (x 1 x 2 + y 1 y 2 )/r = y1 y2 0 (x 1 y 2 − y 1 x 2 )/r Trasponiendo la matriz resultante, podemos hacer cero fuera de la diagonal. Página web personal Página de Abertura Lema 8. Toda matriz 2x2 se puede diagonalizar con rotaciones. Contenido 1 1 Ejemplo 6. Para, A = , con la rotación asociada a su primera columna 1 1 R1 A = 1/ 2 1/ 2 −1/ 2 1/ 2 1 1 = 1 1 2 2/ 2 =B 0 0 ahora, si definimos la rotación, R 2 , asociada a la primera fila de B y multiplicamos a la derecha por su traspuesta, se diagonaliza R 1 AR 2 = B R 2 = 2 2/ 2 0 0 2/2 −1/ 2 2 0 =D = 0 0 1/ 2 2/2 Página 21 de 64 Atrás Pantalla grande/pequeña Cerrar Como R 1 , R 2 ∈ O(2), se tiene |A| = |D|, rango( A )=rango(D ). En este caso, además, como A t = A ⇒ R 2 = R 1t , la diagonal obtenida son los autovalores y la factorización es su diagonalización por semejanza. 15 Salvo la identidad, la matriz de una rotación no tiene autovalores reales p(λ) = Enrique R. Aznar Dpto. de Álgebra a − λ −b = (a − λ)2 + b 2 = 0 =⇒ (a − λ)2 = −b 2 =⇒ b = 0, a = 1 b a −λ Consideramos ahora una isometría inversa. O sea, A ∈ O(2) − SL(2). En este caso, A = p(λ) = a b con a 2 + b 2 = 1, tiene los autovalores b −a a −λ b = λ2 −a 2 −b 2 = 0 =⇒ λ2 = a 2 +b 2 = 1 =⇒ λ = 1, −1 b −a − λ Para hallar sus autovectores, resolvemos los s.l. a −1 b b −a − 1 a +1 b b −a + 1 Página web personal Página de Abertura Contenido x 0 = =⇒ x(a − 1) = −yb =⇒ (x, y) = (b, 1 − a) y 0 x 0 = =⇒ x(a + 1) = −yb =⇒ (x, y) = (b, −1 − a) y 0 Si los normalizamos, u = 1 (b, 1 − a), 2−2a u • v = 0, v= Au = u, 1 (b, −1 − a), 2+2a Página 22 de 64 tenemos Av = −v Entonces, {u, v} es una base ortonormal y para todo vector u ∈ R 2 se tiene u = xu + y v =⇒ f (u) = Au = x Au + y Av = xu − y v 15Al mover un ángulo θ los vectores de la base canónica, también mueve a cualquier vector y no tiene direcciones fijas (autovectores). Atrás Pantalla grande/pequeña Cerrar Toda a.l., f : R −→ R , que tenga los autovalores 1, −1, actúa de la misma forma. Tiene una dirección fija u y lleva su perpendicular v a su opuesto. 2 2 Enrique R. Aznar Dpto. de Álgebra Definición 6. Llamamos reflexión a una a.l. que tenga los autovalores 1, −1. Dado v = (a1 , a2 ) ∈ R2 , llamamos la recta definida por v al subesp. vect. v ⊥ = (x, y) ∈ R2 : a 1 x + a 2 y = 0 Si v es unitario, v = 1, la correspondencia entre v y su recta es biyectiva. A ese v , le llamamos su vector director. Si v es el autovector, correspondiente al autovalor −1, de una reflexión. Definición 7. La llamamos reflexión respecto de la recta dada por v ∈ R2 . Página web personal Página de Abertura Contenido Así, toda matriz A ∈ O(2) − SL(2) (isometría inversa) es una reflexión. Recíprocamente, si f : R2 −→ R2 es una reflexión y v = (a1 , a2 ) ∈ R2 es el autovector unitario correspondiente al autovalor −1. Entonces, la matriz H = I − 2v v t = = 1 0 a 1 0 − 2 1 (a 1 , a 2 ) = − 0 1 a2 0 1 2a 12 2a 1 a 2 2a 1 a 2 = 2a 22 Atrás 1 − 2a 12 −2a 1 a 2 a 22 − a 12 −2a 1 a 2 = ∈ O(2) − SL(2) −2a 1 a 2 1 − 2a 22 −2a 1 a 2 a 12 − a 22 Pantalla grande/pequeña Cerrar 16 Corolario 5. Las isometrías inversas del plano euclídeo son sus reflexiones . 16En el plano afín, hay más pero se reducen a éstas. Página 23 de 64 Enrique R. Aznar Dpto. de Álgebra Las reflexiones también sirven para diagonalizar eficientemente. x1 x2 , con u 1 = x 12 + y 12 , y1 y2 tomamos q = (x 1 + sg (x 1 ) u 1 , x 2 ) y lo normalizamos En efecto, si B = {u 1 , u 2 } = v= 1 (x 1 + sg (x 1 ) x 1 , x 2 ) q Página web personal −sg (x 1 ) u 1 Entonces, la reflexión H = I − 2v v t satisface que Hu 1 = 0 y hace cero por debajo de la diagonal de B . Página de Abertura Contenido Trasponiendo la matriz resultante, podemos repetir y diagonalizar. Lema 9. Toda matriz 2x2 se puede diagonalizar con reflexiones. Ejemplo 7. Para, A = 1 1 , la norma de su primera columna es u 1 = 1 1 Entonces, q = (1 + 2, 1), q = H1 4 + 2 2 =⇒ v = 1 4+2 2 (1 + 2, 1) 1 1 1 1 1 1+ 2 = (I − 2v v t ) = − (1 + 2, 1) = 1 1 1 1 1 2+ 2 = 2+ 2 1+ 2 1 1 1+ 2 − 2 − = − = 1 1 1 1 0 2+ 2 2 Página 24 de 64 Atrás Pantalla grande/pequeña Cerrar − 2 − 2 Por tanto, H A = Finalmente, como (− 2, − 2) = 2, existe 0 0 otra reflexión H2 que multiplicada por la derecha diagonaliza A . H1 AH2 = Enrique R. Aznar Dpto. de Álgebra −(−2) 0 2 0 − 2 − 2 H2 = = 0 0 0 0 0 0 Observamos, en este ejemplo, que la matriz diagonal es la misma17 del ejemplo 6 (donde se diagonaliza por rotaciones). Si usamos reflexiones, no es necesario calcular explícitamente las matrices de cambio H para obtener los productos y por tanto la diagonal. Además, conocemos de antemano la primera columna o fila del resultado. Página web personal Página de Abertura Contenido Así, para toda A ∈ M2 (R), existen matrices ortogonales18 U ,V ∈ O(2) tales que V t AU = D = d1 0 0 d2 Página 25 de 64 t Como hemos visto, U y V no son únicas. Pero siempre A = V DU . Aunque A , no sea simétrica. Siempre lo son sus grammianas, A t A y A A t . Luego ambas son diagonalizables por congruencia-semejanza. Además, t t t t t t t 2 A A = (V DU ) V DU = U DV V DU = U DDU = U D U 17 Atrás Pantalla grande/pequeña t Son los valores propios de A , que ya era diagonalizable por semejanza-ortogonal. 18Pueden ser ambas reflexiones o rotaciones si se preserva el signo del determinante. En caso contrario, hay que mezclar rotación y reflexión. Cerrar Como en esta descomposición, los valores propios aparecen en la diagonal y son únicos. Hemos demostrado que d12 y d22 son los valores propios de A t A . Enrique R. Aznar Dpto. de Álgebra También se demuestra que d 12 y d22 son los valores propios de A A t . Por tanto, los elementos d1 y d 2 que únicos salvo su signo y su orden. Definición 8. Si 0 ≤ d 1 ≤ d 2 , los llamamos los valores singulares de A . Como siempre se pueden hacer positivos y/o reordenar multiplicando por matrices ortogonales especiales. Tenemos Corolario 6. Toda matriz A ∈ M2 (R) tiene valores singulares únicos. Página web personal Página de Abertura Contenido Como A t A = U D 2U t , la matriz ortogonal U ∈ O(2), tiene por columnas una base ortonormal de autovectores de A t A . Análogamente, A A t = V D 2V t y también V ∈ O(2) es una base de autovectores de A A t . Como V t AU = D ⇐⇒ AU = V D , hay correspondencia entre autovectores. Si u es autovector de A t A , v de A A t y d es un valor singular de A . Definición 9. u y v se corresponden por valor singular si Au = d v . 1 1 5 3 2 3 , sus grammianas A t A = , At A = 3 2 3 5 2 1 tienen los autovalores positivos {6.8541, 0.145898}. Sus raíces cuadradas {2.61803, 0.381966} son los valores singulares de la matriz. Ejemplo 8. Para, A = Página 26 de 64 Atrás Pantalla grande/pequeña Cerrar 6. M ATRICES DE G IVENS Y DE H OUSEHOLDER . a b ∈ SO(2), se pueden gener−b a alizar a cualquier dimensión n . Así, si a 2 + b 2 = 1, una matriz 1 ... 0 ... 0 ... 0 .. . . .. .. .. . . . . . 0 . . . a . . . b . . . 0 .. . . . . . . . . A= . ∈ SO(n) . . . . 0 . . . −b . . . a . . . 0 .. .. .. . . .. . . . . . 0 ... 0 ... 0 ... 1 Enrique R. Aznar Dpto. de Álgebra Las rotaciones del plano euclídeo, A = representa una rotación, tanto levógira como dextrógira, de dos de los ejes, manteniendo iguales los n − 2 restantes. Definición 10. Una matriz del tipo anterior es llamada una matriz de Givens. Se dice que es una rotación de los ejes i , j , respecto a los n − 2 restantes. Página web personal Página de Abertura Contenido Página 27 de 64 Atrás Pantalla grande/pequeña Ejemplo 9. En R3 , existen tres tipos de rotaciones o matrices de Givens, Cerrar 1 0 0 a 0 b a b 0 0 a b , 0 1 0 , −b a 0 0 0 1 0 −b a −b 0 a Enrique R. Aznar Dpto. de Álgebra llamadas rotaciones respecto a los ejes x , y , z respectivamente Ahora, toda matriz de orden nxn se puede diagonalizar con rotaciones. O sea, multiplicando a derecha e izquierda por matrices de Givens. Análogamente al caso bidimensional, podemos definir reflexiones. Si u = (a1 , . . . , an ) ∈ Rn , es un vector unitario, u = 1. Definimos H = I − 2uu t y la llamamos una matriz de Householder. 1 ... 0 2a 12 . . . . . . H = .. . . . .. −2 .. (a 1 , . . . , a n ) = .. . . . .. − .. 0 ... 1 an 0 ... 1 2a 1 a n 1 ... 0 a1 Página web personal . . . 2a 1 a n .. . ... .. . 2a n2 Página de Abertura Contenido Lema 10. La matriz H = I − 2uu t , tiene las siguientes propiedades: • • • • Hu = −u . H v = v para todo v ∈ Rn tal que u⊥v . H = Ht. H t = H −1 . Demostración: • • • • Como u t u = u 2 = 1, se tiene Hu = (I − 2uu t )u = u − 2u = −u . Si u t v = 0, se tiene H v = (I − 2uu t )v = v − 0v = v . H t = (I − 2uu t )t = I t − 2(uu t )t = I − 2uu t = H . H 2 = (I −2uu t )(I −2uu t ) = I −4uu t +4(uu t )2 = I −4uu t +4uu t = I . Página 28 de 64 Atrás Pantalla grande/pequeña Cerrar ⊥ La fórmula de las dimensiones, d i m(u ) + d i m(L(u)) = n , implica Enrique R. Aznar Dpto. de Álgebra d i m(u ⊥ ) = n − 1 al subesp. vect. u ⊥ = v ∈ Rn : u • v = 0 = v = (x 1 , . . . , x n ) ∈ Rn : a 1 x 1 + · · · + a n x n = 0 lo llamamos el hiperplano definido por u . Por tanto, Corolario 7. La a.l. f : Rn −→ Rn , definida por una matriz de Householder, f (x) = H x , tiene los autovalores 1 y −1, de multiplicidad geométrica n − 1. Definición 11. Llamamos reflexión respecto de un hiperplano a un endomorfismo que tenga los autovalores 1, y −1, de multiplicidad geom. n − 1. Página web personal Página de Abertura Contenido Como dos endomorfismos coinciden si lo hacen sobre una base. Y por definición, toda reflexión determina una base de autovectores de Rn . Entonces Corolario 8. Toda reflexión viene definida por una matriz de Householder. Página 29 de 64 En la práctica, no es necesario calcular la matriz de Householder. Por ej. Ejemplo 10. Si queremos calcular el vector reflejado de e 1 = (1, 0, 0) respecto al plano x+ y + z = 0, basta calcular el producto escalar e 1 • u = 1 u t e 1 = (1, 1, 1) 0 = 1. Entonces, el reflejado es e 1 − 2u = (−1, −1, −1) 0 He 1 = (I − 2uu t )e 1 = e 1 − 2(u t e 1 )u = e 1 − 2u Atrás Pantalla grande/pequeña Cerrar 7. D ESCOMPOSICIÓN POR VALORES SINGULARES (SVD). Enrique R. Aznar Dpto. de Álgebra Análogamente al caso bidimensional, multiplicando por matrices de Householder y/o Givens, se puede diagonalizar cualquier matriz19. O sea, se puede diagonalizar con reflexiones y/o rotaciones cualquier matriz. Una demostración general es la siguiente. Teorema 2. [de existencia de valores singulares (SVD)] Para toda A ∈ M mxn (R), existen matrices U ∈ O(m), V ∈ O(n) tal que V t AU = D Página web personal Página de Abertura Contenido es diagonal mxn con entradas d1 ≥ · · · ≥ d p ≥ 0 con p = min{m, n}. Demostración: Podemos suponer n = min{m, n}. En caso contrario, descomponemos A t y trasponiendo su SVD, obtenemos la de A . Su grammiana B = A t A es una matriz simétrica real y sus autovalores son no negativos.Así, podemos escribirlos en orden decreciente, como cuadrados d 12 ≥ · · · ≥ d n2 Atrás ≥0 Por Gram-Schimdt, podemos elegir, u 1 , . . . , u n ∈ Rn , autovectores ortonormales. Así, Bu k = dk2 u k y por columnas U = (u 1 , . . . , u n ) es ortogonal nxn . 19 Página 30 de 64 Si A es mxn hay que multiplicar a izquierda por matrices de orden m y a derecha de orden n . Hay algoritmos eficientes para órdenes grandes. Pantalla grande/pequeña Cerrar m Ahora, suponemos d r = 0 y dr +1 = · · · = dn = 0 y definimos vectores de R , v j = d1 Au j 20 para j = 1, . . . , r . Estos son ortonormales, ya que j v tj v k d k2 t 1 1 t t t = u A Au k = u Bu k = u uk = d j dk j d j dk j d j dk j 0, Si j = k 1, Si j = k Podemos ampliar hasta una base ortonormal v 1 , . . . , v r , v r +1 , . . . , v m de Rm . Así, la matriz por columnas V = (v 1 , . . . , v m ) también es ortogonal. Ahora, para todo k > r , como Au k = 0 también v tj Au k = 0. Y si k ≤ r , se tiene v tj Au k = d k v tj v k = Enrique R. Aznar Dpto. de Álgebra 0, Si j = k d k , Si j = k Página web personal Página de Abertura Contenido Por tanto, la descomposición pedida es V t AU = D ⇐⇒ A = V DU t La demostración anterior es constructiva y se aplica a cada matriz para hallar su descomposición por valores singulares. Como en el siguiente 1 1 1 2 1 1 5 3 , su grammiana A t A = · = , 2 1 1 1 2 1 3 2 tiene por ecuación característica p(λ) = |A − λI | = (5 − λ)(2 − λ) − 32 = λ2 − 7λ + 1 = 0 cuyas raíces son los autovalores positivos Página 31 de 64 Ejemplo 11. Para, A = 7+3 5 7−3 5 , 2 2 = {6.8541, 0.145898} 20Ésta es la condición. para la correspondencia entre autovectores izquierda y derecha. Atrás Pantalla grande/pequeña Cerrar Si para cada valor propio, se resuelven los s.l. y se normalizan sus soluciones se obtienen los vectores propios u 1 , u 2 que escritos por columnas dan la matriz U tal que Λ = U t A t AU es diagonal21. O sea, Enrique R. Aznar Dpto. de Álgebra −0.850651 −0.525731 5 3 −0.850651 0.525731 6.8541 0 · · = 0.525731 −0.850651 3 2 −0.525731 −0.850651 0 0.145898 −1.37638 −0.32492 y se tiene B t B = U t A t AU = Λ. −2.22703 0.200811 Por tanto, las columnas de B son vectores ortogonales pero en general no unitarios (su norma son las raíces cuadradas de los valores propios de A t A ). Página web personal Entonces, B = AU = Página de Abertura Contenido Estas raíces cuadradas positivas son los llamados valores singulares de A {d 1 , d 2 } = { 6.8541, 0.145898} = {2.61803, 0.381966} Si normalizamos las columnas de B = AU , dividiendo por d1 y d 2 , obtenemos −0.525731 −0.850651 cuyas columnas son los −0.850651 0.525731 vectores unitarios v 1 , v 2 de la demostración. Además, por la definición de V la matriz ortogonal V = B = A ·U = −0.525731 −0.850651 2.61803 0 · =V ·D −0.850651 0.525731 0 0.381966 21U diagonaliza por congruencia-semejanza a la grammiana A t A . Página 32 de 64 Atrás Pantalla grande/pequeña Cerrar t Finalmente, despejando A = V · D ·U encontramos su SVD. Explícitamente 1 1 −0.525731 −0.850651 = 2 1 −0.850651 0.525731 2.61803 0 0 0.381966 Enrique R. Aznar Dpto. de Álgebra −0.850651 −0.525731 0.525731 −0.850651 U y V en una SVD no son únicas, los d 1 ≥ · · · ≥ d p ≥ 0 si lo son. En efecto, A t A = (V DU t )t V DU t = U DV t V DU t = U DDU t = U D 2U t Página web personal A A t = V DU t (V DU t )t = V DDV t = V D 2V t Página de Abertura Así, necesariamente los cuadrados d i2 son valores propios de A t A y A A t . Y los di son únicos salvo su signo y su orden. Contenido Definición 12. Si 0 ≤ d i , ∀i , los llamamos los valores singulares de A . Corolario 9. Toda matriz A tiene valores singulares únicos. Como A t A = U D 2U t , la matriz ortogonal U ∈ O(2), tiene por columnas una base ortonormal de autovectores de A t A . Análogamente, A A t = V D 2V t y también V ∈ O(2) es una base de autovectores de A A t . Como V t AU = D ⇐⇒ AU = V D , hay correspondencia entre autovectores. Si u es autovector de A t A , v de A A t y d es un valor singular de A . Definición 13. u y v se corresponden por valor singular si Au = d v . A v se le llama vector singular izquierda y a u vector singular derecha. Página 33 de 64 Atrás Pantalla grande/pequeña Cerrar Como las matrices ortogonales U = (u 1 , . . . , u n ) y V = (v 1 , . . . , v m ) representan cambios de base ortonormales, desde la canónica. Enrique R. Aznar Dpto. de Álgebra Para toda a.l. f : Rn → Rm , definida por f (u) = Au , con A ∈ Mmxn (R) Corolario 10. Existen bases ortonormales en Rn y Rm tales que la matriz de f , respecto de estas nuevas bases, es diagonal con entradas no negativas. Página web personal Como una a.l., f , definida por una matriz diagonal, con entradas no negativas, es una dilatación/contracción de ejes coordenados. El corolario nos dice que toda f es esencialmente una dilatación/contracción. 2 7 2 1 3 6 0 9 Página de Abertura Contenido 58 57 tiene los auto57 126 valores positivos {158.37, 25.6298} y sus raíces cuadradas {12.5845, 5.06259} son los valores singulares de A . Ejemplo 12. Para, A = , su grammiana A t A = −0.869563 Los autovectores de A t A son las columnas de U = 0.493823 0.869563 0.493823 . Ahora, para hallar la matriz V , lo que hacemos es calcular el producto A·U = 3.59633 −0.257657 8.67413 −3.124 0.987645 −1.73913 8.31989 3.57484 y normalizar sus columnas de forma que se obtiene la igualdad A ·U = V · D de donde se despeja A = V · D ·U t 2 7 2 1 3 6 0 9 = 0.285774 −0.0508943 0.68927 −0.617076 0.078481 −0.343525 0.661121 0.706129 12.5845 0 0 5.06259 0.493823 0.869563 −0.869563 0.493823 Página 34 de 64 Atrás Pantalla grande/pequeña Cerrar 2 4 A es la matriz de una a.l. de R en R y la hemos descompuesto en una rotación en R 2 definida por U 22, después una dilatación en R 2 definida por la matriz diagonal D y después una a.l. de R 2 en R 4 definida por V . Enrique R. Aznar Dpto. de Álgebra Si ampliamos las 2 columnas de V hasta una base ortonormal de R4 , tenemos 0.285774 −0.0508943 ∗ ∗ 0.68927 −0.617076 ∗ ∗ 0.078481 −0.343525 ∗ ∗ 0.661121 0.706129 ∗ ∗ 12.5845 0 t 0.493823 0.869563 0 5.06259 −0.869563 0.493823 = V1 ·D 1 ·U 0 0 0 0 t y las nuevas V1 , D 1 diagonalizan A A = (V1 D 1U t )(U D 1t V1t ) = V1 D 1 D 1t V1t 12.58452 0 0 0 158.37 0 0 0 t 0 25.6298 0 0 es diagonal 0 5.062592 0 0 = ya que D 1 D 1 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 A= 2 7 2 1 3 6 0 9 = Página web personal Página de Abertura Contenido Cuando una matriz cuadrada A tiene determinante positivo se puede conseguir que las matrices U y V sean de rotaciones. Si A tiene determinante negativo, son una rotación y una reflexión. Además, siempre se tiene que Lema 11. Si r ≤ n es tal que d r = 0 y d r +1 = 0. Entonces, 1) 2) 3) 4) rango(A) = r . A = (v 1 , . . . , v r )diag{d 1 , . . . , d r }(u 1 , . . . , u r )t . N (A) = L(u r +1 , . . . , u n ) es el esp. nulo de A . C (A) = L(v 1 , . . . , v r ) es el esp. de columnas de A . Demostración: 22Porque U es una matriz ortogonal de determinante 1. Página 35 de 64 Atrás Pantalla grande/pequeña Cerrar 1) La multiplicación por matrices invertibles no cambia el rango. 2) Calculando el producto, se tiene Enrique R. Aznar Dpto. de Álgebra A = V DU t = (d 1 v 1 , . . . , d r v r , 0, . . . , 0)(u 1 , . . . , u r )t = r = k=1 d k v k u kt = (v 1 , . . . , v r )diag{d 1 , . . . , d r }(u 1 , . . . , u r )t 3) N (A) = L(u r +1 , . . . , u n ) ya que Au kt = 0 para todo k = r + 1, . . . , n y su dimensión es n − r por ser rango(A) = r . 4) C (A) = L(v 1 , . . . , v r ) es inmediato por 2). Definición 14. La descomposición 2) del anterior corolario se le dice una descomposición SVD compacta de A . Página web personal Página de Abertura Contenido De esta descomposición compacta, A = (v 1 , . . . , v r )diag{d 1 , . . . , d r }(u 1 , . . . , u r )t intercambiando los papeles de U , V y tomando inversos de las entradas, se define fácilmente otra matriz Página 36 de 64 B = (u 1 , . . . , u r )diag{1/d 1 , . . . , 1/d r }(v 1 , . . . , v r )t Atrás que es casi una inversa de A , ya que AB y B A son matrices cuadradas muy n cercanas a sus identidades. Ya que, m v v t = Im , u u t = In y k=1 k k k=1 k k t AB = (v 1 , . . . , v r )diag{1, . . . , 1}(v 1 , . . . , v r ) = v 1 v 1t + · · · + v r v rt ∈ M m (R) B A = (u 1 , . . . , u r )diag{1, . . . , 1}(u 1 , . . . , u r )t = u 1 u 1t + · · · + u r u rt ∈ M n (R) Pantalla grande/pequeña Cerrar En particular, AB y B A son matrices simétricas por ser suma de simétricas. Además, se deduce otra demostración para la existencia de inversas laterales. Enrique R. Aznar Dpto. de Álgebra Corolario 11. Si A es de rango pleno. Entonces, B es inversa lateral de A . En general, la matriz B anterior verifica las siguientes igualdades. A = (v 1 , . . . , v r )diag{d 1 , . . . , d r }(u 1 , . . . , u r )t = = (v 1 , . . . , v r )diag{d 1 , . . . , d r }diag{1/d 1 , . . . , 1/d r }diag{d 1 , . . . , d r }(v 1 , . . . , v r )t = = AB A B = (u 1 , . . . , u r )diag{1/d 1 , . . . , 1/d r }(v 1 , . . . , v r )t = Página web personal Página de Abertura Contenido = (u 1 , . . . , u r )diag{1/d 1 , . . . , 1/d r }diag{d 1 , . . . , d r }diag{1/d 1 , . . . , 1/d r }(v 1 , . . . , v r )t = = B AB O sea, dada un matriz A ∈ Mmxn (R) y su B asociada. Entonces, se tiene que Página 37 de 64 Lema 12. AB A = A, B AB = B . Atrás 8. S EUDOINVERSA DE M OORE -P ENROSE . Ahora, dada un matriz A ∈ Mmxn (R), estamos en condiciones de definir Definición 15. Decimos que B ∈ Mnxm (R) es una inversa generalizada de Moore-Penrose de A si AB y B A son simétricas y AB A = A, B AB = B . Pantalla grande/pequeña Cerrar Por lo anterior, toda matriz tiene una inversa de Moore-Penrose. Pero, además Enrique R. Aznar Dpto. de Álgebra Lema 13. La inversa de Moore-Penrose de una matriz es única. Demostración: Supongamos que B y C son ambas inversas de MoorePenrose de A . Así, por definición, AB , B A , AC , C A son matrices simétricas. B = B AB = A t B t B = A t C t A t B t B = C A A t B t B = C AB AB = C AB C = C AC = CC t A t = CC t A t B t A t = CC t A t AB = C AC AB = C AB Página web personal Esta unicidad de la inversa de Moore-Penrose de una matriz A permite darle nombre propio. Página de Abertura Definición 16. Llamamos A † , a la inversa de Moore-Penrose de A . Contenido Aunque no lo demostramos aquí, dado un s.l. de ecuaciones AX = b , compatible o incompatible, siempre se tiene que Teorema 3. A † b es una solución mínimo cuadrática de norma mínima. Ejemplo 13. A = 1 1 , es simétrica real. Por tanto, diagonalizable por 1 1 congruencia-semejanza. 1 1 0.707107 −0.707107 = 1 1 0.707107 0.707107 Página 38 de 64 Atrás Pantalla grande/pequeña 2 0 0 0 0.707107 0.707107 −0.707107 0.707107 Como sus autovalores 2, 0 son no negativos, la matriz es semidefinida positiva y su SVD coincide con la descomposición anterior. Cerrar Para hallar su inversa de Moore-Penrose, calculamos el producto A† = 0.707107 −0.707107 0.707107 0.707107 Ejemplo 14. El s.l. matriz A = 1/2 0 0 0 x+y = 1 x + y = −1 0.707107 0.707107 0.25 0.25 = −0.707107 0.707107 0.25 0.25 es incompatible porque el rango de la 1 1 es uno y el de su matriz ampliada es dos. 1 1 Página web personal Sin embargo, tiene una solución mínimo cuadrática que es el vector A†b = 0.25 0.25 0.25 0.25 x+y = 1 x+y = 1 es compatible indeterminado porque el rango de su matriz y el de su ampliada es uno (menor que dos incógnitas). La solución de norma mínima es el producto A † b = Página de Abertura Contenido 1 0 = −1 0 Así, el origen de coordenadas es el punto de la recta, imagen por la matriz A (= la bisectriz del primer cuadrante), más cercano al punto (1, −1). O sea, es la solución mínimo cuadrática del s.l. Ejemplo 15. El s.l. Enrique R. Aznar Dpto. de Álgebra 0.25 0.25 0.25 0.25 Así, (0.5, 0.5) es el punto de la recta, x + y = 1 de norma mínima. O sea, el más cercano al origen de coordenadas. 1 0.5 = . 1 0.5 Página 39 de 64 Atrás Pantalla grande/pequeña Cerrar Enrique R. Aznar Dpto. de Álgebra 9. Á REA DE PARALELOGRAMOS . Empezaremos calculando áreas de paralelogramos en R2 . Sean u = a c a c ,v= ∈ R2 y A = (u, v) = la matriz que definen. El b d b d valor absoluto de su determinante es el área del paralelogramo que forman y y Página web personal c Página de Abertura a Contenido T3 T2 d b T T1 a T3 T2 T b T1 x c d Página 40 de 64 x El área del rectángulo, R = ad , es la suma de las áreas de 4 triángulos. ab cd (a − c)(d − b) − − = 2 2 2 ab + cd + (ad + bc − ab − cd ) ad + bc ad − bc = ad − = ad − = =T 2 2 2 R = ad = T + T1 + T2 + T3 ⇐⇒ T = ad − Atrás Pantalla grande/pequeña Cerrar Como el área del paralelogramo, S , es dos veces el área de T, se tiene Enrique R. Aznar Dpto. de Álgebra S = 2T = ad − bc = |A| El dibujo de la izquierda se ha hecho suponiendo ad > bc . Si fuera al contrario, estamos en el dibujo de la derecha, y los mismos cálculos dan S = bc − ad = | det(A)| que es el valor absoluto del determinante. Otra forma (vectorial) de hallar el área del mismo paralelogramo es a c a |A| = = v ⊥ •u = v ⊥ · u ·cos(α) = ± v · h = ad −bc = (d , −c) b d b donde v ⊥ = c 2 + d 2 = v es la longitud de la base h = u · cos(α) es la longitud de la proyección de u = (a, b) sobre v ⊥ . O sea, h es la altura del paralelogramo. Finalmente, el signo depende de cos(α) y es el signo del determinante. Los razonamientos anteriores sirven para todo u, v ∈ R2 . Así Lema 14. S = | det(A)| es el área del paralelogramo formado por u , v . Página web personal Página de Abertura Contenido Página 41 de 64 Atrás n Pero en R también dos vectores u y v forman un paralelogramo. Su área también se puede calcular como base por altura23. Como λu es un vector cualquiera de la recta definida por u . Para que el vector λu − v sea la altura del paralelogramo, basta suponer perpendicularidad 23En Rn , existen normas y la altura se calcula por perpendicularidad. Pantalla grande/pequeña Cerrar Enrique R. Aznar Dpto. de Álgebra con u . O sea, (λu − v) • u = 0 ⇐⇒ λ(u • u) = v • u = u • v El valor de la altura es h = λu − v para el λ anterior. Pero, entonces h 2 = λu − v 2 = (λu − v)•(λu − v) = −(λu − v)• v ⇐⇒ (u • v)λ+h 2 = v • v Las igualdades anteriores forman un s.l. con dos incógnitas λ y h 2 . (u • u)λ + 0h 2 = u • v (u • v)λ + h 2 = v • v Página web personal Página de Abertura Contenido Ahora, por la regla de Cramer para la resolución de sistemas, se tiene h2 = u •u u •v u•v v •v u •u 0 u•v 1 = u •u u •v u•v v •v u •u =⇒ |A t A| = h 2 u Lema 15. S = 2 = u (u, v) v u =⇒ S = h u = 2 = |A t A| =⇒ u 2 |A t A| |A t A| es el área del paralelogramo formado por u , v . Página 42 de 64 Atrás Pantalla grande/pequeña Cerrar En el caso bidimensional, se reencuentra la fórmula anterior S= |A t A| = |A t | · |A| = |A| · |A| = | det(A)| |A t A|, Aunque, no lo demostramos aquí diremos que la fórmula anterior, S = cuando A ∈ Mmxn (R) es de rango pleno por columnas, calcula el volumen n dimensional del paralelepípedo formado por sus n columnas. 2 Ejemplo 16. Dada la matriz A = 1 1 mado por sus columnas, u = (2, 1, 1) y 2 0 el área del paralelogramo for1 v = (2, 0, 1), se calcula como la raíz Enrique R. Aznar Dpto. de Álgebra Página web personal cuadrada del determinante de su grammiana. Por tanto, Página de Abertura u •u u •v 6 5 |A t A| = = = 30 − 25 = 5 =⇒ S = u•v v •v 5 5 |A t A| = 5 = 2.23607 Contenido Si calculamos el determinante de la otra grammiana sale cero. Lo que indica que las tres filas de A son l.d. y forman un paralelepípedo degenerado de volumen cero. Página 43 de 64 2 1 Ejemplo 17. Dada la matriz A = 0 1 2 0 el área del paralelogramo formado 1 1 por sus columnas es |A t A| = u •u u •v 6 5 = = 36−25 = 11 =⇒ S = u•v v •v 5 6 Atrás Pantalla grande/pequeña Cerrar |A t A| = 11 = 3.31662 Enrique R. Aznar Dpto. de Álgebra 10. N ÚMERO DE CONDICIÓN DE UNA MATRIZ . Sabemos por el teorema 2, que dada A ∈ Mmxn (R), existen matrices U ∈ O(m), V ∈ O(n) tal que V t AU = D es diagonal mxn con entradas d1 ≥ · · · ≥ d p ≥ 0 con p = min{m, n}. Si rango(A) = r entonces d r = 0 y dr +1 = 0 y podemos definir el Definición 17. [Número de condición (espectral) de una matriz] Es el cociente entre el mayor y el menor valor singular de A , y lo denotamos k(A) = Página web personal Página de Abertura Contenido d1 ≥1 dr Si k(A) >> 1, es mucho mayor que 1, decimos que A está mal condicionada. Si por el contrario, k(A) ≈ 124 decimos que A está bien condicionada. Ejemplo 18. Dada la matriz de una rotación arbitraria A = a −b , con b a a 2 + b 2 = 1, sabemos que tiene autovalores complejos conjugados, ya que p(λ) = a − λ −b = (a − λ)2 + b 2 = 0 =⇒ (a − λ)2 = −b 2 =⇒ b a −λ =⇒λ = a ± 24Próximo a uno. −b 2 = a ± bi Página 44 de 64 Atrás Pantalla grande/pequeña Cerrar los dos autovalores son números complejos de norma uno, λ1 = λ2 = a 2 + b 2 = 1. O sea, pertenecen a la circunferencia unidad. Enrique R. Aznar Dpto. de Álgebra Además, como su grammiana asociada es la identidad At A = a b −b a a −b 1 0 = b a 0 1 tiene autovalores 1 (doble) y los valores singulares de A son 1, 1. Por tanto, k(A) = 1 y toda rotación está bien condicionada. Ejemplo 19. Dada la matriz de una reflexión arbitraria A = a b , con b −a a 2 + b 2 = 1, sabemos que tiene los autovalores 1 y −1. Página web personal Página de Abertura Contenido Además, también su grammiana asociada es la identidad At A = a b b −a a b 1 0 = b −a 0 1 tiene autovalores 1 (doble) y de nuevo, los valores singulares de A son 1, 1. Por tanto, k(A) = 1 y toda reflexión está bien condicionada. En general, toda matriz ortogonal, A , tiene grammiana asociada la identidad, A t A = I . Tiene todos sus valores singulares 1 y número de condición 1. Página 45 de 64 Atrás Pantalla grande/pequeña Cerrar Cualquier isometría, en cualquier dimensión, tiene número de condición 1. Conforme el número de condición de una matriz se hace mayor, más se aleja A de ser una isometría y más se deformarán las figuras. Por definición, el nº de condición de una matriz es siempre k(A) ≥ 1. Además Enrique R. Aznar Dpto. de Álgebra Lema 16. [Propiedades del nº de condición de una matriz] 1) 2) 3) 4) k(A) = k(A t ) = k(A −1 ). k(λA) = k(A) para 0 = λ ∈ R. k(A t A) = k(A)2 ≥ k(A). k(A) = k(B ), si A y B son semejantes. Demostración: Página web personal Página de Abertura t t 1) Ya que las 2 matrices, A A y A A tienen los mismos autovalores, distintos de cero. Mientras que (A −1 )t A −1 = (A t A)−1 tiene por autovalores los correspondientes inversos de los anteriores. 2) Ya que las 2 matrices, λA y A tienen los mismos autovalores. 3) Ya que los autovalores de la matriz A son las raíces cuadradas positivas de los autovalores de A t A . 4) Si A y B son semejantes, también los son A t A y B t B . Estas tienen los mismos autovalores reales positivos. Por tanto, A y B tienen los mismos valores singulares. Contenido Página 46 de 64 Atrás Pantalla grande/pequeña En R , la interpretación geométrica de la descomposición por valor singular (SVD) de una matriz es interesante por el impacto visual de f (X ) = AX . 2 El círculo unidad se transforma en una elipse, cuya deformación se mide por k(A), que coincide con el cociente de sus semiejes. Cerrar 3 1 Ejemplo 20. La matriz A = , es simétrica real y definida positiva. 1 1 Tiene dos autovalores reales positivos, que son λ1 = 3.41421 y λ2 = 0.585786. Enrique R. Aznar Dpto. de Álgebra Por tanto, coinciden con sus valores singulares. Así, el número de condición de esta matriz es kA = 3.41421 = 5.82843 0.585787 Página web personal Su descomposición SVD coincide con la de congruencia/semejanza 3 1 −0.92388 0.382683 = 1 1 −0.382683 0.525731 3.41421 0 0 0.525731 −0.92388 −0.382683 0.382683 −0.850651 Página de Abertura Contenido Así la a.l, f (X ) = AX , es un automorfismo ( A es regular) del plano, que consiste primero en aplicar la rotación definida por −0.92388 −0.382683 0.382683 −0.850651 después una dilatación/contracción25 y después la rotación inversa. Ambas rotaciones no se anulan porque la dilatación/contracción central deforma los ángulos. El resultado final es una rotación de ejes que se calcula diagonalizando por congruencia/semejanza la matriz B = (A −1 )t A −1 que es la que transforma el círculo unidad en la elipse 0.5s 2 − 2s ∗ t + 2.5t 2 = 1. 25de los dos ejes, según los valores singulares. Página 47 de 64 Atrás Pantalla grande/pequeña Cerrar 11. A PÉNDICE 1. VALORES PROPIOS DE UN PRODUCTO DE MATRICES . Enrique R. Aznar Dpto. de Álgebra Por definición, para que una matriz tenga valores propios tiene que ser la matriz de un endomorfismo. O sea, tiene que ser una matriz cuadrada26. Por tanto, para que el producto, A·B , de dos matrices tenga autovalores, hace falta que tengan dimensiones simétricas m × n y n × m . De forma que ambos productos, A · B de dimensión m × m y B · A de dimensión n × n son matrices cuadradas y se pueden comparar sus autovalores. a 11 . . . a 1n b 11 . . . .. . . .. .. · ... . . . A ·B = . a m1 . . . a mn b n1 . . . n ×m m ×n b 11 . . . b 1m a 11 . . . . .. · .. ... ... B · A = .. . . b n1 . . . b nm a m1 . . . n ×m m ×n b 1m c 11 .. = .. . . ... .. . c 1m Página web personal Página de Abertura .. = C 1 . Contenido b nm c m1 . . . c mm m ×m a 1n c 11 . . . c 1n .. = .. . . . . . .. = C 2 . a mn c n1 . . . c nn n ×n Página 48 de 64 Atrás Pantalla grande/pequeña Pero puede suceder que uno de los productos tenga una dimensión más pequeña y sea más fácil calcular su ecuación característica y autovalores. 26De números reales o complejos. Cerrar 1 1 1 1 Ejemplo 21. Para las matrices A = A ·B = 1 1 1 1 ·(1 4×1 B · A = (1 −2 1 −2 ) 1×4 −2 1 −2 ) · 1×4 1 1 1 1 y B = ( 1 −2 1 −2 ), se tiene = 1 1 1 1 −2 −2 −2 −2 1 1 1 1 4×4 −2 −2 −2 −2 Enrique R. Aznar Dpto. de Álgebra = C1 = (−2) = C 2 4×1 Página web personal 1×1 Página de Abertura Aquí, C 2 es una matriz mucho más sencilla ya que, C 2 = (−2), es esencialmente un escalar y es inmediato que λ = −2 es el único autovalor que tiene. Contenido En cambio, la matriz C 1 como es 4 × 4 tiene 4 (contando multiplicidades) autovalores complejos que aparentemente son difíciles de hallar ya que la ecuación característica, |C 1 − λI | = 0, es un determinante de orden 4 × 4. Pero podemos aplicar la propiedad de que dos matrices semejantes tienen los mismos autovalores. Por tanto, si aplicamos una trasformación elemental de filas a C 1 que equivale a multiplicar E · C 1 y luego la correspondiente (a E −1 ) transformación elemental de columnas. Entonces, la nueva matriz E C 1 E −1 tiene los mismos autovalores. Así, si restamos a la segunda fila la primera y después sumamos la segunda columna a la primera C1 = 1 1 1 1 −2 −2 −2 −2 1 1 1 1 −2 −2 −2 −2 ∼ 1 −2 1 −2 0 0 0 0 1 −2 1 −2 1 −2 1 −2 ∼ −1 −2 1 −2 0 0 0 0 −1 −2 1 −2 −1 −2 1 −2 = E 1 C 1 E 1−1 Página 49 de 64 Atrás Pantalla grande/pequeña Cerrar Si restamos a la 3ª fila la primera y sumamos la 3ª columna a la primera −1 −2 1 −2 0 0 0 0 −1 −2 1 −2 −1 −2 1 −2 ∼ −1 −2 1 −2 0 0 0 0 0 0 0 0 −1 −2 1 −2 ∼ Enrique R. Aznar Dpto. de Álgebra 0 −2 1 −2 0 0 0 0 0 0 0 0 0 −2 1 −2 Finalmente, restamos a la 4ª fila la 1ª y sumamos la 4ª columna a la 1ª 0 −2 1 −2 0 0 0 0 0 0 0 0 0 −2 1 −2 ∼ 0 −2 1 −2 0 0 0 0 0 0 0 0 0 0 0 0 ∼ −2 −2 1 −2 0 0 0 0 0 0 0 0 0 0 0 0 Página web personal Ahora, esta última matriz tiene de ecuación característica −2−λ −2 1 −2 0 −λ 0 0 0 0 −λ 0 0 0 0 −λ Página de Abertura = (−λ)3 (−2 − λ) = 0 Contenido y por tanto los valores propios de C 1 son λ = 0 triple y λ = −2 simple. En el ejemplo, el producto B · A tiene de ecuación característica λ4−1 = λ3 veces la de A · B y por tanto comparten el mismo autovalor distinto de cero (-2). Veremos que siempre se puede repetir el mismo proceso. −1 Página 50 de 64 −1 Como, A · B tiene los mismos autovalores que P (A · B ) P = (P A) · (B P ) si demostramos que éste producto tiene los mismos distintos de cero que (B P ) · (P −1 A) = B · A , habremos demostrado que A · B y B · A tienen los mismos autovalores no nulos. Atrás Pantalla grande/pequeña Cerrar Esto nos permite, cambiar una de las matrices por su forma normal de Hermite (de filas o columnas según nos interese) para hacer la demostración de que tienen la misma ecuación característica salvo una potencia de λ. Por ejemplo si r (B ) = 1 podemos aplicar el algoritmo de transformaciones elementales de columnas para transformarla en su forma normal de Hermite, Enrique R. Aznar Dpto. de Álgebra 1 0 ... 0 ∗ 0 ... 0 B · P = .. .. . . .. . . .. ∗ 0 ... 0 −1 Como el otro producto P A es una matriz arbitraria m × n , basta demostrar que tienen los mismos autovalores no nulos cuando B es de esa forma. O sea a 11 . A · B = .. a m1 1 . . . a 1n b 21 .. · .. . . . .. . . . a mn b n1 m ×n 0 ... 0 c 11 0 . . . 0 0 . . . 0 . .. . . .. = C = .. .. . . .. . . 1 . . . . c m1 0 . . . 0 0 ... 0 n ×m m ×m Donde |C 1 − λI | = (−λ)m−1 (c 11 − λ) = 0 es la ecuación característica de C 1 = A · B con c 11 = a 11 + a 12 b 21 + · · · + a 1n b n1 el único autovalor distinto de cero. Ahora, para calcular los autovalores del otro producto 1 0 ... 0 b 21 0 . . . 0 a 11 . . . a 1n .. .. = C .. B · A = .. · . .. . . .. . 2 . . . . . a m1 . . . a mn b n1 0 . . . 0 n ×m m ×n Página web personal Página de Abertura Contenido Página 51 de 64 Atrás Pantalla grande/pequeña Cerrar n ×n Pero podemos aplicar la propiedad de que dos matrices semejantes tienen los mismos autovalores. Por tanto, si aplicamos una trasformación elemental de filas a B que equivale a multiplicar E · C 2 y luego la correspondiente (a E −1 ) transformación elemental de columnas a A . Entonces, la nueva matriz E C 2 E −1 tiene la misma ecuación característica. Así, si restamos en B a la segunda fila la primera multiplicada por b21 y después en A sumamos la segunda columna por b21 a la primera 0 1 0 ... b 21 0 ... 0 a 11 ... a 1n .. . . .. . . . B · A = .. .. . . .. · . . .. a m1 ... a mn b n1 0 ... 0 1 0 ... 0 0 0 ... 0 b31 0 ... 0 ∼ . . . .· .. .. . . .. b n1 0 ... 0 Enrique R. Aznar Dpto. de Álgebra Página web personal a 11 +a 12 b 21 a 12 ... a 1n Página de Abertura a m1 +a m2 b 21 a m2 ... a mn Contenido .. . .. . . .. . . . Si aplicamos sucesivamente las trasformaciones de fila y columna para hacer cero por debajo del 1 en la primera columna de B llegamos al producto B·A ∼ 1 0 ... 0 0 0 ... 0 a 11 + .. .. . . .. · .. .. a 0 0 ... 0 m1 + n a b i =2 1i i 1 .. . n i =2 a 12 ... a 1n a .. . . .. = . . . a mi b i 1 a m2 ... a mn 11 + n a b i =2 1i i 1 0 .. . 0 a 12 ... a 1n 0 ... 0 .. . . .. . . . 0 ... 0 y esta última tiene un único autovalor no nulo que es el mismo de A · B 27 λ = a 11 + Página 52 de 64 Atrás Pantalla grande/pequeña n a 1i b i 1 = a 11 + a 12 b 21 + · · · + a 1n b n1 = c 11 i =2 27Y la ecuación característica de B · A es la misma de A · B salvo una potencia de λ. Cerrar Cuando el menor de los rangos de A y B es mayor que 1, la demostración es más compleja pero sigue los mismos pasos ya que el proceso anterior es algorítmico y fácil de generalizar. Enrique R. Aznar Dpto. de Álgebra Empezamos con A · B , con B la que tenga menor rango o menor número de columnas, si no conocemos su rango, y transformamos B en su forma normal de Hermite por columnas H y el otro factor A de forma dual en A 1 . Después seguimos transformando en el producto H · A 1 haciendo ceros por debajo de los unos hasta llegar a la forma normal de Hermite por filas H1 y de forma dual A 1 en A 2 y finalmente calculamos H1 · A 2 y comprobamos que su ecuación característica es la misma de A 1 · H salvo un múltiplo de λ. Así Página web personal Página de Abertura Contenido Teorema 4. Si existen A · B y B · A tienen la misma ecuación característica salvo λn−m y por tanto los mismos autovalores no nulos. 1 2 Ejemplo 22. Dadas las matrices A = 21 73 26 y B = 1 7 para comprobar 1 2 que coinciden los autovalores no nulos de AB y B A . Transformamos primero B , multiplicando la 1ª columna por -2 y sumando a la 2ª, dualmente transformamos A , multiplicando la 2ª fila por 2 y sumando a la 1ª. Después, dividimos por 5 la 2ª de B y dualmente multiplicamos por 5 la 2ª fila de A Página 53 de 64 Atrás Pantalla grande/pequeña Cerrar 1 2 1 0 1 0 2 7 2 4 13 14 4 13 14 A ·B = · 1 7 ∼ · 1 5 ∼ · 1 1 1 3 6 1 3 6 5 15 30 1 2 1 0 1 0 Seguimos, multiplicando la 2ª columna de B por -1 y sumando a la 1ª, dualmente la 1ª fila de A y sumando a la 2ª Enrique R. Aznar Dpto. de Álgebra 1 0 1 0 18 13 4 13 14 4 13 14 · 0 1 = A ·B ∼ · 1 1 ∼ 53 28 9 28 44 5 15 30 1 0 1 0 Hemos llegado a la forma de Hermite por columnas de B y concluimos que el producto A·B tiene la misma ecuación característica que el producto final. Ahora, le damos la vuelta al producto y seguimos calculando la forma de Hermite por filas de B que se consigue multiplicando la 1ª fila de A por -1 y sumando a la 3ª, dualmente en B sumamos la 3ª a la 1ª columna Página web personal Página de Abertura Contenido 1 0 1 0 18 13 14 4 13 14 18 13 14 B · A ∼ 0 1 · ∼ 0 1 · = 53 28 44 9 28 44 53 28 44 1 0 0 0 0 0 0 Página 54 de 64 Finalmente, se comprueba que la ecuación característica de B · A es 18 − λ 13 14 18 − λ 13 53 28 − λ 44 = −λ =0 53 28 − λ 0 0 −λ O sea, la misma de A · B multiplicada por λ = λ3−2 . Por tanto, tiene los mismos autovalores como queríamos demostrar. Atrás Pantalla grande/pequeña Cerrar 12. A PÉNDICE 2. U NA APLICACIÓN ESTADÍSTICA DE LA SVD. Enrique R. Aznar Dpto. de Álgebra Si tenemos n medidas de varias variables x i = {ai 1 , . . . , ani }, i ∈ {1, . . . , r } se pueden cambiar los valores a otras nuevas variables, z 1 , . . . , z r , que sean independientes y sucesivamente de varianza máxima pero que recojan toda la información de las anteriores. Las nuevas variables son c.l. de las x 1 , . . . , x r y se obtienen usando la descomposición por valor singular de la matriz de sus desviaciones de las medias. Para eso, se pasa de la matriz de las observaciones X a la matriz A = X − X¯ . a 11 −m 1 ··· a 1r −m r a 11 ··· a 1r X= .. . . .. . . . donde mi = x i = a i 1 +···+a ni n → A = X −X = .. . ... .. . Contenido son las medias aritméticas de las variables. Ahora, si diagonalizamos la grammiana A t A por congruencia-semejanza. O sea, usando sus autovalores reales y sus autovectores normalizados tenemos λ1 ··· 0 = (A ·U ) (A ·U ) = U · A A ·U = Λ = ... . . . ... t Página de Abertura a n1 −m 1 ··· a nr −mr a n1 ··· a nr A 1t A 1 Página web personal t t 0 ··· λr donde A 1 = A ·U es una nueva matriz n × r , donde sus columnas son c.l. de las columnas de A . O sea, de las desviaciones de las variables originales. Ahora, si llamamos z 1 , . . . , z r a las columnas de A 1 , las igualdades anteriores se traducen en que z i · z i = λi , z i · z j = 0 para cada i , j ∈ {1, . . . , r }. Página 55 de 64 Atrás Pantalla grande/pequeña Cerrar Por tanto, son perpendiculares dos a dos y cada vector z i tiene de norma la raíz cuadrada del valor propio λi (es positivo porque A t A es simétrica real). zi = 2 2 = + · · · + b ni b 1i zi · zi = λi = d i Además, como las columnas de A = X − X tienen media cero, también las columnas z i de A 1 tienen media aritmética cero ya que 1 1 ∗ (1, . . . , 1) · A 1 = ∗ (1, . . . , 1) · A ·U = (0, . . . , 0) ·U = (0, . . . , 0) n n .. . Página web personal Página de Abertura Contenido b 1i Como cada z i = Enrique R. Aznar Dpto. de Álgebra tiene media cero, 2 2 b 1i +···+b ni n−1 = λi n−1 es su varianza y b ni λi n−1 = di n−1 su desviación típica. Como los valores propios de una matriz simétrica real λ1 ≥ λ2 ≥ · · · ≥ λr ≥ 0 dan los máximos sucesivos de las normas que representan, se tiene que las nuevas variables z i son sucesivamente de varianza máxima28. Como además, z i · z j = 0, estas variables tienen covarianza cero o sea son independientes. Finalmente, los di son los valores singulares de A y la matriz A 1 nos sirve para encontrar su SVD ya que si normalizamos cada una de sus columnas, 28Con la condición de que sean c.l. por un vector unitario de las originales. Página 56 de 64 Atrás Pantalla grande/pequeña Cerrar vi = 1 di ∗ z i obtenemos una matriz V formada por columnas unitarias y or- Enrique R. Aznar Dpto. de Álgebra togonales tal que podemos despejar la descomposición por valor singular d 1 ··· d 1 ··· 0 A 1 = A ·U = V · ... . . . ... 0 ··· d r 0 =⇒ A = V · ... . . . ... ·U t = V · D ·U t 0 ··· d r Ejemplo 23. Consideramos 4 medidas de dos variables x = {2, 7, 2, 1}, y = {3, 6, 0, 1}, queremos hallar mediante c.l. de ellas otras dos nuevas variables que sean independientes y sucesivamente de varianza máxima. Ptrimero, escribimos la matriz de las observaciones, X = 2 7 2 1 3 6 0 9 Página web personal Página de Abertura , calculamos Contenido = 3, y¯ = 18 = 4.5, sus desviaciones, las medias de sus columnas, x¯ = 12 4 4 A = X −X = 2−3 7−3 2−3 1−3 3−4.5 6−4.5 0−4.5 9−4.5 = −1 −1.5 4 1.5 −1 −4.5 −2 −4.5 su grammiana, su polinomio característico que tiene por raíces los At A = −1 4 −1 −2 −1.5 1.5 −4.5 −4.5 −1 −1.5 4 1.5 −1 −4.5 −2 −4.5 = 22 3 3 45 Página 57 de 64 22 − λ 3 =⇒ = λ2 −67λ+981 3 45 − λ autovalores λ1 = 45.3849 y λ2 = 21.6151 y sus raíces cuadradas que son los valores singulares de A d1 = 45.3849 = 6.73683, d2 = 21.6151 = 4.64921 Los autovectores de A t A son las columnas de U = 0.127245 −0.991871 0.991871 0.127245 . Atrás Pantalla grande/pequeña Cerrar Ahora, para hallar la matriz V , lo que hacemos es calcular el producto A ·U y normalizar sus columnas de forma que se obtiene la igualdad A ·U = V · D Z = A ·U = −1 −1.5 4 1.5 −1 −4.5 −2 −4.5 0.127245 −0.991871 0.991871 0.127245 −1.61505 1.99679 −4.59067 4.20893 = 0.801003 −3.77662 0.419267 2.55635 ya que las normas de las columnas de Z son los valores singulares di = λi porque Z t Z = U t A t · AU = U t (A t A)U = Λ y por tanto z i 2 = z i · z i = λi Z = A ·U = −1.61505 1.99679 −4.59067 4.20893 0.801003 −3.77662 0.419267 2.55635 = −0.239735 0.296399 −0.681428 0.624764 0.172288 −0.812314 0.0901804 0.549846 6.73683 0 0 4.64921 =V ·D de donde despejamos la SVD, A = V · D ·U t −1 −1.5 4 1.5 −1 −4.5 −2 −4.5 = −0.239735 0.296399 −0.681428 0.624764 0.172288 −0.812314 0.0901804 0.549846 Página web personal Página de Abertura Contenido 6.73683 0 0 4.64921 Pero lo que nos interesa aquí es la matriz Z = Enrique R. Aznar Dpto. de Álgebra 0.127245 0.991871 −0.991871 0.127245 −1.61505 1.99679 −4.59067 4.20893 0.801003 −3.77662 0.419267 2.55635 que está Página 58 de 64 formada por dos variables llamadas componentes principales Atrás z 1 = {−1.61505, 1.99679, −4.59067, 4.20893} z 2 = {0.801003, −3.77662, 0.419267, 2.55635} que son independientes porque tienen covarianza cero z 1 · z 2 = 0 y tienen varianzas múltiplos de λ1 y λ1 y por tanto son las máximas posibles29. 29Con la condición de que sean c.l. por un vector unitario de las originales. Pantalla grande/pequeña Cerrar Sus medias son cero ya que (z 1 , z 2 ) = 1 n (1, . . . , 1) · Z Enrique R. Aznar Dpto. de Álgebra y entonces Z = A ·U = X − X ·U = X ·U − X ·U =⇒ (z 1 , z 2 ) = n1 (1, . . . , 1) · Z = 1 (1, . . . , 1) · X n ·U − 1 (1, . . . , 1) · X n ·U =⇒ (z 1 , z 2 ) = (x, y) ·U − (x, y) ·U = (0, 0) En particular, hay otras dos variables independientes trasformadas también por la matriz U de los vectores singulares derecha, que son las dos columnas del producto X · U cuyas medias calculadas son, (x, y) · U , una c.l. de las medias originales y cuyas varianzas son las mismas de z 1 y z 2 . Página web personal Página de Abertura Contenido 13. E JERCICIOS . 3 6 2 1 7 Ejercicio 1. Dadas las matrices A = y B = 0 −1 comprueba 2 0 1 0 9 que coinciden los autovalores de AB y B A . 2 1 7 3 6 2 Ejercicio 2. Dadas las matrices A = 2 0 1 y B = 1 0 7 comprueba 1 1 3 0 9 2 que coinciden los autovalores de AB y B A . Página 59 de 64 Atrás Pantalla grande/pequeña Cerrar 10 10 Ejercicio 3. Dada la matriz A = . ¿Se puede diagonalizar por 10 10 Enrique R. Aznar Dpto. de Álgebra congruencia-semejanza? ¿Y por semejanza? Ejercicio 4. Dada la matriz A = 10 −10 . ¿Se puede diagonalizar por 10 10 congruencia-semejanza? ¿Y por semejanza? Ejercicio 5. Dada la curva de R 2 , C = (x, y) ∈ R2 : 10x 2 − 10x y + 10y 2 = 1 , comprueba que existe una matriz, A , simétrica real 2x2, tal que 10x 2 − 10x y + 10y 2 = X t AX = (x, y) a b b c x y Página web personal Página de Abertura Contenido Calcula los autovalores de A . ¿Qué puedes decir de la curva? Ejercicio 6. Dada la curva de R 2 , C = (x, y) ∈ R2 : 10x 2 − 40x y + 10y 2 = 1 , comprueba que existe una matriz, A , simétrica real 2x2, tal que 10x 2 − 40x y + 10y 2 = X t AX = (x, y) a b b c x y Calcula los autovalores de A . ¿Qué puedes decir de la curva? Ejercicio 7. Dada la curva de R 2 , C = (x, y) ∈ R2 : 10x 2 − 20x y + 10y 2 = 1 , comprueba que existe una matriz, A , simétrica real 2x2, tal que 10x 2 − 20x y + 10y 2 = X t AX = (x, y) a b b c x y Calcula los autovalores de A . ¿Qué puedes decir de la curva? Página 60 de 64 Atrás Pantalla grande/pequeña Cerrar 1 1 0 Ejercicio 8. Dada la matriz A = 1 2 1 Comprueba si se diagonaliza 0 1 1 Enrique R. Aznar Dpto. de Álgebra por congruencia-semejanza. Halla su descomposición de valor singular. 1 1 2 Ejercicio 9. Dada la matriz A = 1 1 2 ¿ Se puede diagonalizar por 0 1 1 congruencia-semejanza ? ¿Y por semejanza ?. Halla su SVD. 1 1 1 Ejercicio 10. Dada la matriz A = 1 1 2 ¿ Se puede diagonalizar por 0 1 1 Página web personal Página de Abertura Contenido congruencia-semejanza ? ¿Y por semejanza ?. Halla su SVD. Compara las distintas factorizaciones o descomposiciones de A. 14. T EST DE REPASO . Página 61 de 64 Para comenzar el cuestionario pulsa el botón de inicio. Cuando termines pulsa el botón de finalizar. Para marcar una respuesta coloca el ratón en la letra correspondiente y pulsa el botón de la izquierda (del ratón). 1. Dada una matriz cuadrada, A ∈ Mn (R). Atrás Pantalla grande/pequeña Cerrar (a) La traza de A es un invariante por semejanza pero no su det(A). (b) El determinante de A es un invariante por semejanza pero no su traza. (c) La traza de A y su |A|, se calculan con sus autovalores. (d) Ni su traza, ni su determinante, son invariantes por semejanza. 2. Dada una matriz cuadrada regular, A ∈ Mn (R). (a) Los autovalores de A son los mismos de A −1 . (b) Los autovalores de A son los inversos de A t . (c) Los autovalores de A son los mismos de A 2 . (d) Los autovalores de A son los mismos de A t . 3. Si A es de dimensión mxn y B de dimensión nxm . (a) AB y B A tienen exactamente los mismos autovalores. (b) AB y B A tienen exactamente los mismos autovectores. (c) A A t y A t A tienen exactamente los mismos autovalores. (d) A A t y A t A tienen exactamente los mismos autovectores. 4. ¿Cuál de las siguientes afirmaciones es verdadera?. (a) Matrices congruentes tienen los mismos autovalores. (b) Matrices congruentes tienen los mismos autovectores. (c) Dos matrices semejantes son también congruentes. Enrique R. Aznar Dpto. de Álgebra Página web personal Página de Abertura Contenido Página 62 de 64 Atrás Pantalla grande/pequeña Cerrar (d) Matrices semejantes tienen los mismos autovalores. 5. Dada una matriz simétrica, A ∈ Mn (R). (a) A es diagonalizable, en R, por semejanza pero no por congruencia. (b) A es diagonalizable, en R, por congruencia pero no por semejanza. (c) A no es diagonalizable en R. (d) A es diagonalizable, en R, por una congruencia-semejanza. 6. ¿Cuál de las siguientes afirmaciones es verdadera?. (a) Toda semejanza preserva productos escalares, normas y ángulos. (b) Si un endomorfismo preserva ángulos también preserva normas. (c) Ninguna semejanza preserva productos escalares, normas y ángulos. (d) Si un endomorfismo preserva normas también preserva ángulos. 7. Dado un endomorfismo f : Rn → Rn , tal que f (u) = Au . (a) f es isometría si preserva ángulos. (b) f es isometría si A ∈ GL(n). (c) f es isometría si A ∈ O(n). (d) f es isometría si A ∈ SL(n). 8. Dado un homomorfismo f : R2 → R2 , tal que f (u) = Au . Enrique R. Aznar Dpto. de Álgebra Página web personal Página de Abertura Contenido Página 63 de 64 Atrás Pantalla grande/pequeña Cerrar (a) A ∈ O(2) si, y sólo si es una reflexión. (b) A ∈ O(2) − SL(2) si, y sólo si es una rotación. (c) A ∈ O(2) si, y sólo si es una rotación. (d) Si A ∈ O(2) puede ser una rotación o una reflexión. 9. ¿Cuál de las siguientes afirmaciones es verdadera?. (a) Una rotación levógira no puede ser dextrógira. (b) Sólo hay una rotación que es levógira y dextrógira a la vez. (c) Existen reflexiones levógiras pero no dextrógiras. (d) No existen reflexiones levógiras ni dextrógiras. 10. ¿Cuál de las siguientes afirmaciones es verdadera?. (a) Toda matriz se puede diagonalizar con rotaciones pero no con reflexiones. (b) Toda matriz se puede diagonalizar con reflexiones pero no con rotaciones. (c) Toda matriz se puede diagonalizar con reflexiones y/o con rotaciones. (d) Para diagonalizar ortogonalmete, hay que hacerlo con rotaciones a la izquierda y reflexiones a la derecha. Enrique R. Aznar Dpto. de Álgebra Página web personal Página de Abertura Contenido Página 64 de 64 Atrás Pantalla grande/pequeña Cerrar
© Copyright 2024