Hits


용어 정리

  • multiplicity - 중근
  • Symmetric - 대칭의
  • Symmetric Matrix - 대칭 행렬
  • Orthogonally Diagonalization - 직교 대각화
  • Spectral Theorem - 스펙트럼 정리
  • Spectral Decomposition - 스펙트럼 분해


  • Symmetrix Matrix 의 Orthogonally Diagonalization 은 선형대수학의 꽃인 SVD 를 유도하기 위해 필수적인 부분이다.


Symmetrix Matrix - 대칭 행렬

  • Symmetric Matrix 는 행렬 A 가 Square Matrix (정사각 행렬) 이고, AT=A 를 만족하는 행렬이다.
  1. A is Square Matrix
  2. AT=A
  • 위 두 가지 조건을 만족하면 Symmetric Matrix 이다.


  • Symmetric Matrix 의 예시
Symmetric : [10 03],[010 158 087],[abc bde cef]


  • Symmetrix Matrix 아닌 경우
Nonsymmetric : [13 30],[140 614 061],[5432 4321 3210]




Diagonalization - 대각화 복습

  • Symmetric Matrix 의 Diagonalization 을 살펴보기 전에 이전에 배웠던 Diagonalization 을 복습해보자.
  • 만약 A 가 diagonal matrix 와 similar 하면 A 를 Diagonalizable 하다고 한다.
  • 즉, A=PDP1 이면, A 는 Diagonalizable 이다.


Diagonalization Example

A=[621 261 115]
  • 행렬 A 는 Symmetric 행렬이다.
  • 대각화(혹은 Eigendecomposition) 을 하기 위해 특성 방정식(Characteristic Equation) 으로 eigenvalue 와 eigenvector 를 구하자.
문제 풀이
det(AλI)=0
  • 위 식을 이용하여 A 의 eigenvalue 를 찾아보자. Determinant 의 경우 Cofactor 전개를 사용하여 풀어보자.
AλI=[6λ21 26λ1 115λ]
  • 여기서 a31,a32,a33 을 기준으로 determinant 를 풀었다. Cofactor 전개의 부호를 주의하자.. 이거 때문에 계산 실수를 해서 몇번을 다시 풀었다..
det(AλI)=(1)((1)(2)(6λ)(1))(1)((6λ)(1)(1)(2))+(5λ)((6λ)(6λ)(2)(2)) =(λ8)+(λ8)+(5λ)(λ212λ+32)=(2λ16)λ3+17λ292λ+160
  • 최종적으로 다음 식이 나오고 인수분해를 하면
0=λ3+17λ290λ+144=(λ3)(λ6)(λ8)
  • 따라서, eigenvalue 는 다음과 같다 λ=3,6,8


  • AλI=0 삭애 도출한 eigenvalue 값들을 넣어 3개의 eigenvector 를 구해보자.

  • (1) λ=3 인 경우

A3I=[321 231 112]
  • augmented matrix 로 만들고 row reduction 을 해보면
[3210 2310 1120][1010 0110 0000]
  • x3 는 free varialbe 이고 x1=x3 , x2=x3 이므로 다음과 같이 general solution 을 도출 할 수 있다.
x3[1 1 1]


  • (2) λ=6 인 경우
A6I=[021 201 111] [0210 2010 1110][1100 0210 0000]
  • x3 는 free varialbe 이고 x2=1/2x3 , x1=x2=1/2x3 이므로 다음과 같이 general solution 을 도출 할 수 있다. 분수가 있어 2를 scale 해주었다.
x3[1 1 2]


  • (3) λ=8 인 경우
A8I=[221 221 113] [2210 2210 1130][2210 0000 0010]
  • 여기서 x2 는 free variable 이고 x3=0 , x1=x2 이므로 다음과 같이 general solution 을 도출 할 수 있다.
x2[1 1 0]


  • 최종적으로 eigenvector 는 다음과 같다.
v1=[1 1 1],v2=[1 1 2],v3=[1 1 0]
  • 위 3개의 eigenvector 를 서로서로 내적해보면 0이 되므로 orthgonal 하고 linearly independent 하므로 normalize 하여 orthonormal vector 로 표현이 가능하다.
u1=1v1v1=13[1 1 1]=[1/3 1/3 1/3] u2=1v2v1=16[1 1 2]=[1/6 1/6 2/6] u3=1v3v1=12[1 1 0]=[1/2 1/2 0]
  • P 는 eigenvector 로 이루어진 행렬이고, D 는 eigenvalue 의 diagonal 행렬이다.
P=[1/31/61/2 1/31/61/2 1/32/60],D=[300 060 008]
  • 여기서 P 의 column 들이 orthonormal vector 로 이루어져 있기 때문에, PT=P1 라는 성질을 만족한다.
  • 따라서 A 행렬을 대각화하면 A=PDP1=PDPT 로 나타낼 수 있다.

Theorem1.

If A is symmetric, then any two eigenvectors from different eigenspaces are orthogonal.

  • A 행렬이 symmetric 이면 서로 다른 eigenspace 에 있는 두 eigenvector 는 orthogonal 하다.

  • 증명
  • v1,v2 가 서로 다른 eigenvalue λ1,λ2 에 해당하는 eigenvector 일 때 v1v2=0 임을 증명해보자.

  • eigenvector 의 성질 에서 Ax=λx 임을 확인할 수 있다. 여기서 λ 는 스칼라값.
λ1v1v2=(λ1v1)Tv2=(Av1)Tv2
  • A 행렬은 symmetric 이므로 AT=T 이다.
=(v1TAT)v2=vT(Av2) =v1T(λ2v2) =λ2v1Tv2=λ2v1v2
  • 위 내용을 정리하자면
λ1v1v2=λ2v1v2 (λ1λ2)(v1v2)=0
  • 여기서 λ1λ20 혹은 λ1λ2 가 되는데
  • 두 eigenvalue 가 서로 다른 eigenspace 애 존재하기 때문에 서로 다른 값이어야 한다. (multiplicity 가 될 수 없다.)
  • 따라서 eigenvector 의 내적인 v1v2=0 이 될 수밖에 없다.

  • 이러한 symmetric matrix 의 성질 때문에 symmetric matrix 의 diagonalization 을 orthogonally diagonalizable 하다고 한다.



Orthogonally Diagonalizable - 직교 대각화

A matrix A is said to be orthogonally diagonalizable if there an orthogonal matrix P with P1=PT and a diagonal matrix D such that

A=PDPT=PDP1
  • symmetric matrix 가 orthogonally diagonalizable 하다는 것은 매우 중요한 성질이다.
  • symmetric matrix 는 AT=A 를 만족한다. 실제로 만족하는지 증명해보자.
  • 증명
AT=(PDPT)T=PTTDTPT=PDPT=A
  • 따라서 A 는 symmetric 이다.



Theorem2.

An n×n matrix A is orthogonally diagonalizable if and only if A is a symmetric matrix.

  • 행렬 A 에 대해 orthogonally diagonalizable 과 symmetric matrix 는 서로 동치이다.


Example 1

Orthogonally diagonalize the matrix A=[324262423]

  • Characteristic Equation (특성 방정식)으로 eigenvalue 를 구한다.
AλI=[3λ24 26λ2 423λ] det(AλI)=(3λ)((6λ)(3λ)4)(2)((3λ)(2)8)+(4)(4(6λ)(4))=0 λ3+12λ221λ98=(λ7)2(λ+2)=0
  • λ=7 with multiplicity = 2 , λ=2 with multiplicity = 1 가 도출되었다.
  • λ=7 인 경우
A7I=[424 212 424]=0 [4240 2120 4240][2120 0000 0000] x=x2[1/2 1 0]+x3[1 0 1] v1=[1 0 1],v2=[1/2 1 0]


  • λ=2 인 경우
A+2I=[524 282 425]=0 [5240 2820 4250][1410 0210 0000] x=x3[1 1/2 1] v3=[1 1/2 1]


  • 여기서 v1,v2 는 같은 eigenspace 에 있기 때문에 서로 orthogonal 하지 않다. 그리고 eigenspace 의 dimension 은 2 이므로 v1,v2 는 eigenspace 를 span 하는 basis 이므로 linearly independent 하다. 따라서 Gram-Schmidt 과정으로 두 eigenvector 를 orthogonal 하도록 만들어주자.
z1=v1=[1 0 1] z2=v2v2v1v1v1v1=[1/2 1 0]1/25/4[1 0 1]=[1/4 1 1/4]


  • 각각의 eigenvector 들을 normalize 시켜서 orthonormal basis 로 변환해보자.
u1=1z1z1=[1/2 0 1/2] u2=1z2z2=[1/18 4/18 1/18]


2v3=[2 1 2] u3=12v32v3=13[2 1 2]=[2/3 1/3 2/3]


  • orthonormal vector 들로 P 를 만들어준다.
P=[u1u2u3]=[1/21/182/3 04/181/3 1/21/182/3],D=[700 070 002]


  • 다음은 Orthogonally Diagonalizataion 을 단계화 해서 살펴보자.

Steps : Orthogonally Diagonalizataion

  1. Check if AT=A

  2. Calculate eigenspaces for distinct eigenvalues

  3. Find orthogonal basis for each eigenspace by the Gram-Schmidt process

  4. Obtain orthonormal basis by normalization

  5. Construct P and D

  • AT=A 인 symmetric matrix 인지 확인하고
  • characteristic equation 을 사용하여 eigenvalue 들을 구한 뒤 AλI=0 을 통해 각 eigenspace 에 해당하는 eigenvector 들을 구하고
  • Gram-Schmidt process 를 통해 각 eigenspace 내부 벡터들 간의 orthogonal basis 를 구하고
  • orthogonal basis 들을 orthonormal basis 로 normalize 한 뒤
  • PD 행렬을 구성하면 된다.



Spectral Theorem - 스펙트럼 정리

Theorem3. The Spectral Theorem for Symmetric Matrices

An n×n symmetric matrix A has the following properties:

a.  A has n real eigenvalues, counting multiplicities.
b.  The dimension of the eigenspace for each eigenvalue λ equals the multiplicity of λ as a root of the characterisitic equation.
c.  The eigenspaces are mutually orthogonal, in the sense that eigenvectors corresponding to different eigenvalues are orthogonal.
d.  A is orthogonally diagonalizable.

  • 행렬 A 의 eigenvalue set 을 Aspectrum 이라고 부른다. 그리고 A 가 symmetric matrix 일 때, 다음 성질을 따른다.

  • a. An 개의 eigenvalue 를 갖고 있으면 multiplicity 를 계산한다.
  • b. 각 eigenvalue 에 해당하는 eigenspace 의 dimension 은 eigenvalue 의 multiplicity 와 동일하다.
  • c. eigenspace 는 서로 orthogonal 하다. 서로 다른 eigenvalue 에 해당하는 eigenvector 역시 orthogonal 하다.
  • d. A 는 orthogonally diagonalizable 하다.



Example True or False

  1. An n×n matrix that is orthogonally diagonalizable must be symmetric.
    정답 : true
    풀이 : symmetric matrix 와 orthogonally diagonalizable 은 서로 동치관계 이기 때문에 참이다.

  2. If AT=A and if vectors u and v satisfy Au=3u and Av=4v , then uv=0 .
    정답 : true
    풀이 : AT=A 는 행렬 A 가 symmetric 하다는 뜻이고 symmetric matrix 는 orthogonally diagonalizable 하다라는 뜻이고 u and v 두 벡터는 A 의 eigenvector 를 의미하므로 두 eigenvector 는 orthogonal 하기 때문에 참이다.

  3. An n×n symmetric matrix has n distinct real eigenvalues.
    정답 : false
    풀이 : symmetric matrix 의 eigenvalue 가 꼭 distinct 일 필요는 없다. eigenvalue 가 같으면 multiplicity 로 계산할 수 있고 동일한 eigenspace 에 linearly independent 한 eigenvector 로 존재하게 된다. 이를 orthogonally diagonalizable 하려면 Gram-Schmidt process 를 사용하여 직교하게 만들 수 있기 때문이다. 따라서 거짓

  4. Every symmetric matrix is orthogonally diagonalizable.
    정답 : true
    풀이 : 1번과 비슷한 내용, 동치 관계에 있기 때문에 참이다.

  5. If B=PDPT , where PT=P1 and D is diagonal matrix, then B is a symmetric matrix.
    정답 : true
    풀이 : PT=P1 라는 말은 symmetric matrix의 orthogonally diagonalizable 의 성질이므로 B=PDPT=PDP1 이므로 B 는 symmetric matrix 이다.

  6. An orthogonal matrix is orthogonally diagonalizable.
    정답 : false
    풀이 : orthogonal matrix가 symmetric 한 경우는 있겠지만, 모든 orthogonal matrix 가 symmetric 하지 않다.

  7. The dimension of an eigenspace of a symmetric matrix equals the multiplicity of the corresponding eigenvalue.
    정답 : true
    풀이 : 동일한 eigenvalue 는 multiplicity 로 계산하고 이는 symmetric matrix 의 eigenspace 의 dimesnion 을 결정하므로 참이다.



Spectral Decomposition - 스펙트럼 분해

  • Spectral Decomposition 은 행렬 Aeigenvalue(spectrum) 으로 표현되는 조각들로 분해 하는 것이다.

  • 행렬 A 가 orthogonally diagonalizable 하다고 가정하고 다음과 같이 표현할 수 있다.

A=PDPT=[u1un][λ10  0λn][u1T  unT]
  • 여기서 D 는 diagonal matrix 이므로 PD 를 계산해보면 다음과 같다.
=[λ1u1λnun][u1T  unT]
  • 위 수식을 matrix multiplication 의 scalar (λ) 성질에 의해 다음과 같이 표현할 수 있다.
A=λ1u1u1T+λ2u2u2T++λnununT
  • 위와 같이 표현한 것을 $A 의 spectral decomposition 이라고 부른다.ㄴ
  • 여기서 mathbfu1u1T 는 행렬임을 주의하자. 그렇다면 각 요소 mathbfukukT 는 rank 가 1인 n×n 행렬이다.
  • 여기서 rank = 1 은 column space 의 dimension 이 1임을 의미한다.

  • ukT 를 스칼라 곱을 해주면 다음과 같이 표현된다.
uk[u1kunk]=[u1kukunkuk]
  • 전부 linearly dependent 하고 모든 column 들이 uk 에 의해서 표현이 된다. 따라서 column space 의 dimension 이 1이된다.

  • 그리고 ukukTx 는 projection matrix 이다. orhtogonal projection x 를 Span{uk} subspace 에 projection 한 것이다.



Example 1

Construct a spectral decomposition of the matrix A that has the orthogonal diagonalization

A=[5/21/2 1/25/2]
  • 행렬 A 를 orthogonally diagonalization 하고 PDPT 으로 spectral decomposition 한다.
A=[1/21/2 1/21/2][30 02][1/21/2 1/21/2]
  • P 행렬을 u1,u2 으로 표기하면
u1=[1/2 1/2]u2=[1/2 1/2] A=3u1u1T+2u2u2T
  • 이렇게 스펙트럼 분해를 할 수 있다.

  • 위 식이 진짜 만족하는지 확인해보면

A=3[1/2 1/2][1/21/2]+2[1/2 1/2][1/21/2]


Example 2

Show that if A is a symmetric matrix, then A2 is symmetric.

  • A 가 symmetric 하면 A2 도 symmetric 한지 확인해보자. symmetric matrix 의 성질인 A=AT 이므로
(A2)T=(AA)T=ATAT=AA=A2


Example 3

Show that if A is orthogonally diagonalizable , then so is A2 .

  • A 가 orthogonally diagonalizable 하다면 symmetric matrix 임과 동치이다.
  • 위의 예제에서 살펴봤듯이 A 가 symmetric 이면 A2 역시 symmetric 이므로
  • A 가 orhtogonally diagonalizable 이면 A2 도 orthogonally diagonalizable 이다.