Tema 9 PCA

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 13

Análisis de componentes principales

Juan José Choquehuanca Zevallos

UCSP

July 7, 2020

Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 1/9
1 Deniciones

2 Representación vectorial de señales

3 Vectores de mínima y máxima varianza

4 Formulación de máxima varianza

5 Función de coste
Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 2/9
Preliminares
1 Representación vetorial de los datos:
(n)
1 Fig. 1a: x ∈ R1×1 , Fig. 1b: x(n) ∈ R2×1 , Fig. 1c: x(n) ∈ R3×1

Figure: Representación vectorial de los datos en un espacio de alta

dimensionalidad.

Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 2/9
Preliminares

En general: x(n) ∈ RD×1 . Por ejemplo:


Imágenes de 100 × 100 píxeles x(n) ∈ R10 ×1 .
4
1

2 Espectrograma utilizando 1024 valores en frecuencia: x(n) ∈ R1024×1 ,


etc.

Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 3/9
Ejemplo de distrución de puntos

Figure: Representación vectorial de los datos bidimensionales.

Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 4/9
.

Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 5/9
Ejemplo de distrución de puntos

Figure: Representación vectorial de los datos bidimensionales.

Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 5/9
.

Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 6/9
Ejemplo de distribución de puntos

Juan José Choquehuanca


Figure:Zevallos (UCSP) Análisisvectorial
Representación de componentes principales
de los July 7, 2020
datos bidimensionales. 6/9
.

Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 7/9
Formulación de máxima varianza
Denición de media:
n o
µx = E x(n) ∈ RD×1 (1)

N
1 X (n)
µx = x (2)
N
n=1

Denición de covarianza:
N
1 X  T (n) 2
σa21 = a1 x − aT1 µ(n)
x ∈ R1×1 (3)
N
n=1
N
1 X  T (n)  2
σa21 = a1 x − aT1 µ(n)
x a T (n)
1 x − aT (n)
µ
1 x ∈ R1×1 (4)
N
n=1

Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 7/9
Formulación de máxima varianza

Considerando bT a = aT b

N  h iT 
1 X  T (n) iT h
σa21 = T (n)
a 1 x − a 1 µx x (n) (n)
a1 − µx a1 ∈ R1×1
N
n=1
(5)
N 
" #
1  T
(6)
X
σa21 = aT1 (n) (n)
x − µx (n) (n)
x − µx a1 ∈ R1×1
N
n=1
N
1 X  (n)  T
S= x − µ(n)
x x(n) − µ(n)
x ∈ RD×D (7)
N
n=1

σa21 = aT1 Sa1 ∈ R1×1 (8)

Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 8/9
Formulación de máxima varianza
Formulación del problema:
(
min aT1 Sa1
(9)
s.t. ka1 k = 1

Empleando operadores de Lagrange

min aT1 Sa1 + λ1 (1 − ka1 k) (10)


∂  T
(11)

a1 Sa1 + λ1 (1 − ka1 k) = 0
∂a1
∂  T
a1 Sa1 + λ1 1 − aT1 a1 = 0 (12)

∂a1
[Sa1 − λ1 a1 ] = 0 (13)
Sa1 = λ1 a1 (14)
Entonces, a1 y λ1 resentan un autovector y autovalor de S .
Juan José Choquehuanca Zevallos (UCSP) Análisis de componentes principales July 7, 2020 9/9

También podría gustarte