2015 Tesis Lilia Karen Rivera
2015 Tesis Lilia Karen Rivera
2015 Tesis Lilia Karen Rivera
T E S I S
QUE PARA OBTENER EL GRADO DE:
MAESTRO EN CIENCIAS CON ESPECIALIDAD EN PROBABILIDAD Y
ESTADÍSTICA
PRESENTA:
LILIA KAREN RIVERA ESCOVAR
DIRECTOR DE TESIS:
DR. MIGUEL NAKAMURA SAVOY
2016
i
A mis padres y hermano, los cuales siempre me recibieron con los brazos abiertos y
me ayudaron a leventarme en los momentos más difı́ciles de mi vida. Siempre han
sido y serán mi fuente de inspiración. Los amo con toda el alma.
Al Dr. Miguel Nakamura, por haber asesorado la presente tesis y trabajar conmigo
el desarrollo y entendimiento de una parte de la teorı́a estadı́stica sobre variedades,
particularmente la que referió al análisis estadı́stico de trayectorias. De esa misma
forma le agredezco sus invaluables consejos académicos y personales, porque siempre
fue más allá de su labor como académico y docente.
A los sinodales Rolando Biscay y Luis Hernández, por sus observaciones y comen-
tarios que enriquecieron y refinaron la teorı́a desarrollada en el presente trabajo.
Principalmente le agradezco a Luis Hernández su tiempo, paciencia y conocimien-
tos, pues desde un principio me ayudó a asentar y delimitar la teorı́a concerniente
a geometrı́a diferencial.
A los Doctores Rogelio Ramos, Victor Rivero, Juan Carlos Pardo, Enrique Villa,
Johan Van Horebeek y Daniel Hernández ya que cada uno de ellos de distinta ma-
nera me escuchó, apoyó, animó y brindó su ayuda académica siempre que lo requerı́.
De manera especial agradezco al Dr. Rogelio Ramos quien fuese mi tutor durante la
maestrı́a, ası́ como al Dr. Victor Rivero el cual fungió como mi asesor de tesis en la
licenciatura y mi tutor en la especialidad.
A todos los profesores del CIMAT que me impartieron clases, gracias por formarme
como persona, estudiante y profesionista, por dejar un pedazo de su sabidurı́a y co-
nocimiento en mı́. Al CIMAT, el cual me dio la oportunidad de hacer una maestrı́a y
me ofreció un pedazo de primer mundo, por permiterme conocer a investigadores de
talla internacional, los cuales siempre me mostraron la belleza de las matemáticas
puras y aplicadas.
Al Consejo Nacional de Ciencia y Tecnologı́a, CONACYT, por darme todas las fa-
cilidades económicas para poder realizar mis estudios de posgrado.
A Dolores Aguilera, Claudia Vega, Eduardo Aguirre y Jannet Vega, los cuales re-
presentan al departamento de servicios escolares del CIMAT, gracias por tenerme
toda la paciencia del mundo para aclarame dudas administrativas y apoyarme con
el proceso de titulación.
v
vi
A Jessica Pérez y Delia Avellaneda por ser mis amigas y estar conmigo a lo largo de
diez años; son las mejores amigas que cualquiera pudiera desear, las adoro.
A todas las personas que están y estuvieron en mi vida, gracias por todas las expe-
riencias vividas.
2-dic-2015.
Índice general
Lista de Figuras IX
Resumen XIII
4. Aportaciones y conclusiones 89
vii
viii Índice general
Apéndice A 95
Bibliografı́a 100
Índice de figuras
ix
x Índice general
xiii
xiv
Capı́tulo 1
Un juego de datos puede ser complejo por la dimensión que posee o por el espacio
donde yacen sus elementos. El primer caso se puede ejemplificar cuando el número
de variables es mayor que el número de datos; es decir n << p, donde n representa
el número de datos y p el número de variables. Este caso también es conocido como
un problema de altas dimensiones y puede ser consultado a fondo en Hastie et al.
[2009], que es considerado uno de los pioneros en esta temática. El segundo caso se
puede ejemplificar con datos que son funciones y por tanto yacen en el espacio de
funciones, los cuales también son conocidos como datos funcionales y las técnicas
para su análisis se abrevian como FDA, por sus siglas en inglés. Estos datos pue-
den ser abordados en una primera instancia en Ramsay [2006], que es considerado
el libro base para su tratamiento. Otro ejemplo de datos que son complejos por la
estructura del espacio en el que yacen son los datos topológicos, los cuales se en-
cuentran ligados con una nueva rama de la estadı́stica conocida como TDA, por sus
siglas en inglés. El análisis topológico de datos trata principalmente de describir el
espacio en el que se encuentran los datos; por ejemplo, describir si el espacio en
el que se está trabajando tiene hoyos y de ser ası́ cuántos tiene. Un artı́culo con-
siderado seminal, el cual introdujo y motivó esta temática fue Carlsson [2009]. La
complejidad que introducen los datos expuestos anteriomente, radica en el hecho de
que las técnicas usuales de estadı́stca, como por ejemplo PCA, no funcionan o bien
no son pertinentes. Por lo tanto imponen el reto de desarrollar, analizar y extender
nueva teorı́a con la cual puedan ser estudiados.
1
2 1. Introducción al análisis estadı́stico sobre variedades
Esta tesis versará principalmente sobre el análisis estadı́stico de datos que se carac-
terizan por ubicarse en espacios no lineales. De esta forma, el objetivo del presente
capı́tulo es introducir, motivar y exhibir la importancia de estudiar este tipo de da-
tos desde un enfoque estadı́stico y probabilı́stico, ası́ como dar un breve esbozo de
lo que tratarán los capı́tulos subsecuentes de la tesis.
Analizar las direcciones de las tortugas es de interés para los biólogos, ya que en
general el estudio de patrones de conducta conduce a un mejor entendimiento
de especies y la relación con su entorno. Los datos comentados en este ejemplo
se conocen como datos circulares o datos direccionales y se puede conocer más
de ellos en Fisher [1995] y Mardia and Jupp [1999].
Análisis de imágenes.
En este tipo de datos el objeto de estudio se centrará en la forma que puede
proporcionar una imagen y de la cual se desea obtener información. Una for-
ma, en general, se define como la geometrı́a de un objeto módulo su posición,
tamaño y orientación. Como ejemplo se tiene la Figura 1.6, donde los peces
tienen la misma forma independientemente de su escala, rotación y posiciona-
miento.
Por ser una forma el objeto de estudio, es necesario “estandarizarla”; esto sig-
nifica suprimir su escalamiento, rotación y posicionamiento. Al eliminar los
elementos anteriores se obtiene que el espacio resultante, donde se encuentra
la forma, no es el espacio n-dimensional. Por ende, el dato registrado no es li-
neal. Para revisar más detalles acerca del análisis de formas se puede consultar
Dryden and Mardia [1998]. Éste es un libro introductorio en lo que respecta
a la teorı́a de formas, el cual también motiva e introduce de manera didáctica
1.1. Motivación al análisis estadı́stico sobre variedades 5
Los ejemplos anteriores se caracterizan por involucrar datos que por su naturaleza
radican en espacios no euclidianos, a los cuales se les conoce como variedades no
lineales. Entonces el siguiente paso es definir, de manera general, el concepto de
variedad. Esta noción requerirá de ciertas bases en materia de topologı́a, las cuales
serán enunciadas brevemente. Es relevante aclarar que dichos conceptos ayudarán a
definir correctamente los espacios en los que se trabajará, de forma que estos tengan
propiedades que permitan extender la teorı́a estadı́stica y probabilı́stica que se co-
noce para Rn . Sin embargo, para aquellos lectores que lo deseen, estas definiciones
pueden ser omitidas en una primera lectura, pues en principio el objetivo es que se
recoja la intuición de lo que es una variedad. Finalmente los lectores que deseen pro-
fundizar en las definiciones subsecuentes, pueden consultar Loring [2008] y Willard
[1970].
Definición 1.1.1 Espacio topológico.
Es un pareja (X, τ ), donde X es un conjunto cualquiera y τ es una familia de
subconjuntos de X que satisface las siguientes propiedades:
1. X ∈ τ y ∅ ∈ τ .
2. Dada una familia {Ui ∈ τ ; i ∈ I} de elementos de τ , tal que I es un conjunto
cualquiera, entonces ∪i∈I Ui ∈ τ .
1
Las Figuras 1.1–1.8 se obtuvieron, respectivamente, de los siguientes sitios de internet:
http://tortugas.anipedia.net.
http://www.windows2universe.
http://hotspotbirding.com.
http://www.birdscalgary.com.
http://www.sci.utah.edu/ fletcher/CS7960.
http://yogafacile.it.
https://nac.spl.harvard.edu.
6 1. Introducción al análisis estadı́stico sobre variedades
3. Si U1 , . . . , Un ∈ τ entonces ∩ni=1 Ui ∈ τ .
En tal caso se dirá que τ es una topologı́a sobre X y a sus elementos se les lla-
mará conjuntos abiertos de (X, τ ).
τ = {∪B∈C B | C ⊂ B} .
Las siguientes dos definiciones serán vitales, pues aclararán las bondades—y también
dificultades—de trabajar en estos espacios a los cuales, como ya fue mencionado
anteriormente, se les denominará como variedades.
La Definición 1.1.6 establece que una variedad es un espacio que localmente se parece
a Rn , por lo cual hereda—de manera local—sus propiedades. Por tanto, intuitiva-
mente, una variedad podrı́a entenderse como un espacio conformado exclusivamente
por “parches” de Rn . Tómese como ejemplo el toro, Figura 1.10, el cual se encuen-
tra representado por pequeños “parches”. El argumento anterior implica que una
variedad, en general, no cuenta con espacio externo e interno. Esto quiere decir que
una variedad, en principio, no posee espacio ambiente. Por ejemplo si se colocara
un grupo de hormigas sobre un toro, Figura 1.11, éstas podrı́an moverse solamen-
te por los parches que conforman a dicho espacio. El hecho de que una variedad
no cuente con espacio ambiente, es uno de los factores que agregan complejidad al
análisis estadı́stico, puesto que para medir distancias entre observaciones que estén
sobre una variedad, habrá que considerar una métrica distinta a la euclidiana, la
cual contemple la curvatura del espacio.
Ejemplos:
Espacio n-dimensional.
También conocido como Rn , se caracteriza por ser un espacio lineal y por ende
8 1. Introducción al análisis estadı́stico sobre variedades
Cı́rculo unitario.
Es un espacio que de manera local se parece a R. Esto se debe a que si se
toma un punto p ∈ S—siendo S el cı́rculo unitario—y en torno a dicho punto
se traza una vecindad de radio , se podrá observar que dicha vecindad es
homeomorfa a una linea recta, como se exhibe en la Figura 1.12. Del hecho
anterior se sigue que el cı́rculo unitario es una variedad de dimensión uno.
Esfera unitaria.
Es un espacio que de manera local se parece a R2 , ya que si se toma una bola
abierta en torno a un punto q que pertenezca a este espacio, se aprecia que esta
vecindad es homeomorfa a un pequeño plano que se puede interpretar como un
pequeño R2 . El hecho anterior queda ejemplificado mediante la Figura 1.13.
Por ende, la esfera es una variedad de dimensión dos.
Es importante destacar que no todas las variedades poseen una representación gráfi-
ca; un ejemplo de ello son SE(2) y el espacio de formas. SE(2) es el grupo de transfor-
maciones rı́gidas en R2 , tal que dichas transformaciones corresponden a traslaciones
y rotaciones en el plano. Por otro lado, el espacio de formas es el que se encuentra
definido por todas las rotaciones, traslaciones y escalamientos que puede tener una
1.2. Relevancia y complejidad del análisis estadı́stico sobre variedades 9
Para evidenciar la complejidad que puede existir al hacerse estadı́stica sobre espacios
no lineales, se mostrará en primer lugar la ineficacia de las herramientas estadı́sticas
que se suelen utilizar para Rn . Posteriormente y como segundo punto, se comen-
tarán algunas nociones de estadı́stica sobre variedades, con la finalidad de esbozar
y ejemplificar el alcance de esta teorı́a.
Para exhibir el primer punto, se tomará como ejemplo la media muestral, que es
uno de los conceptos base de estadı́stica. Se define como X̄ = ni=1 xi /n, donde
P
{xi }ni=1 representa un conjunto de observaciones. Supóngase que se cuenta con dos
direcciones, 359◦ y 1◦ , las cuales están representadas en la Figura 1.14. Al tomar la
media de estos dos datos se esperarı́a que diera una dirección representativa, como
la de la Figura 1.15. Sin embargo, lo que se obtiene es una dirección como la que se
muestra en la Figura 1.16, ya que (359 + 1)/2 = 180. Como segundo ejemplo tómese
los puntos (0◦ , 90◦ ) y (0◦ , −90◦ ), los cuales representan el polo norte y polo sur en la
esfera unitaria, respectivamente. Al promediar dichos puntos, entrada por entrada,
se tiene que el punto resultante cae fuera de la esfera, como muestra la Figura 1.17,
en la cual los puntos rojos representan los polos y el punto negro la suma de éstos.
Figura 1.17: Suma de los puntos que están en los polos de la esfera.
Para reforzar la idea expuesta en el párrafo anterior ası́ como para exhibir el se-
gundo punto—que es mostrar la dificultad de hacer estadı́stica sobre variedades—se
muestran a continuación algunos ejemplos de conceptos estadı́sticos en Rn que se
han logrado extender a espacios no lineales.
1. Media.
Conocida como media de Fréchet o Karcher. Tiene la siguiente definición.
Definición 1.2.1 Sea M una variedad y sea {xi }ni=1 una colección de puntos
tales que xi ∈ M para i = 1, . . . , n. La media de Fréchet se define como
n
d(p, xi )2 ,
X
µ = argmı́n (1.1)
p∈M i=1
serı́a única, ya que los puntos que están en los polos son los que cumplen la
Definición 1.2.1. Otro ejemplo sobre la esfera, en el cual la media sı́ es única,
se encuentra representado mediante la Figura 1.19. En este caso se obtuvo la
media de un conjunto de 14 puntos, tal que la media es el punto negro que se
encuentra sobre la esfera.
Con los dos ejemplos exhibidos se muestra que una noción tan básica, como es
la media, puede complicarse en espacios más abstractos. Por consiguiente, que-
da comprobado que hacer un análisis estadı́stico sobre variedades representa
un reto. Algunos artı́culos en los cuales se pueden revisar diferentes aplicacio-
nes de la media sobre variedades son: Kaziska and Srivastava [2008], Kume
and Le [2003] y Rentmeesters and Absil [2011].
2. Clustering.
También conocido como manifold clustering, consiste en crear grupos de datos,
tales que pueden provenir de una o más variedades. Un artı́culo considerado
1.2. Relevancia y complejidad del análisis estadı́stico sobre variedades 13
seminal en esta temática fue Souvenir and Pless [2005], ya que logró introducir
teorı́a para clasificar datos que radican en múltiples variedades y a su vez
logró hacer contribuciones a la teorı́a clásica de clustering. Una referencia que
muestra la utilidad de hacer clustering en variedades mediante ejemplos reales
y sintéticos es Tu et al. [2014].
3. PCA.
Conocido como PGA por sus siglas en inglés (Principal Geodesic Analysis),
consiste en reducir la dimensionalidad de los datos que están en una variedad
M . Esta teorı́a puede ser revisada en el artı́culo de Fletcher et al. [2004] que
es considerado el pionero en hacer PCA sobre variedades, ya que en éste logra
describir la variabilidad de datos sobre variedades.
Algunos artı́culos que refinaron la teorı́a propuesta por Fletcher son Jung
et al. [2011], Jung et al. [2012] y de manera más reciente Pennec [2015]. Cabe
mencionar que este último artı́culo, viene a resumir las metodologı́as que se
han propuesto para PCA sobre variedades. Además, ofrece una nueva teorı́a,
que abarca cualquier espacio no lineal. Esto implica un gran avance, pues las
herramientas que se habı́an desarrollado de manera previa sólo contemplaban
variedades riemannianas.
4. Estadı́stica no paramétrica.
Como su nombre lo indica, consiste en implementar estadı́stica no paramétrica
sobre variedades. Surge con el trabajo de Hendriks and Landsman [1996] titu-
lado Asymptotic tests for mean location on manifolds, el cual serı́a seguido por
Patrangenaru [1998] con su tesis doctoral Asymptotic Statistics on Manifolds.
Con los ejemplos anteriores se muestra que la tarea de inferencia estadı́stica sobre
variedades es un tema de actualidad. Sin embargo, esto conlleva un reto teórico y
computacional para extender las nociones probabilı́sticas y estadı́sticas que se cono-
cen de Rn a variedades. Lo anterior se traduce en uno de los principales objetivos
de la presente tesis, ası́ como en una parte fundamental de ella.
14 1. Introducción al análisis estadı́stico sobre variedades
A pesar de que inicia con las nociones básicas de geometrı́a diferencial, desde
una perspectiva intuitiva, es necesario contar con cierta intuición geométrica
y topológica para alcanzar a entender los conceptos que aborda. En lo que
respecta a la parte de teorı́a de probabilidad y estadı́stica, se requieren los co-
nocimientos básicos de inferencia estadı́stica. Este texto es ideal para alumnos
de licenciatura quienes ya poseen cierto bagaje en las temáticas de geometrı́a
diferencial e inferencia estadı́stica.
2. Fisher et al. [1987]. Statistical analysis spherical data.
Es uno de las primeros libros en abordar el tema de análisis estadı́stico sobre
variedades. Se caracteriza por ofrecer un resumen de los métodos estadı́sticos y
probabilı́sticos que existen para trabajar y simular datos puntuales que yacen
en la esfera, para luego abordar teorı́a moderna con la que pueden ser trata-
dos. Ası́ mismo, trata algunas técnicas matemáticas para trabajar vectores y
matrices con coordenadas polares y estándar .
1.3. Importancia del análisis estadı́stico sobre variedades 15
Curiosamente este libro nunca hace alusión a la esfera, vista como una varie-
dad. Por lo tanto, la teorı́a desarrollada es exclusivamente de ı́ndole estadı́stico.
Por consiguiente, este ejemplar puede ser leı́do por cualquier persona que ten-
ga conocimientos básicos en álgebra matricial y bases sólidas en inferencia
estadı́stica.
https://www.crcpress.com/ Nonparametric-Statistics-on-Manifolds-and-
Their-Applications-to-Object/Patrangenaru-Ellingson/9781439820506.
Esta aplicación representa un reto estadı́stico, pues para lograr los objetivos
mencionados es necesario establecer una métrica útil, en el sentido de que
incorpore la estructura subyacente del espacio en el que se encuentran los da-
tos. Con dicha métrica se habilita un análisis de reconocimiento de patrones,
ası́ como una extensión del análisis de regresión o de interpolación para varie-
dades. Posteriormente, se procede a ajustar un modelo de probabilidad y con
la ayuda de técnicas Monte Carlo, calcular la probabilidad de ocurrencia de
una trayectoria. Las Figuras 1.20, 1.21 y 1.22 muestran un ejemplo de inter-
polación para el movimiento de brazo de un golfista. La Figura 1.20 deja un
espacio entre imágenes de las cuales se desea obtener la interpolación, mientras
que las Figuras 1.21 y 1.22 muestran los resultados que se obtuvieron con los
procedimientos ya mencionados en este párrafo.
Figura 1.23: Mapa de la República Mexicana con mayor incidencia del dengue.
Hasta este punto se ha esbozado la estadı́stica que puede hacerse para un conjunto
de trayectorias que yacen en una variedad M . Sigue comentar, a grandes rasgos,
el tipo de análisis estadı́stico que será estudiado en el presente trabajo. Dado un
conjunto de trayectorias, se plantea encontrar una trayectoria media que sea re-
presentativa de dicho conjunto, en el sentido de que logre capturar una forma que
sea representativa e interpretable. Posteriormente se propone encontrar la varianza
asociada a la muestra de trayectorias. De esta manera, con estos parámetros y un
modelo de probabilidad—a decir una distribución normal—se obtiene une represen-
tación matemática para describir y simular trayectorias.
ello es que los resultados del proceso estadı́stico se pueden visualizar, por lo cual
son más sencillos de interpretar y entender. Por otra parte, con dicha restricción
se facilitará el cómputo, pues al ser la esfera una de las variedades más estudiadas,
se cuenta con expresiones analı́ticas cerradas para algunas nociones geométricas de
interés. De manera que estas expresiones serán de utilidad al momento de realizar
ciertas implementaciones.
1.5.1. Objetivos
Los objetivos de la tesis son identificar y recomendar literatura base, ası́ como incur-
sionar en la metodologı́a para estudiar trayectorias sobre variedades, particularmente
en la esfera. Por lo tanto, la tesis plantea las siguientes metas y aportaciones:
1.5.2. Capı́tulo 2
Trata los elementos técnicos de geometrı́a diferencial que son necesarios para en-
tender el resumen del artı́culo base—el cual será abordado en el Capı́tulo 3— de
manera que dichas nociones de geometrı́a diferencial serán especializadas a la esfera.
El capı́tulo contendrá las siguientes secciones:
2. Curvas geodésicas.
3. Mapeo exponencial.
4. Mapeo logarı́tmico
5. Transporte paralelo.
1.5.3. Capı́tulo 3
Es un resumen estructurado del artı́culo Statistical analysis of trajectories on Rie-
mannian manifolds: Bird migration, hurricane tracking and video surveillance, el
cual estará dividido en tres grandes secciones. El propósito de dicha estructuración
es procurar que sea entendible el procedimiento estadı́stico que hay de por medio,
para el manejo de trayectorias sobre variedades. Las secciones contempladas son:
http : //weather.unisys.com/hurricane/atlantic/.
El objetivo de este capı́tulo es ofrecer un resumen asequible del artı́culo base, ası́ co-
mo rellenar detalles técnicos que se dan como presupuestos. Además, identificará el
rol que juegan las nociones de geometrı́a diferencial en el desarrollo estadı́stico, y
finalmente hará alcanzable la teorı́a descrita con la implementación de los algoritmos
desarrollados a los datos de huracanes mencionados anteriormente.
22 1. Introducción al análisis estadı́stico sobre variedades
Capı́tulo 2
2.1. Introducción
Para poder hacer y entender la teorı́a estadı́stica sobre variedades es necesario tener
herramientas técnicas adecuadas, en este caso geometrı́a diferencial, que se especia-
lizará en la esfera. La esfera es el conjunto de vectores en R3 cuya norma satisface
ser igual a uno y se denota como S 2 , de forma que
S 2 = {x ∈ R3 : kxk = 1}.
Además, cabe decir que la esfera es una variedad riemanniana, como fue visto en el
Capı́tulo 1. Un atributo que destaca en estas variedades es tener un producto interno
definido, y por ende una distancia. En el caso de la esfera, la distancia es una medida
que se toma a lo largo de la superficie y es la más corta para cualesquiera dos puntos
p, q ∈ S 2 . La distancia en la esfera se define como
tal que h·, ·i denota el producto interno del espacio euclidiano. A la ecuación (2.1) se
le considerará como la distancia intrı́nseca de la esfera, la cual cobrará importancia
en definiciones que serán tratadas más adelante.
Los objetivos de este capı́tulo son tres: familiarizar al lector con algunos conceptos
de geometrı́a diferencial, estudiar teorı́a preliminar supuesta en el artı́culo base y
especializar los conceptos de geometrı́a diferencial en la esfera. Todo esto tiene la
finalidad de hacer accesible el resumen del artı́culo base que será abordado en el
Capı́tulo 3.
Las aportaciones del capı́tulo son dar un orden lógico a la intuición geométrica y
ofrecer cierta heurı́stica de los conceptos geométricos que serán tratados en sec-
ciones posteriores. Lo anterior se logrará mediante la definición y ordenamiento
de conceptos—cuya dificultad vaya en orden creciente—, ası́ como la explicación
e interpretación de los mismos. Además, se mostrarán representaciones gráficas y
23
24 2. Elementos técnicos para estadı́stica sobre variedades
demostraciones didácticas.
Por otro lado, el que el espacio tangente a un punto de la variedad sea un espacio
vectorial tiene cierta importancia, y es que se puede entender como una “linea-
liazación” de la variedad. La utilidad de este hecho es que se prodrán aprovechar
conocimientos de Rn ; por ejemplo, la noción de media muestral.
Una condición suficiente para que el espacio tangente a un punto exista es que la
variedad sea diferenciable. En la Figura 2.2 se muestran dos variedades donde el
espacio tangente no existe; esto se debe a que en ambos casos, el cono y el triángulo
tienen un pico, punto en el cual no es posible definir el espacio tangente. Es por ello
26 2. Elementos técnicos para estadı́stica sobre variedades
Algunos comentarios importantes que surgen a partir de (2.2) son los siguientes:
D ∂γ
Es importante aclarar que en el contexto del presente trabajo, el operador ∂t ∂t
,
se entenderá como una “segunda derivada”. Para tener la formalidad y percibir la
intuición de este operador, ası́ como la analogı́a que posee con la segunda derivada
usual, se recomienda consultar Do Carmo Valero [1992] y Sánchez Morgado and
Palmas Velasco [2007].
Por lo tanto queda comprobado que γp,v (t), bajo las parametrizaciones dadas, está so-
bre la esfera unitaria.
Para finalizar esta sección es importante comentar que existe una relación entre el
plano tangente y las curvas geodésicas. Dicha relación es que las funciones diferen-
ciables γ(t) que ayudan a definir el plano tangente, son curvas geodésicas.
de forma que dicha expresión cumple con la Definición (2.5). Lo anterior se debe
a que expp (v) = cos(kvk)p + sin(kvk) (v/kvk) = γp,v (1), donde γp,v (1) corresponde
a la parametrización (2.4) de las curvas geodésicas en la esfera. A continuación se
probará que la parametrización del mapeo exponecial en la esfera produce puntos
en la esfera unitaria. La prueba consiste básicamente en verificar que la norma al
cuadrado del mapeo exponencial es uno, ya que la norma de cualquier punto p ∈ S 2
es uno. Para ésta se utilizarán las siguientes afirmaciones:
Resulta oportuno comentar que en el caso de la esfera, el mapeo exponencial está de-
finido para todo punto p. La utilidad de hecho anterior se verá en Capı́tulo 3. Para
concluir esta sección, la Figura 2.7 muestra geométricamente el mapeo exponencial
en la esfera.
32 2. Elementos técnicos para estadı́stica sobre variedades
La prueba consiste en verificar que logp (q) · p = 0. Utilizando propiedades del pro-
ducto punto y los resultados preliminares, se tienen las siguientes igualdades:
arc cos(p0 q)
logp (q) = q [q − (p0 q)p]
1 − (p0 q)2
arc cos(p0 q)
logp (q) · p = q [q − (p0 q)p] · p
1− (p0 q)2
arc cos(p0 q)
= q [q · p − (p0 q)(p · p)]
1 − (p0 q)2
arc cos(p0 q)
=q [q · p − (p · q)(p · p)]
1 − (p0 q)2
arc cos(p0 q)
=q [q · p − (p · q)]
1 − (p0 q)2
= 0.
Por lo tanto, logp (q) da origen a vectores en Tp S 2 .
Por otro lado, la herramienta teórica es más complicada, comparada con lo que se ha
desarrollado hasta este momento. Por tal motivo, sólo se dará la intuición geométri-
ca de qué es lo que permite hacer el transporte paralelo. Para dar la teorı́a a nivel
intuitivo se introducirán las siguientes definiciones.
Figura 2.10: Campo vectorial definido por los vectores tangentes de la curva α(t).
1. Campo velocidad.
Es un campo vectorial, el cual es el conjunto de vectores que será transportado.
Este campo vectorial se obtendrá mediante la derivada con respecto a t de la
trayectoria α(t).
2. Curvas geodésicas.
Son las curvas parametrizadas sobre las que se realizará el transporte paralelo
del campo velocidad.
3. Punto de referencia.
Es un punto c ∈ M . Se caracteriza por ser el lugar donde se definirá el espacio
tangente Tc M .
Esbozo
Primero se hará la representación del transporte paralelo. En la Figura 2.11 se mues-
tra una curva “parametrizada” α(t) ∈ S 2 cuyos extremos son los puntos p, q ∈ S 2 ;
también se muestra el vector v ∈ Tp S 2 , cuyo origen es el punto p. El vector v es el
que se desea transportar de manera paralela, al plano tangente que se definirá en el
punto q.
36 2. Elementos técnicos para estadı́stica sobre variedades
ϕ : Tp S 2 −→ Tq S 2 ,
tal que ϕ es una función que preserva ángulos, longitudes y orientación. Es decir,
para u, v ∈ Tp S 2 existe ϕ(u), ϕ(v) ∈ Tq S 2 tal que ϕ(v) · ϕ(v) = u · v, como se ejem-
plifica en la Figura 2.14. Es primordial notar que bajo este contexto, el transporte
paralelo también definió un campo vectorial, el cual se encuentra representado por
el conjunto de vectores amarillos en la Figura 3.11.
Figura 2.12: Representación del vector v Figura 2.13: Transporte paralelo del
en Tq S 2 . vector v.
2.2. Nociones básicas de geometrı́a diferencial 37
Es importante notar los dos detalles siguientes. Primero, recordar que α(t) necesita
ser suave, ya que el campo velocidad se encuentra definido mediante la derivada
de ésta. Segundo, el punto c sobre el cual se define el plano tangente, puede ser
cualquier punto de la esfera.
La Figura 2.17 ejemplifica el conjunto de curvas geodésicas que se usarán para trans-
portar el campo α̇(t), mientras que la Figura 2.18 muestra el transporte paralelo de
los vectores velocidad a lo largo de las curvas geodésicas. Es relevante comentar que,
para lograr este transporte paralelo, las curvas geodésicas deben de tener el mismo
punto de fin, c.
38 2. Elementos técnicos para estadı́stica sobre variedades
Figura 2.17: Curvas geodésicas con un Figura 2.18: Transporte paralelo del
punto c en común. campo velocidad α̇(t).
Una vez que se ha dado la intuición y elementos que usa el transporte paralelo, se
abordará una modificación de éste, cuya utilidad será vista en el Capı́tulo 3. Dicha
modificación es el Transported Square Root Vector Field o TSRVF. El TSRVF se
puede interpretar como un transporte paralelo escalado el cual, de manera análoga
al transporte paralelo anteriormente esbozado, da origen a campos vectoriales.
2.2. Nociones básicas de geometrı́a diferencial 39
El TSRVF surge a partir de una extensión conceptual de Rn , la cual puede ser re-
visada en Srivastava et al. [2011b]. En este artı́culo también se podrá encontrar la
intuición del cómo y por qué surge ésta noción geométrica, ası́ como su utilidad en
la parte computacional. A este tipo de transporte se le denotará como hα (t), donde
α(t) es una trayectoria suave sobre la variedad M . Formalmente, el TSRVF se define
como se muestra a continuación.
ȧ(t)α(t)−→c
hα (t) = q ∈ Tc M. (2.7)
| α̇(t) |
tal que Vβ(t) = (hα (t))c−→β(t) . Es decir, Vβ(t) es el campo vectorial inducido por el
transporte paralelo hα (t), a través de la curva geodésica que empieza en c y termina
en β(t), tal que β(0) = α(0) ∈ M . De esta forma es que la curva parametrizada
resultante β(t) será exactamente la curva parametrizada original α(t). En otras pa-
labras, lo que se está haciendo es un transporte paralelo—TSRVF—de regreso.
Figura 2.21: Campo vectorial V (t). Figura 2.22: Regreso del TSRVF.
Por otro lado, para que el transporte paralelo sea único, α(t) no debe pasar por −q.
Este hecho se debe a que −q es el punto antı́podo del lugar donde se definió Tq S 2 ,
que es el plano donde se transportará el vector velocidad v. Para aclarar ideas, es
importante recordar que hay una infinidad de curvas geodésicas que van de −q a
q. Por lo tanto, existirı́a una infinidad de posibles representaciones del vector v en
Tq S 2 , lo cual conllevarı́a que el transporte paralelo no sea único. A continuación se
tiene la prueba de que (2.9) ofrece vectores que viven en Tq S 2 . Para dicha tarea se
tienen algunos resultados preliminares:
1. | q |2 = hq, qi = 1.
2. | p + q |2 = hp + q, p + qi = 2 + 2p · q.
!
2
La prueba consiste en verificar que v −(2hv, qi/ | p + q | ) (p+q) ·q = 0. Entonces,
utilizando propiedades del producto punto y los resultados preliminares, se tienen
2.2. Nociones básicas de geometrı́a diferencial 41
2hv, qi
w=v− (p + q)
| p + q |2
2hv, qi
w·q =v·q− (p · q + q · q)
| p + q |2
2(v · q)
=v·q− (p · q+ | p + q |2 )
| p + q |2
!
2(p · q + 1)
=v·q 1−
| p + q |2
!
| p + q |2 −2(p · q + 1)
=v·q
| p + q |2
!
2 + 2p · q − 2p · q − 2
=v·q
| p + q |2
= 0.
Por lo tanto, w es un vector que está en Tq S 2 . Con esto queda comprobado que el
transporte paralelo, en la esfera, produce vectores en el plano tangente.
Curvas Geodésicas.
Curva paralela.
2.3. Epı́logo
Para cerrar este capı́tulo, se tienen los siguientes comentarios:
La teorı́a abordada en el presente capı́tulo se puede extender a variedades más
complejas que la esfera. Por ejemplo, SE(2) y el espacio de formas, variedades
que fueron vistas en el Capı́tulo 1.
Mientras más compleja sea la variedad con la que se esté trabajando, más difı́cil
será obtener expresiones analı́ticas para los conceptos anteriormente tratados.
2.3. Epı́logo 43
Finalmente, basta comentar que en el presente capı́tulo se dieron las nociones teóri-
cas primordiales, tanto a nivel técnico como intuitivo, de geometrı́a diferencial. Como
se verá, dichas nociones serán vitales para entender el desarrollo del Capı́tulo 3.
44 2. Elementos técnicos para estadı́stica sobre variedades
Capı́tulo 3
3.1. Introducción
Este capı́tulo contiene un resumen estructurado del artı́culo Su et al. [2014a] que
lleva por tı́tulo Statistical analysis of trajectories on Riemannian manifolds: bird
migration, hurricane tracking and video surveillance. El artı́culo se considera como
base para el desarrollo de la presente tesis, por su novedosa incursión en el análisis
estadı́stico de trayectorias sobre variedades. Éste es innovador en el sentido de que
ofrece un cambio de paradigma para el análisis estadı́stico de trayectorias, al incor-
porar tiempos aleatorios y trabajar sobre variedades. Además, dicho artı́culo logra
una sinergia entre nociones de geometrı́a diferencial con probabilidad y estadı́stica,
para luego proponer un análisis estadı́stico sobre variedades. Esta propuesta consis-
te de dos estapas. La primera es encontrar una trayectoria media y cuantificar la
varianza asociada a un conjunto de trayectorias. La segunda es considerar dichos
parámetros en un modelo de probabilidad con la finalidad de realizar inferencia es-
tadı́stica mediante simulaciones.
45
46 3. Análisis estadı́stico de trayectorias sobre la esfera
3.2. Trayectorias
Como fue establecido en el Capı́tulo 1, analizar trayectorias desde una perspectiva
estadı́stica posee relevancia y dificultad. La relevancia dependerá del problema que
se quiera resolver, mientras que la dificultad radicará principalmente en la estructura
del dato. Un ejemplo de esto es la cantidad de observaciones que tiene la trayec-
toria, la velocidad con la que fue recorrida, el tiempo que se dejó entre el asiento
de cada observación, etc. Por tanto estas caracterı́sticas imponen un reto, pues se
requiere una metodologı́a que permita estudiar un conjunto de trayectorias con las
caracterı́sticas enunciadas, de tal manera que ésta no pierda de vista la estructura
intrı́nseca que tienen los datos; por ejemplo, su forma. Por ende es necesario encon-
trar un enfoque que habilite el estudio estadı́stico de trayectorias, de manera que se
desperdicie la menor cantidad de información.
clasifica dentro del análisis estadı́stico tradicional de trayectorias. Por tanto, a conti-
nuación se exponen las ventajas y desventajas que se obtienen al realizar un análisis
estadı́stico de trayectorias, considerando tiempos no aleatorios. La finalidad de dicha
exposición es evaluar las facilidades y contratiempos que ofrece dicho planteamiento.
Ventajas:
1. El análisis estadı́stico es sencillo, ya que no existe necesidad de recurrir a nueva
teorı́a que vaya más allá de las nociones estándar de probabilidad y estadı́stica.
A raı́z de los problemas anteriores es que surgió la necesidad de estudiar otras he-
rramientas y puntos de vista, como el que expone el artı́culo de Su et al. [2014a].
El enfoque que considera es el estudio de trayectorias ocupando tiempos aleatorios.
Dicho planteamiento se puede motivar con la migración de aves y el seguimiento de
huracanes. En el caso de la migración de aves, a pesar de que una parvada siga la
misma curva, no necesariamente vuela con la misma velocidad. Lo mismo ocurre con
los huracanes; dos huracanes pueden tener la misma curva, y sin embargo pueden
estar asociados a diferentes intensidades de recorrido y corresponder a diferentes
años de registro. Esto quiere decir que se involucra cierta aleatoriedad temporal al
observar las trayectorias. En consecuencia, al incorporarla en un estudio estadı́stico,
se observan resultados que hacen más sentido con la intuición. No obstante, dado
el reciente desarrollo de esta teorı́a, presenta algunas dificultades las cuales serán
enlistadas junto con sus bondades. Es importante mencionar que esta perspectiva
de estudio constituye una de las principales aportaciones del artı́culo.
Ventajas:
Desventajas:
(a) Trayectoria media con el análisis (b) Trayectoria media considerando tiempos
tradicional. aleatorios.
2
Las imágenes que se utilizaron en el análisis comparativo de metodologı́as fueron tomadas del
artı́culo Su et al. [2014a].
50 3. Análisis estadı́stico de trayectorias sobre la esfera
(a) Elipses que representan la varianzas (b) Cı́rculos que representan la varianzas
puntuales con el análisis tradicional. puntuales considerando tiempos aleatorios.
Como se puede apreciar, para esta muestra de trayectorias, el análisis propuesto por
Su et al. [2014a] arroja resultados que concuerdan con la intuición estadı́stica. Lo
anterior es en el sentido de que la curva o traza asociada a la trayectoria media se en-
cuentra acorde con la curva de las trayectorias individuales, a diferencia de la media
que se obtuvo vı́a el análisis clásico. De esa misma forma, las varianzas puntuales
crecen conforme las trayectorias se van desfasando entre sı́, contrariamente a las
varianzas que se obtienen con el enfoque tradicional. Éstos resultados muestran que
en un estudio estadı́stico de trayectorias—las cuales poseen variabilidad temporal y
una forma particular—el desarrollo de la teorı́a propuesta por el artı́culo citado es
pertinente.
2. Liu and Müller [2004]. Functional convex averaging and synchronization for
time-warped random curves.
Aclara las desventajas de considerar un análisis estadı́stico con la cross sectio-
nal mean y la cross sectional variance, cuando los datos de interés contemplan
una variación temporal. Por tal motivo proporciona algunas referencias, en las
cuales se puede profundizar por qué un análisis puntual es inadeacuado para
este tipo de datos. Bajo esta lı́nea de pensamiento, aborda algunas metodo-
logı́as para tratar la variabilidad temporal en trayectorias, con el objetivo de
encontrar el mejor enfoque para el tratamiento de éstas.
3.3. Trayectorias como objeto matemático 51
Para aclarar la idea anterior se postula el siguiente ejemplo. Supóngase que en una
carrera de motocicletas a los concursantes se les coloca un gps que indica su posi-
cionamiento cada dos segundos. La Figura 3.4 muestra las posiciones de los moto-
ciclistas, mientras que la Figura 3.5 exhibe el recorrido conjunto de éstos.
De acuerdo con la Figura 3.5, el concursante que dejó los puntos verdes llevaba
mayor velocidad que el concursante de los puntos rojos, por lo cual fue observado
menos veces durante la carrera. En consecuencia podrı́a pensarse que las huellas que
dejan los concursantes son diferentes. Sin embargo, la Figura 3.4 muestra que los
dos motociclistas dejaron la misma traza en el recorrido, lo cual sigifica que α(t) y
β(t) representan a la misma curva aunque sus parametrizaciones sean diferentes. En
este sentido es que se dice que las trayectorias no son directamente observables.
Uno de los puntos a determinar en una muestra de trayectorias es identificar qué tan
diferentes son entre sı́. Para lograr esta tarea será necesario “estandarizarlas” vı́a
una transformación temporal. La modificación o transformación temporal de trayec-
torias, también conocida como registro temporal, requerirá de una función conocida
como warping function. Ésta, para fines de la tesis, será denominada como función
de deformación temporal. La función de deformación temporal se interpretará como
una reparametrización de una trayectoria α(t), de forma que modelará la variabili-
dad del tiempo en α(t).
Por otra parte, el correcaminos al tiempo t = .2 lleva una velocidad mayor a la del
conductor, casi el doble. Por ende en dicho tiempo, el correcaminos ha recorrido un
mayor porcentaje de su trayectoria total. Lo anterior conlleva a que el segundo punto
amarillo, de la trayectoria del correcaminos, está por encima del segundo punto rosa
que corresponde a la trayectoria del automóvil. Siguiendo este razonamiento es que
se obtienen las curvas restantes γ1 (t) y γ2 (t) de la Figura 3.7.
Con base en lo que se ha comentado hasta este punto, es primordial notar que el
dato que realmente se observa es α(γ(t)). Esta afirmación es consecuencia de la
siguiente situación: si se conoce la huella de la trayectoria α(t) y se recorre con
distintas tasas de evolución γ(t), lo que se obtendrá es un conjunto diferente de
observaciones por cada γ(t) empleada. Esto da lugar a la noción de curva, descrita
en la Deficinición 2.2.2 del Capı́tulo 2 de la presente tesis. En la Figura 3.8 se
puede apreciar de manera más clara el hecho comentado4 . Por otra parte y como fue
mencionado con anterioridad, para conocer la huella de una trayectoria es necesario
realizar de manera previa un proceso de interpolación o ajuste sobre los puntos que
conforman a las trayectorias. Este asunto puede ser considerado como un punto
adverso del presente enfoque, por el reto técnico y computacional que esta tarea
implica. Finalmente a la composición α(γ(t)) se le denotará como (α ◦ γ)(t).
4
Las imágenes usadas en la Figura 3.8 se pueden encontrar en Srivastava et al. [2011a].
54 3. Análisis estadı́stico de trayectorias sobre la esfera
Figura 3.8: Forma de una hoja—primera figura del lado izquierdo—recorrida con
tres diferentes tasas de evolución γ(t).
Una vez esbozados y aclarados puntos que serán vitales en el análisis estadı́stico
que será desarrollado posteriormente, se explicarán brevemente los pasos previos.
3.3. Trayectorias como objeto matemático 55
Primero, se usará el TSRVF (ver Sección 2.2.5) para representar las trayectorias en
un espacio conocido. Posteriormente se empleará la función de deformación tem-
poral, que ayudará a hacer comparables las trayectorias, es decir estandarizarlas.
Finalmente, se encontrará una medida con la cual se puedan establecer distancias
entre trayectorias y con ello sea posible calcular la trayectoria media y la varianza
asociada a un conjunto de trayectorias. Por consiguiente se tienen las siguientes tres
tareas a desarrollar:
Con el desarrollo de éstos tres puntos, se plantea que el lector alcance a percibir
de manera natural la utilidad de algunas herramientas que se desarrollaron en el
Capı́tulo 2. También se pretende exhibir el reto teórico que hay al extender no-
ciones como la de una medida o la de clases de equivalencia, considerando ciertas
transformaciones.
Una vez que las trayectorias fueron transportadas, sigue definir una modificación
temporal de ellas, que es lo que se explicará a continuación.
Para tener una idea más precisa de lo que es el registro temporal, se puede consultar
Ramsay [2006] y Kneip and Ramsay [2008]. El Capı́tulo 7 de la primera referencia
trata ampliamente el tema de registro de trayectorias. La segunda referencia es un
artı́culo que explica, en términos sencillos, en qué consiste el registro de trayectorias
identificando los retos que existen. Por tal motivo, aborda algunos procedimientos de
registro los cuales ejemplifica con datos reales. Este artı́culo es un excelente texto in-
troductorio para aquellos que desean adentrarse en la temática del registro temporal.
¿Por qué quiero una métrica que cumpla esa caracterı́stica? La respuesta, en esen-
cia, obedece al hecho que será ejemplificado a continuación. Supóngase que se tienen
dos carreteras, las cuales son recorridas varias veces al dı́a por vehı́culos que llevan
3.3. Trayectorias como objeto matemático 57
La ventaja que presenta esta métrica es que no exige una transformación previa
de las trayectorias para hacer comparaciones entre ellas. Sin embargo, no es
invariante a transformaciones temporales; es decir, dx (α1 (t), α2 (t)) 6= dx ((α1 ◦
γ)(t), (α2 ◦ γ)(t)). Por este motivo queda descartada.
entre α2 (t) y α1 (t). Los detalles de la prueba pueden ser revisados en Chris-
tensen and Johnson [2001].
3. Log-Mapeo.
Definido y estudiado brevemente en el Capı́tulo 2, la idea de esta propuesta es
representar una trayectoria α(t) en el espacio Tc M , vı́a el mapeo logarı́tmico.
En el caso de la presente tesis, tal espacio es Tc S 2 . El problema que posee el
log-mapeo, bajo esta concepción, es que arroja resultados inconsistentes. Un
ejemplo de ello es la proyección estereográfica, pues tres puntos cercanos en
el polo norte quedarı́an distantes al proyectarlos en el plano tangente, como
muestra la Figura5 3.9.
Como ya se dijo, a pesar de que las propuestas anteriores no fueron fructı́feras, ayu-
daron a concebir atributos deseables en la métrica de interés. El primer atributo es,
que la métrica en consideración indique cuán suave o rugosa fue la transformación
temporal de la trayectoria en cuestión . El segundo atributo hace referencia a que
el lugar donde quede definida tal métrica, tenga la estructura de un espacio vectorial.
Definición 3.3.1 Sean α1 (t) y α2 (t) dos trayectorias suaves sobre M y sean hα1 (t)
y hα2 (t) sus correspondientes TSRVFs. La distancia entre las trayectorias, se define
como Z 1 1/2
dh (hα1 (t), hα2 (t)) = | hα1 (t) − hα2 (t) |2 dt . (3.1)
0
Demostración:
Tomando como punto de partida las igualdades (3.1) y (3.3), la demostración del
teorema se reduce a realizar algunas sustituciones algebraicas. Ello se muestra a
continuación:
60 3. Análisis estadı́stico de trayectorias sobre la esfera
Z 1 1/2
2
dh (hα1 ◦γ , hα2 ◦γ ) = | hα1 ◦γ (t) − hα2 ◦γ (t) | dt
0
!1/2
Z 1 q q 2
= hα1 (γ(t)) γ̇(t) − hα2 (γ(t)) γ̇(t) dt
0
!1/2
Z 1 q 2
= hα1 (γ(t)) − hα2 (γ(t)) γ̇(t) dt
0
Z 1 1/2
2
= |hα1 (γ(t)) − hα2 (γ(t))| γ̇(t)dt .
0
El siguiente paso es trabajar las trayectorias considerando todas las tasas de evo-
lución temporal con las que pueden ser modeladas. Por tanto, a continuación se
introducirá la noción de clases de equivalencia entre trayectorias. Dos trayectorias
α1 (t) y α2 (t) se dirá que son equivalentes, α1 v α2 , si
1. α1 (0) = α2 (0).
2. Existe una sucesión {γk } ∈ Γ tal que lı́mk−→∞ hα1 ◦γk = hα2 bajo la métrica L2 .
Lo anterior significa que dos trayectorias son equivalentes si tienen el mismo punto
de inicio y via transformaciones temporales se puede llegar de hα1 (t) a hα2 (t). La
presentación de las clases de equivalencia entre trayectorias consituye otra de las
aportaciones realizadas por el artı́culo Su et al. [2014a].
La ventaja que ofrece la Definición 3.3.2 es que trabaja con la noción de curva
tomando en cuenta el TSRVF. Por lo tanto se compararán trayectorias vı́a la curva
que les subyace y no propiamente sobre los puntos observados. De acuerdo con lo
que se ha cubierto hasta este punto, sigue definir la distancia más corta dh (·, ·), que
logre cuantificar las diferencias que existen entre estas clases de equivalencia.
3.3. Trayectorias como objeto matemático 61
Esta distancia cumple con ser una distancia propia ya que es simétrica, positiva
definida y satisface la desigualdad del triángulo. La prueba se hace desde principios
básicos y puede ser consultada en la página 11 de Su et al. [2014a]. Cabe resaltar que
la definición de ds (·, ·), ası́ como la prueba de que es una distancia propia constituye
otra de las aportaciones del artı́culo base.
Por tanto, se ha encontrado una métrica entre trayectorias que es invariante a dife-
rentes tasas de evolución γ(t). Como se ha anunciado previamente, el principal uso
de esta métrica será para encontrar una trayectoria media de un conjunto {αi (t)}ni=1
de trayectorias, ası́ como para cuantificar la varianza que se le asocia.
Con este punto concluı́do se dan por finalizados los pasos previos al desarrollo es-
tadı́stico, el cual será abordado a continuación. Es importante notar que en general
el principal reto de esta sección fue definir la métrica ds (·, ·), en gran parte por los
diferentes requerimientos que debı́a cumplir ésta y por ende por toda la herramienta
que se necesitó desarrollar y probar.
1. Tucker et al. [2013]. Generative models for functional data using phase and
amplitude separation.
Este texto motiva la necesidad de capturar la estructura o geometrı́a que puede
ostentar una curva. Como consecuencia de ello es que implementa un estudio
estadı́stico de curvas, tal que la principal herramienta es una técnica llamada
análisis eslástico de la forma de una curva. Algunas ideas de dicho enfoque son
extendidas y empleadas por el artı́culo que fue tomado como base. También,
esta referencia aborda algunos algoritmos parecidos a los que se expondrán a
continuación y los ejemplifica con el uso de datos reales.
La función 3.4 es análoga a la función (1.1), que es la media de Karcher para datos
puntuales que se encuentran en una variedad M . Las piezas que cambian, en esta
nueva función, son la distancia y los elementos sobre los cuales se realizará el pro-
ceso de minimización. Por tanto, la intuición de esta media sigue siendo encontrar
aquel elemento en H, bajo la relación de equivalencia ∼, que minimice la distancia
entre los elementos [hαi ] que pertenecen a dicho espacio. Es valioso percatarse que
para definir hµ —el TSRVF de la trayectoria media—es que se requirió determinar
la distancia ds (·, ·).
Datos de entrada:
Un punto de referencia c.
Se recuerda que las trayectorias {αi (t)}ni=1 deben de ser suaves y no pasar por el
punto antı́podo a c.
Datos de salida:
Pasos:
2. Del conjunto de trayectorias {αi (t)}ni=1 seleccionar una trayectoria como µ(t).
Posteriormente hallar hµ (t), es decir el TSRVF de µ(t).
En este paso es que se requiere el punto de referencia c, pues es el lugar donde
se hará el TSRVF de las trayectorias {αi (t)}ni=1 es Tc S 2 .
n
1X
hµ (t) = hα̃ (t).
n i=1 i
dµ(t)
=| hµ (t) | hµ (t)c−→µ(t) ,
dt
9. Encontrar
n n
ds ([hµ ], [hαi ])2 = dh (hµ , hα̃i )2
X X
E=
i=1 i=1
Es relevante comentar que la función (3.4) decrece iterativamente hacia cero. Por
tanto ésta siempre convergerá, con lo cual se puede asegurar la existencia de una
trayectoria media.
Las Figuras 3.10–3.15 ofrecen un esbozo gráfico de los pasos expuestos con anterio-
ridad.
3.4. Análisis estadı́stico de trayectorias 65
Figura 3.10: Conjunto de trayectorias con Figura 3.11: Selección de una trayectoria
sus puntos iniciales y µ(0). α1 , α2 , α3 como la trayectoria media.
Figura 3.20: La esfera de la izquierda muestra las trayectorias sin alinear. La esfera
de la derecha muestra las trayectorias alineadas con base en α3 .
Datos de entrada:
Datos de salida:
Pasos:
68 3. Análisis estadı́stico de trayectorias sobre la esfera
En este caso ρ̂(tj ) se interpreta como una medida del nivel de alineación de
las trayectorias {α̃i (t)}ni=1 en el tiempo tj .
Figura 3.24: Plano tangente en µ(t2 ). Figura 3.25: Shooting vectors al tiempo
Tµ(t1 ) S 2 t2 .
Figura 3.26: Plano tangente en µ(t3 ). Figura 3.27: Shooting vectors al tiempo
Tµ(t2 ) S 2 t3 .
70 3. Análisis estadı́stico de trayectorias sobre la esfera
Figura 3.28: Plano tangente en µ(t4 ). Figura 3.29: Shooting vectors al tiempo
Tµ(t3 ) S 2 t4 .
Figura 3.30: Plano tangente en µ(t5 ). Figura 3.31: Shooting vectors al tiempo
Tµ(t4 ) S 2 t5 .
Datos de entrada:
La trayectoria α(t) debe ser discretizada, de manera que existan la misma cantidad
de puntos α(tj ) que de puntos µ(tj ) y de matrices K̂(tj ). Es decir, para cada punto
α(tj ) habrá una media µ(tj ) y una covarianza K̂(tj ), tal que j = 1, . . . , m.
Datos de salida:
Pasos:
1. Obtener los shooting vectors v(tj ), entre µ(tj ) y α(tj ) tal que j = 1, . . . , m.
Notar que v(tj ) ∈ Tµ(tj ) M .
El Algoritmo 3.4.3.1 puede ser útil para dar un p-valores de trayectorias simuladas.
La simulación de trayectorias consiste en tomar el conjunto {(µ(tj ), K̂(tj ) | t1 =
0, . . . , tm = 1} y bajo alguna distribución simular los vectores v(tj ). Posteriormente
dichos vectores se devuelven a S 2 vı́a el mapeo exponencial. De esa forma se ob-
tendrı́an los puntos que componen a la trayectoria simulada. Para obtener el p-valor
72 3. Análisis estadı́stico de trayectorias sobre la esfera
de una trayectoria simulada α(t), basta usar el método Monte Carlo. Esto significa,
simular N = 10000 trayectorias y calcular p(α) = N i=1 1P (Xi )<P (α) /N , donde Xi
P
A continuación las Figuras 3.32–3.40 ejemplifican los pasos del algoritmo presentado.
Figura 3.33: Discretizaión del tiempo Figura 3.34: Discretización del tiempo en
igual que en el algoritmo de la varianza. ambas trayectorias.
3.4. Análisis estadı́stico de trayectorias 73
Figura 3.35: Shooting vector al tiempo t1 Figura 3.36: Shooting vector al tiempo t2
y densidad de α1 (t1 ). y densidad de α1 (t2 ).
Figura 3.37: Shooting vector al tiempo t3 Figura 3.38: Shooting vector al tiempo t4
y densidad de α1 (t3 ). y densidad de α1 (t4 ).
Figura 3.39: Shooting vector al tiempo t5 Figura 3.40: Shooting vector al tiempo t6
y densidad de α1 (t5 ). y densidad de α1 (t6 ).
74 3. Análisis estadı́stico de trayectorias sobre la esfera
Dado que no se realizó el proceso iterativo que sugiere el Algoritmo 3.4.1.1, no fue
necesario elegir una trayectoria del conjunto {αi (t)}8i=1 para que fungiera como tra-
yectoria inicial en el algoritmo ya citado (ver paso 2). Por tanto, bajo el contexto
mencionado se calculó el TSRVF de las ocho trayectorias, con acuerdo en el paso 3,
como se muestra en la Figura 3.45. Nótese que el transporte paralelo de estas tra-
yectorias es muy parecido, lo cual es un indicador de que este concepto geométrico
respeta la noción de cercanı́a o lejanı́a entre trayectorias.
Es valioso comentar que para obtener el campo velocidad, que serı́a usado en el trans-
porte paralelo, se supuso que entre cada pareja de observaciones correspondientes
a un huracán habı́a una curva geodésica. Posteriormente se calculó la derivada—
con respecto a t—de la función (2.4), que es una de las parametrizaciones de la
curva geodésica, comentada en el Capı́tulo 2. Para ilustrar ideas, si una trayectoria
α(t) está conformada por veintinueve puntos implica que se calcularán veintiocho
curvas geodésicas y de cada una de ellas se obtendrá la derivada respecto a t, por
consiguiente se transportarán veintiocho vectores a Tc S 2 . Éstos representan el cam-
po vectorial asociado a la trayectoria α(t). Por ende, dichos vectores ofrecerán una
representación de la trayectoria α(t) en el plano tangente. Por otra parte, como con-
secuencia de la omisión del proceso iterativo, los pasos 4, 5 y 6 del algoritmo citado
no fueron implemantados.
yectoria media en T(0,0,1) S 2 , tal que ésta se encuentra representada por los puntos
negros.
6
Los porcentajes que se muestran son resultado del desarrollo de la siguiente fórmula {(k ·
100)/28}28
k=1 , de manera que los números obtenidos sean redondeados.
3.4. Análisis estadı́stico de trayectorias 79
µ(δ) − µ(0)
≈| hµ (δ) | hµ (δ).
δ
Por consiguiente,
µ(δ) ≈ µ(0) + δ | hµ (δ) | hµ (δ).
Usando este recurso de manera iterativa se obtuvo lo siguiente:
donde n es el número de puntos que conforman al TSRVF, en este caso n = 28. Por
otro lado, para que los puntos µ(δ), µ(2δ), . . . , µ(nδ) cayeran en la esfera, se hizo
una normalización de éstos. Es decir, se consideró la transformación
µ(kδ)
µ∗ (kδ) = ,
|µ(kδ)|
para k = 1, . . . , n. De esta manera, los puntos µ∗ (kδ) fueron los que se graficaron en
S 2 . Como resultado se obtuvo la trayectoria de la Figura 3.47.
Las covarianzas muestrales fueron obtenidas tomando como referencia cada uno de
los veintiocho puntos que componen a la trayectoria media y considerando veintio-
cho puntos representativos en cada trayectoria αi (t), i = 1, . . . , 8. Dos comentarios
80 3. Análisis estadı́stico de trayectorias sobre la esfera
surgen en esta instancia; el primero es que el Algoritmo 3.4.2.1 trabaja con las tra-
yectorias α̃i (t), es decir con las trayectorias alineadas; sin embargo tal proceso no
fue implementado. Por lo tanto el algoritmo citado se implementó con las trayecto-
rias originales αi (t), i = 1, . . . , 8. El segundo comentario refiere a la obtención de
los puntos que fueron considerados en las trayectorias αi (t). Basta comentar que se
tomaron aquellos puntos que representan los porcentajes considerados en el TSRVF.
El Listing 1.1 muestra las matrices de varianzas y covarianzas K̂(t26 ), K̂(t27 ), K̂(t28 )
y las trazas de K̂(t1 ), . . . , K̂(t28 ).
Como se puede apreciar en las covarianzas hay un cambio de signos, por ejemplo
de K̂(t26 ) a K̂(t27 ). Esto indica que en el tiempo t27 hubo un cambio en el com-
portamiento de las trayectorias de huracanes y tal cambio es significativo por las
unidades que hay de diferencia. Por otra parte las varianzas ρ(t1 ), ρ(t2 ), . . . , ρ(t28 )
son grandes, lo que indica que las trayectorias no están “bien” alineadas. Este últi-
mo resultado era de esperarse, pues como se dijo no se implementó el algoritmo en
cuestión con las trayectorias alineadas.
El paso final de este breve estudio es simular trayectorias de huracanes. Para ello
se consideró una media µ(t) = (0, 0, 0) y matrices de varianzas y covarianzas de
distintos órdenes. Dichas matrices fueron K̂(tj ), 1/10K̂(tj ), 1/50K̂(tj ), 1/100K̂(tj ),
tal que j = 1, . . . , 28. En la Figura 3.49 se muestran las trayectorias de huracanes
simuladas. Como se puede observar los puntos que conforman a la trayectoria simu-
lada con las matrices {K̂(tj )}28 j=1 , Figura 3.49a, se encuentran totalmente dispersos
principalmente en la parte final de la trayectoria. Es decir, que bajo la estructura
impuesta de K̂(tj ) la trayectoria del huracán presenta un comportamiento errático.
Para la segunda trayectoria simulada con 1/10K̂(tj ), Figura 3.49b, los puntos que
constituyen a la trayectoria siguen presentado un comportamiento errático; sin em-
bargo se puede vislumbrar una trayectoria más “real” comparada con la anterior.
Las últimas dos simulaciones poseen un comportamiento sensato, pues los puntos
que las componen no están totalmente dispersos. Sin embargo, en estas dos trayec-
torias todavı́a se puede apreciar la mayor variabilidad en sus puntos terminales.
2 [[26]]
3 x y z
4 [ 1 , ] 0 . 0 0 0 3 6 6 9 9 8 6 −0.0001469341 −0.0003774803
5 [ 2 , ] −0.0001469341 0 . 0 0 1 5 4 7 2 6 6 2 0 . 0 0 5 2 9 4 3 3 6 0
6 [ 3 , ] −0.0003774803 0 . 0 0 5 2 9 4 3 3 6 0 0 . 0 1 8 1 6 0 2 8 1 1
7
8 [[27]]
9 x y z
10 [ 1 , ] 2 . 5 9 3 0 2 8 e −04 −2.030742 e −05 3 . 7 5 9 4 6 6 e −05
11 [ 2 , ] −2.030742 e −05 1 . 5 8 4 9 2 6 e −03 5 . 4 4 0 2 9 2 e −03
12 [ 3 , ] 3 . 7 5 9 4 6 6 e −05 5 . 4 4 0 2 9 2 e −03 1 . 8 7 1 8 3 7 e −02
13
14 [[28]]
15 x y z
16 [ 1 , ] 0.0002343610 0.0001214343 0.0005279876
17 [ 2 , ] 0.0001214343 0.0015951797 0.0055130241
18 [ 3 , ] 0.0005279876 0.0055130241 0.0191054041
19
20 > traza
21 [ 1 ] 0.002895959 0.003021716 0.003050921 0.003175744 0.003360234
0.003497778
22 [ 7 ] 0.003819601 0.003460979 0.004160103 0.004433891 0.005493516
0.006702765
23 [ 1 3 ] 0.008176330 0.009099484 0.009618453 0.009957313 0.010922260
0.011359632
24 [ 1 9 ] 0.011902401 0.013387441 0.014215386 0.015889487 0.016986101
0.017979638
25 [ 2 5 ] 0.018698731 0.020074546 0.020562595 0.020934945
Figura 3.44: Media de Karcher de los puntos iniciales de las ocho trayectorias de
huracanes.
3.4. Análisis estadı́stico de trayectorias 83
Figura 3.46: Veintiocho puntos de cada uno de los ocho TSRVFs de huracanes y la
trayectoria media de dicho conjunto de TRSVFs.
3.4. Análisis estadı́stico de trayectorias 85
3.5. Epı́logo
El presente capı́tulo abordó la vinculación entre la geometrı́a diferencial y la es-
tadı́stica y probabilidad. Ası́ mismo trató conceptos de estadı́stica sobre variedades,
tales como el de media y varianza. De esa misma forma ofreció algunas aportaciones,
las cuales se comentan a continuación:
Es importante mencionar que la teorı́a desarrollada ası́ como los algoritmos presen-
tados pueden generalizarse fácilmente en lo conceptual, cambiando la variedad S 2
por una variedad riemanniana M . El reto de tal generalización será la parte compu-
tacional, pues como se mencionó previamente varias nociones geométricas de interés
no tienen una expresión analı́tica cerrada.
Aportaciones y conclusiones
89
90 4. Aportaciones y conclusiones
c) Análisis de imágenes.
Nielsen and Barbaresco [2015]. Geometric Science of Information.
Turaga and Srivastava [2015]. Riemannian Computing in Computer Vision.
Por otra parte, se concluyó que para lograr una incursión exitosa en el análisis es-
tadı́stico sobre variedades, es necesario contar con una formación—al menos básica—
en tres áreas del conocimiento. Estas tres ramas de la matemática son vitales, ya que
uno de los principales asuntos en el análisis estadı́stico sobre variedades es encontrar
la “buena” métrica, con la cual sea posible establecer diferencias entre los datos de
interés. Por tanto, es necesario identificar la estructura y propiedades del espacio en
el que se encuentran. Tales ramas son las siguientes:
a) Geometrı́a diferencial.
b) Teorı́a de la medida.
c) Topologı́a elemental.
Uno de los principales retos que presentó la inserción en esta temática fue la labor
computacional. En el área de estadı́stica sobre variedades se carece de riqueza en
cuanto a software implementado y accesible. Uno de los retos computacionales de la
presente tesis fue implementar los conceptos de geometrı́a diferencial abordados en el
Capı́tulo 2. Principalmente giraron en torno a la noción de transporte paralelo, que
jugó un rol esencial en el desarrollo estadı́stico. Gracias a este importante concepto,
junto con los de mapeo exponencial y log-mapeo fue posible la descripción proba-
bilı́stica de trayectorias muestra. Esto a su vez formó la base para la simulación de
huracanes y el examen de la ideosincrasia de trayectorias modeladas. Es importante
resaltar que el cómputo de la función de deformación temporal γ(t) no fue llevado al
cabo, ya que por sı́ mismo amerita un enfoque computacional ad hoc, pues como se
mencionó en el Capı́tulo 3 requiere del uso de programación dinámica. Esto significa
que dentro del alcance de esta tesis no fue posible valorar la magnitud del efecto que
pueda tener esta función, no obstante que en la literatura complementaria se hace
alusión a que este concepto es vital.
Estos puntos, por más pequeños que parezcan, han dado origen a una gran cantidad
de disertaciones y charlas entre expertos del área; un ejemplo de ello es Hotz [2013],
quien desarrolló un breve estudio de medias—extrı́nseca e intrı́nseca1 —en el cı́rculo.
En este estudio comenta, cómo afecta el conocimiento de la distribución en la elección
entre la media extrı́nseca o intrı́nseca en cuanto costo a cumputacional y robustez.
Por tanto esta materia representa un área de oportunidad para estadı́sticos, com-
putólogos, geométras y todo aquél cientı́fico que desee realizar análisis estadı́stico
con datos más complejos que aquellos producidos en el espacio n-dimensional.
1
Para conocer un poco de estos enfoques se sugiere consultar Bhattacharya [2013].
Apéndice A
Librerias usadas
1
2 ## Este script contiene todas las librerias que se usaran
3 ## para trabajar con otros scripts
4
5 library(rgl) ## visualizaciones 3D
6 library(sphereplot)## trabajar graficos de la esfera
7 library(circular) ## datos circulares
8 library(aspace) ## trabajar radianes
9 library(plyr) ## para aplicar funciones de forma sencilla
10 library(dplyr) ## separar datos
11 library(tidyr)
12 library(mvtnorm) ## trabajar con normal multivariada
13 library(lubridate) ## trabajar con fechas
14 library(stringr) ## separar caracteres
15 library(MASS) ## trabajar con la normal multivariada
Funciones utilizadas
1
2 ## Este script contiene todas las funciones que se usarán
3 ## para trabajar con otros scripts. Acontinuación se mencionan
4 ## las funciones que contiene.
5
6 ## Grafica de la esfera.
7 ## Grafica plano tangente en el punto (0,0,1).
8 ## Geodésica reparametrizada.
9 ## Log-mapeo.
10 ## Producto interno.
11 ## Derivada de una geodésica.
12 ## Norma de un vector.
13 ## Transporte paralelo.
14 ## Distancia en la esfera.
15 ## Producto de matrices.
16 ## Shooting vectors
17 ## Matriz de covarianzas
18 ## Regreso transporte paralelo
19 ## Función landmark
20
21 ## Grafica de la esfera
22 esfera<-function()
23 {
24 # crear un nuevo plot
95
96 Apéndice A
25 open3d()
26 # generar la esfera
27 spheres3d(x = 0, y = 0, z = 0, radius = 1,col="red",alpha =.9)
28 # generar los ejes
29 axes3d(c(’x’, ’y’, ’z’))
30 ## tı́tulo y subtı́tulo
31 title3d(’’,’ ’,’x’, ’y’, ’z’)
32 }
33
34 ## Grafica plano tangente
35 plano<-function()
36 {
37 f <- 0
38 g <- 0
39 h <- 1
40 i <- -.9999999
41 planes3d(f, g, h, i, alpha = 0.8)
42 points3d(0,0,1, col="yellow", size=10,lwd=10)
43
44 }
45
46 ## Geodesica reparametrizada
47 ## t=tiempo, p=punto inicio geodésica, v=dirección.
48 G<-function(t,p,v)
49 {
50 nv<-sqrt(sum(v*v))
51 return(cos(t*nv)*p + sin(t*nv)*(v/nv))
52 }
53
54 ## Recordar que el mapeo exponencial es la geodesica evaluada
55 ## en t=1
56
57 ## Implementación geodesica
58 GC<-function(p,v,a)
59 {
60 nv<-sqrt(sum(v*v))
61 sapply(seq(0,pi/(a*nv),len=n2),G, p,v)
62 }
63
64 ## Log mapeo
65 ## p=punto de origen, q0= a donde va
66 logM<-function(p, q0)
67 {
68 if(all(q0==p)) return(c(0,0,0))
69 return((acos(sum(p*q0)))/(sqrt(1- (sum(p*q0)ˆ2)))*(q0-(sum(p*q0)*p)))
70 }
71
72 ## Producto interno
73 Prod_int<-function(x,y) return(sum(x*y))
74
75 ## Derivada de una geodesica
76 ## t=tiempo, p=punto inicio geodésica, v=dirección.
77 DG<-function(t,p,v)
78 {
79 nv<-sqrt(sum(v*v))
80 return( (-sin(t*nv)*nv*p) + (cos(t*nv)*v))
Apéndice A 97
81 }
82
83 ## Norma de un vector
84 ## x= vector
85 N_vec <- function(x) return(sqrt(sum(xˆ2)))
86
87
88 ## Transporte paralelo
89 ## p= punto de inicio, vl=velocidad, c= en donde se hará el transporte
90 TP<-function(p,vl,c)
91 {
92 ## Norma de la suma suma de dos vectores elevado al cuadrado
93 NS2<-(sum(p*p))+ (sum(c*c))+ (2*sum(p*c))
94 ## Transporte paralelo
95 ff<- vl - ( (2*sum(vl*c)/NS2)*(p+c) )
96 ## SRtvF
97 ff<- ff/sqrt(N_vec(ff))
98 return(ff)
99 }
100
101 ## Distancia en la esfera
102 ## p,q0= puntos de la esfera
103 dist_esf<-function(p,q0) return( acos(sum(p*q0)) )
104
105 ## Producto matrices
106 ## x=vector
107 Prod_M<-function(x) x%*%t(x)
108
137 Regreso_T<-function(TpT,P_ini,color)
138 {
139 Reg_T<-matrix(0, nrow=dim(TpT)[1], ncol=3)
140 Reg_T[1,]<- P_ini+ (1/dim(TpT)[1])*(N_vec(TpT[2,])*TpT[2,])
141 Reg_T[1,]<- Reg_T[1,]/N_vec(Reg_T[1,])
142 points3d(Reg_T[1,1],Reg_T[1,2],Reg_T[1,3])
143
144 for(j in 2:dim(TpT)[1])
145 {
146 Reg_T[j,]<- Reg_T[j-1,]+ (1/dim(TpT)[1])*(N_vec(TpT[j,])*TpT[j,])
147 Reg_T[j,]<- Reg_T[j,]/N_vec(Reg_T[j,])
148 points3d(Reg_T[j,1],Reg_T[j,2],Reg_T[j,3], col=color, size=5,lwd=10)
149 }
150 }
151
152 ## función landmark
153 land<-function(por,m) round((por*m)/100) ## funcion landmarks
154
Capı́tulo 2
12 ## Curvas geodésicas
13 a<-GC(p=c(.0028,.9999,.000116),v=c(1/sqrt(2),0,1/sqrt(2)),a=3)
14 b<-GC(p=c(1,0,0),v=c(0,1,0),a=3)
15
16 ## Gráfica curvas geodésicas
17 for(i in 1:n2)
18 {
19 points3d(a[1,i],a[2,i], a[3,i], col="blue", size=5,lwd=10)
20 points3d(b[1,i],b[2,i], b[3,i], col="green", size=5,lwd=10)
21 }
22
23 ## Recorrido de las curvas geodésicas
24 tiempo<-function(a,v)
25 {
26 nv<-sqrt(sum(v*v))
27 seq(0,pi/(a*nv),len=n2)
28 }
29
30 ## Campos velocidad
31 VectVa<-sapply(tiempo(3,v=c(0,1,0)),DG, p=c(.0028,.9999,.000116),v=c(1/sqrt(2),0,1/sqrt(2)))
Apéndice A 99
32 VectVb<-sapply(tiempo(3,v=c(0,1,0)),DG, p=c(1,0,0),v=c(0,1,0))
33
34 ## Grafica transporte paralelo curvas geodésicas
35 for(j in 1:n2)
36 {
37 ## Transporte paralelo curva a
38 tpa<-TP(a[,j],VectVa[,j],c=c(0,0,1))
39 ## Transporte paralelo curva b
40 tpb<-TP(b[,j],VectVb[,j],c=c(0,0,1))
41 ##Gráfica transporte parlelo geodésica a
42 points3d(tpa[1],tpa[2],tpa[3]+1, col="blue", size=5,lwd=10)
43 ##Gráfica transporte parlelo geodésica b
44 points3d(tpb[1],tpb[2],tpb[3]+1, col="green", size=5,lwd=10)
45 }
2 #############################################
3 #### Transporte paralelo curva paralela ####
4 #############################################
5
6 esfera()
7 plano()
8
9 n2<-100 ## numero puntos cada curva
10 d<-1 ## longitud curva
11
12 ### Curva paralela
13 M<-function(t)
14 {
15 return( (1/2)*c(sin(t),cos(t),sqrt(3)) )
16 }
17
18 ### Derivada de la curva paralela
19 DM<-function(t)
20 {
21 return( (1/2)*c(cos(t),-sin(t),0) )
22 }
23
24 ### Puntos curva paralela
25 ma<-sapply(seq(-pi,pi/d, len=n2),M)
26
27 ### Grafica curva paralela
28 for(j in 1:n2) points3d(ma[1,j],ma[2,j], ma[3,j], col="yellow", size=5,lwd=10)
29
30 ### Campo velocidad curva paralela
31 VectVma<-sapply(seq(-pi,pi/d, len=n2),DM)
32
33 ### Grafica transporte paralelo curva paralela
34 for(j in 1:n2)
35 {
36 tpa<-TP(ma[,j],VectVma[,j],c=c(0,0,1))
37 points3d(tpa[1],tpa[2],tpa[3]+1, col="yellow", size=5,lwd=10)
38 }
100 Bibliografı́a
Bibliografı́a
Amari, S.-i. and Nagaoka, H. (2007). Methods of information geometry, volume 191.
American Mathematical Soc.
Aswani, A., Bickel, P., and Tomlin, C. (2011). Regression on manifolds: Estimation
of the exterior derivative. The Annals of Statistics, pages 48–81.
Fisher, N. I., Lewis, T., and Embleton, B. J. (1987). Statistical analysis of spherical
data. Cambridge university press.
Fletcher, P. T., Lu, C., Pizer, S. M., and Joshi, S. (2004). Principal geodesic analysis
for the study of nonlinear statistics of shape. Medical Imaging, IEEE Transactions
on, 23(8):995–1005.
101
102 Bibliografı́a
Gallier, J. (2001). Basics of classical lie groups: The exponential map, lie groups, and
lie algebras. In Geometric Methods and Applications, pages 367–414. Springer.
Hastie, T., Tibshirani, R., and Friedman, J. (2009). Unsupervised learning. Springer.
Joshi, S. H., Su, J., Zhang, Z., and Amor, B. B. (2016). Elastic shape analysis of
functions, curves and trajectories. In Riemannian Computing in Computer Vision,
pages 211–231. Springer.
Jung, S., Dryden, I. L., and Marron, J. (2012). Analysis of principal nested spheres.
Biometrika, 99(3):551–568.
Jung, S., Foskey, M., and Marron, J. (2011). Principal arc analysis on direct product
manifolds. The Annals of Applied Statistics, pages 578–603.
Jupp, P. E. and Kent, J. T. (1987). Fitting smooth paths to speherical data. Applied
Statistics, pages 34–46.
Kneip, A. and Ramsay, J. O. (2008). Combining registration and fitting for functio-
nal models. Journal of the American Statistical Association, 103(483):1155–1165.
Kume, A. and Le, H. (2003). On fréchet means in simplex shape spaces. Advances
in Applied Probability, pages 885–897.
Le, H. and Kume, A. (2000). The fréchet mean shape and the shape of the means.
Advances in Applied Probability, pages 101–113.
Lin, T. and Zha, H. (2008). Riemannian manifold learning. Pattern Analysis and
Machine Intelligence, IEEE Transactions on, 30(5):796–809.
Liu, X. and Müller, H.-G. (2004). Functional convex averaging and synchronization
for time-warped random curves. Journal of the American Statistical Association,
99(467):687–699.
Loring, W. T. (2008). An introduction to manifolds.
Mardia, K. V. and Jupp, P. E. (1999). Directional statistics.
Maybank, S. J. (2008). The fisher-rao metric. Mathematics Today, 44(6):255–257.
Nielsen, F. and Barbaresco, F. (2015). Geometric science of information.
Patrangenaru, V. (1998). Asymptotic statistics on manifolds. PhD thesis, Ph. D.
dissertation, Indiana Univ.
Patrangenaru, Leif Ellingson, V. (2015). Nonparametric Statistics on Manifolds and
Their Applications to Object Data Analysis. CRC Press.
Pennec, X. (2015). Barycentric subspaces and affine spans in manifolds. In Geometric
Science of Information GSI’2015.
Ramsay, J. O. (2006). Functional data analysis. Wiley Online Library.
Rao, C. R. (1945). Information and the accuracy attainable in the estimation of
statistical parameters. Bull. Calcutta Math., pages 81–91.
Rentmeesters, Q. and Absil, P.-A. (2011). Algorithm comparison for karcher mean
computation of rotation matrices and diffusion tensors. In Signal Processing Con-
ference, 2011 19th European, pages 2229–2233. IEEE.
Roberts, P. H. and Ursell, H. D. (1960). Random walk on a sphere and on a rie-
mannian manifold. Philosophical Transactions of the Royal Society of London A:
Mathematical, Physical and Engineering Sciences, 252(1012):317–356.
Samir, C., Absil, P.-A., Srivastava, A., and Klassen, E. (2012). A gradient-descent
method for curve fitting on riemannian manifolds. Foundations of Computational
Mathematics, 12(1):49–73.
Sánchez Morgado, H. and Palmas Velasco, O. A. (2007). Geometrı́a riemanniana.
Shun-ichi, A. (1985). Differential-geometrical methods in statistics, volume 28. Sprin-
ger Science & Business Media.
Souvenir, R. and Pless, R. (2005). Manifold clustering. In Computer Vision, 2005.
ICCV 2005. Tenth IEEE International Conference on, volume 1, pages 648–653.
IEEE.
Srivastava, A., Jermyn, I., and Joshi, S. (2007). Riemannian analysis of probability
density functions with applications in vision. In Computer Vision and Pattern
Recognition, 2007. CVPR’07. IEEE Conference on, pages 1–8. IEEE.
104 Bibliografı́a
Srivastava, A., Klassen, E., Joshi, S. H., and Jermyn, I. H. (2011a). Shape analysis
of elastic curves in euclidean spaces. Pattern Analysis and Machine Intelligence,
IEEE Transactions on, 33(7):1415–1428.
Srivastava, A., Wu, W., Kurtek, S., Klassen, E., and Marron, J. (2011b). Registration
of functional data using fisher-rao metric. arXiv preprint arXiv:1103.3817.
Su, J., Kurtek, S., Klassen, E., Srivastava, A., et al. (2014a). Statistical analysis
of trajectories on riemannian manifolds: bird migration, hurricane tracking and
video surveillance. The Annals of Applied Statistics, 8(1):530–552.
Su, J., Srivastava, A., de Souza, F. D., and Sarkar, S. (2014b). Rate-invariant
analysis of trajectories on riemannian manifolds with application in visual speech
recognition. In Computer Vision and Pattern Recognition (CVPR), 2014 IEEE
Conference on, pages 620–627. IEEE.
Tu, E., Cao, L., Yang, J., and Kasabov, N. (2014). A novel graph-based k-means
for nonlinear manifold clustering and representative selection. Neurocomputing,
143:109–122.
Tucker, J. D., Wu, W., and Srivastava, A. (2013). Generative models for functional
data using phase and amplitude separation. Computational Statistics & Data
Analysis, 61:50–66.