PC 2 - G6
PC 2 - G6
PC 2 - G6
PRACTICA CALIFICADA N 2
Investigue respecto a los temas planteados y responda las siguientes
preguntas:
1. Qu datos y variables se requiere para calcular los estadsticos de
validacin de modelos? Explique cmo se calcula estos estadsticos y
realice un ejemplo en una hoja de clculo
a. Matriz de Confusin
La Matriz de Confusin contiene informacin acerca de las predicciones
realizadas por un Mtodo o Sistema de Clasificacin, comparando para el
conjunto de individuos en de la tabla de aprendizaje o de testing, la
prediccin dada versus la clase a la que estos realmente pertenecen.
La siguiente tabla muestra la matriz de confusin para un clasificador de
dos clases:
Ejemplos:
b. Kolmogorov-Smirnov (KS)
Para esta prueba se requiere tener dos muestras de una variable aleatoria
continua, o al menos de escala ordinal. Con los datos agrupados en k
categoras o intervalos se calculan las frecuencias relativas acumuladas F^i
y G^i con i = 1, 2, : : :, k que corresponden a las dos muestras de tamao
n1 y n2 respectivamente. Calculamos entonces las diferencias de las
frecuencias relativas acumuladas. El estadstico esta dado como la mxima
diferencia de las distribuciones de frecuencias relativas acumuladas
c. Curva ROC
Una de las caractersticas de un buen sistema de rating es que tenga la mayor tasa de acierto (hit
rate) como sea posible (correcta clasificacin de los deudores que impagan como potenciales
defaults) y al mismo tiempo la ms baja tasa de falsa alarma (incorrecta clasificacin de un
deudor cumplidor como un potencia default). La curva ROC es un concepto que se relaciona
con estas dos tasas y tambin con la curva CAP. Para construir la curva ROC, se calculan la tasa
de aciertos y de falsa alarma para cada score, tomando cada nivel de score como un punto de
corte (cut off) para otorgar crdito. La performance de un sistema de rating es mejor cuanto ms
empinada sea la curva ROC y cuanto ms cerca se encuentre del punto (0; 1). Las curvas ROC
de los modelos se presentan en el Grfico2. Usando este criterio, el sistema de rating derivado
del Modelo 4 tiene la mejor performance. Haremos algunas observaciones sobre este resultado
ms abajo.
El .rea bajo la curva ROC se mide por el ndice ROC. El valor de este ndice va desde 0,5 para
un modelo aleatorio (la curva ROC es la diagonal) hasta 1 para el modelo ideal.
d. Curva CAP
CAP (Cumulative Accuracy Profile) El CAP se conoce tambin como curva de poder o
curva de Lorenz. Muestra el porcentaje acumulado observado de deudores en default atribuibles
a un ranking de observaciones ordenadas por sus scores. Visualmente, la curva CAP se
determina graficando el porcentaje acumulado de deudores en el eje horizontal, del ms
riesgoso al menos riesgoso segn su score, y los correspondientes porcentajes acumulados de
defaults en el eje vertical.
Si fuera perfecto, el proceso de rating le asignara a los que hacen default los menores scores y
en consecuencia la curva CAP subir linealmente desde el punto 0 hasta reflejar todos los
defaults y luego pasara a ser horizontal. De all que, a mas empinada la curva CAP en el origen,
mas precisin tiene el proceso de rating
En el otro extremo se encontrara un modelo puramente aleatorio, sin ningn poder
Discriminatorio. La curva esperada del CAP en este caso sera la diagonal, dado que una
Fraccin X de deudores contendra X% de defaults. Cuanta ms cncava sea la curva CAP, ser
mejor el poder discriminatorio del modelo de rating, dado que una curva ms cncava estara
ms cerca del modelo ideal.
El ndice resumido del CAP es el AR (Accuracy Ratio), el cual se basa en el coeficiente Gini del
CAP. En este ratio el numerador es el .rea entre la curva CAP y la diagonal (el modelo aleatorio)
y el denominador es el .rea entre el modelo ideal y la diagonal Un sistema de rating es ms
preciso cuanto ms cerca de uno este el AR.
Comparando los modelos de rating estimados en el presente documento, la curva CAP del
sistema de rating derivado del Modelo 4 es la ms cncava y tiene mayor AR. Haremos algunas
calificaciones sobre estos resultados ms adelante.
e. ndice Gini
En 1960 se propuso medir la desigualdad en la salud a partir de la curva de
Lorenz, el ndice de Gini se deriva de esta. El ndice de Gini es uno de los
ms utilizados para medir la desigualdad entre dos poblaciones. En el caso
que nos ocupa se utiliza para medir la desigualdad de las poblaciones de
buenos y malos clientes. Tericamente la curva de Lorenz de las funciones
de distribucin F(x) y G(x) es el subconjunto del producto cartesiano dado
por
L(F, G) = {(u, v)|u = F(x) y v = G(x); con x R}.
Definimos a F y G como las funciones de distribucin tericas asociadas a
los clientes malos y buenos respectivamente, donde x es el puntaje de
score. Si el puntaje de score para buenos es mayor que el puntaje score
para malos, la curva de Lorenz de F y G es cncava hacia arriba como en la
figura 2.2. Se ve que si F(x) = G(x) entonces L(F, G) describe la recta u = v
con u (0,1) entre las distribuciones F y G.
Por lo tanto mientras L se separe ms de la recta v = u, mayor ser la
diferencia entre F(x) y G(x). Por esta razn, el rea A que se encuentra entre
la identidad y la curva de Lorenz es una medida de desigualdad entre las
distribuciones F y G. El ndice de Gini resulta de la razn entre el rea A y el
rea del tringulo delimitado por la identidad, el eje horizontal u y la recta u
=1
ndice de Gini con observaciones agrupadas
Cuando se desconocen las funciones de distribucin F(x) y G(x), pero se
cuenta con una muestra aleatoria de cada una de esta dos distribuciones
empricas de tamao n1 y n2 respectivamente se puede estimar la curva de
Lorenz y por lo tanto el ndice de Gini. Para hacer esto primero se define
7
El ndice de Gini es
f.
Distancia de Kullback-Leibler
g. ndice de Pietra
El .ndice Pietra considera el mayor .rea triangular que puede obtenerse entre la curva ROC y la
diagonal. Estas medidas para el poder discriminatorio de los modelos estimados se presentan en
el Cuadro6. El sistema de rating estimado por el Modelo 4 muestra mejor performance
considerando estos tres .ndices. En particular, es claramente superior al Modelo 2, el cual
Geomtricamente, este ndice puede estimarse como la mxima rea de un triangulo ubicado
entre la curva ROC y la diagonal. De manera equivalente, el ndice Pietra puede calcularse
como la mxima distancia entre la curva ROC y la diagonal. En el caso de una curva cncava
puede calcularse como:
h. Entropa condicional
Otro ndice no lineal es la entropa uno, donde Como su nombre indica, esto
est relacionado con la entropa o la cantidad de informacin en la divisin
entre los buenos y malos en el nodo. Es una medida de cuntas maneras
diferentes se podra terminar con la divisin real de los buenos de los malos
en el nodo, y que se relaciona con la informacin estadstica utilizada en las
mediciones de clasificacin
Supongamos que en vez de tener una nica variable aleatoria X, existe otra variable Y
dependientes entre s, es decir el conocimiento de una (por ejemplo Y) entrega informacin
sobre la otra (por ejemplo X). Desde el punto de vista de la entropa de la informacin
podemos decir que la informacin de Y disminuir la incertidumbre de X. Por tanto
podemos decir que la entropa de X ser condicional a Y. y por tanto:
11
i.
j.
Bootstrap y Jackknifing
k. Otros
Nota: El uso de grficos y ejemplos para explicar sus respuestas tendr un
valor adicional. Asimismo, deber indicar las fuentes bibliogrficas
Participantes:
-
Bibliografa
13