CAPITULO 6. Homogeneidad PDF
CAPITULO 6. Homogeneidad PDF
CAPITULO 6. Homogeneidad PDF
INFORMACIÓN HIDROLÓGICA.
En todas las pruebas de hipótesis estadísticas, se debe obtener una estadística muestral
de la población (como la media o la varianza) que ha de ser comparada con un parámetro
hipotético para aceptar o rechazar dicho valor solo si el resultado muestral es muy poco
probable cuando la hipótesis es cierta.
N
1
N
X
t 1
t
[1]
1 N
2 X t 2
N 1 t 1 [2]
Paso 4: Estandarizar el estimador, con esto se pretende hallar un estadístico que pueda
ser comparado con una distribución de probabilidad.
El presente capitulo tiene por objeto explicar y aplicar las pruebas de hipótesis para el
análisis de homogeneidad de series hidrológicas agrupándolas en las siguientes
categorías:
• Otras pruebas.
Se dice que una serie de tiempo presenta cambio (salto) en la media, cuando se observa
un cambio abrupto en el nivel o la magnitud de la media de determinada variable, estos
cambios pueden ser negativos o positivos. Cuando ocurre un cambio positivo, la media de
la variable en estudio se incrementa después del punto de cambio, si ocurre lo contrario
se dice que el cambio es negativo.
• Prueba T-modificada (Bayley & Hammersley, 1946), (Matalas & Langbein, 1962)
X t t 1,2,..., N
Sea , es una serie hidrológica con tamaño muestral N , independiente y
normalmente distribuida con media y desviación estándar . Si se divide la serie dada
en dos subseries con tamaños muestrales N 1 y N 2 tal que N1 N 2 N . La primera
estándar 1 . La segunda subserie definida por los t tales que t N1 1,..., N se asume
X
con media 2 y varianza 2 . La prueba T simple puede ser usada para validar la
hipótesis de igualdad de las medias 1 y 2 considerando la siguiente prueba:
H 0 : 1 2
vs. H1 : 1 2 [3]
H0
Donde y H 1 son las hipótesis nula y alternativa respectivamente.
debe ser verificada mediante una prueba de cambio en la varianza) se calculan las
medias de las dos subseries mediante los siguientes estimadores:
1 N1 1 N
ˆ1 t 2 N 2 t
N1 t 1
X ̂ Xt
N1 1
, [4]
N1 N
X t ˆ1 X t ˆ 2
2 2
t 1 t N1 1
Sˆ
N 2 [5]
ˆ1 ˆ 2
T
1 1
Sˆ
N1 N 2
[6]
Si las desviaciones estándar de las dos subseries son diferentes (según una prueba de
hipótesis de cambio en la varianza), se debe utilizar un nuevo estadístico para la prueba
T simple definido como.
ˆ 1 ˆ 2
T
ˆ 12 ˆ 22
N1 N2
[7]
N
22
1
X t 2
N 2 1 t N1 1
[9]
2
ˆ 12 ˆ 22
C N1 N 2
ˆ 2 2 ˆ 2 2
1 2
N 1 N2
N1 1 N 2 1
[10]
La prueba T simple requiere que las series sean independientes, es decir que no posean
autocorrelación. En caso de presentarse autodependencia en las series el procedimiento
descrito en la prueba T simple no puede ser aplicado para la estimación de cambios en la
media. Un enfoque para resolver dicho problema está basado en el concepto de número
equivalente de observaciones independientes que puede ser usado en con la prueba T
simple (Lettenmaier, 1976).
con media 1 y desviación estándar 1 . La segunda subserie definida por los t tales
X
N 12
NE1
ˆ N1 1 1 N 1 ˆ 12 1 N 1 1ˆ 1 1
N1 2 1
ˆ1 1 12 [11]
N 22
NE 2
ˆ 1N 2 1 2 N 2 ˆ 12 2 N 2 1ˆ 1 2
N 2 2
ˆ1 2 12 [12]
Donde ˆ1 1 y ˆ1 2 son los coeficientes de autocorrelación de rezago 1 estimados para
las subseries uno y dos respectivamente. Los coeficientes de autocorrelación de rezago k
de la muestra son estimados utilizando la siguiente ecuación:
N k
X t k ˆ X t ˆ
ˆ k t 1
N
X ˆ
t 1
t
2
[13]
Bajo la hipótesis de que las dos subseries posean la misma varianza (hipótesis que
2
debe ser verificada mediante una prueba de cambio en la varianza) se calculan las
medias de las dos subseries mediante los siguientes estimadores:
1 N1 1 N
ˆ1
N1 t 1
X t ̂ 2
N2
X
t N1 1
t
, [14]
N1 N
X t ˆ1 X t ˆ 2
2 2
t 1 t N1 1
Sˆ
N 2 [15]
ˆ 1 ˆ 2
T
1 1
Sˆ
NE1 NE 2 [16]
La hipótesis de igualdad de las dos medias no puede ser rechazada (se acepta) si
T t1 / 2, NE1 NE2 2 donde t1 / 2, N 2 representa el quantil
1 / 2 de la distribución t de Student con NE1 NE2 2 grados de libertad, siendo
el nivel de significancia.
Si las desviaciones estándar de las dos subseries son diferentes (según una prueba de
hipótesis de cambio en la varianza), se debe utilizar un nuevo estadístico para la prueba
T simple definido como.
ˆ 1 ˆ 2
T
ˆ 12 ˆ 22
NE1 NE 2
[17]
1 N1
12 X t
2
N1 1 t 1 [18]
N
22
1
X t 2
N 2 1 t N1 1
[19]
La hipótesis de igualdad de las dos medias no puede ser rechazada (se acepta) si
T t1 / 2, donde t1 / 2, representa el quantil 1 / 2 de la distribución t
de Student con grados de libertad, siendo el nivel de significancia. El valor
corresponde al menor entero más cercano al número dado por:
Sea
X t , t 1,2,..., N es una serie hidrológica con tamaño muestral N , dividida en dos
Se puede probar la hipótesis de igualdad entre las medias de ambas subseries usando el
estadístico de la prueba que se calcula con base en la siguiente expresión:
N1
N N 1
R X 2 t
1
U t 1
N 1
1
12
N1 N N 1 12
[21]
R X t X t en Z t .
Donde representa el rango de ka observación
Se usan para saber si una serie de datos posee cambios abruptos en la magnitud de su
varianza, usa una hipótesis nula de comparación entre las varianzas de series de datos
segmentadas, las pruebas más usadas son:
Sea
X t , t 1,2,..., N una serie hidrológica con tamaño muestral N , independiente y
normalmente distribuida con media y desviación estándar . Si se divide la serie dada
en dos subseries con tamaños muestrales N 1 y N 2 tales que N1 N 2 N . La primera
H 0 : 12 22 vs. H1 : 12 22 [22]
H0
Donde y H 1 son las hipótesis nula y alternativa respectivamente.
ˆ 12
F
ˆ 22 [23]
N
22
1
X t 2
N 2 1 t N1 1
[25]
Una prueba similar a la T modificada puede ser desarrollada para detectar cambios en la
varianza cuando la muestra de la serie tiene una estructura de dependencia, la prueba F
será llamada F modificada pero en este caso el estadístico para aceptar o rechazar la
los
X t tales que t 1,2,..., N1 se asume normalmente distribuida con media 1 y
desviación estándar 1 Xt
. La segunda subserie definida por los tales que
t N1 1,..., N se asume normalmente distribuida con media 2 y desviación estándar
2.
N 22
NE 2
ˆ N 2 1 2 N 2 ˆ12 2 N 2 1ˆ1 2
N 2 2 1
ˆ1 2 12 [28]
Donde ˆ1 1 y ˆ1 2 son los coeficientes de autocorrelación de rezago 1 estimados para
las subseries uno y dos respectivamente.
Una varianza combinada de las dos subseries puede ser determinada mediante la
siguiente expresión:
NE1ˆ 12 NE 2ˆ 22
ˆ
2
NE1 NE 2 [29]
Donde
1 1 1
NE1 NE 2 NE1 NE 2
s 1
3 [31]
grado de libertad.
H 0 : x2 y2 H 1 : x2 y2
vs. [33]
Donde
H 0 y H 1 son las hipótesis nula y alternativa respectivamente.
Ésta prueba es no paramétrica y se asume que ambas muestras proviene que una
población con mediana conocida.
colocando una serie detrás de la otra. Para cada observación de la serie t un rango es
Z
asignado de la siguiente forma: se asigna rango 1 simultáneamente a la observación más
pequeña y más grande, rango 2 a las segundas más pequeña y más grande, etc. Si
N N1 N 2 es impar el conjunto de rangos se verá como
1,2,3...N 1 / 2, N 1 / 2, N 1 / 2....3,2,1 y si N es par, el conjunto se verá como
1,2,3...N / 2, N / 2,....3,2,1 Sy
. Un estadístico definido como:
N1
S y R X t
t 1 [34]
R X Xt Zt
Donde t representa el rango de la observación en la serie de la manera
descrita anteriormente.
E Sy
N1
4N
N 12 N N N
si 1 2 es impar [36]
Var S y
N1 N 2
48N 1
N 2N 2
i N N1 N 2 es par [37]
Var S y
N1 N 2
N 1 N 2 3
i N N1 N 2 es impar
2
48 N [38]
S r E S r
Uc
Var S r [39]
U c z 1 / 2
[40]
R N 2
T
1 R2 [41]
N : Tamaño de la muestra.
T t , N 2
6.1.6 Aplicación de las pruebas de hipótesis sobre las series sintéticas de caudales
Los outliers son observaciones atípicas, poco frecuentes – datos de una variable que
parecen no seguir la distribución característica de los datos restantes. Pueden representar
propiedades reales del fenómeno en estudio (variable), o ser debidas a errores en la
medición u otros errores que no deben ser modelizados.
Las pruebas estadísticas utilizadas para detección de outliers en las series de datos son:
X K * Sx [42]
Donde:
Los límites inferior y superior dados por el rango de la prueba están dados por:
3503Can_01 Rio caney 17/12/1999 23/10/1999 20/12/1999 22/08/1998 22/08/1998 08/07/1995 -7.61E-05
3503Can_02 Rio caney 17/12/1999 23/10/1999 20/12/1999 22/08/1998 22/08/1998 08/07/1995 -3.03E-05
3503Can_03 Rio caney 17/12/1999 20/12/1999 20/12/1999 22/08/1998 22/08/1998 08/07/1995 -1.30E-04
3503Sec_01 Caño seco 17/12/1999 25/10/1999 20/12/1999 22/08/1998 22/08/1998 08/07/1995 -8.00E-06
3503Sec_02 Caño seco 17/12/1999 25/10/1999 20/12/1999 22/08/1998 22/08/1998 08/07/1995 -4.89E-05
3503Sec_03 Caño seco 17/12/1999 25/10/1999 20/12/1999 22/08/1998 22/08/1998 08/07/1995 -5.55E-05
3503Car_01 Caño caraño 24/11/1999 24/11/1999 23/12/1999 27/05/1994 27/05/1994 07/07/1995 -1.79E-06
3503Car_02 Caño caraño 24/11/1999 24/11/1999 23/12/1999 27/05/1994 27/05/1994 07/07/1995 -7.61E-06
3503Car_03 Caño caraño 24/11/1999 24/11/1999 23/12/1999 27/05/1994 27/05/1994 07/07/1995 -7.83E-06
3503Upi_01 Rio Upín 24/11/1999 17/12/1999 23/12/1999 27/05/1994 27/05/1994 07/07/1995 -1.08E-04
3503Upi_02 Rio Upín 24/11/1999 17/12/1999 23/12/1999 27/05/1994 27/05/1994 07/07/1995 -1.42E-04
FORMULACION DEL PLAN DE ORDENAMIENTO DE LAS FUENTES HIDRICAS PRIORIZADAS EN JURISDICCIÓN DE CORMACARENA - CONTRATO
N° PS-GCT.2.7.010-375 16
Estación de monitoreo Cambio en la media Cambio en la varianza Tendencia
3503Upi_03 Rio Upín 24/11/1999 17/12/1999 23/12/1999 27/05/1994 27/05/1994 07/07/1995 -9.29E-04
3501Cam_01 Caño Camoa 05/05/2001 05/05/2001 03/05/2001 30/12/2001 11/09/2001 14/07/1995 4.51E-05
3501Cam_02 Caño Camoa 05/05/2001 05/05/2001 03/05/2001 30/12/2001 11/09/2001 14/07/1995 8.36E-05
FORMULACION DEL PLAN DE ORDENAMIENTO DE LAS FUENTES HIDRICAS PRIORIZADAS EN JURISDICCIÓN DE CORMACARENA - CONTRATO
N° PS-GCT.2.7.010-375 17
Estación de monitoreo Cambio en la media Cambio en la varianza Tendencia
3501Cam_03 Caño Camoa 05/05/2001 02/12/1994 03/05/2001 30/12/2001 11/09/2001 14/07/1995 1.55E-04
FORMULACION DEL PLAN DE ORDENAMIENTO DE LAS FUENTES HIDRICAS PRIORIZADAS EN JURISDICCIÓN DE CORMACARENA - CONTRATO
N° PS-GCT.2.7.010-375 18
6.2.1 Prueba de “Rango normalizado”.
Q max Q min
q
Sx [45]
Donde:
Con un valor crítico “q”, que depende del nivel de significancia “”. Si q > q , Qmax o
Qmin son valores atípicos. En este caso para un nivel de significancia = 0,05, q = 5,01.
6.2.2 Aplicación
Las pruebas de hipótesis para la detección de Outsiders fueron aplicadas sobre las series
de caudales diarias homogéneas, los resultados de dicha aplicación pueden ser
consultados en detalle en el Anexo 1. A manera de ejemplo en la Figura 6-1 se presenta
el análisis desarrollado para estimar los posibles valores anómalos (outliers) en la serie
homogénea de caudales medios diarios de la estación de monitoreo 3503Oco_08. Los
outliers detectados fueron removidos de la serie de tiempo y luego remplazados utilizando
el modelo lluvia escorrentía.