Produccion de Azucar
Produccion de Azucar
Produccion de Azucar
INTEGRANTE:
La industria azucarera en el Perú es una de las actividades más importantes en la economía de nuestro
país, por su contribución a la industria agrícola e industrial y por la generación de empleo. Hasta antes
de su expropiación y conversión al modelo cooperativista, la industria azucarera peruana era líder a
nivel latinoamericano; sin embargo, dicha posición se perdió como resultado del desmanejo de las
empresas azucareras en el largo lapso que operaron como empresas asociativas. Todos los indicadores,
tanto de producción, productividad y rentabilidad desmejoraron reflejando la crisis del sector, crisis
que comenzó a revertirse a partir de 1998 cuando las empresas azucareras abandonaron el modelo
cooperativo y comenzaron a recibir capitales frescos por el ingreso de socios estratégicos a las
empresas. Sin embargo, existen ciertos factores que afectan la rentabilidad en la industria como:
El precio interno del azúcar ha caído dramáticamente
El incremento promedio de 80% en los costos de insumos (Urea 320%) y equipos
importados (Brasil)
Entonces debido a que la industria azucarera es muy importante para nuestra economía, surge la
interrogante ¿Puedo explicar la producción de azúcar mediante diversos factores y conocer
matemáticamente si son influyentes para ésta? Por este motivo creemos conveniente efectuar el
siguiente trabajo para entender cómo se maneja la producción de azúcar y cuál es su funcionamiento
real.
Se toma como ámbito espacial a los departamentos de Ancash, Arequipa, Lambayeque, Lima y La
Libertad.
Problema general:
¿Cuál es la relación entre la producción de caña de azúcar de Perú, en el periodo 2010-2014, y el precio
de los insumos, el precio de azúcar, la superficie cosechada, la tasa de interés, el ingreso per cápita y el
clima (denominados variables explicativas); y de qué manera influyen sobre ésta?
Problemas Específicos:
Problema específico I:
¿Existe una relación estadísticamente significativa entre la producción de caña de azúcar y las
variables explicativas (el precio de los insumos, el precio de azúcar, la superficie cosechada, la tasa
de interés, el ingreso per cápita y el clima), en el Perú para el periodo 2010-2014?
¿De qué manera las variables explicativas que resultan significativas influyen en la producción de
caña de azúcar en el Perú para el periodo 2010-2014?
¿En cuántas toneladas las variables explicativas que resultan significativas afectan a la productividad
marginal de la caña de azúcar en el Perú para el periodo 2010-2014?
II. OBJETIVOS
Determinar la relación y de qué manera influyen las variables explicativas (el precio de los insumos, el
precio de azúcar, la superficie cosechada, la tasa de interés, el ingreso per cápita y el clima) en la
producción de caña de azúcar en el Perú para el periodo 2010-2014.
Objetivo específico I:
Determinar qué variables explicativas (el precio de los insumos, el precio de azúcar, la superficie
cosechada, la tasa de interés, el ingreso per cápita y el clima) son estadísticamente influyentes en
la producción de caña de azúcar en el Perú para el periodo 2010-2014.
Determinar de qué manera las variables explicativas que resultan significativas influyen en la
producción de caña de azúcar en el Perú para el periodo 2010-2014.
Objetivo específico III:
Determinar la cuantía (en toneladas) mediante la cual cada variable explicativa que resulta
significativa influye en la productividad marginal la caña de azúcar en el Perú para el periodo 2010-
2014.
III. JUSTIFICACION
Una de las peores consecuencias de la reforma agraria de la dictadura militar fue la desaparición de la
industria azucarera peruana. No solo colapsó la producción y se malograron los campos e ingenios,
sino que sus trabajadores también pasaron a una situación de miseria, con salarios nominales que nunca
se pagaban y niños desnutridos.
Los daños llegaron incluso al fútbol nacional, pues perdimos generaciones de jóvenes fuertes y bien
alimentados, acostumbrados a correr en los arenales, como los que otrora se lidiaban de igual a igual
con los jóvenes del resto del mundo y nos dieron tantas satisfacciones.
Con el regreso de la inversión privada al campo y, en este caso a los ingenios azucareros del norte,
hemos retomado la senda de crecimiento, mayor productividad y mejores condiciones de trabajo y vida
para miles de nuestros peruanos en el pujante ‘sólido norte’.
Debido a esto, la industria del azúcar se ha convertido en una de las industrias más importantes e
influyentes en la economía nacional
El cultivo de caña de azúcar en el Perú, es de gran potencial de producción, principalmente por las
condiciones óptimas de clima y suelo existentes, que ayudan a tener rendimientos muy buenos
alrededor 120 toneladas por hectárea, convirtiéndose en un factor competitivo importante, de este
cultivo se pueden extraer productos como el guarapo, azúcar rubia artesanal, chancaca y otros.
La caña de azúcar es producida a lo largo de todo el Perú en especial en la costa y algunas regiones de
la selva, este cultivo es de importancia económica y social para las distintas regiones productoras y el
país. Las características de este cultivo que su producción se realiza en un molino o trapiche,
generalmente empleado únicamente para la obtención del jugo de la caña con el cual preparar "mosto"
o "guarapo" o “ventisho”, que resulta de una primera fermentación, a su vez se produce azúcar, la
chancaca o panela, azúcar rubia artesanal y otros, la producción agroindustrial de este producto mejora
las condiciones económicas de los productores ayudando en su desarrollo. La producción de caña de
azúcar no tiene una estacionalidad definida por tanto la siembra y la cosecha se realiza durante todo el
año, permitiendo que los productores agroindustriales azucareros estén abastecidos permanentemente
de caña.
Es por eso que debido a la abundante información que se tiene, y por la falta de la implementación de
un modelo estadístico que pueda explicar cuál es el funcionamiento de esta industria, y además entender
cuáles son los principales factores influyentes en la producción de caña de azúcar.
4
IV. MARCO TEORICO
4.1 ANTECEDENTES
Los pronósticos de los niveles de humedad del suelo usando este modelo son bastante
buenos, calculados en campos de Casa Grande, Paramonga y Cartavio, y ha sido validado
en la industria azucarera de la costa del Perú, en variedades de caña de azúcar, con edades
mayores o iguales a cuatro meses hasta la cosecha.
Para la mayor parte del área cañera peruana, donde el agua es el factor limitante de la
producción, un régimen de riego eficiente debe ser determinado por una mayor productividad
media en términos de mayor índice de azúcar recuperable por unidad de volumen de agua
aplicada (t/m3) y no el índice que se usa generalmente, azúcar recuperable por unidad de
superficie (t/ha).
3. Estimación del rendimiento futuro de caña de azúcar usando el Modelo GCM- MRI y
un modelo de rendimiento de cultivos Universidad Nacional Agraria La Molina, Lima,
Perú
La caña de azúcar es uno de los cultivos más importantes a nivel mundial. Crece con relativa
facilidad en una amplia variedad de climas, y sus productos y subproductos tienen gran
relevancia para la subsistencia del hombre. Según las estadísticas de la FAO (2014), la
producción mundial de caña crece a una tasa promedio anual de 4%. En 2013, la producción
mundial excedió las 1800 millones de toneladas (FAO, 2014).
4.1.2Antecedentes internacionales
El objetivo general de este documento es identificar los principales problemas que afectan la
rentabilidad y competitividad de la cadena de valor de caña de azúcar en los departamentos
de Concepción y Canindeyú, estableciendo su situación actual. Aquí se presentan y analizan
los aspectos e informaciones más relevantes del funcionamiento de la cadena, la
comercialización y el consumo, a través de la interacción y el comportamiento de los actores
Ada uno de los eslabones.
También se analizan los problemas que confrontan los actores en los distintos eslabones que
integran la cadena, con la finalidad de crear las condiciones para superar los obstáculos que
pudieran detectarse y hacerla más competitiva en su conjunto.
La productividad en caña (127.59 t/ha) y azúcar (13 t/ha), obtenida en el 2002, se sitúa
por debajo de la lograda en 1973 que fue 176 t/ha y 18 t/ha respectivamente; si bien, la edad
promedio de corte descendió de 18.6 a 15.78 meses en el mismo lapso. En promedio se
obtiene 101 kg de azúcar por tonelada de caña, mientras que Colombia, país líder en la
producción de azúcar, en el 2001 obtuvo 119 kg por tonelada de caña de 12.14 meses. La
actual sobreproducción de azúcar en el mercado mundial, iniciada a comienzos de la década
del 90, ha originado una caída sostenida en el precio internacional a US $ 199 y US$ 273 por
tonelada de azúcar rubia y blanca respectivamente, por debajo del costo de producción
promedio mundial de US $ 320 por tonelada de azúcar de caña. Se estima que en el 2004 la
producción nacional superará a la demanda interna, generando un excedente productivo no
competitivo en el contexto internacional, considerando el alto costo de producción por
tonelada de azúcar que en el país es de aproximadamente US $ 364. Por otro lado, la
apertura comercial en el mediano plazo en los países miembros de la Comunidad Andina de
Naciones (CAN), que contempla la reducción de los aranceles, obliga a ser más competitivo,
incrementando la productividad o diversificando el cultivo de la caña de azúcar hacia otros
usos. Una alternativa es la producción de etanol, que en el 2002 tuvo una demanda de
aproximadamente 40 billones de litros, como combustible y aditivo de la gasolina,
principalmente en los EEUU, los países de la UE y Asia. La demanda potencial de etanol a
nivel nacional, para su uso como aditivo del 10% en la gasolina, se estima en 162 mil m3/año.
Otra alternativa potencial, es la producción de azúcar ecológica, que está teniendo una
creciente demanda en países desarrollados, como Canadá, Holanda y Dinamarca.
La caña de azúcar es uno de los cultivos más viejos en el mundo, se cree que empezó
hace unos 3.000 años como un tipo de césped en la isla de Nueva Guinea y de allí se extendió
a Borneo, Sumatra e India.
El proceso del azúcar se escuchó primero en la India tan temprano como en el 3.000
A.C.
Una leyenda local en las Islas de Salomón dice que los antepasados de la raza
humana se generaron de un tallo de la caña. Una corona hecha de caña de azúcar se
describe en el Atharvaveda, libro sagrado de los hindúes, escrito aproximadamente 800 A.C.
V. METODOLOGÍA
Descriptivo, pretendemos juntar información adecuada sobre el tema, especificar las características de
las variables relacionadas en nuestro estudio de investigación (producción, ingresos, clima y
superficie cosechada), es decir nos enfocaremos en describir el fenómeno de estudio tal como se
presenta en la realidad.
Explicativo, porque está dirigido a responder a las causas de los eventos físicos o sociales, dando a
conocer por qué ocurre un fenómeno, proceso o hecho (producción de azúcar), en qué condiciones se
da este o porque dos o más variables esta relacionadas.
ANÁLISIS DESCRIPTIVO
143662.3 1 640.4 64.38 910,64 20.8333 3.5 1,137 Nov Lima 2014
163021.32 1 640.4 63.58 923,84 20.8333 3.5 1,341 Dic Lima 2014
Al revisar nuestros datos, descubrimos que existen datos faltantes en ciertos meses en el
departamento de Arequipa (Ej.: Feb, Jul 2010, Ago 2011, etc.)
Clima
Min. 1st Qu. Median Mean 3rd Qu. Max.
20.83 21.00 21.40 22.12 23.40 23.95
La produccion de azúcar está altamente correlacionada con la variable superficie cosechada (0.964
35), esto indica que la producción está en función de la variable superficie cosechada principalme
nte.
ANÁLISIS EXPLICATIVO
donde:
𝛽0 , 𝛽1 , 𝛽2 ,…𝛽𝑝 : parámetros, miden la influencia que las variables explicativas tienen sobre la
variable explicada.
𝛽0 la intersección o término "constante", las 𝛽1 , 𝛽2 ,…𝛽𝑝 son los parámetros respectivos a cada
variable independiente, y p es el número de parámetros independientes a tener en cuenta en
la regresión.
Modelo de regresión
ANOVAa
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 7056292544128 6 1176048757354 1011,079 ,000b
,690 ,782
Residuo 340806546010, 293 1163162273,07
455 3
Total 7397099090139 299
,145
a. Variable dependiente: Producción
b. Predictores: (Constante), Superficie_cose, Costo_ferti, Clima, Precio, Ingreso, Tasa_inte
Coeficientesa
Coeficientes
Coeficientes no estandarizados estandarizados
Modelo B Desv. Error Beta t Sig.
1 (Constante) 338780,528 42555,375 7,961 ,000
Ingreso 27,487 9,809 ,045 2,802 ,005
Precio 35,541 89,639 ,007 ,396 ,692
Costo_ferti -24,465 19,734 -,028 -1,240 ,216
Clima -16509,954 1617,688 -,136 -10,206 ,000
Tasa_inte 2094,207 3350,932 ,012 ,625 ,532
Superficie_cose 133,745 1,978 ,996 67,604 ,000
a. Variable dependiente: Producción
Se observa que hay 3 variables que no son significativas a un nivel del 5% (Precio, Costo de
fertilizante y tasa de interés)
El Coeficiente de Determinación (R2) es 95.4% con el cual el modelo queda muy bien
explicado por las 5 variables explicativas.
LuegoLas variables precio, costo_fertilizantes y tasa_interes no son significativos (a un nivel de
significancia del 5%), por lo cual se excluyen con el objetivo de mejorar el modelo.
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 323.962746 40.598089 7.980 3.25e-14 ***
ingreso 0.028135 0.009153 3.074 0.00231 **
clima -16.455969 1.603772 -10.261 < 2e-16 ***
sup_cosechada 0.133815 0.001929 69.372 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Los indicadores 𝑅 2 = 95.36% y 𝑅 2 − 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 = 95.31% nos indican que el modelo es adecuado
Análisis de varianza
Supuesto de Normalidad
Mediante el histograma apreciamos que no tiene la forma acampanada ni tampoco hay simetría, por
ello podemos afirmar que los residuales no se ajustan a una distribución normal
En la gráfica se aprecia que los residuales no se ajustan a la recta norma, es decir que no siguen
una distribución normal. Utilizamos pruebas estadísticas con el propósito de verificar dicha
observación.
Pruebas estadísticas
Nivel de significancia: 5%
Anderson-Darling normality test
data: error
A = 2.2099, p-value = 1.284e-05
data: error
D = 0.066384, p-value = 0.002808
data: error
P = 81.733, p-value = 1.885e-10
data: error
W = 0.96733, p-value = 8.994e-06
data: error
JB = 32.538, p-value < 2.2e-16
En todo los test el p-value < 0.05, entonces se rechaza Ho. Concluimos que los residuales no se aju
stan a una distribución normal.
El modelo no cumple el supuesto de normalidad, para solucionar este problema se realiza la transfo
rmación de box cox
lambda: 𝜆 = 0.35
𝑌 ∗ = 𝑌 0.35
head(data$produccion)
8.894956
8.910681
8.960252
6.694924
8.764045
8.668424
El modelo
Supuesto de Normalidad
Mediante el histograma apreciamos que tiene la forma acampanada y también hay simetría, por ello
podemos afirmar que los residuales se ajustan a una distribución normal
En la gráfica se observa que los residuales se ajustan mejor a la línea normal, es posible que los
residuales se ajusten a una distribución normal.
Pruebas estadísticas
Nivel de significancia: 5%
data: error1
D = 0.06477, p-value = 0.00404
data: error1
P = 35.733, p-value = 0.004977
data: error1
B = 0.32859, p-value = 0.014
data: error1
W = 0.99123, p-value = 0.06712
data: error1
JB = 0.15055, p-value = 0.9185
data: error1
d = 0.78666, p-value = 0.828
data: error1
T = 2.9979, p-value = 0.995
data: error1
T = -0.054862, p-value = 0.684
data: error1
WB = 0.99123, p-value = 0.0615
data: error1
T.138 = 1.2712, p-value = 0.148
Los cuatro primeros test resultaron significativos (p-values < 0.05), mientras que los siete siguientes
test resultaron no significativos (p-values > 0.05). Como la mayoría de los test resultaron no significa
tivos, entonces no se rechaza Ho. Concluimos que los residuales se ajustan a una distribución norm
al, comprobando el supuesto de normalidad.
Supuesto de Homocedasticidad
Se aprecia en la gráfica que los datos no tienen un comportamiento desordenado y disperse por la
region, por lo contrario se observa un tendencia cuadrática. Esto indica que posiblemente no se
está cumpliendo el supuesto de homocedasticidad
Nivel de significancia: 5%
Suma de cuadrados residual: SCR = 829.9
𝑒2
̂2
= 𝛼0 + 𝛼1 ∗ 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 𝛼2 *clima + 𝛼3 ∗ 𝑠𝑢𝑝_𝑐𝑜𝑠𝑒𝑐ℎ𝑎𝑑𝑎 + u
𝜎
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
ingreso 1 1.02 1.019 0.5596 0.4550
clima 1 59.06 59.063 32.4254 2.984e-08 ***
sup_cosechada 1 0.12 0.118 0.0648 0.7993
Residuals 296 539.17 1.822
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
2
𝑋(5%,3) = 7.815
2
BP > 𝑋(5%,3) , entonces se rechaza Ho
De la misma manera tampoco se cumple el supuesto de independencia, esto nos lleva a plantear
otro modelo más adecuado.
La información se recolecto por 5 años (2010-2014) y por región (Ancash, La libertad, Lambayeque,
Lima y Arequipa), y como sabemos la producción de azúcar cambia año tras año, así como también
que la producción dependerá de la región donde es cosecha. Por estos motivos se construyen
modelos por cada región.
Región Ancash
El modelo
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -84.669595 11.789652 -7.182 1.58e-09 ***
datanc1$ingreso 0.090804 0.012228 7.426 6.20e-10 ***
datanc1$sup_cosechada 0.125622 0.004726 26.584 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Análisis de varianza
Response: datanc1$produccion
Df Sum Sq Mean Sq F value Pr(>F)
datanc1$ingreso 1 3973.4 3973.4 122.01 8.658e-16 ***
datanc1$sup_cosechada 1 23014.2 23014.2 706.69 < 2.2e-16 ***
Residuals 57 1856.3 32.6
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Región Lambayeque
El modelo
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 157.134895 31.874798 4.930 7.46e-06 ***
datlab1$ingreso -0.148668 0.040503 -3.671 0.000535 ***
datlab1$sup_cosechada 0.087031 0.004651 18.713 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Análisis de varianza
Response: datlab1$produccion
Df Sum Sq Mean Sq F value Pr(>F)
datlab1$ingreso 1 748 748 1.816 0.1831
datlab1$sup_cosechada 1 144150 144150 350.175 <2e-16 ***
Residuals 57 23464 412
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.713e+02 5.744e+01 -2.983 0.004199 **
datlibt1$ingreso 2.160e-01 5.601e-02 3.857 0.000295 ***
datlibt1$sup_cosechada 1.305e-01 7.573e-03 17.227 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Análisis de varianza
Response: datlibt1$produccion
Df Sum Sq Mean Sq F value Pr(>F)
datlibt1$ingreso 1 40773 40773 34.302 2.466e-07 ***
datlibt1$sup_cosechada 1 352739 352739 296.756 < 2.2e-16 ***
Residuals 57 67753 1189
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Región Lima
El modelo
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -49.51814 15.98193 -3.098 0.00302 **
datlima1$ingreso 0.05623 0.01145 4.909 8.03e-06 ***
datlima1$sup_cosechada 0.09779 0.01057 9.247 6.10e-13 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Response: datlima1$produccion
Df Sum Sq Mean Sq F value Pr(>F)
datlima1$ingreso 1 8836.6 8836.6 86.420 5.086e-13 ***
datlima1$sup_cosechada 1 8744.1 8744.1 85.516 6.103e-13 ***
Residuals 57 5828.4 102.3
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Región Arequipa
El modelo
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.365e+04 2.791e+03 -4.891 8.57e-06 ***
datarp1$ingreso 8.729e+00 2.102e+00 4.153 0.000111 ***
datarp1$sup_cosechada 1.389e+02 6.737e-01 206.228 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Análisis de varianza
Response: datlarp1$produccion
Df Sum Sq Mean Sq F value Pr(>F)
datarp1$ingreso 1 1.6364e+10 1.6364e+10 6503.2 < 2.2e-16 ***
datarp1$sup_cosechada 1 1.0702e+11 1.0702e+11 42530.1 < 2.2e-16 ***
Residuals 57 1.4343e+08 2.5163e+06
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Script 1
base<-read.csv(file.choose(), head=T)
View(base)
data<-base[,1:7]
head(data)
data$produccion<-data$produccion/1000
head(data)
summary(data$clima)
plot(data)
cor(data)
plot(data$ingreso,data$produccion)
plot(data$precio,data$produccion)
plot(data$costo_fertilizantes,data$produccion)
plot(data$clima,data$produccion)
plot(data$tasa_interes,data$produccion)
cor(data$produccion,data$sup_cosecha)
main="Producción de azucar")
###modelo de regresion
attach(data)
#las variables precio, costo_fertilizantes y taasa_interes no son sinificcativas
modelo1<-lm(produccion~ingreso#+precio+costo_fertilizantes
+clima#+tasa_interes
+sup_cosechada,data = data)
summary(modelo1)
View(anova(modelo1))
prodc_est<-modelo1$fitted.values
error<-modelo1$residuals
plot(prodc_est,error)
#supuesto de normalidad
qqnorm(error)
qqline(error)
install.packages("nortest")
install.packages("normtest")
library(nortest)
library(normtest)
ad.test(error)
lillie.test(error)
pearson.test(error)
sf.test(error)
jb.norm.test(error)
install.packages("fpp")
install.packages("tseries")
library(tseries)
library(fpp)
data$produccion<-BoxCox(data$produccion,lambda)
modelo2<-lm(produccion~ingreso#+precio+costo_fertilizantes
+clima#+tasa_interes
+sup_cosechada,data = data)
summary(modelo2)
View(anova(modelo2))
prodc_est1<-modelo2$fitted.values
error1<-modelo2$residuals
plot(prodc_est1,error1)
#supuesto de normalidad
qqnorm(error1)
qqline(error1)
boxplot(error1)
ad.test(error1)
lillie.test(error1)
pearson.test(error1)
sf.test(error1)
jb.norm.test(error1)
geary.norm.test(error1)
frosini.norm.test(error1)
kurtosis.norm.test(error1)
skewness.norm.test(error1)
wb.norm.test(error1)
spiegelhalter.norm.test(error1)
install.packages("zoo")
install.packages("lmtest")
library(lmtest)
library(zoo)
dwtest(modelo2,alternative="two.sided") #Durbin-watson
install.packages("score")
install.packages("car")
library("car")
library("score")
ncvTest(modelo2)
#pruba de Breusch-Pagan
aov(modelo2)
var_est<-829.9/300#varianza esimada
head(y)
sum(y)
mod<-lm(y~ingreso#+precio+costo_fertilizantes
+clima#+tasa_interes
+sup_cosechada,data = data)
#SCE=1.02+59.06+0.12=60.2
install.packages("Johnson")
library(Johnson)
john<-RE.Johnson(data$produccion)
john
modelo3<-lm(y~data$ingreso #+dat1$precio+dat1$costo_fertilizantes#
+data$clima+#3dat1$tasa_interes
+data$sup_cosechada,data = data)
summary(modelo3)
View(anova(modelo2))
prodc_est2<-modelo3$fitted.values
error2<-modelo3$residuals
plot(prodc_est2,error2)
#supuesto de normalidad
qqnorm(error2)
qqline(error2)
ad.test(error2)
lillie.test(error2)
pearson.test(error2)
sf.test(error2)
jb.norm.test(error2)
geary.norm.test(error2)
frosini.norm.test(error2)
kurtosis.norm.test(error2)
skewness.norm.test(error2)
wb.norm.test(error2)
spiegelhalter.norm.test(error2)
#cambio estructural
install.packages("gap")
library(gap)
chow.test(dat1$produccion[1:60],dat1$sup_cosechada[1:60],dat1$produccion[61:120],dat1$sup_cos
echada[61:120])
#2010
dat2010<-read.delim("clipboard", head=T)
dat12010<-dat2010[,1:7]
dat12010$produccion<-dat12010$produccion/1000
attach(dat12010)
plot(dat12010)
mod2010<-lm(produccion~ingreso+precio+costo_fertilizantes
+clima+tasa_interes+sup_cosechada,data = dat12010)
mod2010<-lm(produccion~ingreso+clima+sup_cosechada,data = dat12010)
summary(mod2010)
anova(mod2010)
#2011
dat2011<-read.delim("clipboard", head=T)
dat12011<-dat2010[,1:7]
dat12011$produccion<-dat12011$produccion/1000
detach(dat12011)
plot(dat12011)
mod2011<-lm(produccion~ingreso+precio+costo_fertilizantes
+clima+tasa_interes+sup_cosechada,data = dat12011)
mod2011<-lm(dat12011$produccion~dat12011$ingreso+clima
+dat12011$sup_cosechada,data = dat12011)
summary(mod2011)
anova(mod2011)
#region Ancash
datanc<-read.delim("clipboard", head=T)
datanc1<-datanc[,1:7]
datanc1$produccion<-datanc1$produccion/1000
attach(datancash1)
modanc<-lm(produccion~ingreso+precio+costo_fertilizantes
+tasa_interes+sup_cosechada+año,data = datancash1)
modanc<-lm(datanc1$produccion~datanc1$ingreso
+datanc1$sup_cosechada,data = datanc1)
summary(modanc)
anova(modanc)
#regionlambayeque
datlab<-read.delim("clipboard", head=T)
datlab1<-datlab[,1:7]
datlab1$produccion<-datlab1$produccion/1000
modlab<-lm(produccion~ingreso+precio+costo_fertilizantes
+tasa_interes+sup_cosechada+año,data = datancash1)
#la tasa de interes y el año no son significativas
modlab<-lm(datlab1$produccion~datlab1$ingreso
+datlab1$sup_cosechada,data = datlab1)
summary(modlab)
anova(modlab)
#region lima
datlima<-read.delim("clipboard", head=T)
datlima1<-datlima[,1:7]
datlima1$produccion<-datlima1$produccion/1000
modlima<-lm(produccion~ingreso+precio+costo_fertilizantes
+tasa_interes+sup_cosechada+año,data = datancash1)
modlima<-lm(datlima1$produccion~datlima1$ingreso
+datlima1$sup_cosechada,data = datlima1)
summary(modlima)
anova(modlima)
#region Arequipa
datarp<-read.delim("clipboard", head=T)
datarp1<-datlarp[,1:7]
datarp1$produccion<-datarp1$produccion/1000
modarp<-lm(produccion~ingreso+precio+costo_fertilizantes
+tasa_interes+sup_cosechada+año,data = datancash1)
modarp<-lm(datlarp1$produccion~datarp1$ingreso
+datarp1$sup_cosechada,data = datlarp1)
summary(modarp)
anova(modarp)