Produccion de Azucar

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 34

“MODELO EXPLICATIVO DEL FUNCIONAMIENTO DE LA

PRODUCCION DE LA CAÑA DE AZUCAR EN EL PERU–


PERIODO 2010 AL 2014”

INTEGRANTE:

o Jose Carlos Ccorimanya Conchatupa

CURSO: METODOS ECONOMETRICOS


PROFESOR: SAAVEDRA PACHECO, JOSÉ
INDICE

I. PLANTEAMIENTO DEL PROBLEMA .......................................................................................... 2


1.1 Descripción y ubicación ............................................................................................................... 2
1.1.1 Localidad: ..................................................................................................................... 2
1.1.2 Realidad problemática (descripción del problema) .................................................................... 2
1.1.2 Ámbito espacial donde se produce el problema: ................................................................. 2
1.1.3 Ámbito temporal donde se ubica el problema: .................................................................... 2
1.2 Formulación del problema. ........................................................................................................... 2
Problema general: ............................................................................................................................ 2
Problemas Específicos: ..................................................................................................................... 3
II. OBJETIVOS .............................................................................................................................. 3
2.1 Objetivo general: ........................................................................................................................ 3
2.2 Objetivos Específicos: ................................................................................................................. 3
III. JUSTIFICACION .......................................................................................................................... 4
IV. MARCO TEORICO ....................................................................................................................... 5
4.1 ANTECEDENTES...................................................................................................................... 5
4.1.1 Antecedentes nacionales .................................................................................................. 5
4.1.2 Antecedentes internacionales ...................................................................................... 7
4.2 BASES TEÓRICAS .................................................................................................................. 8
4.2.1 Variable Dependiente: Producción de Azúcar .............................................................. 8
4.2.1.2. Producción de azúcar en el Perú ................................................................................. 10
V. METODOLOGÍA ........................................................................................................................ 10
5.1 Tipo de la investigación ............................................................................................................. 10
5.2 Nivel de Investigación ............................................................................................................... 11
I. PLANTEAMIENTO DEL PROBLEMA

1.1 Descripción y ubicación


1.1.1 Localidad:

La investigación se desarrolla en la República del Perú, específicamente en las regiones de Ancash,


Arequipa, Lambayeque, Lima y La Libertad; las cuales son las que producen la caña de azúcar.

1.1.2 Realidad problemática (descripción del problema)

La industria azucarera en el Perú es una de las actividades más importantes en la economía de nuestro
país, por su contribución a la industria agrícola e industrial y por la generación de empleo. Hasta antes
de su expropiación y conversión al modelo cooperativista, la industria azucarera peruana era líder a
nivel latinoamericano; sin embargo, dicha posición se perdió como resultado del desmanejo de las
empresas azucareras en el largo lapso que operaron como empresas asociativas. Todos los indicadores,
tanto de producción, productividad y rentabilidad desmejoraron reflejando la crisis del sector, crisis
que comenzó a revertirse a partir de 1998 cuando las empresas azucareras abandonaron el modelo
cooperativo y comenzaron a recibir capitales frescos por el ingreso de socios estratégicos a las
empresas. Sin embargo, existen ciertos factores que afectan la rentabilidad en la industria como:
 El precio interno del azúcar ha caído dramáticamente
 El incremento promedio de 80% en los costos de insumos (Urea 320%) y equipos
importados (Brasil)
Entonces debido a que la industria azucarera es muy importante para nuestra economía, surge la
interrogante ¿Puedo explicar la producción de azúcar mediante diversos factores y conocer
matemáticamente si son influyentes para ésta? Por este motivo creemos conveniente efectuar el
siguiente trabajo para entender cómo se maneja la producción de azúcar y cuál es su funcionamiento
real.

1.1.2 Ámbito espacial donde se produce el problema:

Se toma como ámbito espacial a los departamentos de Ancash, Arequipa, Lambayeque, Lima y La
Libertad.

1.1.3 Ámbito temporal donde se ubica el problema:

El estudio está enfocado entre los años 2010-2014.

1.2 Formulación del problema.

Problema general:

¿Cuál es la relación entre la producción de caña de azúcar de Perú, en el periodo 2010-2014, y el precio
de los insumos, el precio de azúcar, la superficie cosechada, la tasa de interés, el ingreso per cápita y el
clima (denominados variables explicativas); y de qué manera influyen sobre ésta?
Problemas Específicos:

 Problema específico I:

¿Existe una relación estadísticamente significativa entre la producción de caña de azúcar y las
variables explicativas (el precio de los insumos, el precio de azúcar, la superficie cosechada, la tasa
de interés, el ingreso per cápita y el clima), en el Perú para el periodo 2010-2014?

 Problema específico II:

¿De qué manera las variables explicativas que resultan significativas influyen en la producción de
caña de azúcar en el Perú para el periodo 2010-2014?

 Problema específico III:

¿En cuántas toneladas las variables explicativas que resultan significativas afectan a la productividad
marginal de la caña de azúcar en el Perú para el periodo 2010-2014?

II. OBJETIVOS

2.1 Objetivo general:

Determinar la relación y de qué manera influyen las variables explicativas (el precio de los insumos, el
precio de azúcar, la superficie cosechada, la tasa de interés, el ingreso per cápita y el clima) en la
producción de caña de azúcar en el Perú para el periodo 2010-2014.

2.2 Objetivos Específicos:

 Objetivo específico I:

Determinar qué variables explicativas (el precio de los insumos, el precio de azúcar, la superficie
cosechada, la tasa de interés, el ingreso per cápita y el clima) son estadísticamente influyentes en
la producción de caña de azúcar en el Perú para el periodo 2010-2014.

 Objetivo específico II:

Determinar de qué manera las variables explicativas que resultan significativas influyen en la
producción de caña de azúcar en el Perú para el periodo 2010-2014.
 Objetivo específico III:

Determinar la cuantía (en toneladas) mediante la cual cada variable explicativa que resulta
significativa influye en la productividad marginal la caña de azúcar en el Perú para el periodo 2010-
2014.

III. JUSTIFICACION

Una de las peores consecuencias de la reforma agraria de la dictadura militar fue la desaparición de la
industria azucarera peruana. No solo colapsó la producción y se malograron los campos e ingenios,
sino que sus trabajadores también pasaron a una situación de miseria, con salarios nominales que nunca
se pagaban y niños desnutridos.

Los daños llegaron incluso al fútbol nacional, pues perdimos generaciones de jóvenes fuertes y bien
alimentados, acostumbrados a correr en los arenales, como los que otrora se lidiaban de igual a igual
con los jóvenes del resto del mundo y nos dieron tantas satisfacciones.

Con el regreso de la inversión privada al campo y, en este caso a los ingenios azucareros del norte,
hemos retomado la senda de crecimiento, mayor productividad y mejores condiciones de trabajo y vida
para miles de nuestros peruanos en el pujante ‘sólido norte’.

Debido a esto, la industria del azúcar se ha convertido en una de las industrias más importantes e
influyentes en la economía nacional

El cultivo de caña de azúcar en el Perú, es de gran potencial de producción, principalmente por las
condiciones óptimas de clima y suelo existentes, que ayudan a tener rendimientos muy buenos
alrededor 120 toneladas por hectárea, convirtiéndose en un factor competitivo importante, de este
cultivo se pueden extraer productos como el guarapo, azúcar rubia artesanal, chancaca y otros.

La caña de azúcar es producida a lo largo de todo el Perú en especial en la costa y algunas regiones de
la selva, este cultivo es de importancia económica y social para las distintas regiones productoras y el
país. Las características de este cultivo que su producción se realiza en un molino o trapiche,
generalmente empleado únicamente para la obtención del jugo de la caña con el cual preparar "mosto"
o "guarapo" o “ventisho”, que resulta de una primera fermentación, a su vez se produce azúcar, la
chancaca o panela, azúcar rubia artesanal y otros, la producción agroindustrial de este producto mejora
las condiciones económicas de los productores ayudando en su desarrollo. La producción de caña de
azúcar no tiene una estacionalidad definida por tanto la siembra y la cosecha se realiza durante todo el
año, permitiendo que los productores agroindustriales azucareros estén abastecidos permanentemente
de caña.

Es por eso que debido a la abundante información que se tiene, y por la falta de la implementación de
un modelo estadístico que pueda explicar cuál es el funcionamiento de esta industria, y además entender
cuáles son los principales factores influyentes en la producción de caña de azúcar.

4
IV. MARCO TEORICO

4.1 ANTECEDENTES

4.1.1 Antecedentes nacionales

1. Pronostico de Riego en Caña de Azúcar, Universidad Nacional Agraria La Molina


UNALM, Lima Perú.

El presente artículo investiga la importancia conjunta de los programas de riego para la


sistematización de la administración del riego de los cultivos, en especial para los de periodo
vegetativo largo.

Los pronósticos de los niveles de humedad del suelo usando este modelo son bastante
buenos, calculados en campos de Casa Grande, Paramonga y Cartavio, y ha sido validado
en la industria azucarera de la costa del Perú, en variedades de caña de azúcar, con edades
mayores o iguales a cuatro meses hasta la cosecha.

El aumento de las eficiencias en el manejo del agua de riego, se logra mejorando la


infraestructura existente y despejando las interrogantes ¿Cuando, con cuanto y como regar?
Estas interrogantes se resuelven mediante estudios de consumo de agua por el cultivo,
funciones de producción del agua y el conocimiento de la capacidad de almacenamiento e
infiltración de los suelos, fundamentalmente.

Para la mayor parte del área cañera peruana, donde el agua es el factor limitante de la
producción, un régimen de riego eficiente debe ser determinado por una mayor productividad
media en términos de mayor índice de azúcar recuperable por unidad de volumen de agua
aplicada (t/m3) y no el índice que se usa generalmente, azúcar recuperable por unidad de
superficie (t/ha).

2.- La industria azucarera peruana en el contexto internacional y la posible firma del


TLC con los Estados Unidos, MINCETUR, Perú.

La evolución de la industria azucarera nacional en las últimas tres décadas muestra a un


sector que de ser exportador neto de más de la mitad de su producción hasta los 1970s pasó
a ser importador neto y estar crecientemente orientado al mercado interno en las últimas dos
décadas. Las empresas azucareras fueron cooperativizadas por el gobierno de Velasco, y
enfrentaron crecientes problemas externos (control de precios y menos crédito) así como
internos (problemas de gestión), con lo cual este sector se fue descapitalizando y perdiendo
presencia en los mercados mundiales. La crisis azucarera se profundizó en la década de los
1980s ante la caída de los precios mundiales y los crecientes problemas para abastecer al
inestable mercado interno. Durante la primera mitad de la década de los 1990s el Perú se
convirtió en un país importador neto de azúcar. Esto llevó a iniciar un cambio de política
desde 1996 con la finalidad de atraer inversionistas privados para el reflotamiento de este
sector.

Este proceso de re-estructuración empresarial ha tenido a la fecha resultados positivos pero


parciales. En los últimos cinco años el Perú ha incrementado su producción hasta
prácticamente cubrir el mercado interno tanto de consumo final como consumo industrial.
Esta expansión productiva ha sido diferenciada, identificándose tres sectores distintos. Un
primer grupo está compuesto por las empresas que lograron atraer socios comerciales que
han reorientado completamente las prácticas empresariales e invertidas en mejoras
significativas en campo, ingenios y sistemas de mercadeo. Este sector viene liderando el
crecimiento. Un segundo grupo, más pequeño, tiene empresas que no han atraído un socio
comercial aún, pero que han conseguido adaptarse a las nuevas condiciones del mercado y
vienen generando resultados positivos. El tercer grupo está compuesto por empresas en una
crisis muy seria y que no han logrado atraer inversión privada. Este grupo es de particular
importancia dado su peso específico en la producción.

Esta evolución ha venido acompañada de un aumento significativo en el nivel de protección


a este producto vía la franja de precios, que ha colocado la diferencia entre precio
internacional y precio de internamiento en un 120%. Bajo este escenario el precio doméstico
de azúcar se ha incrementado significativamente hacia fines del año 2003, generando
durante el presente año algunos conflictos con los sectores de consumidores y utilizadores
industriales. Es en este contexto que se viene negociando un tratado de libre comercio (TLC)
con los Estados Unidos, dentro de una política comercial más amplia del Gobierno Peruano.

La política azucarera del gobierno de los Estados Unidos se concentra en el llamado


“programa azucarero”, con dos instrumentos básicos: el sistema de cuotas a la importación;
y un sistema de precios mínimos de soporte a los productores.

3. Estimación del rendimiento futuro de caña de azúcar usando el Modelo GCM- MRI y
un modelo de rendimiento de cultivos Universidad Nacional Agraria La Molina, Lima,
Perú

La caña de azúcar es uno de los cultivos más importantes a nivel mundial. Crece con relativa
facilidad en una amplia variedad de climas, y sus productos y subproductos tienen gran
relevancia para la subsistencia del hombre. Según las estadísticas de la FAO (2014), la
producción mundial de caña crece a una tasa promedio anual de 4%. En 2013, la producción
mundial excedió las 1800 millones de toneladas (FAO, 2014).

El Perú no es ajeno a esta realidad, si bien su producción es inferior a la de grandes


productores como Brasil, India o China, tiene un clima óptimo para su cultivo y por esto se
encuentra entre los países con mejor producción de caña por hectárea (FAO, 2014). La
producción interna crece anualmente a una tasa promedio de 3%, y en el año 2013 fue de
casi 11 millones de toneladas {FAO, 2014). Siendo la caña de azúcar un producto relevante
para la economía, cabe preguntarse cómo será su comportamiento frente al Cambio
Climático, sabiendo que el Perú es considerado uno de los países más vulnerables a este
fenómeno (Vargas, 2009).

Actualmente, los avances en la comprensión de los fenómenos climáticos y las mejoras


tecnológicas, en particular la capacidad de procesamiento de datos, permiten hacer
estimaciones del clima futuro bajo distintos escenarios. Los modelos de circulación general,
GCM por sus siglas en inglés, son una de las herramientas más sofisticadas para este fin.
Por otro lado, se han desarrollado robustas aplicaciones informáticas que permiten simular
la respuesta de los cultivos a su entorno. En el presente trabajo se utilizan dos modelos: el
modelo climático GCM-MRI 20-3.1s para estimar el comportamiento de la temperatura,
máxima y mínima, en el futuro cercano {2020 - 2039) y lejano {2080-2099), y el modelo
dinámico de crecimiento de cultivos AquaCrop - FAO para estimar la respuesta de la
producción y rendimiento de la caña de azúcar en la costa norte del Perú a las variaciones
de temperatura.

4.1.2Antecedentes internacionales

1. Caña de Azúcar: Análisis de la cadena de valor en Concepción y Canindeyú – ACDI


VOCA

Se pretenden analizar las características técnicas y económicas de la cadena de valor,


ubicando los factores determinantes de sus niveles de rentabilidad y competitividad ante el
mercado. Con base en lo anterior, el programa Iniciativa Zona Norte a través del acuerdo de
cooperación entre ACDI/VOCA y USAID, impulsó la realización de este trabajo para
determinar mejores bases de coordinación y participación de los representantes de
empresas, organizaciones, instituciones y otros agentes que inciden determinantemente en
el funcionamiento de la cadena de valor.

El objetivo general de este documento es identificar los principales problemas que afectan la
rentabilidad y competitividad de la cadena de valor de caña de azúcar en los departamentos
de Concepción y Canindeyú, estableciendo su situación actual. Aquí se presentan y analizan
los aspectos e informaciones más relevantes del funcionamiento de la cadena, la
comercialización y el consumo, a través de la interacción y el comportamiento de los actores
Ada uno de los eslabones.

También se analizan los problemas que confrontan los actores en los distintos eslabones que
integran la cadena, con la finalidad de crear las condiciones para superar los obstáculos que
pudieran detectarse y hacerla más competitiva en su conjunto.

A la vez se busca conjugar la información necesaria para entender su funcionamiento,


problemática y necesidades, generando un documento base para integrar el plan de acción
dentro de la cadena con un enfoque participativo entre los diferentes agentes que intervienen
en su desarrollo.

2. Factors Affecting Sugarcane Production in Pakistan

La caña de azúcar es una importante cosecha de efectivo de Pakistán y juega un papel


importante en el aumento de las condiciones socioeconómicas de los productores. El rápido
crecimiento de la industria azucarera ha contribuido al desarrollo económico del país. La caña
de azúcar es la mayor fuente de ingresos para el gobierno porque este cultivo recauda miles
de millones de rupias en el gobierno en forma de derechos e impuestos. En el progreso
industrial reciente la caña de azúcar no sólo se limita a la producción de azúcar, sino también
a sus bi-productos como el alcohol, tableros de aglomerado y docenas de otros compuestos
químicos industriales y se pueden fabricar durante la elaboración de la caña de azúcar.
Pakistán ocupa la quinta posición en términos de producción de caña de azúcar y 7º y 8º en
términos de producción y consumo de azúcar respectivamente en el mundo. Por desgracia,
el país se encuentra en un nivel muy bajo de alrededor de 4 tono / hectárea. En la actualidad,
el cultivo de caña de azúcar en Pakistán ocupa el 5% de la superficie cultivada total y
representa el 17% del valor agregado bruto de todos los cultivos.

En Pakistán, la caña de azúcar se planta ampliamente en las provincias de Sindh, Punjab y


NWFP. La Producción de caña de azúcar más alta se registró en Punjab con un rendimiento
690mds / acre durante el año 2007-08, mientras que el menor rendimiento de caña de azúcar
fue registrado para la provincia NWFP con un rendimiento promedio de 566mds / acre
durante el mismo año. El rendimiento promedio de caña de azúcar en los últimos años oscila
entre 45 y 50 ton / hectárea. Es uno de los más pobres entre los 16 países productores de
caña de azúcar como cultivo principal. El rendimiento de la caña de azúcar es bastante bajo,
500-800 mds / acre, considerablemente menor que los rendimientos potenciales. La brecha
entre el rendimiento potencial y real es muy amplia debido a las malas prácticas de manejo
y las pérdidas poscosecha. También se encuentra que el sistema de producción de caña de
azúcar ha pasado de generaciones anteriores y es dominante entre los productores. Los
métodos tradicionales son comúnmente utilizados en la gestión de caña de azúcar y la mano
de obra es un insumo importante en el proceso de producción de caña de azúcar. El proceso
de producción no es mecanizado y es mayormente laborioso. La mayoría de los agricultores
no siguen las prácticas modernas como el uso adecuado de FYM, inter-cultivo, aplicación de
fertilizantes, aerosoles y riego oportuno. Los problemas de las pérdidas posteriores a la
cosecha incluyen el manejo inadecuado, la cosecha y las instalaciones de transporte
inadecuadas. Por lo tanto, este estudio se llevó a cabo para investigar los principales factores
que afectan la producción de caña de azúcar en Pakistán

3. Manual de Producción de Caña de Azúcar, Honduras

La caña de azúcar representa el cultivo más importante en la producción de endulzante


en el mundo. El área total en producción es de 19.24 millones de hectáreas distribuidos
en Asia 42.5%, América 47.7% y en África y Oceanía cultivan 7.4% y 2.4%,
respectivamente. Además de la producción de azúcar provee subproductos como el etanol
para uso energético, etanol hidratado (con 4 ó 5% de agua) para motores de explosión,
generación de energía eléctrica y materia prima para alimentación animal. Zamorano no
cuenta con un manual de producción de caña de azúcar que pueda contribuir al
aprendizaje teórico-práctico de los estudiantes, para este efecto, se elaboró este manual
con base en la revisión de literatura y en su mayor parte la experiencia obtenida durante
el programa de prácticas externas en los Ingenios cañeros de La Unión y Pantaleón,
líderes en Guatemala y Centroamérica en tecnología, eficiencia productiva, organización
y trabajo en equipo. Este manual se basa en cuatro componentes principales para la
producción de este cultivo: (1) los factores que inciden en la producción de caña y
sacarosa, (2) el tipo de suelo, (3) la disponibilidad de agua para riego y (4) el año de
producción. Además contiene situaciones prácticas de manejo y sugiere la manera de
llevar a cabo dichas prácticas. El manual está presentado con ilustraciones que pueden
leerse de forma amigable, combinando las opciones a seguir según la situación de
producción y la interacción de los componentes, tipo de suelo, disponibilidad o no de riego
y el año actual de producción (caña nueva o de rebrote). Este manual es sólo una guía en
el cultivo de la caña, las condiciones de suelo, ambientales, tecnológicas y administrativas
de la finca definirán la forma de manejo de la misma.

4.2 BASES TEÓRICAS

4.2.1 Variable Dependiente: Producción de Azúcar

La caña de azúcar es producida por empresas y por sembradores. La producción


nacional en el período 1990 - 2001 se ha venido recuperando llegando a tener un nivel de
aproximadamente 6 millones de Tm. La recuperación es más notoria a partir de 1997. La
superficie cosechada con caña de azúcar creció levemente pasando de 48 a 60 mil hectáreas
tanto en empresas como en sembradores siendo más significativa en estos últimos.
Históricamente, la producción de azúcar en el Perú, alcanzó niveles superiores a la
demanda interna, lográndose la máxima producción en 1974 con 993,088 t. Los cambios
introducidos por la Reforma Agraria en 1969, originaron la caída en la producción y
productividad, convirtiéndose el país en importador de azúcar a partir de 1980. La reciente
reactivación del sector azucarero, debido en parte a la privatización de algunos ingenios, ha
incrementado la producción nacional a 877,566 t en el 2002, aunque la demanda interna
alcanzó 953,113 t. Los hogares peruanos constituyen el principal mercado del azúcar
nacional, mientras que la industria de bebidas gaseosas y laboratorios industriales consumen
la mayor parte del azúcar importado, que en el 2002 fue de 138,363 t. Las exportaciones,
que en su totalidad corresponden a la cuota americana, descendieron de 462,171 t en 1974
a 62,816 t en el 2002.

La productividad en caña (127.59 t/ha) y azúcar (13 t/ha), obtenida en el 2002, se sitúa
por debajo de la lograda en 1973 que fue 176 t/ha y 18 t/ha respectivamente; si bien, la edad
promedio de corte descendió de 18.6 a 15.78 meses en el mismo lapso. En promedio se
obtiene 101 kg de azúcar por tonelada de caña, mientras que Colombia, país líder en la
producción de azúcar, en el 2001 obtuvo 119 kg por tonelada de caña de 12.14 meses. La
actual sobreproducción de azúcar en el mercado mundial, iniciada a comienzos de la década
del 90, ha originado una caída sostenida en el precio internacional a US $ 199 y US$ 273 por
tonelada de azúcar rubia y blanca respectivamente, por debajo del costo de producción
promedio mundial de US $ 320 por tonelada de azúcar de caña. Se estima que en el 2004 la
producción nacional superará a la demanda interna, generando un excedente productivo no
competitivo en el contexto internacional, considerando el alto costo de producción por
tonelada de azúcar que en el país es de aproximadamente US $ 364. Por otro lado, la
apertura comercial en el mediano plazo en los países miembros de la Comunidad Andina de
Naciones (CAN), que contempla la reducción de los aranceles, obliga a ser más competitivo,
incrementando la productividad o diversificando el cultivo de la caña de azúcar hacia otros
usos. Una alternativa es la producción de etanol, que en el 2002 tuvo una demanda de
aproximadamente 40 billones de litros, como combustible y aditivo de la gasolina,
principalmente en los EEUU, los países de la UE y Asia. La demanda potencial de etanol a
nivel nacional, para su uso como aditivo del 10% en la gasolina, se estima en 162 mil m3/año.
Otra alternativa potencial, es la producción de azúcar ecológica, que está teniendo una
creciente demanda en países desarrollados, como Canadá, Holanda y Dinamarca.

4.2.1.1. Orígenes del Azúcar

La caña de azúcar es uno de los cultivos más viejos en el mundo, se cree que empezó
hace unos 3.000 años como un tipo de césped en la isla de Nueva Guinea y de allí se extendió
a Borneo, Sumatra e India.

El proceso del azúcar se escuchó primero en la India tan temprano como en el 3.000
A.C.
Una leyenda local en las Islas de Salomón dice que los antepasados de la raza
humana se generaron de un tallo de la caña. Una corona hecha de caña de azúcar se
describe en el Atharvaveda, libro sagrado de los hindúes, escrito aproximadamente 800 A.C.

El general griego Nearchus, quien acompañó a Alejandro el Grande a la India en el IV


siglo A.C. cuenta de una caña que produjo 'miel' sin la ayuda de las abejas.

Cristobal Colón introdujo la caña en América en su segundo viaje (1493) a la Isla de


La Española, cañas que no prosperaron. Tan sólo en 1501 fueron introducidas plantas que
sí crecieron. El éxito de las plantaciones de azúcar en el Santo Domingo llevó a su cultivo a
lo largo del Caribe y América del Sur.

4.2.1.2. Producción de azúcar en el mundo

A fines de la década del 90 la producción mundial de azúcar fue de aproximadamente


131 millones de toneladas métricas. En la década la producción mundial se ha incrementado.
El cambio más significativo a lo largo del período ha sido el crecimiento de Brasil como
productor y exportador. Este país representa el 28 % del incremento en la producción mundial
y el 75 % de las exportaciones.

Actualmente su participación se ha incrementado del 14% al 26%. Este cambio ha


sido a expensas de los mayores países exportadores: Unión Europea, India, y China. los
cuales en total han decrecido en un 10% en su participación en el mercado mundial. El
liderazgo de Brasil en el mercado mundial actualmente se basa en los menores costos de
producción y a la activa presencia del sector alcoholero como una importante alternativa de
los subproductos de la caña en ese país.

4.2.1.2. Producción de azúcar en el Perú

La caña de azúcar es producida por empresas y por sembradores.

La producción nacional en el período 1990 - 2001 se ha venido recuperando llegando a


tener un nivel de aproximadamente 6 millones de Tm. . La recuperación es más notoria a
partir de 1997.

La superficie cosechada con caña de azúcar creció levemente pasando de 48 a 60 mil


hectáreas tanto en empresas como en sembradores siendo más significativa en estos
últimos.

V. METODOLOGÍA

5.1 Tipo de la investigación


El presente trabajo se realizó una investigación no experimental.

No experimental porque no se tiene un control directo de las variables (dependiente e independientes).


Nos enfocamos en la observación que se desarrollan en el ambiente, sin la intervención de los
investigadores. Al tratarse de estudios con enfoques cuantitativos, si hay un análisis numérico de los
datos, estos se obtienen por observación y, posteriormente, se hace la interpretación de los mismos.

5.2 Nivel de Investigación

El presente estudio tiene alcance DESCRIPTIVO-EXPLICATIVO.

Descriptivo, pretendemos juntar información adecuada sobre el tema, especificar las características de
las variables relacionadas en nuestro estudio de investigación (producción, ingresos, clima y
superficie cosechada), es decir nos enfocaremos en describir el fenómeno de estudio tal como se
presenta en la realidad.

Explicativo, porque está dirigido a responder a las causas de los eventos físicos o sociales, dando a
conocer por qué ocurre un fenómeno, proceso o hecho (producción de azúcar), en qué condiciones se
da este o porque dos o más variables esta relacionadas.

ANÁLISIS DESCRIPTIVO

Reunimos los siguientes datos de fuentes oficiales*:


ingreso precio
costo de
prom promedio tasa superificie
produccion fertilizantes clima
mensual mensual de cosechada mes region año
(t) (S/. Por (°c)
del en chacra interes (hectareas)
tonelada)
trabajo (s/./t)
56,860 870.1 78.17 652,82 21 1.25 544 Ene Ancash 2010
57,078 870.1 88.67 650,29 21 1.25 555 Feb Ancash 2010
57,768 870.1 96.36 703,99 21 1.25 579 Mar Ancash 2010
31,450 870.1 107.92 764,99 21 1.25 259 Abr Ancash 2010
55,069 870.1 104.23 652,82 21 1.5 453 May Ancash 2010
53,785 870.1 90.46 650,29 21 1.75 441 Jun Ancash 2010
47,283 870.1 86.92 703,99 21 2 404 Jul Ancash 2010
35,291 870.1 83.08 764,99 21 2.5 289 Ago Ancash 2010
5,435 870.1 79.38 878,78 21 3 36 Set Ancash 2010
… … … … … … … … … …
146241.89 1 640.4 68.54 932,49 20.8333 3.5 1,070 Oct Lima 2014

143662.3 1 640.4 64.38 910,64 20.8333 3.5 1,137 Nov Lima 2014

163021.32 1 640.4 63.58 923,84 20.8333 3.5 1,341 Dic Lima 2014

 Se obtuvieron de páginas oficiales del gobierno e instituciones estatales.


Los departamentos que producen caña de azúcar son: Ancash, Arequipa, La Libertad, Lambayeque
y Lima

Al revisar nuestros datos, descubrimos que existen datos faltantes en ciertos meses en el
departamento de Arequipa (Ej.: Feb, Jul 2010, Ago 2011, etc.)

Un dato interesante es que la temperatura mínima es de 20.83°C mientras que la máxima es de


23.95°, es decir, tan solo 3 grados de diferencia para producir azúcar.

Clima
Min. 1st Qu. Median Mean 3rd Qu. Max.
20.83 21.00 21.40 22.12 23.40 23.95
La produccion de azúcar está altamente correlacionada con la variable superficie cosechada (0.964
35), esto indica que la producción está en función de la variable superficie cosechada principalme
nte.

ANÁLISIS EXPLICATIVO

En el presente trabajo la técnica estadística a utilizar es la regresión lineal. La regresión lineal


o ajuste lineal es un modelo matemático usado para aproximar la relación de dependencia
entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε.
Este modelo puede ser expresado como:

donde:

𝑌𝑡 : variable dependiente, explicada o regresando.

𝑋1 , 𝑋2 , …, 𝑋𝑝 : variables explicativas, independientes o regresores.

𝛽0 , 𝛽1 , 𝛽2 ,…𝛽𝑝 : parámetros, miden la influencia que las variables explicativas tienen sobre la
variable explicada.

𝛽0 la intersección o término "constante", las 𝛽1 , 𝛽2 ,…𝛽𝑝 son los parámetros respectivos a cada
variable independiente, y p es el número de parámetros independientes a tener en cuenta en
la regresión.

Modelo de regresión

Produccion = 𝛽0 + 𝛽1 ∗ 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 𝛽2 ∗ 𝑝𝑟𝑒𝑐𝑖𝑜 + 𝛽3 ∗ 𝑐𝑜𝑠𝑡𝑜_𝑓𝑒𝑟𝑡𝑖𝑙𝑖𝑧𝑎𝑛𝑡𝑒 + 𝛽4 *clima + 𝛽5 ∗ 𝑡𝑎𝑠𝑎_𝑖𝑛𝑡𝑒𝑟𝑒𝑠


+ 𝛽6 ∗ 𝑠𝑢𝑝_𝑐𝑜𝑠𝑒𝑐ℎ𝑎𝑑𝑎 + ε

𝛽𝑖 , i=0,1,…,7 coeficientes regresoras ; ε: término de perturbación


Resumen del modelo:

ANOVAa
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 7056292544128 6 1176048757354 1011,079 ,000b
,690 ,782
Residuo 340806546010, 293 1163162273,07
455 3
Total 7397099090139 299
,145
a. Variable dependiente: Producción
b. Predictores: (Constante), Superficie_cose, Costo_ferti, Clima, Precio, Ingreso, Tasa_inte

Observamos que el modelo incluyendo todas las variables explicativas, es significativo.

Ahora analizamos la significancia de cada variable explicativa:

Coeficientesa
Coeficientes
Coeficientes no estandarizados estandarizados
Modelo B Desv. Error Beta t Sig.
1 (Constante) 338780,528 42555,375 7,961 ,000
Ingreso 27,487 9,809 ,045 2,802 ,005
Precio 35,541 89,639 ,007 ,396 ,692
Costo_ferti -24,465 19,734 -,028 -1,240 ,216
Clima -16509,954 1617,688 -,136 -10,206 ,000
Tasa_inte 2094,207 3350,932 ,012 ,625 ,532
Superficie_cose 133,745 1,978 ,996 67,604 ,000
a. Variable dependiente: Producción

Se observa que hay 3 variables que no son significativas a un nivel del 5% (Precio, Costo de
fertilizante y tasa de interés)

Resumen del modelo


R cuadrado Error estándar
Modelo R R cuadrado ajustado de la estimación
1 ,977a ,954 ,953 34105,16490
a. Predictores: (Constante), Superficie_cose, Costo_ferti, Clima, Precio,
Ingreso, Tasa_inte

El Coeficiente de Determinación (R2) es 95.4% con el cual el modelo queda muy bien
explicado por las 5 variables explicativas.
LuegoLas variables precio, costo_fertilizantes y tasa_interes no son significativos (a un nivel de
significancia del 5%), por lo cual se excluyen con el objetivo de mejorar el modelo.

Produccion = 𝛽0 + 𝛽1 ∗ 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 𝛽2 *clima + 𝛽3 ∗ 𝑠𝑢𝑝_𝑐𝑜𝑠𝑒𝑐ℎ𝑎𝑑𝑎 + ε

Resumen del modelo

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 323.962746 40.598089 7.980 3.25e-14 ***
ingreso 0.028135 0.009153 3.074 0.00231 **
clima -16.455969 1.603772 -10.261 < 2e-16 ***
sup_cosechada 0.133815 0.001929 69.372 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 34.06 on 296 degrees of freedom


Multiple R-squared: 0.9536, Adjusted R-squared: 0.9531
F-statistic: 2026 on 3 and 296 DF, p-value: < 2.2e-16

Los indicadores 𝑅 2 = 95.36% y 𝑅 2 − 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 = 95.31% nos indican que el modelo es adecuado

Análisis de varianza

Df Sum Sq Mean Sq F value Pr(>F)

ingreso 1 1131584.6 1131584.637 975.2597 1.12E-95

clima 1 338128.5 338128.454 291.417 5.80E-46

sup_cosechada 1 5583940 5583940.005 4812.5357 4.00E-185

Residuals 296 343446 1160.291

El modelo es significativo (p-value = 0 < 0.05), el modelo mejora.

El modelo de regresión cumple con 4 supuestos (linealidad, normalidad, independencia y


homocedasticidad), a continuación se corrobora dichos supuestos.

Supuesto de Normalidad
Mediante el histograma apreciamos que no tiene la forma acampanada ni tampoco hay simetría, por
ello podemos afirmar que los residuales no se ajustan a una distribución normal

En la gráfica se aprecia que los residuales no se ajustan a la recta norma, es decir que no siguen
una distribución normal. Utilizamos pruebas estadísticas con el propósito de verificar dicha
observación.

Pruebas estadísticas

Hipótesis nula: los residuales se ajustan a una distribución normal

Hipótesis alterna: los residuales no se ajustan a una distribución normal

Nivel de significancia: 5%
 Anderson-Darling normality test

data: error
A = 2.2099, p-value = 1.284e-05

 Lilliefors (Kolmogorov-Smirnov) normality test

data: error
D = 0.066384, p-value = 0.002808

 Pearson chi-square normality test

data: error
P = 81.733, p-value = 1.885e-10

 Shapiro-Francia normality test

data: error
W = 0.96733, p-value = 8.994e-06

 Jarque-Bera test for normality

data: error
JB = 32.538, p-value < 2.2e-16

En todo los test el p-value < 0.05, entonces se rechaza Ho. Concluimos que los residuales no se aju
stan a una distribución normal.

El modelo no cumple el supuesto de normalidad, para solucionar este problema se realiza la transfo
rmación de box cox

Transformación de box cox

𝑌 ∗ = 𝑌 𝜆 , 𝑌 ∗ ∶ 𝑙𝑎 𝑛𝑢𝑒𝑣𝑎 𝑣𝑎𝑟𝑖𝑏𝑎𝑙𝑒𝑠 𝑟𝑒𝑝𝑢𝑒𝑠𝑡𝑎 𝑡𝑟𝑎𝑛𝑠𝑓𝑜𝑟𝑚𝑎𝑑𝑎 ;

lambda<-BoxCox.lambda(data$produccion,method =c("loglik"),lower = -5, upper=5)

lambda: 𝜆 = 0.35

𝑌 ∗ = 𝑌 0.35

head(data$produccion)
8.894956
8.910681
8.960252
6.694924
8.764045
8.668424
El modelo

Produccion∗= 𝛽0 + 𝛽1 ∗ 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 𝛽2 *clima + 𝛽3 ∗ 𝑠𝑢𝑝_𝑐𝑜𝑠𝑒𝑐ℎ𝑎𝑑𝑎 + ε

Donde Produccion∗: es la nueva variable respuesta tranformada

Supuesto de Normalidad
Mediante el histograma apreciamos que tiene la forma acampanada y también hay simetría, por ello
podemos afirmar que los residuales se ajustan a una distribución normal

En la gráfica se observa que los residuales se ajustan mejor a la línea normal, es posible que los
residuales se ajusten a una distribución normal.

Pruebas estadísticas

Hipótesis nula: los residuales se ajustan a una distribución normal

Hipótesis alterna: los residuales no se ajustan a una distribución normal

Nivel de significancia: 5%

 Anderson-Darling normality test


data: error1
A = 0.96759, p-value = 0.0146

 Lilliefors (Kolmogorov-Smirnov) normality test

data: error1
D = 0.06477, p-value = 0.00404

 Pearson chi-square normality test

data: error1
P = 35.733, p-value = 0.004977

 Frosini test for normality

data: error1
B = 0.32859, p-value = 0.014

 Shapiro-Francia normality test

data: error1
W = 0.99123, p-value = 0.06712

 Jarque-Bera test for normality

data: error1
JB = 0.15055, p-value = 0.9185

 Geary test for normality

data: error1
d = 0.78666, p-value = 0.828

 Kurtosis test for normality

data: error1
T = 2.9979, p-value = 0.995

 Skewness test for normality

data: error1
T = -0.054862, p-value = 0.684

 Weisberg-Bingham test for normality

data: error1
WB = 0.99123, p-value = 0.0615

 Spiegelhalter test for normality

data: error1
T.138 = 1.2712, p-value = 0.148

p-values ponderado = 0.34

Los cuatro primeros test resultaron significativos (p-values < 0.05), mientras que los siete siguientes
test resultaron no significativos (p-values > 0.05). Como la mayoría de los test resultaron no significa
tivos, entonces no se rechaza Ho. Concluimos que los residuales se ajustan a una distribución norm
al, comprobando el supuesto de normalidad.
Supuesto de Homocedasticidad

Se aprecia en la gráfica que los datos no tienen un comportamiento desordenado y disperse por la
region, por lo contrario se observa un tendencia cuadrática. Esto indica que posiblemente no se
está cumpliendo el supuesto de homocedasticidad

Prueba de BREUSCH PAGAN

Hipótesis nula: 𝜎12 = 𝜎22 =……..= 𝜎𝑛2

Hipótesis alternativa: 𝜎𝑖2 ≠ 𝜎𝑗2 , para al menos un par (i,j)

Nivel de significancia: 5%
Suma de cuadrados residual: SCR = 829.9

Número de observaciones: n = 300

𝜎̂ 2 = SCR/n = 829.9/300 = 2.766

Estimamos por MCO el modelo auxiliar

𝑒2
̂2
= 𝛼0 + 𝛼1 ∗ 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 𝛼2 *clima + 𝛼3 ∗ 𝑠𝑢𝑝_𝑐𝑜𝑠𝑒𝑐ℎ𝑎𝑑𝑎 + u
𝜎

Analysis of Variance Table

Response: y
Df Sum Sq Mean Sq F value Pr(>F)
ingreso 1 1.02 1.019 0.5596 0.4550
clima 1 59.06 59.063 32.4254 2.984e-08 ***
sup_cosechada 1 0.12 0.118 0.0648 0.7993
Residuals 296 539.17 1.822
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Suma de cuadrados explicada: SCE = 60.2


2
BP = CSE/2 = 60.2/2 = 30.1 ~ 𝑋(𝛼,𝑝)

2
𝑋(5%,3) = 7.815

2
BP > 𝑋(5%,3) , entonces se rechaza Ho

Concluimos que n o se está cumpliendo el supuesto de homocedasticidad, es decir existe


heterocedasticidad

De la misma manera tampoco se cumple el supuesto de independencia, esto nos lleva a plantear
otro modelo más adecuado.

La información se recolecto por 5 años (2010-2014) y por región (Ancash, La libertad, Lambayeque,
Lima y Arequipa), y como sabemos la producción de azúcar cambia año tras año, así como también
que la producción dependerá de la región donde es cosecha. Por estos motivos se construyen
modelos por cada región.

Región Ancash
El modelo

Produccion = 𝛽0 + 𝛽1 ∗ 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 𝛽3 ∗ 𝑠𝑢𝑝_𝑐𝑜𝑠𝑒𝑐ℎ𝑎𝑑𝑎 + ε

Resumen del modelo

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -84.669595 11.789652 -7.182 1.58e-09 ***
datanc1$ingreso 0.090804 0.012228 7.426 6.20e-10 ***
datanc1$sup_cosechada 0.125622 0.004726 26.584 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 5.707 on 57 degrees of freedom


Multiple R-squared: 0.9356, Adjusted R-squared: 0.9334
F-statistic: 414.3 on 2 and 57 DF, p-value: < 2.2e-16

Análisis de varianza

Response: datanc1$produccion
Df Sum Sq Mean Sq F value Pr(>F)
datanc1$ingreso 1 3973.4 3973.4 122.01 8.658e-16 ***
datanc1$sup_cosechada 1 23014.2 23014.2 706.69 < 2.2e-16 ***
Residuals 57 1856.3 32.6
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Producción = -84.6696 + 𝟎. 𝟎𝟗𝟎𝟖 ∗ 𝒊𝒏𝒈𝒓𝒆𝒔𝒐 + 𝟎. 𝟏𝟐𝟓𝟔 ∗ 𝒔𝒖𝒑_𝒄𝒐𝒔𝒆𝒄𝒉𝒂𝒅𝒂

Región Lambayeque
El modelo

Produccion = 𝛽0 + 𝛽1 ∗ 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 𝛽3 ∗ 𝑠𝑢𝑝_𝑐𝑜𝑠𝑒𝑐ℎ𝑎𝑑𝑎 + ε

Resumen del modelo

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 157.134895 31.874798 4.930 7.46e-06 ***
datlab1$ingreso -0.148668 0.040503 -3.671 0.000535 ***
datlab1$sup_cosechada 0.087031 0.004651 18.713 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 20.29 on 57 degrees of freedom


Multiple R-squared: 0.8606, Adjusted R-squared: 0.8557
F-statistic: 176 on 2 and 57 DF, p-value: < 2.2e-16

Análisis de varianza

Response: datlab1$produccion
Df Sum Sq Mean Sq F value Pr(>F)
datlab1$ingreso 1 748 748 1.816 0.1831
datlab1$sup_cosechada 1 144150 144150 350.175 <2e-16 ***
Residuals 57 23464 412
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Producción = 157.1349 + −𝟎. 𝟏𝟒𝟖𝟕 ∗ 𝒊𝒏𝒈𝒓𝒆𝒔𝒐 + 𝟎. 𝟎𝟖𝟕 ∗ 𝒔𝒖𝒑_𝒄𝒐𝒔𝒆𝒄𝒉𝒂𝒅𝒂


Región La Libertad
El modelo

Produccion = 𝛽0 + 𝛽1 ∗ 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 𝛽3 ∗ 𝑠𝑢𝑝_𝑐𝑜𝑠𝑒𝑐ℎ𝑎𝑑𝑎 + ε

Resumen del modelo

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.713e+02 5.744e+01 -2.983 0.004199 **
datlibt1$ingreso 2.160e-01 5.601e-02 3.857 0.000295 ***
datlibt1$sup_cosechada 1.305e-01 7.573e-03 17.227 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 34.48 on 57 degrees of freedom


Multiple R-squared: 0.8531, Adjusted R-squared: 0.848
F-statistic: 165.5 on 2 and 57 DF, p-value: < 2.2e-16

Análisis de varianza
Response: datlibt1$produccion
Df Sum Sq Mean Sq F value Pr(>F)
datlibt1$ingreso 1 40773 40773 34.302 2.466e-07 ***
datlibt1$sup_cosechada 1 352739 352739 296.756 < 2.2e-16 ***
Residuals 57 67753 1189
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Producción = -171.3366 + −𝟎. 𝟐𝟏𝟔 ∗ 𝒊𝒏𝒈𝒓𝒆𝒔𝒐 + 𝟎. 𝟏𝟑𝟎𝟓 ∗ 𝒔𝒖𝒑_𝒄𝒐𝒔𝒆𝒄𝒉𝒂𝒅𝒂

Región Lima
El modelo

Produccion = 𝛽0 + 𝛽1 ∗ 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 𝛽3 ∗ 𝑠𝑢𝑝_𝑐𝑜𝑠𝑒𝑐ℎ𝑎𝑑𝑎 + ε

Resumen del modelo

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -49.51814 15.98193 -3.098 0.00302 **
datlima1$ingreso 0.05623 0.01145 4.909 8.03e-06 ***
datlima1$sup_cosechada 0.09779 0.01057 9.247 6.10e-13 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 10.11 on 57 degrees of freedom


Multiple R-squared: 0.751, Adjusted R-squared: 0.7423
F-statistic: 85.97 on 2 and 57 DF, p-value: < 2.2e-16
Análisis de varianza

Response: datlima1$produccion
Df Sum Sq Mean Sq F value Pr(>F)
datlima1$ingreso 1 8836.6 8836.6 86.420 5.086e-13 ***
datlima1$sup_cosechada 1 8744.1 8744.1 85.516 6.103e-13 ***
Residuals 57 5828.4 102.3
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Producción = -49.5181+ −𝟎. 𝟎𝟓𝟔𝟐 ∗ 𝒊𝒏𝒈𝒓𝒆𝒔𝒐 + 𝟎. 𝟎𝟗𝟕𝟖 ∗ 𝒔𝒖𝒑_𝒄𝒐𝒔𝒆𝒄𝒉𝒂𝒅𝒂

Región Arequipa
El modelo

Produccion = 𝛽0 + 𝛽1 ∗ 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 𝛽3 ∗ 𝑠𝑢𝑝_𝑐𝑜𝑠𝑒𝑐ℎ𝑎𝑑𝑎 + ε

Resumen del modelo

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.365e+04 2.791e+03 -4.891 8.57e-06 ***
datarp1$ingreso 8.729e+00 2.102e+00 4.153 0.000111 ***
datarp1$sup_cosechada 1.389e+02 6.737e-01 206.228 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1586 on 57 degrees of freedom


Multiple R-squared: 0.9988, Adjusted R-squared: 0.9988
F-statistic: 2.452e+04 on 2 and 57 DF, p-value: < 2.2e-16

Análisis de varianza

Response: datlarp1$produccion
Df Sum Sq Mean Sq F value Pr(>F)
datarp1$ingreso 1 1.6364e+10 1.6364e+10 6503.2 < 2.2e-16 ***
datarp1$sup_cosechada 1 1.0702e+11 1.0702e+11 42530.1 < 2.2e-16 ***
Residuals 57 1.4343e+08 2.5163e+06
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Producción = -1365.1 + 𝟖. 𝟕𝟐𝟗𝟑 ∗ 𝒊𝒏𝒈𝒓𝒆𝒔𝒐 + 𝟏𝟑𝟖. 𝟗𝟑𝟖𝟗 ∗ 𝒔𝒖𝒑_𝒄𝒐𝒔𝒆𝒄𝒉𝒂𝒅𝒂


ANEXOS

Script 1

base<-read.csv(file.choose(), head=T)

View(base)

#quitamos la variable mes, region y año de la base de datos

data<-base[,1:7]

head(data)

#la producciontrabajearemos por miles

data$produccion<-data$produccion/1000

head(data)

###resumen de los datos

summary(data$clima)

plot(data)

cor(data)

#la variable respuesta es la produccion

plot(data$ingreso,data$produccion)

plot(data$precio,data$produccion)

plot(data$costo_fertilizantes,data$produccion)

plot(data$clima,data$produccion)

plot(data$tasa_interes,data$produccion)

cor(data$produccion,data$sup_cosecha)

plot(data$sup_cosecha,data$produccion, xlab="superficie cosechada",ylab="produccion (miles)",

main="Producción de azucar")

###modelo de regresion

attach(data)
#las variables precio, costo_fertilizantes y taasa_interes no son sinificcativas

#por ello lo retiramos del modelo original

modelo1<-lm(produccion~ingreso#+precio+costo_fertilizantes

+clima#+tasa_interes

+sup_cosechada,data = data)

summary(modelo1)

View(anova(modelo1))

prodc_est<-modelo1$fitted.values

error<-modelo1$residuals

plot(prodc_est,error)

#supuesto de normalidad

hist(error,xlab="residuales", main = "Histograma")

qqnorm(error)

qqline(error)

install.packages("nortest")

install.packages("normtest")

library(nortest)

library(normtest)

ad.test(error)

lillie.test(error)

pearson.test(error)

sf.test(error)

jb.norm.test(error)

#transformaciones de box cox

install.packages("fpp")

install.packages("tseries")

library(tseries)
library(fpp)

lambda<-BoxCox.lambda(data$produccion,method =c("loglik"),lower = -5, upper=5)

head(data$produccion)#la variable respuesta antes de la tranformacion

data$produccion<-BoxCox(data$produccion,lambda)

head(data$produccion)#la nueva variable transformada

modelo2<-lm(produccion~ingreso#+precio+costo_fertilizantes

+clima#+tasa_interes

+sup_cosechada,data = data)

summary(modelo2)

View(anova(modelo2))

prodc_est1<-modelo2$fitted.values

error1<-modelo2$residuals

plot(prodc_est1,error1)

#supuesto de normalidad

qqnorm(error1)

qqline(error1)

hist(error1,xlab="residuales", main = "Histograma")

boxplot(error1)

ad.test(error1)

lillie.test(error1)

pearson.test(error1)

sf.test(error1)

jb.norm.test(error1)

geary.norm.test(error1)

frosini.norm.test(error1)

kurtosis.norm.test(error1)

skewness.norm.test(error1)

wb.norm.test(error1)
spiegelhalter.norm.test(error1)

#para la prueba de independencia

install.packages("zoo")

install.packages("lmtest")

library(lmtest)

library(zoo)

dwtest(modelo2,alternative="two.sided") #Durbin-watson

#para laprueba de homoscedasticidad

install.packages("score")

install.packages("car")

library("car")

library("score")

ncvTest(modelo2)

#pruba de Breusch-Pagan

aov(modelo2)

var_est<-829.9/300#varianza esimada

y<-(error1^2)/var_est #nueva variable respuesta

head(y)

sum(y)

mod<-lm(y~ingreso#+precio+costo_fertilizantes

+clima#+tasa_interes

+sup_cosechada,data = data)

anova(mod)#para calcular la suma de cuadrados explicada (SCE)

#SCE=1.02+59.06+0.12=60.2

#estadistico de Breusch-pagam: BP=SCE/2--->BP=60.2/2=30.1

#El estadistico BP se aproxima a una distribucion chi-cuadrado

#X^2 (0.05,3)=7.815--->BP > x^2 (0.05,3)--> se rechaza ho


#transformaciones de jonhson

install.packages("Johnson")

library(Johnson)

john<-RE.Johnson(data$produccion)

john

y<-john$transformed#la variable y contiene los valores de la transformacion de johonson de la varible


respuesta

modelo3<-lm(y~data$ingreso #+dat1$precio+dat1$costo_fertilizantes#

+data$clima+#3dat1$tasa_interes

+data$sup_cosechada,data = data)

summary(modelo3)

View(anova(modelo2))

prodc_est2<-modelo3$fitted.values

error2<-modelo3$residuals

plot(prodc_est2,error2)

#supuesto de normalidad

qqnorm(error2)

qqline(error2)

hist(error2,xlab="residuales", main = "Histograma")

ad.test(error2)

lillie.test(error2)

pearson.test(error2)

sf.test(error2)

jb.norm.test(error2)

geary.norm.test(error2)

frosini.norm.test(error2)

kurtosis.norm.test(error2)

skewness.norm.test(error2)
wb.norm.test(error2)

spiegelhalter.norm.test(error2)

#cambio estructural

install.packages("gap")

library(gap)

chow.test(dat1$produccion[1:60],dat1$sup_cosechada[1:60],dat1$produccion[61:120],dat1$sup_cos
echada[61:120])

#trabajando por año (esto debido al cambio estructural)

#2010

dat2010<-read.delim("clipboard", head=T)

dat12010<-dat2010[,1:7]

dat12010$produccion<-dat12010$produccion/1000

attach(dat12010)

plot(dat12010)

mod2010<-lm(produccion~ingreso+precio+costo_fertilizantes

+clima+tasa_interes+sup_cosechada,data = dat12010)

#la tasa de interes no es significativa

mod2010<-lm(produccion~ingreso+clima+sup_cosechada,data = dat12010)

summary(mod2010)

anova(mod2010)

#2011

dat2011<-read.delim("clipboard", head=T)

dat12011<-dat2010[,1:7]

dat12011$produccion<-dat12011$produccion/1000

detach(dat12011)

plot(dat12011)
mod2011<-lm(produccion~ingreso+precio+costo_fertilizantes

+clima+tasa_interes+sup_cosechada,data = dat12011)

#la tasa de interes no es significativa

mod2011<-lm(dat12011$produccion~dat12011$ingreso+clima

+dat12011$sup_cosechada,data = dat12011)

summary(mod2011)

anova(mod2011)

#trabajando por region (esto debido al cambio estructural)

#region Ancash

datanc<-read.delim("clipboard", head=T)

datanc1<-datanc[,1:7]

datanc1$produccion<-datanc1$produccion/1000

attach(datancash1)

modanc<-lm(produccion~ingreso+precio+costo_fertilizantes

+tasa_interes+sup_cosechada+año,data = datancash1)

#la tasa de interes y el año no son significativas

modanc<-lm(datanc1$produccion~datanc1$ingreso

+datanc1$sup_cosechada,data = datanc1)

summary(modanc)

anova(modanc)

#regionlambayeque

datlab<-read.delim("clipboard", head=T)

datlab1<-datlab[,1:7]

datlab1$produccion<-datlab1$produccion/1000

modlab<-lm(produccion~ingreso+precio+costo_fertilizantes

+tasa_interes+sup_cosechada+año,data = datancash1)
#la tasa de interes y el año no son significativas

modlab<-lm(datlab1$produccion~datlab1$ingreso

+datlab1$sup_cosechada,data = datlab1)

summary(modlab)

anova(modlab)

#region lima

datlima<-read.delim("clipboard", head=T)

datlima1<-datlima[,1:7]

datlima1$produccion<-datlima1$produccion/1000

modlima<-lm(produccion~ingreso+precio+costo_fertilizantes

+tasa_interes+sup_cosechada+año,data = datancash1)

#la tasa de interes y el año no son significativas

modlima<-lm(datlima1$produccion~datlima1$ingreso

+datlima1$sup_cosechada,data = datlima1)

summary(modlima)

anova(modlima)

#region Arequipa

datarp<-read.delim("clipboard", head=T)

datarp1<-datlarp[,1:7]

datarp1$produccion<-datarp1$produccion/1000

modarp<-lm(produccion~ingreso+precio+costo_fertilizantes

+tasa_interes+sup_cosechada+año,data = datancash1)

#la tasa de interes y el año no son significativas

modarp<-lm(datlarp1$produccion~datarp1$ingreso

+datarp1$sup_cosechada,data = datlarp1)

summary(modarp)
anova(modarp)

También podría gustarte