Metodologia de La Investigacion
Metodologia de La Investigacion
Metodologia de La Investigacion
40
30
Porcentaje
20
10
Hbito de estudio
PARTE I
1RA EDICION
Todos los derechos reservados. Prohibida la reproduccin total o parcial de este libro en forma idntica o modificada por cualquier medio mecnico o electrnico, incluyendo fotocopia, grabacin o cualquier sistema de almacenamiento y recuperacin de informacin no autorizada por el autor.
Impreso en Per.
1.1 INVESTIGACIN CIENTFICA La investigacin cientfica, se puede entender como un conjunto de actividades que realizamos para obtener conocimientos nuevos, sobre problemas nuevos que afectan la realidad, pero que sean nuevos, respecto a la ciencia, es decir, respecto al conjunto de conocimientos ya provisionalmente establecidos y sistematizados por la humanidad, conocimientos nuevos que, como aportes, se sumarn a la Ciencia. Qu es investigar? Investigar viene del latn investigare. Es la forma ms adecuada de aproximarse al conocimiento de la verdad mediante verdades parciales. Desarrollar actividades con el objetivo de registrar, indagar o descubrir la verdad. En trminos generales, es agregar algo nuevo a los conocimientos humanos. Es un proceso que, mediante la aplicacin del mtodo cientfico, procura obtener informacin relevante y fidedigna. corregir o aplicar el conocimiento De entender, verificar,
1.2 PROBLEMA DE INVESTIGACIN Es un hecho, fenmeno o situacin que incita a la reflexin o al estudio y es importante puesto que permite conocer la situacin que se va a mostrando sus principales rasgos. estudiar
CRITERIOS BASICOS PARA IDENTIFICAR PROBLEMAS. De manera general se considera que hay un problema cuando lo que DEBERA SER, difiere de lo que ES. El DEBERA SER, es el marco referencial, el patrn comparativo, el ideal, el modelo, el paradigma. Lo que ES, representa la realidad, es la prctica. DEBERA SER diferente a ES, entonces existe Problema
ESQUEMA DEL PROBLEMA DE INVESTIGACION. Para la presentacin del POI, es necesario considerar cuatro momentos: el diagnstico, el pronstico, el control del pronstico y la formulacin de la pregunta o preguntas o la redaccin de un texto a manera de pregunta.
El diagnstico es la descripcin de los sntomas o problemas. El pronstico es la serie consecuencias de los problemas. El control del pronstico es la serie de acciones para superar las consecuencias de los problemas. Formulacin del problema
ELEMENTOS DE DEL TITULO DE UN PROBLEMA Especificidad Situacin problemtica Unidad de estudio Espacio Tiempo
Situacin problemtica Responde a la pregunta Qu investigar? Por ejemplo: Rendimiento acadmico, gestin educativa, desempeo profesional,.. La especificidad
Es el aspecto o los aspectos concretos que se quiere investigar acerca del hecho o situacin problemtica. Por ejemplo: causas, consecuencias, caractersticas, importancia, influencia, tendencia, modalidades, incidencia, prevalencia, implicancias, estructura, funcin, nivel, relacin, evolucin, etc. Unidades de estudio. Son aquella en las se ponen de manifiesto los hechos o situaciones problemticas y constituyen, desde el punto de vista estadstico, la poblacin o muestra a la que se refiere la investigacin. Son: Personas, grupos Espacio Esta referido al lugar en el que ocurre el hecho o situacin problemtica. Puede ser geogrfico o administrativo. Dnde?; Per, Ciudad del Cusco, Zona Franca, Aceros Arequipa, etc. Tiempo Est referido al momento en que ocurre el hecho o situacin problemtica. Cundo?. 1.3 FORMULACION DE OBJETIVOS Son los propsitos o fines que se pretenden lograr al realizar la investigacin. Los objetivos son de dos tipos: El objetivo general (singular) Los objetivos especficos (plural) Los objetivos deben ser verificables Al definir los objetivos, debemos pensar inmediatamente en la manera de verificar si stos se han cumplido o no (pensar en mtodos o herramientas para ello) Lo anterior nos permitir ir dibujando el perfil metodolgico de nuestra investigacin Los objetivos se convierten as en la carta de navegacin de la investigacin a realizar sociales, seres, acontecimientos, instituciones, objetos,
procesos.
Los objetivos deben ser precisos y no muy ambiciosos: deben ser acordes con los recursos disponibles (tiempo) y ello delimitar el nivel de detalle esperable.
Ejemplo 1: Reforzar la capacidad de gestin en los centros de educacin inicial del pas para la atencin de los dominios del aprendizaje de los nios de 4 y 5 aos de edad. Accin : Reforzar la capacidad de gestin en los centros de
educacin inicial del pas. Contenido: La atencin de los dominios del aprendizaje. Sujeto : Nios de 4 a 5 aos de edad
1.4 JUSTIFICACION Y DELIMITACION DE LA INVESTIGACIN Criterios de justificacin. Originalidad Relevancia Inters Factibilidad Criterios para delimitar Espacial - Geogrfica Cronolgica
1.5 MARCO TEORICO En el marco terico se integra con las teoras, enfoque tericos, estudios y antecedentes en general que se refieran al problema de investigacin.
Para elaborar el marco terico es necesario detectar, obtener y consultar la literatura y otros documentos pertinentes para el problema de investigacin, as como extraer y recopilar de ellos la informacin de inters. La revisin de la literatura puede iniciarse manualmente o acudiendo a un banco de datos al que se tenga acceso por computadora. La construccin del marco terico depende de lo que
encontremos en la revisin de la literatura: Marco Terico: Fundamentacin terica dentro de la cual se enmarca la investigacin Marco Conceptual: Definicin de conceptos relevantes utilizados en el estudio Marco Normativo: Normas, leyes referentes al estudio Qu funciones cumple el marco terico? Sirve de gua al Investigador Provee un marco para la interpretacin de resultados 1.6 HIPOTESIS DE INVESTIGACION
Afirmaciones o suposiciones que hace el investigador respecto al problema de investigacin. Es una suposicin que permite establecer relaciones entre hechos. El valor de una hiptesis reside en su capacidad de establecer esas relaciones entre los hechos y de esa manera, explicarnos por qu se produce el fenmeno de estudio.
Qu Funciones cumple? Direccionar el problema objeto de investigacin Identificar variables objeto de anlisis Orientar el uso de mtodos y tcnicas de obtencin de informacin Elementos estructurales de la hiptesis 1. Las unidades de anlisis, que puedan ser los individuos, grupos, viviendas, instituciones, etc.
2. Variables, las caractersticas o propiedades cualitativas o cuantitativas que presentan las unidades de anlisis. 3. Los elementos lgicos, son los que relacionan las unidades de anlisis con las variables y estas entre s. Requisitos para estructurar las hiptesis Las hiptesis deben referirse slo a un mbito determinado de la realidad social. Las hiptesis en las ciencias sociales slo pueden someterse a prueba en un universo y contexto bien definidos. Los conceptos de las hiptesis deben ser claros y precisos. En las hiptesis, los conceptos son las variables y las unidades de anlisis. Los conceptos de las hiptesis deben contar con realidades o referencias empricas observables (verificables). El planteamiento de las hiptesis deben prever las tcnicas para probarlas. Se deben formular hiptesis que estn relacionadas con tcnicas disponibles para su verificacin.
El nivel de una investigacin viene dado por el grado de profundidad y alcance que se pretende con la misma
INVESTIGACIN DESCRIPTIVA Orientada al descubrimiento de las propiedades particulares del hecho o situacin problemtica y tambin a la determinacin de la frecuencia con que ocurre el hecho o situacin problemtica. Responde a las preguntas Cmo son? Cuntos son? Dnde estn? Se refiere a las caractersticas cualidades internas y externas, propiedades y rasgos de la poblacin de estudio
Ejemplo 2: Nivel de conocimiento de las estrategias cognitivas por los profesores, de la poblacin de la ciudad de Cusco, 2011. INVESTIGACIN EXPLICATIVA Orientada al descubrimiento de las causas o consecuencias o condicionantes de la situacin problemtica Est dirigida a responder a las causas de los eventos fsicos o sociales y su inters se centra en explicar por qu y en qu condiciones ocurre un fenmeno, o por qu dos o ms variables se relacionan. Por qu? La finalidad es determinar por qu un hecho o fenmeno de la realidad tiene tales y cuales caractersticas. Ejemplo 3: Principales causas de la desercin escolar en la regin andina del Per, 2010.
INVESTIGACIN COMPARATIVA Orientada al estudio de las semejanzas o diferencias de un hecho o situacin problemtica en dos circunstancias diferentes. Ejemplo 4: Nivel de aplicacin de metodologas de enseanza por los profesores de las instituciones educativas A y B de Cusco, 2010.
INVESTIGACIN RELACIONAL Orientada al descubrimiento de la influencia de un hecho o situacin problemtica en otro hecho o situacin problemtica.
Ejemplo 5: Influencia de la internet en la lectura de los estudiantes de secundaria de la Ciudad del Cusco, 2011.
INVESTIGACIN CORRELACIONAL Orientada a descubrir la covariacin o correspondencia entre los valores de dos hechos o situaciones problemticas.
Ejemplo 6: Correlacin entre hbitos de estudio y aprendizaje en los estudiantes de la Universidad de Nacional San Antonio Abad del Cusco, 2011. INVESTIGACIN EXPERIMENTAL Orientada a descubrir la validez de un hecho para la modificacin de una situacin problemtica. Qu cambios y modificaciones se han producido? Qu mejoras se han logrado?. Ejemplo 7: Evaluacin del efecto del uso de tres tipos de materiales didcticos en el rendimiento acadmico, en las I.E de la ciudad de Cusco, 2011.
1.8 TIPOS DE INVESTIGACION Los Tipos de investigacin se determinan mediante la aplicacin de distintos criterios, a continuacin se refieren algunos de ellos.
INVESTIGACION BASICA. Solo busca aplicar y profundizar el conocimiento cientfico existente acerca de la realidad.
INVESTIGACION APLICADA.
Se investiga
INVESTIGACION SUSTANTIVA. Se orienta a resolver problemas facticos, su propsito es dar respuesta objetiva a interrogantes que se plantea en un determinado fragmento de la realidad y del conocimiento con el objeto de
INVESTIGACION
TECNOLOGICA.
Se
relaciona
esencial,
objetiva
metodolgicamente con el nivel experimental, se busca cambios mediante la aplicacin de nuevos sistemas.
1.9 DISEOS DE INVESTIGACION. Conjunto de estrategias procedimentales y metodolgicas definidas y elaboradas para el desarrollo del proceso de investigacin.
El diseo de investigacin puede ser pensado como la estructura de la Investigacin. El investigador debe seleccionar un diseo de investigacin. Esto se refiere a la manera prctica y precisa que el investigador adopta para cumplir con los objetivos de su estudio, ya que el diseo de investigacin indica los pasos a seguir para alcanzar dichos objetivos. Es necesario por tanto que previo a la seleccin del diseo de investigacin se tengan claros los objetivos de la investigacin. Las maneras de cmo conseguir respuesta a las interrogantes o hiptesis planteadas dependen de la investigacin. Por esto,
existen diferentes tipos de diseos de investigacin, de los cuales debe elegirse uno o varios para llevar a cabo una investigacin particular (Hernndez, Fernndez y Baptista, 2000; Castillo, 2005). La precisin, la profundidad as como tambin el xito de los resultados de la investigacin dependen de la eleccin adecuada del diseo de investigacin. He aqu un esquema donde se resumen los diferentes tipos de investigacin segn Hernndez, Fernndez y Baptista (2000).
Diseos experimentales Son aquellos en los que se cumple que: Los grupos a ser investigados han sido asignados al azar, por procedimientos aleatorios y los grupos resultantes son equivalentes, de tal manera que se tiene un grupo control equivalente a los grupos experimentales. Diseos cuasi-experimentales. Entendemos por diseos cuasi-experimentales cuando se cumplen las siguientes condiciones: Los grupos sobre los que se lleva a cabo la investigacin no han podido establecerse como equivalentes en las caractersticas fundamentales. Los grupos no han sido asignados al azar, sino que han sido establecidos por algn otro procedimiento de muestreo. Como dice Hernndez et al.En los diseos cuasi-experimentales los sujetos no son asignados al azar a los grupos no emparejados; sino que dichos grupos ya estaban formados antes del experimento, son grupos intacto (la razn por la que surgen y la manera como se formaron fueron independientes o aparte del experimento. Tambin algunos autores denominan CUASI-EXPERIMENTAL, cuando el investigador aplica un tratamiento a un solo grupo de sujetos, sin grupo de control, observndolo antes y despus de aplicar el tratamiento. Diseos no-experimentales. Se establece que un diseo no-experimental es: la que se realiza sin manipular deliberadamente variables. Es decir, se trata de investigacin donde no hacemos variar intencionadamente las variables independientes. Lo que hacemos en la investigacin no experimental es observar fenmenos tal y como se dan en su contexto natural, para despus analizarlos. (Hernndez, 184)
La diferencia con los diseos experimentales y cuasi- experimentales se ve con claridad, porque en estos dos siempre hay algn tipo de intervencin del investigador, que manipula las variables independientes para averiguar su influencia en las variables dependientes.
Mtodo transversal: Es el diseo de investigacin que recolecta datos de un solo momento y en un tiempo nico. El propsito de este mtodo es describir variables y analizar su incidencia e interrelacin en un momento dado.
Diseos transversales descriptivos: son aquellos que tienen como objetivo indagar la incidencia y los valores en que se manifiesta una o ms variables.
Diseos transversales correlacionales: Se encargan de describir relaciones entre dos o ms variables en un momento determinado.
Diseos transversales
causas y efectos ya ocurrieron en la realidad (estaban dados y manifestados) y el investigador los observa y explica.
Diseos longitudinales: Son aquellos que analizan cambios a travs del tiempo (en variables o sus relaciones), dentro de alguna poblacin en general.
1.10 VARIABLES A las caractersticas objeto de estudio en la poblacin se les llama variables, ya que pueden variar de un individuo a otro y se representara por letras maysculas: X, Y, Z,. . ., debemos distinguir los distintos tipos de variables que hay, lo cual nos va a permitir utilizar las herramientas estadsticas apropiadas.
TIPOS DE VARIABLES. Las variables estadsticas pueden ser de dos tipos: Variables cualitativas o atributos: describen cualidades y no toman valores numricos, estas a su vez pueden ser: Nominales.- Las cualidades no presentan ningn orden. Ejemplo Sexo del estudiante (Femenino, Masculino), Procedencia, I.E.
Ordinales.- Este tipo de variables presentan orden Ejemplo: Grado de estudios (Analfabeto, primaria, secundaria, superior), Nivel de
conocimiento de Docentes.
Variables cuantitativas: toman valores numricos. A su vez pueden ser: Discretas.- Solo toman un nmero finito o infinito numerable de valores distintos (generalmente nmeros naturales o enteros). Ejemplos: nmero de estudiantes por secciones, nmero de profesores, nmero de aulas, etc. Continuas.Toman valores en un intervalo. Generalmente
corresponden a medir magnitudes continuas. Ejemplo, Rendimiento acadmico, altura, ingreso del docente, etc.
Una caracterstica esencial de este tipo de variables es que sus valores nunca son observables con exactitud, sino que dependen (las observaciones) de la precisin del instrumento de medida.
Ejemplo 7
Un especialista estudia, el nivel de introversin en nios menores de 4 aos en las instituciones educativas de la ciudad de Cusco. previos para este estudio. Solucin: Poblacin: Nios menores de 4 aos de las I.E de la ciudad de Cusco. Muestra: Nios de 3 aos de las I.E de la ciudad de Cusco. Variable: Nivel de Introversin. Tipo de variable: Cuantitativa Unidad de estudio: Nio menor de 4 aos. Defina los conceptos
1.11 ESCALAS DE MEDICION Se llama medicin Tenemos las al proceso de atribuir nmeros a las caractersticas.
Escala nominal: la clave de estas escalas de medida es que slo informan de la igualdad o desigualdad de los individuos en una caracterstica, pero no de posibles ordenaciones, puesto que la caracterstica a la que se refieren no se tiene en mayor o menor medida, sino que simplemente adopta formas cualitativamente distintas. Los nmeros solo sirven para distinguir valores o categoras diferentes de la variable. Esta escala se emplea para variables cualitativas nominales.
Ejemplo 8: El sexo 1=Masculino y 2=Femenino esto simplemente es un proceso de codificacin pero no significa que la mujer sea mayor que el hombre, ni el doble, ni que existe sexo intermedio.
Escala Ordinal: Los nmeros adems de servir para distinguir reflejan un orden existente sobre los valores de la variable. Se obtiene clasificando objetos o arreglndolos en un orden con respecto a alguna variable comn. La pregunta es simplemente, si el objeto tiene ms o menos de esta variable que algn otro objeto. Esta escala se emplea para variables cualitativas ordinales.
Ejemplo 9: Nivel de conocimientos de estrategias cognitivas por parte de los docentes. Excelente=5, bueno =4, regular =3 y malo = 2. es cierto la relacin de orden 2<3<4<5.
Escala de Intervalo: La ubicacin del punto origen no es fija, puesto que 0 no denota la ausencia del atributo. Aqu los nmeros para clasificar los objetos representan tambin incrementos iguales del atributo que se esta midiendo. Esto significa que los nmeros pueden ser comparados. La diferencia en 1 y 2 es la misma que entre 2 y 3, pero es solo la mitad de la diferencia entre 2 y 4. Las temperaturas Fahrenheit y Centgrados son medidas que tiene diferentes escalas de intervalo y diferentes puntos de 0. Escala de Razn: Medida numricas en las cuales cero es un valor fijo en cualquier escala y la diferencia entre valores es diferente
Adems de la distancia de orden e intervalo, se aade un origen absoluto de forma que no solo cabe hallar distancias (ya en la escala de intervalo), si no tambin mltiplos exactos. En este caso, el valor representado por 4 tiene doble cantidad medida que l representado por un 2. Ejemplo 10: Edad del profesor expresada en aos. 40 aos y 20 aos son edades distintas y 40 aos es superior a 20 aos Entre 40 y 20 hay una diferencia de 20, la misma que entre 50 y 30. El 0 tiene sentido. Una persona con 0 aos, realmente no tiene edad todava no ha nacido. En el siguiente cuadro se muestra un resumen de las caractersticas de las escalas de medicin. Resumen de escalas de medicin
Tipo Informacin deducible Relaciones Nominal igual que o distinto que Transform. admisibles Significa Significa orden No Aplicaciones inyectivas Significa distancia Origen No No Ejemplos Procedencia del Profesor, tipo de metodologia Si Relaciones Ordinal mayor que o igual que No No Grado de planificacin, Funciones crecientes Nivel de utilizacin de materiales educativos. Igualdad o Intervalo desigualdad de diferencias Igualdad o Razn desigualdad de razones Si B .x (b 0) Si Si Rendimiento acadmico, Nmero de estudiantes. A + b.x (b 0) Si Si No Temperatura, inteligencia
ESCALAS PARA LA MEDICION DE ACTITUDES La escala de clasificacin por categoras es la que usan ampliamente los investigadores de ciencias de la salud y sociales.
Escala de clasificacin por categoras: Existen cuatro categoras a partir de las cuales los entrevistados pueden elegir para sealar su nivel general de satisfaccin. - Muy satisfecho (+2) - Satisfecho (+1 ) - Algo satisfecho (0) - No del todo satisfecho (-1)
Escala De Comparacin: Es una versin de la escala de categoras, califica a estas categoras como: excelente, muy bueno, bueno, regular y deficiente, eliminando de esta forma la comparacin implcita. El problema con tal escala es que el punto de referencia es poco claro y diferentes entrevistados pueden usar diferentes puntos de referencia o estndares.
Escala de Likert: La escala de Likert requiere que un entrevistado indique un grado de acuerdo o desacuerdo con respecto a una variedad de afirmaciones (reactivos) relacionadas con el objeto de las actitudes.
Es un tipo de instrumento de medicin o de recoleccin de datos que disponemos en la investigacin social. Es una escala para medir las actitudes. Consiste en un conjunto de tems bajo la forma de afirmaciones o juicios ante los cuales se solicita la reaccin (favorable o desfavorable, positiva o negativa) de los individuos.
Alternativas o puntos en la escala de Likert Asignacin Asignacin Numrica I 2 Numrica II 5 Muy de acuerdo Totalmente de acuerdo Definitivamen Completame te s nte verdadero 1 4 De acuerdo De acuerdo Probablemen te s 0 3 Ni de acuerdo, ni en desacuerdo -1 2 En desacuerdo -2 1 Muy en desacuerdo En desacuerdo Totalmente en desacuerdo Probablemen te no Definitivamen Completame te no nte falso Falso Neutral o indiferente Indeciso Ni falso, ni verdadero Verdadero Alternativa A Alternativa B Alternativa C Alternativa D
Para obtener las puntuaciones de la escala de Likert, se suman los valores obtenidos respecto de cada items. El puntaje mnimo resulta de la multiplicacin del nmero de tems por 1. Una puntuacin alta est dada por el nmero de tems o afirmaciones multiplicado por 5.
Ejemplo 11: Ha encontrado en la institucin educativa el apoyo y las facilidades necesarias para que usted desarrolle de modo ptimo su trabajo. ( ) Definitivamente s ( ) Probablemente s
Ejemplo 12: El Director de la UGEL se preocupa por el bienestar del recurso humano. Categoras de Respuesta Frecuencia Porcentaje Asignacin de puntajes Totalmente de acuerdo De acuerdo Indeciso En desacuerdo (5) (4) (3) (2) 2 4 7 9 23 n=45 4.4% 9% 15.6% 20% 51% 100% 2(5) 4(4) 7(3) 9(2) 23(1) Total=88
Para interpretar el puntaje se ubica en los tramos de la escala de likert. Totalmente En (1) 45*1=45 En Indeciso (3) De acuerdo (4) Totalmente de Acuerdo (5)
45*3=135 45*4=180
45*5=225
La puntuacin 88 se aproxima a 90, por lo tanto se ubica en la parte que indica en desacuerdo.
Variable independiente Es aquella que juega un rol determinante, causal o de influencia en otra u otras variables, supone cierta autonoma con relacin a las dems variables, pero es necesario, sealar que las variables independientes en determinados problemas, pueden cambiar, segn
sea la posicin que ocupen en el enunciado, debido a que la realidad est en movimiento y que todos los hechos estn concatenados. Este tipo de variable se encuentra en las siguientes investigaciones: 1. Explicativa, 2. Relacional 3. Experimental ( en la experimental se le conoce como estmulo)
Variable dependiente Es aquella que juega un rol de consecuencia, al ser determinada, originada o influida por la variable independiente. Esto significa que no pueden existir variables dependientes sin las independientes. Considerando el tiempo, las independientes son ms antiguas que las dependientes. Se encuentran en las siguientes investigaciones: 1. Explicativa 2. Relacional 3. Experimental (La variable dependiente en una investigacin experimental se le conoce como respuesta) Ejemplo 13: En el problema influencia del uso de mapas mentales en el rendimiento acadmico de los estudiantes de las I.E de la regin de Cusco, 2011. Variable independiente: Rendimiento Acadmico Variable dependiente: Uso de mapas mentales
Variable Intermedia Es aquella que juega un rol de factor condicionante, pues su presencia entre la variable independiente y variable dependiente hace que sin tener el carcter de factor causal o determinante, modifique le resultado ms complejas y de mayor profundidad.
Ejemplo 14: En el estudio de formacin acadmica y rol de la experiencia en el desempeo profesional, Quillabamba. 2011. Variable independiente: formacin acadmica. Variable Dependiente: Desempeo profesional Variable Intermedia : Experiencia
Variable interviniente Es aquella que en ciertas medida juega un rol pasivo en el problema, pues permite medir las caractersticas, atributos, estructuras, incidencia, elementos o aspectos que se son inherentes. La variable interviniente, la encontramos en investigaciones: 1. Descriptiva 2. Comparativa.
Ejemplo 15: En el problema: Niveles de desnutricin de los estudiantes de las instituciones educativas de la ciudad de Sicuani, 2011. Variable interviniente : Nivel de desnutricin. Variables Asociadas Son aquellas que no guardan mayor nivel de dependencia, no hay relacin causal entre ellas y considerando el criterio tiempo vienen a ser ms o menos contemporneas, pues para que aparezca el problema surgen de manera simultnea. Este tipo de variables, se encuentra en la investigacin descriptiva multivariable, se trata de dos o ms variables intervinientes, por lo que nunca van acompaadas de algn otro tipo de variables.
Ejemplo 16: En el problema: Rasgos sociales y culturales de los profesores de la ciudad de Cusco , 2011.
culturales
Variables Interdependientes Son aquellas que indistintamente pueden ser consideradas como causa o como consecuencia una de otra. Corresponden a la investigacin correlacional.
Ejemplo 17: En el problema: Correlacin entre tipo de alimentacin y obesidad de los estudiantes de la ciudad de Cusco, 2010. Las variables interdependientes, son tipo de alimentacin y obesidad
Comparativa Interviniente
Observaciones: 1. Las variables segn su naturaleza se clasifican en cuantitativas y cualitativas. 2. Las variables segn su relacin casual se clasifican en:
independiente, dependiente, interviniente. En el rea de las ciencias de la salud, se tiene los siguientes tipos de investigacin biomdica.
1.13
RECOPILACIN DE DATOS.
Dentro de un proceso de investigacin una de las actividades que se realizan es la recopilacin de datos, la cual es el acopio de informacin y se incluye
desde elaborar fichas bibliogrficas hasta la aplicacin de cuestionarios con el empleo de tcnicas de muestreo. Para Hernndez et.al. (2006) un instrumento de medicin es un recurso que utiliza el investigador para registrar informacin o datos sobre las variables que tiene en mente. La construccin de instrumento consiste en generar un nmero suficiente de tems para medir todas las variables con todas sus dimensiones.
La investigacin documental. Consiste en el estudio de documentos escritos sobre un objeto determinado, es decir son todos aquellos documentos registrados en diferentes dispositivos fsicos a los que podemos tener acceso en forma directa o indirecta para su consulta y se puede clasificar en: 1.- Documental bibliogrfica 2.- Documental hemerogrfica 3.- Documental escrita 4.- Documental audiogrfica 5.- Documental videogrfica 6.- Documental iconogrfica
La investigacin de campo. Consiste en obtener informacin directa mediante diferentes actividades por contacto directo con el hecho que se quiere investigar as como las personas relacionadas y se puede realizar: a) Por observacin directa b) Por interrogacin
La observacin. Es el procedimiento emprico bsico, el cual consiste en realizar la percepcin intencionada de una actividad determinada
mediante la experimentacin la cual consiste en la obtencin de datos cuantitativos por medio de la medicin del fenmeno que se este observando. Para realizar la observacin se utilizan diversos
3.- La entrevista
La Entrevista. Es una de las tcnicas ms comunes y es considerada como la relacin directa entre el investigador y el objeto de estudio a travs de individuos o grupos con el fin de obtener testimonios reales. a) Entrevistas formales b) Entrevistas informales
La Encuesta. Consiste en recopilar informacin sobre una parte de la poblacin. La informacin recopilada puede emplearse para un anlisis cuantitativo con el fin de identificar las magnitudes del problema.
El Cuestionario. Es un eficaz auxiliar en la observacin cientfica que contiene aspectos del fenmeno esenciales, las cuales son preguntas formuladas por escrito y no es necesaria la presencia del investigador. - Cuestionarios por correo - Cuestionario administrado por el entrevistado - Cuestionario administrado por el entrevistador
La Cedula. Tiene carcter de annimo, donde el encuestador es quien llena la cedula de entrevista, adems de que es posible aclara la informacin sobre las preguntas y es utilizada cuando una persona tiene un bajo nivel cultural.
La validacin de los instrumentos se realiza con el fin de conseguir una mayor objetividad al seleccionar los tems en los respectivos cuestionarios.
VALIDEZ DE CONTENIDO El proceso de validacin de contenido es eminentemente lgico, si bien pueden utilizarse jueces expertos en el tema para valorar la congruencia entre los diversos items y los diversos objetivos. Existen procedimientos cuantitativos diversos para que cada experto valore el grado en que un tem sirve para evaluar el objetivo al que corresponde. El procedimiento cuantitativo ms sencillo sera el siguiente: Especificar los diversos objetivos (v.gr. reas diferentes de contenidos) que se Pretenden evaluar. Elaborar varios tems para cada objetivo. Seleccionar una muestra de expertos en el contenido del test. Pedirles que, segn su opinin, asignen cada tem al objetivo que pretende medir. Seleccionar los tems en los que los expertos manifiestan mayor acuerdo en sus clasificaciones.
ESCALA DE VALORACION
1 2 3 4 5
en este instrumento, son una muestra representativa del universo materia del estudio? 4. Considera usted que si aplicamos en reiteradas oportunidades este instrumento a muestras similares, obtendramos tambin datos similares? 5. Considera usted que los conceptos utilizados en este instrumento, son todos y cada uno de ellos, propios de las variables del estudio? 6. Considera usted que todos y cada uno de los tems contenidos en este instrumento tienen los mismos objetivos? 7. Considera usted que el lenguaje utilizado en el presente instrumento es claro, sencillo y no da lugar a diversas interpretaciones? 8. Considera usted que la estructura del presente instrumento es adecuada al tipo de usuario a quien se dirige el instrumento? 9. Estima usted que las escalas de medicin utilizadas son pertinentes a los objetos materia de
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
estudio? 10. Que aspectos habra que modificar, que aspectos tendran que incrementarse o que aspectos habra que suprimirse?
PROCEDIMIENTO El mtodo DPP mide la adecuacin de los instrumentos, para medir la variable de inters, en funcin a la valoracin de los expertos. Ejemplo 18. En el presente estudio la valoracin de los expertos es:
2. Con los promedios hallados, se determina la distancia de punto mltiple (DPP), mediante la siguiente ecuacin:
DPP = (X 1 Y1 )2 +(X 2 Y2 )2 + ................(X 9 Y9 )2
Determinar la distancia mxima (Dmax) del valor obtenido respecto al punto de referencia Cero (0), con la ecuacin:
2 2 2 D x ) (1 x ) . . . . . . . . . . . . . . . . . . . (1 x ) M a x (1 1 2 n
Donde: Xi = Valor mximo en la escala concedido para el tem i. 1 = Valor mnimo de la escala para cada tem.
DMax
(5 1) 2
(5 1) 2
...................(5 1) 2
12
La Dmax hallada fue de 12 La Dmax se divide entre el valor mximo de la escala, lo que nos da un valor de 12/5=2.4 5. Con el valor hallado anteriormente (apartado 4) se construye una nueva escala valorativa a partir de cero, hasta llegar a Dmax. Dividindose en intervalos Iguales entre si, llamndose con las letras A, B, C, D, y E. Siendo: Valoracin Escala 02.4 2.44.8 4.87.2 7.29.6 9.612 E = inadecuacin B = Adecuacin en gran medida C = Adecuacin Promedio D = Escasa Adecuacin A = Adecuacin Total Valoracin de Expertos DPP=1.541
6. El punto DPP debe caer en las zonas A o B; en caso contrario, la encuesta requiere reestructuracin y/o modificacin, luego de las cuales se somete nuevamente a juicio de expertos. El valor hallado del DPP fue de 1.541 cayendo en la zona A, lo que indica la Adecuacin del instrumento y que puede ser aplicado.
TEM Claridad En la
Criterios a evaluar Coherencia interna Induccin a la Lenguaje Adecuado Con el nivel (sesgo) Del informante Si No Si No Si No Si No Si No Mide lo que pretend e medir redacci n respuesta
observaciones ( si debe o
eliminarse
1 .. n Aspectos generales El instrumento contiene instrucciones claras y precisas para responder el cuestionario Los tems permiten el logro del objetivo de la investigacin Los tems estn distribuidos en forma lgica y secuencial El nmero de tems es suficiente para recoger la informacin. En caso de ser negativa su respuesta, sugiera los tems a aadir Validez Aplicable ( ) Validado por: Firma: No aplicable ( ) Si No *************
1.5.10 CONFIABILIDAD del INSTRUMENTO Antes de iniciar el trabajo de campo, es imprescindible probar el cuestionario sobre un pequeo grupo de poblacin. Esta prueba piloto ha de garantizar las mismas condiciones de realizacin que el trabajo de campo real. Se recomienda un pequeo grupo de sujetos que no pertenezcan a la muestra seleccionada pero s a la poblacin o un grupo con caractersticas similares a la de la muestra del estudio, aproximadamente entre 14 y 30 personas. De esta manera se estimar la confiabilidad del cuestionario. La confiabilidad responde a la pregunta con cunta exactitud los tems, reactivos o tareas representan al universo de donde fueron seleccionados?. El trmino confiabilidad designa la exactitud con que un conjunto de puntajes de pruebas miden lo que tendran que medir (Ebel, 1977, citado por Fuentes, op. cit., p. 103).
Mtodo Test-Retest: una forma de estimar la confiabilidad de un test o cuestionario es administrarlo dos veces al mismo grupo y correlacionar las puntuaciones obtenidas. El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad porque denota la coherencia de las puntuaciones en el tiempo Para un desarrollo adecuado y sean confiables deben variar entre 0,80 y 0,95 (Popham, 1980, citado por Fuentes, op. cit.). Se usa la correlacin por el mtodo de los puntajes directos (Correlacin r de Pearson):
rxy n
Donde:
n xi2
xi yi
2
xi
yi yi2 yi
2
xi * n
Y: valores de Y (2 aplicacin) Mtodo comn de divisin por mitades o Hemitest: este mtodo computa el coeficiente de correlacin entre los puntajes de las dos mitades del test o cuestionario aplicado. Esto supone que las dos test mitades son paralelos, tienen igual longitud y varianza entre s. Se estima a travs del coeficiente de confiabilidad de Spearman-Brown: Se establece la correlacin entre los dos puntajes de las dos mitades del test a travs del mtodo de los puntajes directos, Correlacin r de Pearson:
r12 n
2r12 1 r12
n x12
x1 x2
2
x1
x2
2 x2
x1 * n
x2
rtt
Se interpreta la prueba de hemitest como coeficiente de consistencia interna, ya que una sola prueba contiene las dos formas equivalentes y su nfasis lo pone en las puntuaciones de los sujetos, no en los temes.
El mtodo de divisin por mitades de Rulon: utiliza la divisin del test en mitades, pero su mtodo no supone necesariamente varianzas iguales en los sub-tests. coeficiente de consistencia interna.
rtt
Donde:
2 sd 1 2 st
El mtodo de divisin por mitades de Guttman: tambin se denomina coeficiente de consistencia interna. Su frmula es:
rtt
Donde:
2 sa sb2 2 1 st2
ALFA DE CRONBACH
Para evaluar la confiabilidad o la homogeneidad de las preguntas o tems es comn emplear el coeficiente alfa de Cronbach cuando se trata de alternativas de respuestas policotmicas, como las escalas tipo Likert; la cual puede tomar valores entre 0 y 1, donde: 0 significa confiabilidad nula y 1 representa confiabilidad total. El coeficiente de Cronbach puede ser calculado por medio de la varianza de los tems y la varianza del puntaje total (Hernndez Sampieri et al, 2003). Para calcular el coeficiente de confiabilidad se us el COEFICIENTE ALFA DE CROMBACH ( ) Crdova (2009), cuya ecuacin es:
donde: : coeficiente de confiabilidad de la prueba o cuestionario nmero de tems del instrumento : Varianza total del instrumento. : Sumatoria de las varianzas de los tems.
Mtodo de Kuder-Richarson 21: permite obtener la confiabilidad a partir de los datos obtenidos en una sola aplicacin del test. La suposicin bsica es considerar que todos los temes presentan igual varianza. Coeficiente de consistencia interna.
KR21
Donde:
n n 1
M n M nst2
n: nmero total de tems M: media aritmtica de las puntuaciones obtenidas por los individuos
TABLA DE CATEGORAS ESCALA CATEGORA Confiabilidad muy alta Confiabilidad alta Confiabilidad aceptable Confiabilidad moderada Confiabilidad baja Confiabilidad muy baja Confiabilidad despreciable
Ejemplo 19. Determine la confiabilidad, utilizando alfa de cronbach, para la siguiente informacin
Encuestados 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Total 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 3 2 0 1 1 0 0 0 0 0 0 1 0 1 0 0 1 5 3 3 0 1 0 0 1 0 0 0 0 0 1 0 0 0 4 1 1 2 1 1 1 2 0 1 2 1 1 1 2 0 17
Preguntas (tems) 5 1 2 1 1 1 1 1 0 1 2 1 2 2 2 0 18 6 1 1 1 0 1 1 2 1 0 2 1 2 2 0 0 15 7 0 1 0 0 2 0 2 0 0 0 0 0 0 0 0 5 8 0 1 0 1 1 1 1 0 0 2 1 2 0 1 1 12 9 0 2 0 0 0 0 0 0 0 2 2 0 0 0 0 6 10 0 2 0 0 0 0 2 0 0 2 2 1 0 0 0 9
Puntos
3 12 5 3 7 4 10 1 3 13 9 9 5 6 3 93
0.17 0.24 0.17 0.42 0.45 0.57 0.53 0.46 0.69 0.83
Para medir la variable de estudio se aplico una encuesta utilizando la escala de likert, la misma que presenta en cada tems cinco alternativas, a partir de las cuales los entrevistados pueden elegir, con la finalidad de sealar su nivel de acuerdo. - Alternativa a (5) - Alternativa b (4) - Alternativa c (3) - alternativa d (2) -alternativa e (1) Para obtener las puntuaciones de la variable de estudio, se suman los valores obtenidos respecto de cada tem. El puntaje mnimo (PM) resulta de la multiplicacin del nmero de tems (x) por 1. Una puntuacin alta (PA) est dada por el nmero de tems o afirmaciones multiplicado por 5.
PM--------------------I----------------------I----------------------I------------------PA
puntuaciones
de la variable de estudio se
Puntaje Obtenido
2.5x 3.5x
Puntaje 4.5x
5.11 MATRIZ DE CONSISTENCIA. Esta referido a la estructura del proyecto de Investigacin desarrollado y que para fines didcticos se presenta en el siguiente esquema: TITULO: PROBLEMA General .? Formulacin de problemas especficos. 1. .? 2. 3. ? Objetivo especfico .. .. . Formulacin de hiptesis operativas. .. .. . .. Variable Dependiente OBJETIVO General HIPOTESIS General VARIABLES Variable independiente
TIPO DE ESTUDIO Nivel de investigacin. Tipo de investigacin. Diseo de investigacin VARIABLES 1 DIMENSIONES 1
MODELO DE TESIS TTULO DE LA TESIS: CAPITULO I: PROBLEMA DE INVESTIGACIN PLANTEAMIENTO DEL PROBLEMA FORMULACIN DEL PROBLEMA DE INVESTIGACIN OBJETIVOS JUSTIFICACIN ORIGINALIDAD: PERTINENCIA: RELEVANCIA: OPORTUNIDAD: FACTIBILIDAD: IMPORTANCIA LIMITACIN REA DE ESTUDIO DELIMITACIN DELIMITACIN ESPACIAL DELIMITACIN TEMPORAL CAPITULO II: MARCO TERICO ANTECEDENTES DE ESTUDIO MARCO CONCEPTUAL MARCO NORMATIVO MARCO TERICO CONCEPTUALIZACIN EN TRMINOS HIPTESIS DE INVESTIGACION. CAPITULO III: DISEO METODOLGICO NIVEL DE INVESTIGACIN TIPO DE NVESTIGACION. DISEO DE INVESTIGACIN POBLACIN Y MUESTRA VARIABLES OPERACIONALIZACIN DE VARIABLES TCNICAS E INSTRUMENTOS DE RECOLECCIN DE DATOS
41
EJERCICIOS PROPUESTOS.
1.
Influencia del uso de materiales didcticos en el rendimiento acadmico de los estudiantes de la ciudad de Cusco. Especifique. a. La(s) variable(s) de estudio y el tipo de variable. b. La escala de medicin a emplear. c. Nivel de investigacin. d. Tipo de investigacin e. Diseo de investigacin
2.
Se realizo el estudio de la calidad de vida y servicio educativo de los profesores de las I.E de la UGEL Cusco. Especifique a. Proponer un titulo para esta investigacin. b. La(s) variable(s) de estudio y el tipo de variable. c. La escala de medicin a emplear. d. Nivel, tipo y diseo de investigacin.
3.
Se hizo una encuesta a una muestra representativa de profesores de la UGEL La Convencin sobre el nivel de acuerdo con la carrera pblica magisterial propuesta por el gobierno. Carrera publica magisterial. Totalmente de acuerdo De acuerdo Indeciso En desacuerdo Totalmente en desacuerdo Frecuencia 15 40 25 10 6
42
ESTADISTICA
4.
Clasificar cada una de las siguientes variables : a. b. c. d. e. f. g. h. i. j. k. Rendimiento Acadmico (Bajo, Medio, Alto). Sexo. Edad. Nivel educativo (primario secundario, superior). Aos de estudios completados. Tipo de enseanza (privada o pblica). Estrato social (bajo, medio o alto). Numero Telefnico Numero de DNI de un profesor. Mtodo de enseanza. Nivel de congruencia entre la sumilla y el silabo.
5.
Se aplico un test para medir la competitividad del magisterio a una muestra piloto de 5 profesores, obteniendo los siguientes resultados. Profesor 1 1 2 3 4 5 1 0 1 1 0 2 0 0 0 0 0 3 1 1 0 1 1 tems 4 0 1 1 1 0 5 0 0 1 0 1 6 0 1 1 0 1
43
CAPITULO II ORGANIZACIN Y PRESENTACIN DE DATOS 2.1 ESTADISTICA. La Estadstica es la ciencia que se ocupa de los mtodos y procedimientos de coleccin, clasificacin, organizacin, anlisis, sntesis e interpretacin de datos; siendo su caracterstica que la distingue, la de hacer generalizaciones o inferencias en base a una muestra. Se define la estadstica como: Una ciencia que se ocupa de la recoleccin, organizacin, procesamiento y anlisis de la informacin. Una ciencia que permite tomar de decisiones Herramienta de la investigacin cientfica.
En trminos generales la estadstica aborda dos tipos de problemas: Resumir, describir y explorar datos. Utilizar datos de una muestra para inferir la naturaleza del conjunto del cual se selecciono la muestra.
DIVISION DE LA ESTADISTICA La estadstica se divide en dos partes ntimamente relacionadas: Estadstica Descriptiva: Esta es la parte de la estadstica que se dedica a la organizacin, sntesis y descripcin de conjuntos de datos. Esta es importante, ya que antes de que la mente humana pueda interpretar (hacer inferencias) un conjunto de datos, especialmente cuando estos son demasiados, es necesario resumirlos o representarlos de manera clara, simplificada o reducida.
44
ESTADISTICA
Estadstica Inferencial: Esta rama de la estadstica trata el problema de inferir la naturaleza de un conjunto de datos a partir de una muestra de dichos datos.
Poblacin
Muestra
Inferencias
CONCEPTOS BASICOS Poblacin. Es cualquier conjunto de datos, objetivo de nuestro inters, sobre los cuales interesa observar una o ms caractersticas. Esta puede ser finita o infinita. El tamao de la poblacin es el nmero de individuos que esta tiene. Muestra. Una muestra es un conjunto de individuos de la poblacin que refleja las caractersticas de sta lo mejor posible. Si las caractersticas quedan bien reflejadas, se dice que la muestra es representativa. El tamao de una muestra es el nmero de individuos que tiene, lo denotamos por n. Unidad de estudio. Es cada elemento que va a ser estudiado, normalmente se trate de individuos, pero no tiene por qu ser as. Data. Es cualquier medida resultado de haber observado una variable en una unidad de alguna poblacin. Parmetro. Es una propiedad descriptiva de una poblacin. Ejemplo media y varianza poblacional Estadstico. Es una propiedad descriptiva de una muestra. Ejemplo media y varianza muestral. Variable. Cualquier caracterstica de Inters en el estudio. Variable cualitativa: Ordinal y Nominal Variable cuantitativa: Discreta y continua.
Por otra parte, el reporte de las variables medidas requiere de los siguientes conceptos:
45
2.2 ORGANIZACIN DE DATOS La presentacin de datos a travs de tablas estadsticas es una actividad importante dentro de los sistemas de informacin, estas se fortalecen significativamente cuando se la acompaan con grficos descriptivos ilustrativos. En el contexto de los sistemas de informacin, en ms de una oportunidad se encontrara que un buen grafico resume y expresa mucho ms que prrafos completos de comentarios e interpretaciones literales. Resumir los datos es un procedimiento til para conseguirlo y puede hacerse mediante tablas, grficos o valores numricos. A lo largo de este tema veremos las principales tcnicas numricas y grficas que nos permiten describir una caracterstica de inters observada en una poblacin, poniendo en relieve sus rasgos ms importantes.
2.3 TABLA DE FRECUENCIAS. Un primer resumen de la informacin contenida en un conjunto de datos observado se obtiene al organiza los datos, en una tabla de frecuencias. En sta se recogen los distintos valores (nmeros o categoras) que toma la variable junto con sus correspondientes frecuencias de aparicin.
TABLA DE FRECUENCIAS PARA VARIABLES CUALITATIVAS Si en una muestra de n elementos, se observa k categoras diferentes C1, C2,, Ck de una variable cualitativa X. Para resumir la informacin, previamente definimos algunos conceptos:
La frecuencia absoluta de un valor Ci es el nmero de veces que dicho valor aparece en la muestra. Se representa por fi y cumple
k
fi
i 1
f1
f 2 ......
fk
La frecuencia relativa de un valor Ci es el cociente de la frecuencia absoluta (fi) entre el tamao de la muestra (n), se representa por hi
hi
fi n
, se cumple
hi 1
i 1
46
ESTADISTICA
La frecuencia absoluta acumulada del valor i-simo es la suma de las frecuencias absolutas hasta dicho valor, se denota por Fi
Fi
f1
f 2 ...... fi
La frecuencia relativa acumulada del valor i-simo es la suma de las frecuencias relativas hasta dicho valor, se denota por Fi
Hi
Hi
h1 h2 ...... hi
Fi n
Categora de X C1 C2 . Ck Total
fi f1 f2 fk n
hi h1 h2 hk 1.00
pi p1 pi pk 100
Fi F1 F2 Fk=n
Hi H1 H2 Hk=1
GRAFICAS PARA VARIABLES CUALITATIVAS. Las representaciones grficas prcticamente estn orientadas de acuerdo con las necesidades del investigador o estadstico, de todas formas se tienen algunas normas de trabajo y representacin, que tienen por objeto facilitar la lectura de los datos e informacin que se maneja estadsticamente. La calidad de un grfico estadstico consiste en comunicar ideas complejas con precisin, claridad y eficiencia, de tal manera que: Induzca a pensar en el contenido ms que en la apariencia No distorsione la informacin proporcionada por los datos Presente mucha informacin (nmeros) en poco espacio
47
Favorezca la comparacin de diferentes grupos de datos o de relaciones entre los mismos (por ejemplo una secuencia temporal)
La finalidad de los grficos estadsticos es: Organizar los datos. Observar patrones. Observar agrupamientos. Observar relaciones. Comparar distribuciones. Visualizar rpidamente la distribucin de los datos. Visualizar, obtener y comparar medidas estadsticas.
La tabla de frecuencias para variables cualitativas, se puede representar utilizando los siguientes grficos.
Diagrama de barras o rectangulos Es la representacin grfica usual para variables cualitativas. Para el caso de variables cualitativas se construye dibujando sobre la categora correspondiente un rectngulo con altura igual a la frecuencia (absoluta o relativa). Tambin es vlido para variables cuantitativas discretas, considerando en el eje de abscisas los valores de la variable en orden creciente en lugar de las categoras, sobre cada valor levantamos una barra de altura igual a la frecuencia (absoluta o relativa). Este grafico es recomendable, cuando categoras. la variable de estudio tiene muchas
Diagrama de Pareto. Se ordenan las categoras de mayor a menor importancia y se dibujan los rectngulos correspondientes. Este grafico se recomienda para jerarquizar los factores considerados en el estudio.
48
ESTADISTICA
A cada valor de la variable se le asocia el sector circular proporcional a su frecuencia. Para hallar el ngulo usamos la siguiente proporcin: al tener una circunferencia 360, el cociente entre la frecuencia absoluta (o relativa) total y la frecuencia absoluta (o relativa) que queramos representar ser igual al cociente entre los 360 de la circunferencia y el ngulo a determinar, as:
n fi
Donde
360
1 hi
360
es el ngulo a determinar.
Pictogramas. Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable. La escala de los dibujos debe ser tal que el rea de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa.
TABLA
DE
FRECUENCIAS
PARA
VARIABLES
CUANTITATIVAS
DISCRETAS Una vez obtenida una muestra de cualquier poblacin y observados los valores que toma la variable en los individuos de la muestra, estos valores se suelen ordenar. Si la variable es cuantitativa la ordenacin ser de menor a mayor.
49
Dada una variable X, consideramos una muestra de tamao n que toma k valores distintos, x1, . . . , xk (x1 < x2 < . . . < xk). La organizacin es en forma similar al caso cualitativo.
Valores de X x1 x2 . xk Total
fi f1 f2 fk n
hi h1 h2 hk 1.00
pi p1 pi pk 100
Fi F1 F2 Fk=n
Hi H1 H2 Hk=1
Diagrama de cajas(box-plot) Presentacin visual que describe al mismo tiempo varias caractersticas importantes de un conjunto de datos, tales como el centro, la dispersin, el alejamiento de la simetra, y la identificacin de valores extremos (puntos atpicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos. Presenta los tres cuartiles, (y los valores mnimos y mximos) alineados sobre una caja vertical u horizontalmente. El procedimiento Para el diagrama de cajas y bigotes es:
1. Dibujar un segmento con extremos en los valores menor y mayor que aparecen en la muestra paralelo a uno de los ejes. 2. Dibujamos una caja con extremos en el primer y tercer cuartil y marcamos en ella la mediana. 3. Se hallan los lmites interiores (Q1 1.5 IQR y Q3 + 1.5 IQR) y los lmites exteriores (Q1 3 IQR y Q3 + 3 IQR). Donde Qi : Cuartiles que seran desarrollados ms adelante. 4. Se unen, con unos segmentos (bigotes), Q1 y Q3 con los valores adyacentes de la muestra.
50
ESTADISTICA
Tallos y Hojas (stem & leaf) Procedimiento semigrfico para el que se preparan los datos resumindolos en dos o tres cifras (expresndolos en las unidades adecuadas). A continuacin se disponen en una tabla de dos columnas del siguiente modo:
1. Si los datos son de dos dgitos, a la izquierda (en el tallo) aparece la cifra de las decenas, a la derecha separada por una lnea aparecen las hojas y se escriben ordenadas y todas seguidas. 2. Si hay tres dgitos el tallo est formado por los dos primeros. Las hojas son las unidades.
TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS CONTINUAS A veces se hace necesario trabajar con datos agrupados. Definimos entonces como clase a cada uno de los intervalos en que se agrupan los datos. Las frecuencias harn ahora referencia al nmero de datos que hay en cada intervalo.
Para construir distribucin de frecuencias por intervalos, se tiene los siguientes pasos:
Elegir un nmero de intervalos de clase (K) Puede utilizar la regla de Sturges, Donde k: Nmero de intervalos. n: Nmero de datos.
k 1 3.3log(n)
Determinar el rango.
xmax
xmin
R/k
51
I1
xmin , xmin
LI1, LS1
I2
xmin
A, xmin 2 A
LI2 , LS2
Ik
xmin (k 1) A, xmin kA
LI k , LSk
mi
LI i 2
LSi
LS : Limite superior.
Ii I1 I2 . Ik Total
mi m1 m2 mk
fi f1 f2 fk n
hi h1 h2 hk 1.00
hi h1 h2 hk 1.00
pi p1 pi pk 100
Fi F1 F2 Fk=n
Hi H1 H2 Hk=1
Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polgonos de frecuencias.
52
ESTADISTICA
Histograma de frecuencias Un histograma es la representacin ms frecuente con datos agrupados, se construye a partir de la tabla estadstica, representando sobre cada intervalo, un rectngulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectngulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el rea de los mismos.
Polgono de frecuencias El polgono se construye fcilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante lneas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polgono de frecuencias en el primer y ltimo intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una lnea recta los puntos del histograma que corresponden a sus marcas de clase.
Ojivas Es una poligonal construida uniendo los puntos cuyas abscisas son los lmites superiores de clases y las ordenadas son las frecuencias absolutas acumuladas
53
Resumen de grficos. Variable Cualitativa Tipo Nominal Ordinal Grfico Sectores circulares, barras, pictogramas, pareto. Cuantitativa Discreta Bastones, barras, box plots, tallos y hojas Continua Histogramas, polgonos de frecuencia, Ojivas, Grafico de cajas, Boxplots, tallos y hojas.
54
ESTADISTICA
EJERCICIOS DESARROLLADOS
del mtodo de
enseanza: Clsico(A), Nuevo enfoque (B), Ambos mtodos(C), 30 docentes dieron las siguientes respuestas: A, B, B, B, C, B, B, B, A, A, B, B, C, A, B, C, B, A, A, B, B, B, C, C, B, B, C, C, C, B Construir la distribucin de frecuencias y represente la informacin mediante un grafico. Solucin. Mtodo Clsico Nuevo Enfoque Ambos mtodos Total n=30 fi 6 16 8 hi 0.2 0.5333 0.2667 1.00 pi 20 53.33 26.67 100.00
12
frequency
55
Pie Chart of C1
Category Ambos metodos Clasico Nuevo enfoque
2. En un estudio realizado de los hbitos estudio de los estudiantes de I.E de la ciudad de Cusco, se cuadro siguiente. obtuvo los siguientes resultados que se muestra en el
Frecuencia 96 83 71 250
40
30
Porcentaje
20
10
Hbito de estudio
56
ESTADISTICA
3. El Director de una institucin educativa desea analizar el nmero de tardanzas presentadas por los estudiantes. Para ello, se toma una muestra aleatoria de 50 estudiantes obtenido los siguientes datos de tardanzas: 2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4 3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1 En base a la informacin: a) Cul es la poblacin objeto de estudio? b) Qu variable estamos estudiando? c) Qu tipo de variable es? d) Construir la tabla de frecuencias? Solucin: a) La poblacin objeto de estudio es el total de estudiantes de la I.E. b) La variable (x) que estamos estudiando es el nmero de tardanzas c) El tipo de variable es discreta ya que el nmero de tardanzas solo puede tomar determinados valores enteros d) Para construir la tabla de frecuencias tenemos que analizar el nmero de tardanzas de los estudiantes. Podemos ver que el nmero de tardanzas, toma los valores existentes entre 0 y 6 hijos: Xi 0 1 2 3 4 5 6 fi 2 4 21 15 6 1 1 n = 50 Fi 2 6 27 42 48 49 50 hi 0.04 0.08 0.42 0.30 0.12 0.02 0.024 1 Hi 0.04 0.12 0.54 0.84 0.96 0.98 1
4. En la UGEL de la regin Cusco, se realizo un estudio sobre el conocimiento de estrategias cognitivas. Los resultados se muestran a continuacin.
57
60,0%
Porcentaje
40,0%
20,0%
Conocimiento
5. Por encargo del nutricionista, se debe dar la siguiente cantidad de caloras a un grupo de 50 estudiantes de una institucin educativa.
3255 1895 2155 2456 1525 4450 4243 3024 4244 1255
2123 2740 3255 3772 3847 2793 4124 3214 4955 4675
3525 4525 2460 4220 3005 1965 4595 4509 3925 4580
2123 3215 1985 2971 2224 2327 2643 3727 2220 3437
3453 2593 3530 4685 2646 4525 3797 4134 2335 2702
58
ESTADISTICA
a) Organice la informacin en una tabla de frecuencias. b) Represente la informacin utilizando: Histograma de frecuencias porcentuales acumuladas y Ojiva. c) Trace el histograma y polgono de frecuencias porcentuales.
Solucin. a) Construiremos la tabla de frecuencias. Nmero de clases. Usando la relacin de sturges se tiene:
xmax
xmin
R k
3700 7
528,57
hi 0,0400 0,1600
[2312,14 - 2840,71 ) 2576,43 10 0,2000 [2840,71 - 3369,29 ) 3105,0 7 0,1400 0,1600 0,1200 0,1800
50 1
59
100 80
Ojiva
60
Histograma
40 20 0 0 1 2 Calorias
Histograma
5 (X 1000,0)
20
Frecuencia Porcentual
Polgono de frecuencias
60
ESTADISTICA
6. Un investigador recopila informacin del peso de 50 profesores. Los datos obtenidos fueron los siguientes. 65 63 65 63 69 67 53 64 65 64 72 68 66 55 64 65 64 71 68 66 56 63 65 63 70 67 66 57 64 64 63 69 67 66 58 a. Construya la tabla de distribucin de frecuencias 58 57 59 59 60 60 60 61 61 61 61 62 62 62 62
Solucin. a. Para construir una tabla de frecuencia se tiene los siguientes pasos. Elegir el nmero de clases. Usando la relacin de sturges se tiene:
k 1 3.3log(n) 1 3.3log(50) 7
xmax
xmin
72 53 19
LI - LS [52 55) [55 58) [58 61) [61 64) [64 67) [67 70) [70 73) TOTAL
fi 2 5 9 15 12 5 2 n=50
Fi 2 7 16 31 43 48 50
pi 4 10 18 30 24 10 4 100
61
b.
Histogram 30 25
percentage
20 15 10 5 0 52 56 60 64 Peso 68 72 76
62
ESTADISTICA
EJERCICIOS PROPUESTOS.
1. Un investigador realiza una investigacin con la finalidad de comparar la eficiencia de los siguientes mtodos de comprensin lectora: A: Enseanza directa. B: Enseanza recproca. C: Combinacin de los mtodos de enseanza directa y enseanza recproca. Si se aplico cada mtodo en forma independiente en tres secciones diferentes de 50 alumnos cada uno, obtenindose, que 30 alumnos con el mtodo de enseanza directa, 20 con mtodo de enseanza reciproca y 35 con la combinacin de estos mtodos presenta una buena comprensin lectora. En base a estos resultados cual es su conclusin del estudio.
evaluar la
influencia de los programas de capacitacin de docentes fomentados por el Estado en la calidad de servicio educativo. Los resultados son los siguientes: I.E 1 2 3 4 5 6 7 Donde X: Programas de capacitacin. Y: Calidad del servicio educativo. M: Mala, R: Regular, B: Buena, MB: Muy buena. Cul es su conclusin del estudio X R M M R B M R Y R M R M B M R I.E 8 9 10 11 12 13 14 X MB R R M M R MB Y MB R M M R R B I.E 15 16 17 18 19 20 21 X R R M M M B B Y R M R M M B R
3. Se ha medido la comprensin lectora de una muestra de 50 profesores de la UGEL A, Los resultados son los siguientes: 30, 35, 34, 38, 40, 42, 43, 43,
63
44,44,45,45,46,46,46, 47, 48, 50, 55, 56, 58, 59, 60, 63, 65, 66, 67, 67, 68, 70, 72, 74, 75, 77,78,78,78,78, 78, 79, 79, 79, 80,82, 82, 83, 88, 90, 96,99 a) Organiza y representa adecuadamente la informacin. b) Redacte sus conclusiones del estudio.
4. Los siguientes datos corresponden a una muestra de 30 estudiantes de un centro educativo de la ciudad de Cusco, en los cuales se midieron tres caractersticas: Peso en libras (X), Nmero de tardanzas en el ao escolar (Y) y Estrato socioeconmico (Z)
X 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 149 168 126 138 176 163 119 154 165
Y 3 5 1 4 3 2 0 1 5 3 4 2 2 4 5 4 4 0 1 2 2 3 5 2
Z MEDIO MEDIO ALTO BAJO MEDIO MEDIO BAJO BAJO MEDIO ALTO BAJO MEDIO MEDIO ALTO BAJO MEDIO MEDIO MEDIO ALTO BAJO MEDIO MEDIO BAJO BAJO
64
ESTADISTICA
3 4 1 1 2 2
Identifique los siguientes conceptos: a) Poblacin. b) Muestra. c) Unidad de anlisis. d) Variables o caractersticas de inters e) Clasifique las variables definidas anteriormente
II.
Construya una tabla de frecuencias para presentar el estrato socioeconmico de los estudiantes con su correspondiente ttulo y anxele un grfico adecuado.
III.
Construya una tabla de frecuencias para presentar el nmero de tardanzas al ao de los estudiantes con su correspondiente ttulo y anxele un grfico adecuado.
IV.
Construya una tabla de frecuencias de 5 intervalos para presentar el peso de los estudiantes con su correspondiente ttulo y anxele un grfico adecuado.
V.
De las tablas construidas anteriormente responda las siguientes consultas: a) Qu porcentaje de estudiantes corresponde al estrato socioeconmico bajo? b) Cuantos estudiantes realizan, presentaron a lo ms dos tardanzas al ao? c) Qu porcentaje de estudiantes no presento tardanzas en el ao? d) Cuntos estudiantes tienen un peso a lo ms de 167? e) Qu porcentaje de estudiantes tiene un peso mayor a 127 y menor o igual a 159? f) Cuntos estudiantes tienen un peso mayor a 159?
5. Una encuesta realizada en un grupo de profesores sobre el uso de los distintos tipos de estrategias metodolgicas, dio los siguientes resultados
A B D
D A A
B B D
A A C
D C A
D A C
A A C
C D D
D D A
65
B D
A C
D A
B D
A A
B B
C A
C B
A A
Confeccionar una tabla de frecuencias que recoja esta informacin y elabora dos tipos de grficos distintos a partir de ella. Qu porcentaje de profesores utiliza cada estrategia? 6. Los datos siguientes representan el nmero de gestiones realizadas en instituciones pblicas o privadas de 52 Directores de igual nmero de centros educativos en el ao 2009: 0 2 0 1 3 4 0 2 1 3 0 2 2 1 0 5 2 6 1 2 1 4 1 1 0 1 1 2 0 5 2 0 4 3 2 4 3 2 1 6 2 3 3 5 1 3 6 1 3 4 5 0 2 3 a) Identifique los siguientes conceptos: i) Poblacin analizada. ii) Elementos de la poblacin. iii) Caracterstica en estudio. iv) Tipo de dato analizado. b) Construya una tabla de frecuencias completa para estos datos y escrbale un ttulo. c) d) Trazar una grafica adecuada. Con la tabla construida en c) entregue la siguiente informacin al Director de la UGEL: i) Cuntos Directores , realizaron a lo ms 3 gestiones?. ii) Qu porcentaje de Directores, realizo exactamente 5 gestiones?.
7.
Se ha realizado una encuesta a 30 familias en la que se les pregunta el n de integrantes. Las respuestas obtenidas han sido las siguientes: 1, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3. 1. Calcule la distribucin de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. 2. 3. Qu proporcin de familias est compuesta por tres o menos personas? Dibuje el diagrama de barras de frecuencias.
8.
Se le aplico una prueba de inteligencia a los estudiantes de un centro educativo, obteniendo los siguientes datos.
66
ESTADISTICA
87 105 115 89
88 103 114 125 108 107 118 114 129 100 106 113 105 111 82 141 92 132 112 97 135 101 104 130 99 114 91 145
94 95 93
98 140 107 94
108 122 117 114 141 116 108 102 101 118 138 118 123 108 131 127 100 91
99 105 112
96 132
a) Agrupe los datos en y confeccione una tabla de frecuencias b) Trace las graficas adecuadas.
Frecuencia 2 18 30 50
67
3.1 INTRODUCCION. Las tcnicas estudiadas anteriormente permiten una descripcin visual de la distribucin de una variable. En muchos casos, el resumen puede hacerse eficazmente de una forma ms sencilla y precisa, utilizando valores numricos que den idea de la ubicacin o del centro de los datos (medidas de posicin). Usando cantidades que informen de la concentracin de las observaciones alrededor de dicho centro (medidas de dispersin) y mediante nmeros que reflejen la forma (asimetra y apuntamiento) de la distribucin (medidas de forma). La conjuncin de tcnicas numricas y grficas permite una buena descripcin de la variable. Los estadsticos resmenes tratan de reflejar numricamente distintos aspectos de la variable en estudio. Podemos distinguir 4 aspectos o caractersticas principales que pueden resumirse en una distribucin. (Ver cuadro siguiente)
68
ESTADISTICA
Media Centralizacin Mediana Moda Percentiles Cuartiles Posicin Deciles Varianza Medidas descriptivas Dispersin Desviacin tpica Coeficiente de variacin Rango
Nos dan un centro de la distribucin de frecuencias Son valores de la distribucin que dividen en partes iguales Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al
3.2 MEDIDAS DE TENDENCIA CENTRAL Los promedios o medidas de tendencia central son valores representativos de un conjunto de datos. Pretenden resumir todos los datos en un nico valor. Las medidas de tendencia central son fundamentales ya que permiten localizar cuantitativamente la zona central o de mayor acumulacin de informacin de un conjunto de datos correspondientes a una variable, obtenidos de una muestra seleccionada de una poblacin especfica o de un conjunto de resultados del espacio muestral de un experimento aleatorio.
69
Media ( x ) Media para datos sin agrupar: Dado un conjunto de observaciones x1, . . . , xn, la media se representa mediante
x,
se obtiene mediante:
n
x1
x2 ..... xn n
xi
i 1
Media para datos agrupados Consideremos el caso en que tenemos una distribucin de frecuencia variables cuantitativas discretas, en este caso la media es: para
f1 x1
f 2 x2 ..... f k xk n
xi hi
i 1
Si los datos estn agrupados por intervalos, para hallar la media tomamos la marca de las clases,
f1m1
f 2 m2 ..... f k mk n
hi mi
i 1
La media se mide en las mismas unidades que la variable, y tiene el inconveniente de verse muy afectada por la presencia de datos que sean extremadamente grandes o pequeos (datos atpicos).
Mediana (Me) Se calcula para variables cuantitativas; es el valor de la serie de datos que se sita justamente en el centro de la muestra una vez se ha ordenado sta, corresponde a un 50% de valores son inferiores y otro 50% son superiores.
70
ESTADISTICA
Mediana para datos sin agrupar La mediana es el valor del dato central y depende del tamao de la muestra.
Me
xn
2
, para n impar
x Me
n 2
x 2
n 1 2
, Si n es par.
Mediana para datos agrupados Cuando trabajamos con variables agrupadas por intervalos es imposible determinar con precisin los valores que toman los datos, ya que esa informacin se ha perdido en privilegio del agrupamiento intervalo. Por lo tanto, en este caso, debemos buscar otro mtodo para determinar el valor de la mediana.
Me LI
n Fi 1 2 A LI fi
0.5 H i 1 A hi
La mediana slo tiene en cuenta la posicin de los valores en la muestra y por lo tanto tiene mejor comportamiento que la media cuando hay observaciones anmalas.
Moda (Mo) Es el valor con mayor frecuencia. Si hay ms de una moda, la variable se dice multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o cualitativas). Si los datos estn agrupados hablamos de clase modal y ser aquella para la que la frecuencia absoluta sea mayor.
Mo
LI
1
1 2
LI
fi fi fi
1
fi
fi
fi
A
1
71
Donde:
fi
fi
fi
fi
Unimodal
Bimodal
Multimodal
Cmo elegir entre las medidas de tendencia central?- En general, la media es la medida de tendencia central ms til y ms empleada. El uso de la media es el ms apropiado cuando y la distribucin de los datos es unimodal y aproximadamente simtrica. Cuando valores extremos distorsionan la distribucin de los datos, el uso de la mediana es ms apropiado pues se ve menos afectada, pero en la prctica esta medida de tendencia central no se utiliza demasiado. Si se trata de una variable ordinal, o slo necesitas una descripcin rpida y aproximada de la tendencia central, puedes utilizar la moda, que tambin es til cuando la distribucin est distorsionada por valores extremos o la distribucin es bimodal.
3.3 CLASES DE DISTRIBUCIONES Distribucin Simtrica: Se presenta si todas las observaciones estn concentradas en un solo valor de la variable, en este caso la media, mediana y moda coincidiran en el mismo.
Me
Mo
72
ESTADISTICA
Supongamos ahora que las observaciones de la parte izquierda se alejan del valor central ms que las observaciones de la parte derecha, generando una distribucin asimtrica hacia la izquierda; en este caso como la media es la suma de los valores de las observaciones dividido por la cantidad total de observaciones, su valor se correr a la izquierda tambin y por el mismo motivo, la media ser menor que la mediana y ambas menor que la moda, es decir:
Me
Mo
Distribucin asimtrica sesgada a la derecha. En este caso la media, es mayor que la mediana y que la moda.
Mo
Me
3.4
MEDIDAS DE POSICIN. Cuartiles Dividen la muestra, ordenada de menor a mayor, en 4 partes iguales, y se denotan por Qi , i=1,2,3
Qi
LI i
i.n Fk 4 fk
73
Q1, primer cuartil, al menos el 25% de los datos son menores o iguales que l y al menos el 75% de los datos son mayores o iguales que l. Q2, segundo cuartil, es la mediana, Q2 = Me. Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales que l y al menos el 25% de los datos son mayores o iguales que l.
Pi
LI i
i.n Fk 100 fk
son menores o iguales que l y al menos el (100-i) % de los datos son mayores o
A partir de las definiciones de los cuartiles y percentiles, es claro que Q1 = P25, Q2 = P50 =Me y que Q3 = P75. Deciles Dividen el conjunto de datos en 10 partes iguales y se denota con Di , i=1,9
Di
LI i
i.n Fk 10 fk
3.5
MEDIDAS DE DISPERSIN Mientras los estadsticos de tendencia central nos indican los valores alrededor de los cuales se sitan un grupo de observaciones, los estadsticos de variabilidad o dispersin muestran si los valores de las observaciones estn prximos entre s o
74
ESTADISTICA
estn muy separados. Dos conjuntos de datos pueden tener la misma localizacin central y no obstante, ser muy distintos si uno se halla ms disperso que el otro. La dispersin es el grado en que los datos numricos tienden a extenderse alrededor de un valor medio. La dispersin de la distribucin suministra
informacin complementaria que permite juzgar la confiabilidad de nuestra medida de tendencia central. Si los datos estn ampliamente dispersos, la localizacin central ser menos representativa de los datos en su conjunto de lo que sera en el caso de datos que se acumulasen ms alrededor de la media. Adems, si no conviene tener una amplia dispersin de valores respecto al centro o si esa dispersin implica un riesgo inaceptable, deberemos ser capaces de reconocerlo y no escoger las distribuciones que presentan la mxima dispersin. Las medidas ms importantes son: Varianza, desviacin tpica, coeficiente de variacin muestral, rango y rango semiintercuartilico. Las mismas que se desarrolla a continuacin:
xi S2
i 1
xi2
i 1
n
n
n x
2 n
x2 fi xi2
xi S2
i 1
fi
i 1
n
n 2 n
n
f i mi2
i 1
mi S2
i 1
x n
fi
x2,
75
Las unidades de la varianza son los cuadrados de las unidades de los datos y en muchas ocasiones no son fciles de interpretar. Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto. Si la muestra es pequeo, se recomienda utilizar en el denominador de la ecuacin de la varianza n-1 en reemplazo de n.
s2
.
Observaciones sobre la desviacin tpica: Nos permite determinar con mayor grado de precisin dnde se sitan los valores de una distribucin de frecuencia en relacin con la media. Las unidades de la desviacin tpica se expresan en las mismas unidades de los datos. Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto.
Variables tipificadas Los distintos conjuntos de datos estn asociados por lo general a diferentes medias, ya sea porque son de naturaleza diferente (escalas de medidas diferentes). Con el propsito de reducir los datos a un mismo punto de referencia y a una escala comn, se realiza entre ellos una transformacin llamada tipificacin. Se conoce por tipificacin de una variable x a efectuar el cambio de or igen y de escala de la variable:
z z
x x s x-
76
ESTADISTICA
Esta nueva variable (z), carece de unidades de medida y permite comparar dos o ms cantidades que en un principio no son comparables porque aluden a conceptos diferentes. Tambin es aplicable a casos en que se quieran comparar individuos semejantes de poblaciones diferentes.
Ejemplo 1: Un estudiante obtuvo 84 puntos en el examen final de matemticas, en el que la nota media fue 76, y la desviacin tpica 10. En el examen final de fsica obtuvo 90 puntos, siendo la media 82 y la desviacin tpica 16. En qu examen sobresali ms?.
Examen de matemtica
x = 76
Examen de fsica
x = 82
s = 10 x = 84 z=
84 76 10 0,8
s = 16 x = 90 z=
90 82 16 0,5
Sobresali ms en matemticas.
Coeficiente de variacin Muestral de Pearson Las medidas de dispersin anteriores dependen de las unidades de medida, el coeficiente de variacin es, en cambio, una medida de dispersin relativa y adimensional.
CV
S *100% |X|
CV es apropiado en poblaciones donde los datos son positivos. Si 0<CV<15%, los datos provienen de una poblacin homognea Si CV>15%, los datos provienen de una poblacin heterognea.
El coeficiente de variacin es til, en razn de su carcter adimensional, para comparar muestras con medias desiguales, donde las unidades de medida de las
77
observaciones son diferentes. Tambin para decidir cual muestra es ms homognea o menos variable
R x max
x min
Rango semiintercuartlico y amplitud intercuartil El rango semiintercuartlico es la mitad de la diferencia entre el tercer y primer cuartil, Q = (Q3 Q1)/2. La amplitud intercuartil es el doble del valor anterior, 2Q = IQR = (Q3 Q1). Cmo elegir entre las medidas de dispersin?- La medida de dispersin ms til es la desviacin tpica. Slo debes usar el rango cuando dispones de pocas medidas o cuando todo lo que necesitas conocer es la dispersin general de las medidas. Utiliza el coeficiente de variacin cuando quieras tener una idea de la variabilidad relativa de dos o ms variables cuyas medias son muy diferentes en magnitud. Esto se ve facilitado por su carcter adimensional, es decir, no depende de las unidades en que se mida la media
3.6
MEDIDAS DE FORMA Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda y Hacen referencia a la forma de la distribucin, simtrica, asimetra a la derecha o a la izquierda. En general la mejor manera de verlo es por la representacin grfica, pero si no la tenemos existen coeficientes que nos indican la forma de la distribucin. Los ms utilizados son:
Coeficiente de asimetra de Pearson, El coeficiente de asimetra de una variable mide el grado de asimetra de la distribucin de sus datos en torno a su media, es adimensional y se define como sigue:
78
ESTADISTICA
Ap
Ap
x Mo S
Ap
Ap
negativa.
Curtosis El Coeficiente de Curtosis mide el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin.
La curtosis hace referencia al mayor o menor apuntamiento que tiene una distribucin de frecuencias respecto a una distribucin Normal, por lo tanto slo se estudia en comparacin con la campana de Gauss, se determina mediante:
0.5
K K
0 , la curva es ms puntiaguda que la normal se llama Leptocrtica 0 , la curva es ms aplastada que la normal, se llama Platicrtica
79
80
ESTADISTICA
EJERCICIOS DESARROLLADOS
1. La siguiente tabla muestra los coeficientes de inteligencia de 480 nios. C.I fi 70 4 74 9 78 16 82 28 86 45 90 66 94 85 98 72 102 106 110 114 118 122 126 54 38 27 18 11 5 2
Calcule: a) El C.I. medio de los nios. b) Su desviacin tpica. c) Si una madre afirma que exactamente la mitad de los nios del colegio tienen un C.I. superior al de su hijo, qu C.I. tiene el nio? d) Supongamos que se quieren hacer estudios sobre el proceso de aprendizaje de los nios con mayor C.I., pero que el psiclogo solo puede atender al 15% de los nios del centro. Qu C.I. deber tener un nio como mnimo para ser considerado dentro de ese grupo de elegidos? e) Se van a preparar unas clases de apoyo, para un 25% de los nios del centro, precisamente para aquellos que tengan menor C.I. Hasta que nios de qu C.I. deberemos considerar en estas clases? Solucin: La variable de estudio es el cociente intelectual (X) xi 70 74 78 82 86 90 94 98 102 106 110 114 fi 4 9 16 28 45 66 85 72 54 38 27 18 fixi 280 666 1248 2296 3870 5940 7990 7056 5508 4028 2970 2052 fixi2 19600 49284 97344 188272 332820 534600 751060 691488 561816 426968 326700 233928 Fi 4 13 29 57 102 168 253 325 379 417 444 462 Hi 0.0083 0.0271 0.0604 0.1188 0.2125 0.35 0.5271 0.6771 0.7896 0.8688 0.925 0.9625
81
11 5 2 n=480
0.9854 0.9958 1
a) Media
b) Varianza y desviacin.
xi S2
i 1
x n
fi
i 1
fi xi2 n x2
4473216 480
95.96
110.88
110.88 10.52
xn Me
2
xn
2
x 480
2
x 480
2
x 240 2
x 241
94 94 2
94
d) Percentil 85
P 106 85
e) Percentil 25
P25
2.
90
Un centro educativo particular requiere los servicios de un Profesor. De los expedientes presentados, se han seleccionado 2 candidatos: A y B, los cuales renen los requisitos mnimos requeridos. Para decidir cual de los 2 se va a contratar, los miembros del Jurado deciden tomar 7 pruebas a cada uno de ellos.
82
ESTADISTICA
Candidato 1 A B 57 80 2 55 40 3 54 62
Prueba 4 52 72 5 62 46 6 55 80 7 59 40
a) Halle e interprete la media, mediana y moda de los dos candidatos. b) Estadsticamente Cul de los candidatos debe ser contratado? Fundamente su respuesta.
Solucin: XA 57 55 54 52 62 55 59 394 XB 80 40 62 72 46 80 40 420 XA2 3249 3025 2916 2704 3844 3025 3481 22244 xB2 6400 1600 3844 5184 2116 6400 1600 27144
a) Estadsticos de A.
n
xA
x1 x 2 ..... xn n
xi
i 1
394 7
56.28
MeA
xn
2
MeA
MoA
xn
2
x7
2
x4
55
55
83
Estadsticos de B.
n
xB
x1 x 2 ..... xn n
xi
i 1
420 7
60
MeB
MeB
MoB1
MoB 2
xn
2
xn
2
x7
2
x4
62
40
80
b) Calcular la varianza
n
xi
2 SA i 1
xi2
i 1
n
S | XA |
n
n
10.27 56.28 0.057
n
2 xA
22244 (56.28) 2 7
10.27
CVA
xi
2 SB i 1
xi2
i 1
n
S | XB | 277.7 60
n
0.277
2 xB
27144 7
602
277.7
CVB
84
ESTADISTICA
70
Puntaje
60
50
40 A Postulante B
3. En un examen de matemticas los 30 alumnos de una clase han obtenido las puntuaciones recogidas en la siguiente tabla:
Calificaciones [0, 1> [1, 2> [2, 3> [3, 4> [4, 5> [5, 6> [6, 7> [7, 8> [8, 9>
Alumnos 2 2 3 6 7 1 1 1 1
85
Solucin: I [0, 1> [1, 2> [2, 3> [3, 4> [4, 5> [5, 6> [6, 7> [7, 8> 8, 9 Total fi 2 2 3 6 7 1 1 1 1 24 mi 0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 40.5 mifi 1 3 7.5 21 31.5 5.5 6.5 7.5 8.5 92 mi2fi 0.5 4.5 18.75 73.5 141.75 30.25 42.25 56.25 72.25 440 Fi 2 4 7 13 20 21 22 23 24
fi mi x
Varianza.
n
mi2 fi
92 24
3.83
S2
Desviacin.
x2
440 24
3.83
3.66
s
Coeficiente de Variacin.
3.66 1.91
CV
S |X|
1.91 3.83
0.498
86
ESTADISTICA
Mediana
Me 3
Moda
12 7 *1 3.833 6
Mo
Li
1
1 2
1
2
7 6 1
7 1 6
1 1 6 *1 4.14
Mo
4.
En una institucin educativa, se ha medido el nivel de depresin que presentan los adolescentes en una escala de 0- 20, obteniendo los siguientes resultado.
Nivel de depresin [ 0-5 > [ 5-10 > [ 10-13 > [13-18 > [ 18-20
Nro de adolescentes. 10 15 25 8 2
a) Calcule la media, varianza y la desviacin. b) Determine la mediana y la moda c) Determine e interprete Q1, Q3, P10 y P90 d) Coeficiente de curtosis y de asimetra.
87
Solucin: I [ 0-5 > [ 5-10 > [ 10-13 > [13-18 > [ 18-20 fi. 10 15 25 8 2 60 Fi 10 25 50 58 60 mi 2.5 7.5 11.5 15.5 19 56 mifi 25 112.5 287.5 124 38 587 mi2fi 62.5 843.75 3306.25 1922 722 6856.5
fi mi x n
587 60
9.78
Varianza.
mi2 fi S2 n x2
6856.5 60
9.782
18.63
Desviacin.
s
b) Mediana y moda Mediana
18.63
4.31
Me
Li
n 2
Fk fK
Determinamos
n 2
60 2
30
88
ESTADISTICA
Me Li
n Fk 2 fK
A 10
30 25 3 10.6 25
Moda
Mo
1
Li
1
1 2
25 15 10
25 8 17
Mo Li
1
1 2
A 10
10 3 11.11 10 17
c) Determine e interprete Q1, Q3, P10 y P90 Para obtener los cuarteles se tiene la relacin.
Qi
Cuartil 1
Li
i.n Fk 4 fK
Q1
Li
1.n Fk 4 fK
A 5
15 10 5 6.67 15
89
Cuartil 3
Q3
Li
3.n Fk 4 fK
A 10
45 25 3 12.4 25
Pi
Percentil 10
Li
i.n Fk 100 fK
P 10
Li
10.n Fk 100 fK
A 0
6 0 5 3 10
Percentil 90
P90
Li
90.n Fk 100 fK
A 13
54 50 5 15.5 8
d) Coeficiente de Asimetra.
Ap
x Mo s
90
ESTADISTICA
Puesto que Ap < 0 la distribucin es asimtrica negativa o a izquierdas (desplazada hacia la izquierda).
Q3 Q1 P90 P 10
0.5
Si
91
EJERCICIOS PROPUESTOS.
1.
Se desea evaluar el efecto de un programa de intervencin educativa en el nivel de conservacin del medio ambiente, para este fin se aplico un instrumento antes y despus de la aplicacin del programa, obtenindose los siguientes resultados:
1 10 13
2 13 18
3 11 14
4 09 15
5 13 13
6 12 17
7 11 13
8 14 16
9 08 12
Cul es su conclusin del estudio. 2. Se realiza un experimento en una I.E, con la finalidad de determinar el efecto de dos mtodos de enseanza (Tradicional y ABP) en el rendimiento acadmico. Tradicional ABP 12 14 14 13 04 12 09 15 13 15 16 14 13 16 05 14 15 16
3.
En 20 Unidades de gestin escolar, seleccionados aleatoriamente se contabiliz el nmero de libreta de notas, incorrectamente llenadas durante un ao escolar, obtenindose los siguientes resultados: 3 4 4 2 2 4 3 1 6 4 1 3 4 4 3 4 2 4 6 3
4.
Las puntuaciones de un test de inteligencia de 198 Profesores dieron los siguientes resultados: Puntuacin N de personas a) Calcula la media, la mediana y la moda. b) Calcule la varianza, desviacin y el coeficiente de variacin c) Calcule el coeficiente de curtosis y de asimetra. [30,40] (40,50] (50,60] (60,70] (70,80] (80,90] 6 17 76 68 22 9
92
ESTADISTICA
5.
El Director de un centro educativo esta interesado en firmar un contrato de larga duracin para el aprovisionamiento de suministros. El encargado de realizar la operacin desea llevarla a cabo con la empresa que menos se retrase en proporcionar dichos suministros por termino medio. Tras un periodo de prueba con dos compaas, se han obtenido los siguientes datos referidos a retrasos en suministros, medidos en hora
Asumiendo que el periodo de prueba es representativo del futuro desempeo de la actividad por que empresa debera decidirse?
6.
Se mide la altura en metros de 110 estudiantes, obteniendo la siguiente tabla: Altura [1,55-1,60) [1,60-1,70) [1,70-1,80) [1,80-1,90) [1,90-2,00) a) Construye la tabla de frecuencias. b) Calcule Q1, D7 y P40 , e interprete dichos valores. c) Se consideran bajos aquellos alumnos cuya estatura est sobre el percentil 30. Cul es la altura mxima que pueden alcanzar? d) Se consideran altos aquellos alumnos cuya altura est sobre el percentil 82. Cul ser su altura mnima? e) En qu percentil est un joven cuya altura es 1,78 m.? N de jvenes 18 31 24 20 17
7.
Se registra el tiempo en minutos que utilizan 30 alumnos para ejecutar una tarea, resultando los siguientes:
93
19,15,26,17,11,23,26,22,18,20,11,18,23,25,20,16,9,22,12,23,13,18,12,13,15,20, 21,15,18,22 a) Construir una distribucin de frecuencias de 5 intervalos, de amplitud constante. b) Calcule el tiempo debajo del cual se encuentran el 25% de las tareas.
8.
En un examen final de estadstica, la puntuacin media de un grupo de 150 estudiantes fue de 78 y la desviacin tpica fue de 8 puntos. En lgebra, sin embargo, la media final del grupo fue de 73 y la desviacin tpica 7,6. En qu asignatura hubo mayor dispersin absoluta y en cul mayor dispersin relativa?
9.
En un estudio se anot el nmero de palabras ledas en 15 segundos por un grupo de 120 sujetos que haban recibido previamente un adiestramiento y 120 individuos que no haban recibido dicha instruccin. Los resultados fueron los siguientes:
10.
En un examen final de microeconoma, la puntuacin media de 150 estudiantes fue 12,8 puntos y la desviacin tpica 2,3 puntos. En estadstica el promedio fue 10,2 puntos y la desviacin tpica 1,6 puntos. a) En qu materia hay mayor dispersin relativa? b) En qu materia destaca ms un alumno que obtuvo 14 puntos en ambas?
11.
La siguiente tabla representa los resultados en la prueba de aptitud acadmica de un grupo de 1000 jvenes que aspiran ingresar a cierta universidad:
94
ESTADISTICA
300-350) 6
350-400) 28
400-450) 45
450-500) 63
500-550) 95
550-600) 100
a) Porcentaje de aspirantes cuya calificacin es superior a 420 puntos pero inferior a 510 b) N de estudiantes que obtuvieron 500 puntos o ms c) La mayor nota del 30% que obtuvo la nota ms baja d) Porcentaje que obtuvo ms de 480 puntos e) Coeficiente de asimetra de Pearson e interprete f) La curtosis e interprete.
12.
el rendimiento acadmico
generado por dos mtodos de enseanza, A y B. El especialista piensa que el mtodo de enseanza A presenta mayor eficiencia que el mtodo B. Para comprobar esta sospecha se toma una muestra aleatorias de 10 alumnos que utilizaron el mtodo de enseanza A y de 10 con el mtodo B, obtenindose los siguientes rendimientos en una escala vigesimal : Mtodo A Mtodo B 14 12 15 13 13 13 11 14 10 13 17 14 18 14 16 12 15 15 05 14
a)
Estadsticamente. Cul de los mtodos es ms recomendable para el especialista que est interesado en: Mayor rendimiento Acadmico. Mayor nivel de confianza. Fundamente su respuesta.
b)
13.
Se han tabulado el nivel de gestin de los directores de las instituciones educativas, obteniendo los siguientes resultados. Nivel de gestin Frecuencia 0-20 6 20-40 12 40-60 14 60-80 9 80-100 3
Con la finalidad de una capacitacin de los directores, el ministerio de educacin agrupara los directores segn sus niveles de gestin en tres
95
categora A, el 30% de los que presentan mayores niveles de gestin en la categora C y el resto en la categora B. Cules son los limites para cada categora.
14.
En cierta evaluacin para optar por una beca, Juan Perez obtuvo una calificacin de 310 puntos en habilidad verbal y 218 puntos en habilidad numrica. Los parmetros de c/u son: Habilidad verbal:
245
s 24
s2
900
a. En cul de las dos pruebas obtuvo mejor calificacin? b. En cul de las dos pruebas el grupo es ms homogneo?
15.
Una gran compaa llev a cabo un estudio para ubicar las variables que pudieran determinar el sueldo de un egresado universitario dos aos despus de haberse graduado en un rea Administrativa. Los datos recogidos se presentan en la siguiente tabla: (La columna del sueldo es en cientos de miles de soles.)
Sueldo 6,75 6,90 6,90 6,80 7,10 6,50 7,25 6,80 6,75 6,80 6,75 7,00 7,15 7,50
96
ESTADISTICA
15 16 17 18 19 20
26 24 26 28 25 29
M F F F M M
S D C S C C
a) Utilice la tcnica de estadstica descriptiva ms apropiada para analizar cada variable individualmente. Interprete lo obtenido. b) Realice diagramas de cajas que le ayuden a visualizar como influye cada una de las variables en el sueldo que gana el individuo.
97
Si resumir la informacin de una variable es de por si interesante, en investigacin lo es mucho ms el poner de manifiesto la posible relacin entre dos de ellas. El anlisis de la relacin de dos variables, X e Y, depende del tipo de variables y Segn sean los tipos de cada una de ellas se usa tcnicas estadsticas diferentes.
4.1 CUALITATIVA-CUALITATIVA. Cuando las variables de estudio son discretas con poca cualitativas (categricas) o cuantitativas
variables X e Y, mediante pares ordenados (xi, yi), esta forma de presentaciones se denomina tablas de contingencia. Las tablas de contingencia son de doble entrada organizada por filas y columnas y donde se presenta la distribucin de frecuencias conjuntas de las dos variables. Dada una variable bidimensional ( X, Y ), consideramos una muestra de tamao n en la que X toma k valores distintos, x1, . . . , xk, e Y toma l valores distintos, y1, . . , yl, obtenemos, por tanto, observaciones del tipo (xi, yj). La frecuencia absoluta de un valor (xi, yj) es el nmero de veces que dicho valor aparece en la muestra. Se representa por fij , se cumple
k l
fij
i 1 j 1
98
ESTADISTICA
La frecuencia relativa de un valor (xi , yj) es el cociente de la frecuencia absoluta fij entre el tamao de la muestra n, se representa por hij
hij
fij n ,
se cumple:
hij
i 1 j 1
Distribuciones marginales Nos indican el comportamiento aislado de cada una de las variables X e Y que dan lugar a una variable bidimensional. Frecuencia absoluta marginal de xi,
fi.
f i1
f i 2 f il
fi . n
fij
j 1
hi .
Frecuencia absoluta marginal de yj,
f. j
f1 j
f 2 j f kj
f. j n
fij
i 1
h. j
Una tabla de doble entrada de una variable bidimensional sigue la estructura que se presenta a continuacin, en la que tienen cabida las frecuencias marginales (representadas en la ltima fila y ltima columna). Puede ser de frecuencias absolutas o relativas.
99
Y X y1 x1 x2 .. xk n.j fk1 f.1 f11 F21 .. y2 f12 f22 .. fk2 f.2 ..... ..... ..... ..... ..... ..... yl f1l f2l .. fkl f.l ni. f1. f2. .. fk. n
Ejemplo 1: En una encuesta aplicada a los profesores egresados de una Universidad respecto a la comprensin lectora y hbitos de estudio se obtuvo los siguientes resultados.
Comprensin lectora Habito de estudio Bajo Intermedio. Alto. Interprete la informacin. Solucin.
Compresin Lectora Habitos de Estudio Bajo Intermedio Deficitario 12 80.0% 1 7.1% 3 27.3% 16 40.0% Dependiente 3 20.0% 13 92.9% 3 27.3% 19 47.5% Independiente 0 .0% 0 .0% 5 45.5% 5 12.5% Total 15 100% 14 100% 11 100% 40 100%
Deficitario 12 1 3
Dependiente 3 13 3
Independiente 0 0 5
Alto Total
Chi-cuadrado=32,805
P-valor=0,000
100
ESTADISTICA
Del 100% de estudiantes con el hbito de estudio bajo, 80% de estos presentan un deficitario nivel de comprensin lectora, en cambio del 100% de estudiantes con un hbito de estudio intermedio, 92.9% de ellos presenta una comprensin lectora dependiente y del 100% de estudiantes con un habito de estudio alto, el 45.5% presenta una comprensin lectora independiente. La informacin se muestra en el siguiente grafico:
Com prension lectora Deficitario Dependiente Independiente
100 90 80 70
Porcentaje
4.2 CUALITATIVA-CUANTITATIVA. Supongamos que tenemos datos cuantitativos (numricos) para varias
cualitativas (categoras), por ejemplo en un experimento donde hacemos mediciones numricas en dos o ms grupos. En estos casos, lo que se realiza es un estudio descriptivo de la variable numrica en cada una de las muestras y se comparamos los resultados.
Ejemplo 2: Un investigador esta analizando el efecto que tiene en el rendimiento acadmico el uso de tres mtodos de enseanza, para tal efecto solicito a 30 docentes para que participen en el estudio. En el cuadro siguiente se muestra el rendimiento promedio de los alumnos de cada Docente.
101
a) Calcule el rendimiento promedio para cada mtodo de enseanza. b) Cual de los mtodos, genera rendimientos ms homogneos. c) Represente la informacin mediante un grafico.
SOLUCION: Mtodo Ambos Clsico Mean 11.200 9.800 S 2.658 2.781 1.494 Variance 7.067 7.733 2.233 CV 23.74 28.38 9.77 Median Kurtosis 10.500 9.500 16.000 1.38 -0.53 -0.99
102
ESTADISTICA
15.0
Rendimiento
12.5
10.0
7.5
4.3 CUANTITATIVA-CUANTITATIVA. Anlisis de dos variables cuantitativas y establecimiento de una relacin entre ellas. La forma ms sencilla de estudiar la posible asociacin entre estas variables es el diagrama de dispersin (Nube de puntos). Si reconocemos una tendencia, entonces el inters ahora ser el anlisis de regresin.
Media y varianza La informacin de las dos variables X e Y se puede resumir usando la media y la varianza como se muestra a continuacin:
Media de la variable X:
fi xi n
fi yi n
Media de la variable Y:
Varianza de la variable X:
103
2 x
fi xi2 n
Varianza de la variable Y:
2 sy
fi yi2 n
La covarianza Es una medida de la asociacin lineal existente entre dos variables. Resume la informacin contenida en el diagrama de dispersin. Presenta la siguiente expresin:
cov( x, y)
sxy
fi xi yi n
x. y
Si la covarianza est muy prxima a cero, no existe relacin entre las variables o si existe es marcadamente no lineal, si es positiva, hay asociacin lineal positiva, y si es negativa, hay asociacin lineal negativa. Sin embargo, como la covarianza depende de las unidades de medida de las variables, no nos permite cuantificar el grado de asociacin lineal ni comparar la asociacin existente entre distintos pares de variables. Para dar solucin a este problema se obtiene el coeficiente de correlacin.
Correlacin. Estudia la relacin o dependencia que existe entre dos variables que intervienen en una distribucin bidimensional.
Coeficiente de correlacin lineal. Es un nmero que mide el grado de dependencia entre las variables X e Y. Se mide mediante la siguiente frmula:
104
ESTADISTICA
s xy s x .s y
Si r = -1 r = 1 todos los valores de la variable bidimensional se encuentran situados sobre una recta. Si 1< r < 0 se dice que las variables X e Y estn tambin en dependencia aleatoria. La correlacin es negativa. Si 0 < r < 1 la correlacin es positiva. Las variables X e Y estn tambin en dependencia aleatoria.
La correlacin es tanto ms fuerte a medida que r se aproxima a 1 1 y es tanto ms dbil a medida que se aproxima a 0.
4.3.1 Anlisis de Regresin. Regresin: conjunto de tcnicas que son usadas para establecer una relacin entre una variable cuantitativa llamada variable dependiente y una o ms variables independientes, llamadas predictoras. Estas tambin deberan ser cuantitativas, sin embargo algunas de ellas podran ser cualitativas.
Estimacin de la lnea de regresin usando Mnimos Cuadrados Minimizando el error cuadrtico medio:
n n
,
i 1
n
e
xi yi
i 1 n
2 i i 1
n n
( yi
xi yi
i 1
xi )2
, se tiene:
n n
i 1 n
S xy S xx
xi2 (
i 1 i 1
xi ) 2
105
x
, indica el cambio promedio en la variable de respuesta cuando
La pendiente
variable predictora vale 0. Sin embargo carece de interpretacin prctica si es irrazonable pensar que el rango de valores de x incluye a cero. A partir de la recta
los de x. La fiabilidad que podemos conceder a los clculos obtenidos viene dada por el coeficiente de correlacin: si r es muy pequeo no tiene sentido realizar ningn tipo de estimaciones. Si r es prximo a 1 1, las estimaciones realizadas estarn cerca de los valores reales. Si r = 1 o r = -1, las estimaciones realizadas coincidirn con los valores reales.
estratgicas cognitivas en el proceso de enseanza en una escala de 0- 120. Los datos que se obtuvo fueron los siguientes:
106
ESTADISTICA
X 51.3 49.9 50 49.2 48.5 47.8 47.3 45.1 46.3 42.1 44.2 43.5 42.3 40.2 31.8 34 a) b) c)
Y 102.5 104.5 100.4 95.9 87 95 88.6 89.2 78.9 84.6 81.7 72.2 65.1 68.1 67.3 52.5
Trace un diagrama de dispersin. Ajuste una recta de regresin. Calcule la correlacin lineal e interprete dicho valor.
Solucin:
110
100
90 80
70
60
50 30 35 40 X 45 50
107
X 51.3 49.9 50 49.2 48.5 47.8 47.3 45.1 46.3 42.1 44.2 43.5 42.3 40.2 31.8 34 713.5
Y 102.5 104.5 100.4 95.9 87 95 88.6 89.2 78.9 84.6 81.7 72.2 65.1 68.1 67.3 52.5
X.Y 5258.25 5214.55 5020 4718.28 4219.5 4541 4190.78 4022.92 3653.07 3561.66 3611.14 3140.7 2753.73 2737.62 2140.14 1785
X2 2631.69 2490.01 2500 2420.64 2352.25 2284.84 2237.29 2034.01 2143.69 1772.41 1953.64 1892.25 1789.29 1616.04 1011.24 1156
Y2 10506.25 10920.25 10080.16 9196.81 7569 9025 7849.96 7956.64 6225.21 7157.16 6674.89 5212.84 4238.01 4637.61 4529.29 2756.25
xi n
713.5 16
44.59375 ;
y
s
2 x
yi n
xi2 n
1333.5 83.34375 ; 16
x
2
32285.29 44.593752 16
2
29.228
2 y
yi2 n
xi yi n
114535.33 83.343752 16
212.277 ;
sxy
x. y
108
ESTADISTICA
Recta de regresin
n n n
n
i 1
xi yi
n i 1 n
xi
i 1
yi
S xy S x2
n
i 1
xi2 (
i 1
xi )2
68.9 29.228
2.357
Y
r
sxy sx .s y
x
X
83.34375 2.357(44.59375)
21.76 2.357 X
68.9 29.228. 212.277 0.8747
21.76
Ejemplo 4: Las calificaciones de 40 alumnos en psicologa evolutiva y en estadstica han sido las siguientes: X calif. en psicol. 3 4 5 6 6 7 7 8 10 a) b) c) Y calif. en estad. 2 5 5 6 7 6 7 9 10 Nmero de alumnos. 4 6 12 4 5 4 2 1 2
109
Solucin: Disponemos los datos de la siguiente forma: xi 3 4 5 6 6 7 7 8 10 yi 2 5 5 6 7 6 7 9 10 ni 4 6 12 4 5 4 2 1 2 40 nixi 12 24 60 24 30 28 14 8 20 220 niyi 8 30 60 24 35 24 14 9 20 224 nixi2 36 96 300 144 180 196 98 64 200 1314 niyi2 16 150 300 144 245 144 98 81 200 1378 nixiyi 24 120 300 144 210 168 98 72 200 1336
x
2 x
ni xi N
220 5,5 ; 40
ni yi N
224 5,6 40
ni xi2 N
2 sx
x
2,6
1314 (5,6) 2 40
1,61
2
sx
2 y
ni yi2 N
1378 (5,6) 2 40
3,09 ;
sy
s xy
3,09 1,75
ni xi yi N x. y 1336 (5,3).(5,6) 40 33,4 30,8 2,6
El coeficiente de correlacin: r
2,6 (1,61).(1,75)
s xy s x .s y
0,92
La correlacin es positiva, es decir, a medida que aumenta la nota de estadstica aumenta tambin la nota en psicologa. Su valor est prximo a 1 lo que indica que se trata de una correlacin fuerte, las estimaciones realizadas estn cerca de los valores reales.
110
ESTADISTICA
EJERCICIOS PROPUESTOS.
1.
De la evaluacin censal, desarrollado a los docentes de la ciudad de Cusco, se registro la informacin del conocimiento y aplicacin de metodologas de enseanzas de 10 Docentes.
Docentes 1 2 3 4 5 6 7 8 9 10
Conocimiento 16 14 18 15 13,5 17 15 10 15 14
a) b) c)
Calcula la covarianza, las varianzas y el coeficiente de correlacin. Existe correlacin entre las dos variables? Calcula la recta de regresin. Interprete adecuadamente los resultados?
2.
En una encuesta realizada a los alumnos de los centros educativos de la ciudad de Cusco, respecto al conocimiento de los docentes de las materias que regenta, proporciona la siguiente informacin:
Recuento El profesor de la asignatura conoce el curso Regular Bien Muy Bien 5 12 7 84 16 1 30 10 10 17 19 32 70 138 35
Area
Total
111
a) b)
Analice la informacin de forma adecuada Interprete los resultados obtenidos y redacte algunas conclusiones.
3.
Un especialista en Educacin, desea analizar si la metodologa de los Docentes esta relacionado con su preparacin acadmica, para tal efecto aplica un test, los resultados se muestran a continuacin.
a) b) c)
Trace el diagrama de dispersin Que tipo de relacin se observa? Ajuste una recta de regresin Calcula el coeficiente de correlacin. Interprete adecuadamente dicho resultado?
4.
La siguiente tabla muestra las distribuciones de frecuencias de las puntuaciones finales de 100 estudiantes en matemticas y fsica:
112
ESTADISTICA
a) Nmero de alumnos que recibieron puntuacin entre 70 y 79 en matemticas y entre 80 y 89 en fsica. b) Porcentaje de estudiantes con puntuacin en matemticas inferior a 70. c) Porcentaje de que un estudiante obtenga 70 ms puntos en fsica y menos de 80 en matemticas. d) Porcentaje de estudiantes que aprob al menos una de las dos asignaturas, suponiendo 60 la puntuacin mnima para aprobar. e) Porcentaje de que un estudiante tenga aprobadas las dos asignaturas. f) Porcentaje de que un estudiante, que sabemos que tiene aprobada las matemticas, tenga aprobada tambin fsica. g) Porcentaje de estudiantes que tienen aprobada matemticas de entre los que tienen aprobada fsica. h) Sobre qu puntuacin en fsica tendr un estudiante del que sabemos que ha obtenido 86 puntos en matemticas. i) Da una medida de la exactitud del resultado obtenido en h).
5.
Se ha recogidos datos sobre la puntuaciones que en una encuesta dieron los alumnos de cuatro grupos a un profesor. La informacin se muestra en el
cuadro siguiente:
113
NOTA A 2 4 6 8 10 20 30 30 10 10 B 0 30 40 20 10
GRUPO C 10 20 40 10 20 D 30 30 20 20 0
a) En que grupo tuvo el profesor mejor calificacin media. b) En cual de los grupos hubo menos divergencia de opiniones. c) Interprete adecuadamente la tabla. 6. La tabla siguiente muestra el CI (coeficiente intelectual) de un grupo de personas y su capacidad lectora (HL). CI 109 138 86 153 156 40 70 126 68 99 112 138 103 127 63 a) Trace una diagrama de dispersin b) Ajuste los datos a una recta de regresin. c) Predecir la capacidad lectora de una persona con cociente intelectual de 120 d) Calcule la correlacin entre ambas variables. interprete dicho valor. HL 31,8 24,5 11,8 18,8 17,3 11,0 12,2 20,6 10,8 5,3 29,3 8,0 35,8 19,6 21,4
114
ESTADISTICA
CAPITULO V PROBABILIDADES
El Clculo de Probabilidades se ocupa de estudiar ciertos experimentos que se denominan aleatorios, cuya caracterstica fundamental es la incertidumbre del resultado, esto significa que es imposible predecir los resultados porque hay ms de uno posible. En nuestra vida cotidiana asociamos usualmente el concepto de probabilidad a su calificativo probable, considerando probable a aquellos eventos en los que tenemos alto grado de creencia en su ocurrencia. En esta lnea probabilidad es un concepto asociado a una medida del azar. El objetivo de la probabilidad es cuantificar las posibilidades que tengan ciertos eventos inciertos.
5.1 EXPERIMENTO ALEATORIO. Es una accin que da lugar a resultados identificables y se caracteriza por: Todos los posibles resultados son conocidos previamente. Repeticiones en situaciones anlogas pueden dar resultados diferentes. No se puede predecir el resultado del mismo antes de realizarlo, es decir, no se sabe cul de los posibles resultados aparecer al final. Los experimentos pueden ser aleatorios o deterministas. Aleatorio significa relativo a todo acontecimiento incierto, por depender de la suerte o del azar, mientras que los deterministas son aquellos que se caracterizan por el hecho de que las mismas causas producen los mismos efectos.
115
Espacio muestral. Es el conjunto de todos los resultados posibles del experimento y se denota por . A cada elemento de se denomina punto muestral w , es decir:
w / w es un punto muestral .
Evento o Suceso Aleatorio. Un evento aleatorio es un subconjunto del espacio muestral y se denota con letras maysculas. El evento seguro El evento imposible , es aquel que ocurre siempre al realizar el experimento. , es aquel que no ocurre nunca.
Los eventos elementales solo tienen un punto muestral. El evento complementario no estn en
5.2 OPERACIONES DE EVENTOS. Unin de eventos: Dados dos eventos A y B de un mismo espacio muestral su unin se representa por A
Interseccin de eventos: Dados dos eventos A y B de un mismo espacio muestral su interseccin se representa por
Evento Complemento: El complemento de un evento A se representa por es el evento que contiene todos los elementos que no estn en A. El evento ocurre si A no ocurre.
Ac y
Ac
116
ESTADISTICA
5.3
DEFINICIN CLSICA DE PROBABILIDAD: La probabilidad de un suceso A se calcula como el nmero de casos favorables al suceso A, dividido por el nmero de casos posibles del experimento aleatorio.
P( A)
5.4
DEFINICIN AXIOMTICA DE PROBABILIDAD. La probabilidad es una funcin que asigna a cada suceso A que varia entre 0 a 1. un nmero real
P: A i) ii) P(A)
y que verifica:
P( A) 1
1
P A P B
P A B
propiedades: iv) v) vi) vii)
P( Ac ) 1 P A
P( ) 0
Si
B,
P( A)
P( B)
P( A \ B)
P( A) P( A
B) ,
A,B
P A1
ix) Si A, B
A2
...
An
P A1
P A2
... P An
P A B
x) Si A, B
P A
P B
P A B
117
P( A)
5.5
P A
Bc
P A
PROBABILIDAD CONDICIONADA. Queremos estudiar como cambia la probabilidad de ocurrencia de A cuando se conoce que otro evento B ha ocurrido. En este caso habr que redefinir el espacio muestral considerando solamente los elementos de B como posibles resultados.
La probabilidad de A condicionada a B, esta definido como la probabilidad de que ocurra A sabiendo que ha ocurrido B, y se define mediante:
P( A | B)
En consecuencia,
P( A B) , P(B) P( B)
B) =P( A) P( B ) A
0.
P(A
P( A)
Es decir, se cumplir que:
P( A | B) , o bien P( B)
P( B | A)
P( A
B)
P( B).P( A)
A1, A2, An
P( Ai ) P( Aj ) si
P( Ai
Aj )
P( Ai
Si i
j
Aj
Ak )
P( Ai ) P( Aj ) P( Ak )
k y as sucesivamente. En general,
118
ESTADISTICA
P( A1
A2
An)
5.6 TEOREMA DE LA PROBABILIDAD TOTAL Si suponemos que los eventos A1, A2, A3, ...., An, forman una particin de un espacio muestral su unin es . ; esto es, que los eventos Ai son mutuamente excluyentes y
E
An
A1
A2
A3
A1 A2
i 1
ii) iii)
Ai
P( Ai ) 0 ,
i 1,....n .
P( B)
P( A1 ) P( B
A1
) P( A2 ) P( B
A2
) ....... P( An ) P( B
An
119
P( B)
i 1
P( Ai) P( B | Ai)
5.7 TEOREMA DE BAYES El procedimiento que se utiliza para encontrar probabilidades posteriores, a partir de probabilidades previas, se llama regla Bayesiana. Las probabilidades a priori o previas se conocen antes de obtener informacin alguna del experimento en cuestin. Las probabilidades a posteriori se determinan despus de conocer los resultados del experimento. El teorema de Bayes consiste en un mtodo para encontrar la probabilidad de una causa especfica cuando se observa un efecto particular. Esto es, si el evento B ha ocurrido, Cul es la probabilidad de que fue generado por el evento A1 (que es una causa posible ) o por el A2 (otra causa posible)?.
Si A1, A2, ......., An es una particin del espacio muestral tal que
p( Ai ) 0 ,
P( Ai | B)
P( Ai B) P( B)
P( Ai ) P( B | Ai )
n i
P( Ai ) P( B | Ai) 1
, i = 1, ...., n.
P( Ai | B)
P( Ai ) P( B | Ai) P( A1 ) P( B ) P( A2 ) P( B ) ....... P( An ) P( B ) A1 A2 An
120
ESTADISTICA
EJERCICIOS DESARROLLADOS.
1) Un director de una institucin educativa mixta, tiene 3 vacantes para el quinto ao de secundaria. a) Cual es el espacio muestral. b) Si el inters del director es matricular, exactamente dos estudiantes de sexo masculino Cual es la probabilidad asociado a este evento? c) Cual es la probabilidad de que el primer estudiante aceptado sea de sexo masculino y el ltimo de sexo femenino. d) Cual es la probabilidad de admitir por lo menos un estudiante de sexo masculino e) Cual es la probabilidad de admitir a lo ms 1 estudiantes de sexo femenino.
Solucin. a)
c) Sea el evento B: Primer estudiante aceptado de sexo masculino y el ltimo de sexo femenino.
M1M2 F3 , M1F2 F3
p(C ) n(C ) n( ) 2 8
121
2) La biblioteca municipal de una provincia compra libros de 3 editoriales: el 45% de los libros son compradas del editorial A resultando defectuoso el 1%, la editorial B suministra el 30% de los libros y de ellas es defectuoso el 2%. Las restantes son adquiridas de la editorial C, siendo defectuoso el 3% de las mismas. En un control de recepcin de libros se selecciona un libro al azar cual es la probabilidad: a) b) c) De que sea defectuosa. De que sea defectuosa y haya sido adquirido de la editorial B Calcular la probabilidad de que el libro haya sido adquirido de la editorial C, dado que es defectuoso.
Solucin
Defectuoso 1% 99% A 40% 2% Libro 30% 98% B 3% 30% C 97% Bueno Bueno Bueno Defectuoso
Defectuoso
Sean los eventos. A: Libro adquirido de la editorial A, B: Libro adquirido de la editorial B. C: Libro adquirido de la editorial C, D: Libro defectuoso, E: libro Bueno.
a) p( D)
p( A) p( D ) A
p( B) p( D ) B
p(C ) p( D ) C
b) p(B
D) =p( B) p( D ) B
p(B D) =0.3*(0.02)
122
ESTADISTICA
c) p(C | D)
p(C D) p( B)
p( A) p( D | A)
p(C ) p( D | C ) p( B) p( D | B) p(C ) p( D | C )
p(C | D)
3) En un estante hay 7 libros de historia y 3 de matemticas. De los libros de historia, tres estn empastados de amarillo y el resto de rojo; mientras que de los libros de matemticas, uno est empastado en amarillo y dos en rojo. Suponiendo que del estante se elige un libro al azar, cul es la probabilidad de que sea de : a) Historia b) Color amarillo. c) matemticas y de color rojo d) matemticas o de color rojo d) Historia, dado que es de color amarillo.
Sean los eventos: A: Libro de matemticas. B: Libro de historia. C: Color amarillo, D: Color rojo. a) p( B) b) p(C ) c) p( A
n( B ) n( ) n(C ) n( ) D) 7 10 6 10 0.7 0.6 2 10 0.4
n( A D ) n( )
123
d) p( A
D)
p( A)
p ( D)
p( A
p( A
D)
D)
n( A) n( )
n( D ) n( )
n( A D ) n( )
7 10 0.7
3 6 2 10 10 10
e) P ( B | C )
P( B C ) P (C )
n( B C ) n( ) n(C ) n( )
n( B C ) n(C )
4 7
4) En una ciudad se publican los peridicos A, B y C. Una encuesta reciente de lectores indica lo siguiente: 20% lee A, 16% lee B, 14% lee C, 8% lee A y B, 5% lee A y C, 2% lee A, B y C, y 4% lee B y C. Para un adulto escogido al azar, calcular la probabilidad de que: a) No lea ninguno de los peridicos. b) Lea exactamente uno de los peridicos. c) Lea A y B.
Solucin. Sean los eventos A: Lee el peridico A. B: Lee el peridico B. C: Lee el peridico C.
A
9% 6% B 3% 2% 2% 7% 6%
a) p A
p(U ) p A B C
c
p A
124
ESTADISTICA
6%
5)
En una Universidad, se conoce a travs de una muestra, que en los estudiantes varones: 50 son de aspiraciones elevadas y 20 de aspiraciones modestas. Asimismo, en los estudiantes 60 son de aspiraciones elevadas y 30 de aspiraciones modestas. Si se selecciona seleccionar: Dos estudiantes de aspiraciones elevadas? Un estudiante con aspiraciones elevadas y uno de aspiraciones modestas. El primer seleccionado sea de sexo masculino y el segundo de sexo femenino. dos estudiantes Cual es la probabilidad de
Solucin. Masculino Aspiraciones elevadas Aspiraciones modestas Total 50 20 70 Femenino 60 30 90 Total 110 50 160
Sean los eventos A: Estudiante se sexo masculino. B: Estudiante se sexo femenino. C: Estudiante de aspiraciones elevadas. D: Estudiante de aspiraciones modestas. a) p(C1
C2 )
110 C2 160 C2
p(C1
D2 ) p(D1
110 C150 * C1 160 C2
C2 )
c) p( A1
B2 )
125
126
ESTADISTICA
Problemas Propuestos.
1)
Calcular la probabilidad de que al lanzar un dado se obtenga un nmero que sea mltiplo de dos o tres.
2)
3)
En una encuesta entre alumnos de maestra en administracin se obtuvieron los datos siguientes acerca de el principal motivo del alumno para solicitar su ingreso a la escuela donde est matriculado.
a. Si un alumno es de tiempo completo. Cul es la probabilidad de que la calidad de la institucin sea el principal motivo para elegir su escuela?. b. Si un alumno es de tiempo parcial. Cul es la probabilidad de que la calidad de la escuela sea el motivo para elegirla? c. Sea A el evento en que el alumno es de tiempo completo y sea B el evento que el alumno menciona que la calidad de la escuela es el 1 er motivo de su solicitud. Son independientes los eventos A y B?. Justifique su respuesta.
4)
Antes de que un libro sea lanzado al mercado se recogen las reacciones de un grupo de personas a las que se les permite leer el libro previamente. Posteriormente a las ventas del libro se les asigna el calificativo de altas, moderadas o bajas de acuerdo a las noemas del mercado. Los resultados se muestran en la siguiente tabla:
127
Favorables
Neutral
Desfavorables
173 88 42
61 70 141
a) Cul es la probabilidad de que las ventas sean altas? b) Cul es la probabilidad de que las reacciones sean favorables? c) Si la reaccin del grupo es favorable?. Cul es la probabilidad de que las ventas sean altas? d) Si las ventas son bajas Cual es la probabilidad de que las opiniones hayan sido desfavorables? e) Cul es la probabilidad de que las opiniones sean favorables y las ventas sean altas? f) Cul es la probabilidad de que las ventas sean favorables o desfavorables?. Son esos sucesos mutuamente excluyentes? Justifique g) Son los sucesos Opiniones desfavorables y Ventas Bajas independientes? Justifique.
5)
Una prueba de seleccin consta de dos preguntas tipo test. Se consideran aptos aquellos individuos que contesten correctamente a la segunda pregunta, independientemente de cmo hayan contestado a la primera. La primera pregunta tiene cuatro posibles respuestas. A los individuos que contestan correctamente a la primera pregunta, se les plantea una segunda pregunta con dos posibles respuestas, mientras que a quienes fallan la primera pregunta les proponen una segunda cuestin con ocho posibles respuestas. Si un individuo que se presenta a la prueba y contesta a las preguntas al azar, a) cul es la probabilidad de que sea considerado apto? b) cul es la probabilidad de que conteste correctamente a la primera pregunta y mal a la segunda?
6) En un instituto hay 320 alumnos de primer curso, 280 de segundo y 200 de tercero. Al final de curso han suspendido 60 alumnos de primero, 48 de segundo y 72 de
128
ESTADISTICA
tercero. Hallar la probabilidad de que al elegir un alumno al azar y resultando que est suspendido, sea de 1, de 2 o de 3.
7) En una clase de 30 alumnos hay 18 que han aprobado matemticas, 16 que han aprobado ingls y 6 que no han aprobado ninguna de las dos. Elegimos al azar un alumno de esa clase: a) Cul es la probabilidad de que haya aprobado ingls y matemticas? b) Sabiendo que ha aprobado matemticas, cul es la probabilidad de que haya aprobado ingls? c) Son independientes los sucesos "Aprobar matemticas" y "Aprobar ingls"?
8) La probabilidad de que un alumno estudie para su examen es 0.75. Si estudia, la probabilidad de que apruebe el examen es 0.80. Si el alumno no estudia la probabilidad de que no apruebe el examen es 0.90. a. Cual es la probabilidad de que el alumno apruebe el examen? b. Si el alumno aprueba el examen Cual es la probabilidad de que haya estudiado?
9) Una direccin departamental de educacin recibe 25 solicitudes para una vacante de director de una UGEL. Entre los solicitantes 10 son hombres. Diecisiete de ellos acreditan titulo de maestra y ocho son licenciados. Adems se sabe que 7 aspirantes son mujeres que tienen grado de magster. Cual es la probabilidad de que sea seleccionado una mujer o una persona con titulo de licenciado? Si el postulante seleccionado es magster Cual es la probabilidad de que sea varn?
10) 200 alumnos de la Facultad de Educacin estn distribuidos de acuerdo a su sexo y lugar de procedencia de la siguiente forma: 70 son mujeres, 110 son de Cusco y 30 son mujeres y de provincias. Si se elige dos alumnos al azar calcular la probabilidad de que: Ambos sean mujeres y de Cusco. Al menos uno de los dos escogidos sea hombre.
129
11) En la entrada de una facultad hay tres fotocopiadoras, A, B y C cuyos porcentajes de fallo son 3%, 5% y 4% respectivamente. Un alumno entra en la facultad y, como las tres fotocopiadoras estn libres, elige una al azar, para realizar su fotocopia. Al llegar a clase observa que la fotocopia es defectuosa. Cul es la probabilidad de que fuera hecha en la mquina B?. 12) En una clase, el 20% de los chicos y el 5% de las chicas juega al tenis. El 60% de la clase son chicos. Se eligi al azar un estudiante de la clase y result ser de los que jugaban al tenis. Cul es la probabilidad de que el estudiante elegido sea chico?. 13) En una asignatura de una carrera el 10% de los alumnos reciben una nota final de sobresaliente. El 70% de los estudiantes que la reciben ya la haban obtenido en un examen realizado a mitad de curso. Adems, el 10% de los alumnos que no reciben sobresaliente al final de curso lo haban obtenido en el examen parcial. Qu porcentaje de alumnos obtiene sobresaliente en el examen parcial?. Cul es la probabilidad de que un alumno que recibe un sobresaliente en el parcial obtenga esa calificacin en el examen final?
130
ESTADISTICA
6.1 VARIABLE ALEATORIA. Definicin.- Una variable aleatoria (v.a) X es cualquier funcin, que transforma cada elemento del espacio muestral , en un nmero real.
X:
X
Al conjunto de posibles valores de X se le llama rango de X (Rx) Si Rx es finito o enumerable (rango discreto), entonces X es una v.a Discreta. Si Rx no es enumerable (rango continuo), entonces X es una v.a Continua.
Funcin de Probabilidad.- Si X es una v.a discreta, la funcin de probabilidad de X viene dada por:
PX x
tal que
P X
/X
PX ( x) 1
x Rx
131
una aplicacin
fX : X
0,
tal que
P a
b
a
f X ( x)dx
,tal
que
f X ( x)dx 1
FX ( x)
P( X
x)
P(
/ X( )
x)
P a
F b
F a
P X
P a
F ' ( x)
F b
f ( x)
F a
dF ( x) dx
limx
FX ( x) 0 y lim x
FX ( x) 1
6.2 ESPERANZA Y VARIANZA. Esperanza La esperanza o media de una variable aleatoria X, denotada por
E( X )
x.P X E X
x Rx
x , si X es discreta
x. f ( x)dx, si X es continua
x Rx
132
ESTADISTICA
E a bX
a bE X
, se define
V X
2 X
E X
2 X
E X
E X
E X
E2 X
E X
2 X
V aX b
a2V ( X )
se cumple
P X
1 k2
Ejemplo 1: Sea X la variable aleatoria definida como la suma de los valores que aparecen al lanzar dos dados.
133
1/36 2/36 3/16 4/16 5/36 6/36 5/36 4/36 3/36 2/36 1/36
b) c)
p(5
Media
8)
p(6)
p(7) 5/ 36 6 / 36 11/ 36
x , si X es discreta
7 6 36 8 5 36 9 4 36 10 3 36 11 2 36 12 1 36
E X
x Rx
x.P X
3 36 5 4 36 6 5 36
E X
E X
1 36 252 36
2 36
Varianza.
2 X
E X
1 36 1974 36 22
E2 X
32 2 36 42 3 36 52 4 36 62 5 36 72 6 36 82 5 36 92 4 36 102 3 36 112 2 36 122 1 36
E X2
E X2
2 X
E X
1974 36
252 36
134
ESTADISTICA
6.3 DISTRIBUCIONES DE PROBABILIDAD. Existen otras variables cuyas funciones de probabilidad o densidad resultan ser modelos de mucha utilidad para una serie de aplicaciones. Se cita brevemente algunos de los modelos de mayor importancia.
6.3.1
Distribuciones discretas.
Un experimento de Bernoulli, es un experimento aleatorio con solo dos posibles resultados: xito y Fracaso. Sea p = P (xito).
Distribucin Binomial. La distribucin binomial aparece cuando se dan las condiciones siguientes: -Tenemos un experimento aleatorio simple, con una situacin dicotmica, es decir xito y Fracaso.
PX x
Valor esperado: Notacin: X
n x Cx p 1 p
n x
, si x
0,1,2,..., n
0
X
, en otro caso.
2 X
np. Varianza:
np 1 p .
B(n, p).
BN(r, p).
X = Nmero de ensayos (experimentos independientes de Bernoulli) hasta conseguir el r-simo xito. Funcin de Probabilidad:
PX x
Crx 11 1 p 0
x r
pr
135
Valor esperado:
r . Varianza: p
2 X
r1 p p
2
Nota: Si r = 1, X se dice que es una variable aleatoria con distribucin geomtrica de parmetro p, y se le denota por X G(p).
H(N, M, n).
Considrese una poblacin de N elementos, M de los cuales son de un tipo A, y supongamos se extraen sin reemplazo una muestra de n elementos de esta poblacin. Entonces:
PX x
N Cn
, si x
0,1,2,..., n
0
Valor esperado: Notas: 1. En PX se esta usando la convencin que
X
, en otro caso.
2 X
M . Varianza: N
M M 1 N N
N n . N 1
b Ca
0,
si a > b.
X B n, p
M . N
Distribucin de Poisson. La distribucin de Poisson aparece en situaciones en las que se cuenta el nmero de apariciones de un determinado suceso o bien en un intervalo de tiempo dado (como el nmero de partculas emitidas en un segundo por un material radioactivo, o el nmero de pacientes que llegan a un servicio en un intervalo de tiempo dado) o bien en un recinto fsico (como el nmero de fallos en un metro de alambre de hierro producido.
136
ESTADISTICA
X = Nmero de eventos en 0, t .
Funcin de Probabilidad:
x
PX x
e x! 0
2 X
, si x
0,1,2,...
, en otro caso.
Valor esperado:
. Varianza:
6.3.2
Distribuciones continuas. U a, b .
Esta distribucin se da cuando la variable aleatoria X puede tomar indistintamente cualquier valor en el intervalo a, b . Funcin de densidad:
1 fX x b a
, si x
a, b
0 , en otro caso.
Valor esperado:
a b . Varianza: 2
N( ,
2
2 X
b a2 . 12
).
fX x
Valor esperado: Nota: Cuando
X
1 2
2 X
e
2
. Varianza:
2
=0y
137
Si
i 1
Xi n n
X / n
N (0, 1)
B (n, p) y n es
X np np 1 p
N (0, 1).
Aqu, para el clculo de probabilidades, se recomienda utilizar la llamada correccin por continuidad: Si a aproximadamente: b son dos nmeros naturales, entonces
Pa
P a
1 2
1 2
Fz
1 2
np
np 1 p
Fz
1 2
np
np 1 p
6.4
OTRAS DISTRIBUCIONES CONTINUAS IMPORTANTES DISTRIBUCION CHI-CUADRADO. Una v.a. X tiene distribucin chi-cuadrado con n grados de libertad, y se le denota por
(n) .
Z2
(1)
138
ESTADISTICA
2 1
2 2
...
2 k
distribuciones
chi-cuadrado
n1 , n2 ,..., nk
k n i 1 i grados
X1 , X 2 ,..., X n
es una m.a de X
N ( , 2), entonces
n 1 S2
2
(n-1)
DISTRIBUCION T DE STUDENT. Una v.a. X tiene distribucin t de Student con n grados de libertad, y se le denota por
Z
2
X1 , X 2 ,..., X n
de X,
X t (n -1) . S/ n
139
DISTRIBUCION F DE FISHER. Una v.a. X tiene distribucin F de Fisher con n grados de libertad en el numerador y m grados de libertad en el denominador, y se le denota por
X F (n, m) .
PROPOSICION. 1. Si
X F (n, m)
F (m, n).
entonces:
1 X
2 1
2. Si
(n) y
2 2
2 1 2 2
/n F (m, n) . /m
En particular, si
X1 , X 2 ,..., X n
es una v.a. de N ( 2,
X
2 2 ),
N ( 1,
2 1 ),
Y1 , Y2 ,...,Ym
donde X e Y son
independientes, entonces
S12 2 S2
2 2 2 1
F (n -1, m - 1)
Nota: La distribucin normal estndar, t de Student, chi-cuadrado y F de Fisher poseen todas tablas en la que se tabulan algunos valores de su funcin de distribucin.
140
ESTADISTICA
EJERCICIOS DESARROLLADOS
1.
Una prueba de inteligencia est compuesta por 10 preguntas, cada una de las cuales tiene 4 respuestas y solo una de ellas correcta. Un alumno tiene prisa por acabar la prueba y decide contestar aleatoriamente. Se pide a) Probabilidad de acertar exactamente 4 preguntas b) Probabilidad de no acertar ninguna c) Probabilidad de acertar todas d) Probabilidad de acertar al menos 8 e) Probabilidad de acertar a los sumo 6 f) Media y varianza
Se trata de una distribucin Binomial de parmetros B (10, 0.25 ) Sea X la variable aleatoria que representa el nmero de preguntas contestadas correctamente
a) P(acertar 4) = P X
10 (0.25)4 (0.75)6 4 0
0.1460
10 (0.25)0 (0.75)10 0 0
0.0563
c) P(acertar todas) = P X
10
10 (0.25)10 (0.75)0 10
d) P(acertar al menos 8) = P X
PX
PX
PX
10
10 (0.25)8 (0.75)2 8
10 (0.25)9 (0.75) 0 9
0.005
e) P( acertar a lo sumo 3) = P X
PX
PX
PX
PX
141
10 (0.25)0 (0.75)10 0
f) Media y Varianza
np 10 (0.25)
2
10 (0.25)1 (0.75)9 1
10 (0.25)2 (0.75)8 2
10 (0.25)3 (0.75)7 3
0.7759
2.5
2.
La probabilidad de que un estudiante obtenga el ttulo de licenciado en Geografa e Historia es de 0.3. Halla la probabilidad de que de un grupo de siete estudiantes matriculados en primer curso. a) Ninguno de los 7 finalice la carrera b) Finalicen todos la carrera c) Al menos 2 acaben la carrera d) Halla la media y la desviacin tpica
Por tanto se trata de una distribucin Binomial de parmetros B (7, 0.3) Sea X la variable aleatoria que representa el nmero de estudiantes que obtienen el ttulo de licenciado en Geografa e Historia a)
PX
0.0824
b)
PX
c) P X
1 PX
PX
0.6705
np(1 p)
7(0.3)(0.7)
1.21
142
ESTADISTICA
3) El peso medio de los estudiantes de un colegio es 60 kg y la desviacin tpica es 6 kg. Suponiendo que los pesos estn distribuidos normalmente. a) Cual es la probabilidad de que un estudiante pese menos de 64k g? b) Cual es la probabilidad de que un estudiante pese 57 kg o ms? c) Cual es la probabilidad de que un estudiante pese ms de 63 Kg? d) Cual es la probabilidad de que un estudiante pese entre 57 a 65 kg? e) Cual es la probabilidad de que un estudiante pese menos de 50 Kg? f) Cual es la probabilidad de que un estudiante pese entre 64 a 70 kg? g) Si los estudiantes son 200, .Cuantos cabe esperar que pesen ms de 57 kg y menos de 64k g?. Solucin. X: Peso de los trabajadores.
60 (Media poblacional)
6
(Desviacin)
64) P( X 64 ) P( Z 64 60 ) 6 P( Z 0.67)
a) P( X
(0.67)
z=0.67
0.5
b) P( X
57)
P(
57
P( Z
57 60 ) 6
P( Z
0.5)
(0.5) 0.5
(0.5)
z= 0.5
0.19146+0.5=0.69146=69.146%
143
c) P( X
63)
P(
63
P( Z
63 60 ) 6
P( Z
0.5)
0.5
(0.5)
(0.5)
z=0.5
0.5 0.19146=0.30854=30.854%
d) P(57
65)
X
P(
57
65
P(
57 60 6
65 60 ) 6
P( 0.50
0.83)
(0.50)
(0.83) 0.19146+0.29373=0.48519=48.519%
(0.5)
(0.83)
e) P( X
50)
P(
50
P( Z
50 60 ) 6
(0.167)
0.5
f) P(64
70)
P(
64
P(0.67
1.67)
(1.67)
(0.67) 0.45254-0.24857=0.20397=20.397%
z= 0.167
z= 0.50
z=0.83
P( Z
0.167)
144
ESTADISTICA
z=0.67 z=1.67
(0.67) (1.67)
g) P(57
64)
P(
57
64
P( 0.5
0.67)
(0.5)
(0.67) 0.19146+0.24857=0.44003=44.003%
P(
57 60 6
64 60 ) 6
145
EJERCICIOS PROPUESTOS. 1) En un grupo de 10 alumnos de un centro educativo se ha comprobado que cada uno de ellos falta a clase el 5% de los das. Calcula la probabilidad de que en un da determinado. . a) no se registre ninguna ausencia. b) falten a clase ms de 5 alumnos. c) no asista a clase ningn alumno. d) falte a clase un nico alumno. e) falten a clase menos de 3 alumnos.
2) La probabilidad de que un estudiante obtenga el grado de magster es de 0.3. Calcular la probabilidad de que de un grupo de siete estudiantes matriculados. . . a) los siete obtenga el grado de magster. b) al menos dos obtengan el grado.
3) La probabilidad de que un estudiante de ingeniera fracase en sus estudios es de 0.7. a) De un grupo de 7 estudiantes de ingeniera, calcula la probabilidad de que los 7 fracasen en sus estudios. b) En el mismo caso que en el apartado anterior, calcula la probabilidad de que al menos 2 acaben la carrera. c) Se el grupo se aumenta a 40 estudiantes, calcular la probabilidad de que fracasen entre 20 y 30 de ellos
4) Un examen tipo test tiene 100 preguntas y cada pregunta 4 respuestas diferentes, de las que slo una es correcta. a) Calcular la probabilidad de que un estudiante que responde al azar acierte ms de 20 preguntas. b) Calcular la probabilidad de que de las 20 primeras preguntas acierte a lo sumo 5) Las puntuaciones de un test se distribuye normalmente con media 80 y varianza 49 Cul es la probabilidad de obtener en el test una puntuacin entre 79 y 88 puntos ?.
146
ESTADISTICA
6) Se llama cociente intelectual (C.I.) al cociente entre la edad mental y la edad real. Se sabe que la distribucin del C.I. se distribuye normalmente con media 0.95 y desviacin tpica 0.22. En una poblacin con 2600 personas se desea saber: a) Cuantas tendran un C.I. superior a 1.3? b) Cuantas tendran un C.I. inferior a 0.07? c) Cuantas tendran un C.I. entre 0.8 y 1.15? 7) Tras realizar un test de cultura general entre los habitantes de cierta poblacin, se observa que las puntuaciones siguen una distribucin normal, de media 68 y desviacin tpica 18. Se desea clasificar a los habitantes en tres grupos (de baja cultura general, de cultura general aceptable y de cultura general excelente), de manera que el primer grupo abarque un 20% de la poblacin, el segundo un 65% y el tercero el 15% restante. .Cuales son las puntuaciones que marcan el paso de un grupo a otro? 8) Se ha aplicado un test de fluidez verbal a 500 alumnos de la UNSAAC. Se supone que las puntuaciones obtenidas se distribuyen segn una normal de media 80 y desviacin tpica 12. Se pide: a) .Que puntuacin separa el 25% de los alumnos con menos fluidez verbal? b) .A partir de que puntuacin se encuentra el 25% de los alumnos con mayor fluidez verbal? 9) El peso medio de 500 estudiantes de cierta universidad es 72 Kg y la desviacin tpica es 7. Si los pesos se distribuyen segn una normal, halla: a) El nmero de estudiantes que pesan entre 68 y 75 Kg. b) El nmero de estudiantes que pesan ms de 72 Kg. c) El nmero de estudiantes que pesan menos de 62 Kg. 10) En una clase de Ingeniera Tcnica se sabe que las calificaciones de Estadstica se distribuyen segn una N(4, 2). Si el profesor desea aprobar al 70% de la clase, a partir de qu nota se debe considerar aprobado el examen? 11) La nota media de un examen es 5,25 y la desviacin tpica 2. El 10% de la clase recibir la calificacin de sobresaliente. Cul es la nota mnima para optar a l? Se eligen cinco alumnos al azar, cul es la probabilidad de que dos de ellos hayan Obtenido un sobresaliente?
147
148
ESTADISTICA
BIBLIOGRAFIA.
1. Briones, G. (1998). Mtodos y tcnicas de investigacin para las Ciencias Sociales. Mxico: Trillas. 2. Blalock, H. (1994). Estadstica Social. Mxico: Fondo de Cultura Econmica. 3. Carrasco, J. B. y Calderero, J. F: (2000). Aprendo a investigar en educacin. Madrid: Ediciones Rialp, S.A. 4. Cordova, Manuel (2003). Estadstica descriptiva e inferencial. Editorial Mosqueira Lima. 5. Guilford J. P. Y Fruchter B. 1984. Estadstica aplicada a la Psicologa y a la Educacin. Editorial Mc Graw Hill. 6. JESUS AMON, Estadstica para Psiclogos 1, estadstica descriptiva. 7. JESUS AMON, Estadstica para Psiclogos 2, estadstica inferencial. 8. 5PAGANO, Robert, ESTADSTICA PARA LAS CIENCIAS DEL COMPORTAMIENTO, Edit. Thomson, 7ma edicin, 2006, Mxico D.F. 9. Pea D. Y Romo J. 1997. Introduccin a la estadstica para las Ciencias sociales. Editorial Mc Graw Hill. Interamericana de Espaa. 10. Siegel, S. (1956). Non Parametric Statistics for the Behaviral Sciences. New Cork: McGraw Hill Book Company. 11. Valdivieso Serrano Luis (2004) Estadstica aplicada, editorial PUCP.