Palacios Gomez Jose Luis
Palacios Gomez Jose Luis
Palacios Gomez Jose Luis
Directores:
Dr. Antonio Pardo Merino
Dr. Miguel ngel Ruiz Daz
Abril de 2013
A Esther
A Irache
Agradecimientos
Quiero agradecer aqu los diversos apoyos y ayudas de todas las personas que han
contribuido de una u otra manera a que este trabajo de tesis sea posible. Entre ellos,
resulta obligado mencionar a los que siguen por su importancia destacada:
A los tcnicos y responsables de los servicios socioculturales en los que he
llevado a cabo las encuestas que me han permitido recabar los datos utilizados en esta
investigacin, y especialmente a Donato Barba, Ana Mara Judel, Piedad Novillo y
Rosario Pea, por todas las facilidades que me han prestado.
A los profesores Benjamn Sierra y Francisco Jos Abad, de la Universidad
Autnoma de Madrid, por su inestimable asesoramiento en algunas de las partes de esta
investigacin.
A los directores de esta tesis, los profesores Antonio Pardo y Miguel ngel
Ruiz, de la Universidad Autnoma de Madrid, que no han escatimado esfuerzos ni
asperezas para conducir sabiamente este trabajo hasta que llegara a su fin.
A mi mujer, Esther, por su paciencia y generosidad para concederme el tiempo
que le he hurtado para realizar esta tesis, y a mi hija Irache, por sus estimulantes nimos
para llevarla a cabo a estas alturas de mi vida.
When you can measure what you are speaking about, and express it
in numbers, you know something about it; but when you cannot
measure it, when you cannot express it in numbers, your knowledge is
of a meagre and unsatisfactory kind
NDICE
INTRODUCCIN: Planteamiento de la investigacin, objetivos y supuestos
fundamentales.....................................................................
CAPTULO 1. La calidad del servicio y la satisfaccin del usuario: concepto
y medida ...................................................................................
1.1. El concepto de calidad y de calidad del servicio ......................
1.2. El concepto de satisfaccin del cliente .....................................
1.3. La estructura de la calidad percibida: sus dimensiones ............
1.4. La cuestin de las expectativas del cliente y su papel en la
medida de la calidad percibida .................................................
1.5. Escalas ms usadas para medir la calidad percibida .................
1.6. Comparacin terica, metodolgica y emprica de las escalas.
Fundamentos de eleccin de un modelo para disear QPSC....
1.7. A modo de conclusin: razones para evaluar positivamente el
modelo de la escala QPSC .......................................................
CAPTULO 2. Proceso de confeccin de la escala: funcin, diseo y
valoracin crtica de la escala QPSC .......................................
2.1. Planteamiento y fundamentos generales de la escala QPSC.....
2.2. Valoracin crtica de la confeccin de la escala .......................
2.2.1. Cuestiones previas: fundamentos tcnicos y requisitos
institucionales ................................................................
2.2.2. Preparacin del cuestionario y confeccin de la
escala ..............................................................................
2.2.3. El informe de resultados .................................................
2.2.4. Crtica del proceso de confeccin de la escala ...............
CAPTULO 3. Mtodo .....................................................................................
3.1. Diseo general del estudio ........................................................
3.2. Factibilidad de la escala QPSC .................................................
3.3. Anlisis de los tems de la escala ..............................................
3.3.1. Valores perdidos ..............................................................
3.3.2. Capacidad discriminante .................................................
3.4. Fiabilidad ..................................................................................
3.4.1. Consistencia interna ........................................................
3.4.2. Estabilidad temporal ........................................................
3.4.3. Aproximacin a la fiabilidad de la escala desde el
enfoque de la Teora de Respuesta al tem ......................
3.5. Estudio de validez de la escala QPSC ......................................
3.5.1. Introduccin: el concepto de validez y sus tipos ...........
3.5.2. Evidencias de validez de la escala QPSC .......................
3.5.2.1. Evidencias de validez basadas en el contenido.......
3.5.2.2. Evidencias de validez basadas en la relacin
con un criterio ........................................................
3.5.2.3. Evidencias de validez basadas en la estructura
interna ....................................................................
9
9
12
18
27
34
37
44
49
49
54
55
58
64
65
69
69
74
75
78
78
79
79
80
82
92
92
102
103
106
111
129
129
135
135
135
153
164
173
176
178
178
183
184
198
263
297
ANEXOS .................................................................................
331
198
201
203
223
236
INTRODUCCIN
Planteamiento de la investigacin, objetivos
y supuestos fundamentales
Los Servicios Socioculturales son un rtulo bajo el que se articulan una serie de
prestaciones, ya prcticamente estandarizadas, que incluyen servicios a las personas en
las reas de juventud, tercera edad, educacin y cultura, principalmente. En Espaa han
sido las administraciones municipales, sobre todo, las que han efectuado una labor ms
notable en este campo: centros socioeducativos, casas de cultura, centros de juventud,
etc., han visto la luz por centenares en toda su geografa. Estos servicios, mejor o peor
dotados de recursos econmicos y humanos, han ido desarrollando programas de accin
sociocultural con una indudable repercusin en el bienestar social de los ciudadanos.
Cuando la accin sociocultural, que en sentido estricto no es sino una prctica de
dinamizacin social, independientemente de quien la lleve a cabo, se convierte en
trabajo sociocultural institucionalizado, en servicio pblico, deja de ser una prctica
social perifrica para constituirse en una parte ms de los servicios que componen el
sistema de bienestar social que los contribuyentes sufragan con sus impuestos. Y,
consiguientemente, va a recibir por parte del ciudadano la misma exigencia de calidad
que el resto de los servicios pblicos.
La calidad es un concepto fundamental que ha entrado a formar parte de la
filosofa contempornea de la administracin y direccin de las organizaciones
productivas. Concepto no siempre unvocamente definido, que ha ido evolucionando
con el paso del tiempo: desde su primera acepcin como hacer un producto de
conformidad con unas determinadas especificaciones (Crosby, 1989), hasta su
concepcin como un sistema eficaz para integrar los esfuerzos de mejora para
1
Por su parte, los supuestos fundamentales de esta investigacin son bsicamente los
siguientes:
Captulo 1
La calidad del servicio y la satisfaccin del usuario:
concepto y medida
10
Calidad objetiva calidad subjetiva (Muoz, 1999; Barrera y Reyes, 2003), siendo
la calidad objetiva el cumplimiento de las especificaciones tcnicas para el producto
y la subjetiva la percibida por el cliente.
Calidad interna calidad externa (Alet, 1994; Senlle y Vilar, 1996), entendiendo por
interna la relativa a los procesos de produccin del servicio y por externa la
relativa al producto ofrecido.
Calidad intrnseca calidad extrnseca (Mels, Boshoff y Nel, 1997), con significado
semejante al dado para la calidad tcnica y la funcional.
Calidad del resultado calidad del entorno calidad de la interaccin con el cliente
(Brady y Cronin, 2001), entendiendo por la primera la propia del producto, por la
segunda la de las instalaciones y por la ltima la que se refiere a la relacin con el
cliente.
que, en definitiva, es el concepto al que aluden los autores antes sealados cuando
hablan explcitamente de calidad percibida (Horowitz, 1990; Muoz, 1999) o cuando
la nombran con otros trminos como calidad subjetiva (Muoz, Barrera y Reyes,
2003), calidad interactiva (Grnross, 1994; Walbrigde y Delene, 1993; Villegas y
Daz, 2003), calidad externa o extrnseca (Alet, 1994; Senlle y Vilar, 1996; Mels et
al., 1997) o calidad de la interaccin con el cliente (Brady y Cronin, 2001). El modelo
de calidad EFQM otorga una importancia del 20% del total de puntos del modelo a la
satisfaccin del cliente, de modo que, aunque no identifica calidad con calidad
percibida, hace de esta ltima uno de los referentes fundamentales de la calidad
alcanzada por la organizacin. Posiblemente, esta circunstancia es la que hace de EFQM
un modelo de calidad especialmente adecuado para las organizaciones productoras de
servicios si se admite que en stos la satisfaccin del cliente es el ms importante dato a
tener en cuenta para determinar si el producto es o no de calidad.
1.2.
14
y Surprenant, 1982; Halstead et al., 1994; Oliver, 1981; Parasuraman, Zeithaml y Berry,
1988, 1991; Voss, Parasuraman y Grewal, 1998).
La cuestin de las expectativas nos lleva al segundo aspecto del problema
planteado ms arriba: de qu depende la satisfaccin? Si, como han defendido
numerosos autores, la satisfaccin con el servicio aparece cuando se colman las
expectativas relativas al mismo, la tarea simplemente consiste en establecer cules son
esas expectativas para darles una respuesta (servicio). Si la respuesta se adecua a las
expectativas, entonces se produce la satisfaccin del cliente. El esquema explicativo es
sencillo y aparentemente plausible, pero el problema surge cuando se pretenden
determinar las expectativas sobre el servicio, pues no est del todo claro no ya que las
mismas se puedan identificar con precisin lo cual presenta dificultades metodolgicas
considerables, sino que el propio cliente las haya concretado en su mente y las pueda
formular en el plano de lo consciente (Bielen y DHoore, 2002). Para algunos
investigadores, adems, tampoco resulta evidente que la satisfaccin sea el resultado de
unas expectativas colmadas, pues puede experimentarse satisfaccin con un servicio del
que nada concreto se esperaba (Kano, 1984; Williams, 1994). Como veremos
posteriormente, existen otros modelos de medicin de la satisfaccin del cliente que
apuestan por una medida simple o ponderada de la satisfaccin del cliente sin considerar
sus expectativas u otros elementos de comparacin, de tal modo que los problemas
inherentes a la inclusin de las expectativas o de otros referentes en la determinacin de
la satisfaccin desaparecen o dejan de ser considerados por inoperantes (Babakus y
Boller, 1992; Carman, 1990; Cronin y Taylor, 1992, 1994).
En todo caso, la satisfaccin del cliente con el servicio aparece en gran parte de
la literatura como el principal indicador de la calidad del servicio (de la calidad
percibida) y constituye el mejor predictor de fidelizacin del cliente con respecto al
servicio (uso y/o compra posterior del mismo). Este presupuesto terico y operativo es
el ms ampliamente aceptado y es el ncleo de los planteamientos mercadotcnicos que
asumen modelos genricos como el de la Service Profit Chain, propuesto y difundido
por la Escuela de Negocios de la Universidad de Harvard. Sin embargo, tampoco sobre
este asunto existe acuerdo entre los especialistas, pues mientras para algunos
(ciertamente la mayora) la calidad percibida precede a la satisfaccin (Anderson et al.,
1994; Casado, Ms y Azorn, 2004; Cronin y Taylor, 1992; Llorens, 1996; Reidenbach
y Sandifer-Smallwood, 1990), para otros la satisfaccin precede a la calidad percibida
(Bitner, 1990; Bolton y Drew, 1991a; Carman, 1990; Aln y Fraiz, 2006, Parasuraman
15
et al., 1988; Teas, 1993). Tambin se ha apuntado que la satisfaccin es una variable
que mediatiza la formacin de nuevas percepciones de calidad desde las previas (Oliver,
1981). As mismo, se ha sealado que la calidad percibida es ms bien una actitud
largoplacista sobre la base de la evaluacin total del servicio, mientras que la
satisfaccin es una actitud, tambin, pero emergida de la valoracin de una transaccin
especfica (Bitner, 1990; Bolton y Drew, 1991a), de manera que la calidad percibida del
servicio no es otra cosa, a la postre, que la consecuencia actitudinal de la valoracin
(medida como satisfaccin) de una serie de transacciones especficas del cliente con el
servicio (Parasuraman, Zeithalm y Berry, 1994). Esta determinacin del significado de
calidad del servicio resulta fundamental para aclarar su relacin causal con la
satisfaccin del cliente con el servicio (entendiendo sta como una percepcin global
del servicio que se construye sobre la adicin de percepciones parciales que generan
mayor o menor satisfaccin). Si se da al concepto de calidad del servicio otra acepcin,
entendindola como un output y no como una actitud, y la cuestin que se plantea es si
la calidad del servicio es lo que produce satisfaccin en el cliente o si la satisfaccin del
cliente con el servicio conduce a que ste lo considere como un servicio de calidad, la
discusin parece poco menos que ftil a efectos prcticos, pues probablemente lo que
sucede es que ambas afirmaciones son ciertas y entraan una concepcin circular de la
relacin entre calidad y satisfaccin: la mayor o menor calidad de un servicio produce
mayor o menor satisfaccin y sta se traduce en que el cliente valora el servicio como
de mayor o menor calidad. Adems, algunos autores (Iacobucci, Ostrom y Grayson,
1995; McAlexander, Kaldenburg y Koenig, 1994) han apuntado que es imposible
concluir si es la satisfaccin o la calidad de los servicios la antecesora de la otra,
mientras que otros (Bern, Mgica y Yage, 1996; Taylor y Baker, 1994) han concluido
que la calidad es tanto un antecedente como una consecuencia de la satisfaccin. Puede
dudarse que el cliente sepa determinar en qu consiste la calidad de un servicio (tanto
antes como despus de recibirlo), pero no es sa su preocupacin ni su tarea. Lo que el
cliente desea es recibir un buen servicio, y de eso precisamente depende que se sienta
satisfecho o no con el mismo y que luego valore que el servicio es o no de calidad. Lo
identificable y medible es la satisfaccin del cliente, mientras que la calidad es un
constructo considerablemente proteico elaborado por las administracines de las
organizaciones productivas y los tratadistas, til para estos ltimos en lo que se refiere a
la estrategia y la tctica mercadotcnica, pero escasamente relevante para el cliente ms
all de que le sirve para expresar, con una acepcin consuetudinaria del trmino, si el
16
servicio es bueno o no, juicio que depende de si ha quedado o no satisfecho con dicho
servicio. La satisfaccin, por tanto, es un indicador global de la calidad del servicio, si
se quiere identificar una cosa con la otra, y no lo es si no se acepta tal igualdad y se
considera que la calidad es algo ms que el logro de la satisfaccin del cliente. Si se
circunscribe el concepto de calidad al de calidad percibida, parece evidente que, al
menos operativamente, satisfaccin es igual a calidad percibida y que sta es igual a
satisfaccin (Liljander, 1994); niveles altos de satisfaccin comportan fidelizacin del
cliente (compra o uso reiterados del servicio) y, en definitiva, de eso es de lo que se
trata. Adems, algunos investigadores han encontrado una correlacin muy alta entre
calidad percibida y satisfaccin (Aln y Fraiz, 2006: r = 0,915 en un estudio emprico en
once establecimientos termales; Cronin y Taylor, 1992: un promedio de r = 0,875 en
cuatro estudios empricos en diversos sectores de servicios; Iaccobucy et al., 1995: un
promedio de r = 0,909 en diez estudios empricos en variados servicios; Saurina y
Coenders, 2002: r = 0,910 en un estudio general de servicios bancarios), lo cual abona
la tesis de que aunque los dos conceptos no sean idnticos, medir la satisfaccin del
cliente supone, como poco, medir la calidad percibida en muy alto grado. Tambin
merece la pena destacar que la investigacin emprica ha puesto de manifiesto que
mientras que el constructo calidad del servicio muestra una relacin estadsticamente
significativa con la intencin de comportamiento (volver a comprar o usar) solamente
en algunos servicios estudiados, la satisfaccin del cliente muestra esa relacin
estadsticamente significativa en todos los servicios estudiados (Childress y Crompton
1997; Cronin y Taylor, 1994; Dabholkar y Torpe, 1994; Saurina y Coenders, 2002).
En definitiva, parece plausible considerar la satisfaccin del cliente con el
servicio como un excelente indicador de la calidad percibida, que entonces resultara ser
un precedente de la satisfaccin. La calidad de un servicio se manifiesta en la
satisfaccin que ste produce a quien lo disfruta, de manera que la satisfaccin puede
entenderse como la consecuencia de la calidad de servicio percibida (Lee, Lee y Yoo,
2000, p. 226) y medirla comporta medir (indirectamente, si no se admite que son
conceptos intercambiables) la calidad del servicio recibido. Esta es una perspectiva que
nos parece aceptable y es asimismo la concepcin asumida por el modelo de medida de
la escala QPSC. Por otro lado, la satisfaccin del cliente muestra un mayor poder
predictivo que la calidad percibida sobre la intencin de volver a comprar o reutilizar el
servicio, lo cual hace ms conveniente medir la satisfaccin si no se conviene en
17
18
Calidad Percibida
del Servicio
Calidad Tcnica
Calidad Funcional
Fiabilidad
Respuesta
Empata
Calidad Percibida
Seguridad
Tangibles
de que la alta correlacin entre algunos factores haca aconsejable fundirlos en uno solo.
As, por ejemplo, McDougall y Levesque (1994) encontraron solamente tres
dimensiones de la calidad en servicios bancarios; Falces, Sierra, Briol y Becerra (1999)
hallaron asimismo tres dimensiones en servicios tursticos; Sierra, Falces, Ruiz y Alier
(2003) hallaron cuatro en servicios de hostelera; Van Riel, Liljander y Jurriens (2001)
encontraron cuatro en servicios on line; y Fernndez y Bedia (2004) tambin
determinaron cuatro dimensiones de la calidad en servicios hoteleros. Especialmente
significativo resulta que los propios Parasuraman y Zeithaml, en uno de sus ms
recientes trabajos conjuntos (Parasuraman, Zeithhaml y Malhotra, 2005), hayan
concluido que la calidad percibida en sitios web abarca cuatro dimensiones: eficiencia,
disponibilidad del sistema, cumplimiento y privacidad. Y no lo es menos que uno de los
antecedentes citados por estos ltimos autores sea la adaptacin del modelo americano
pentadimensional a contextos electrnicos llevada a cabo por Gefen (2002), en la que se
redujeron las dimensiones a tres: tangibles, empata y una combinacin de capacidad de
respuesta, fiabilidad y seguridad.
No han faltado tampoco algunos autores (por ejemplo, Mels et al., 1997;
Martnez-Tur et al., 2001) que proponen integrar la perspectiva nrdica y la americana y
utilizar un modelo conjunto, en el cual la dimensin Tangibles de la americana se
asimilara a la calidad tcnica de la nrdica y el resto de dimensiones de la primera se
asimilara a la calidad funcional de la segunda, pero no est claro que esas
equivalencias sean muy precisas ni que puedan establecerse en cualquier clase de
servicio.
Por otro lado, adems de los dos modelos dominantes, nrdico y americano,
existen otros modelos conceptuales que distinguen ms o menos dimensiones y que las
relacionan de modo distinto a como hemos visto en esos dos modelos, presentndose
formalmente como alternativos. As, el Modelo de los Tres Componentes (Rust y
Oliver, 1994) propone tres dimensiones de la calidad: la referida a la produccin o
resultado del servicio, la relativa a la entrega del mismo y la relativa al entorno del
servicio (las dos primeras dimensiones son equivalentes, respectivamente, a la calidad
tcnica y a la calidad funcional del modelo de Grnroos). Otro modelo, el Modelo
Multinivel (Dahbolkar, Thorpe y Rentz, 1996), abre la va de los llamados modelos
jerrquicos,
que
distinguen
dimensiones
primarias
secundarias
(o
subdimensiones) de la calidad del servicio. En la figura 1.2 se ilustran estas dos visiones
de la dimensionalidad de la calidad percibida.
20
Calidad
del Servicio
Resultado
del Servicio
Entrega
del Servicio
Entorno
del Servicio
Calidad
del Servicio
D1
d11
D2
d12
d21
Dn
d22
dn1
dn2
Calidad de la
Interaccin
Conducta
Profesionalidad
Ambiente
Calidad del
Servicio
Calidad del
Entorno Fsico
Diseo
Factores
sociales
Tiempo de
espera
Calidad del
resultado
Tangibles
Valencia
(2003) han propuesto un modelo de cuatro dimensiones para su escala para medir la
satisfaccin con los servicios sanitarios de atencin primaria, distinguiendo entre
calidad del personal sanitario, calidad del personal de apoyo, calidad de las condiciones
fsicas y calidad del acceso al servicio, cada una de las cuales est vinculada con una
serie de aspectos o atributos del servicio (trato del mdico, agilidad en cita telefnica,
comodidad de la sala de espera o tiempo de espera para ser atendido, por ejemplo).
Noda, Gonzlez y Prez (2005) han distinguido tres dimensiones fundamentales en la
calidad de los servicios hoteleros: tangibles relativos al servicio que se ofrece, tangibles
relativos al ambiente en que se ofrece e intangibles referidos a la forma en que se
ofrece, cada una de las cuales se asocia con atributos diversos (confort, seguridad o
amabilidad, por ejemplo). Y Molino et al. (2008) han propuesto un modelo, al que
denominan Q+4D, en el que diferencian tres dimensiones fundamentales para
cualquier servicio en general: entorno fsico, organizacin e interaccin clienteproveedor, cada una de las cuales se subdivide en una serie de subdimensiones
(instalaciones, equipamiento, seguridad, etc.), vinculadas con atributos caractersticos
(limpieza, horarios o profesionalidad, por ejemplo). En las figuras 1.4, 1.5 y 1.6 pueden
verse las representaciones grficas de estas tres concepciones de la dimensionalidad de
la calidad percibida del servicio.
Calidad
del Servicio
Personal
sanitario
Personal
de apoyo
Condiciones
fsicas
Acceso
23
Calidad
del Servicio
Tangibles
del servicio
Tangibles
ambiente
Forma
de ofrecerlo
Entorno fsico
Equipamiento
Localizacin
Informacin
Calidad del
Servicio
Organizacin
Diseo
Otros
Profesionalidad
Interaccin
Seguridad
Otros
24
Sin embargo, hay que sealar que algunos autores cuestionan la concepcin
multidimensional de la calidad del servicio y entienden que se han encontrado algunas
evidencias que apoyan una concepcin unidimensional de la misma. As, por ejemplo,
Babakus y Mangold (1989), utilizando 15 de los 22 tems originales del modelo
SERVQUAL de Parasuraman, Zeithaml y Berry (1988), en vez de conseguir reproducir
su estructura pentadimensional, encontraron un nico factor principal que resuma
adecuadamente la variabilidad de los tems utilizados. Cronin y Taylor (1992)
encontraron asimismo valores altos de las saturaciones sobre un nico factor en 21 de
los 22 tems de SERVQUAL, lo cual entendieron que sugera una estructura
unidimensional para esta escala. Tambin Babakus y Boller (1992), en un estudio de
calidad percibida en servicios de gas y electricidad, hallaron que la estructura factorial
que mejor se ajustaba a los datos era de dos factores, que estaban altamente
correlacionados y que podan asimilarse, haciendo muy plausible una estructura
unidimensional. De hecho, la aparicin de factores altamente correlacionados en
modelizaciones multifactoriales sugiere muchas veces la conveniencia de combinarlos,
reduciendo la multidimensionalidad y conduciendo eventualmente a una estructura de
una sola dimensin, susceptible de ser desglosada en subdimensiones para una mejor
captacin de la calidad percibida del servicio.
En definitiva, la cuestin de las dimensiones de la calidad del servicio no ha
podido resolverse unvocamente, en el sentido de que ni la teora ni la investigacin
emprica han conseguido establecer un modelo singular que integre todos los factores,
elementos y situaciones involucrados en la prestacin de un servicio en general. La
probablemente deseable universalidad de la estructura de la calidad percibida
(Robinson, 1999) se ha mostrado sumamente esquiva a los esfuerzos modelizadores de
los especialistas y los resultados de sus estudios e investigaciones ms bien han
contribuido a poner de relieve la naturaleza variable de la estructura de la calidad
percibida y la aparentemente insalvable dificultad de determinarla con carcter general.
Todo parece indicar que la calidad de los servicios es un constructo considerablemente
verstil y voluble, cuya estructura muda cualitativa y cuantitativamente no slo en
virtud del tipo de servicio y su contexto, sino tambin en funcin de la perspectiva
terica y analtica de los investigadores. La evidencia emprica muestra que los distintos
segmentos del sector servicios poseen singularidades que los hacen susceptibles de ser
modelizados especficamente, con arreglo a las caractersticas propias que poseen.
Cabra esperar, por tanto, que los servicios pertenecientes a un mismo sector
25
presentasen una estructura de la calidad muy semejante, de modo que sus dimensiones,
en contenido y cantidad, fuesen las mismas o muy parecidas. Es cierto que los
resultados de algunas investigaciones (v.g. Andaleeb, 2001; Santom y Costa, 2007;
Valdunciel, Flrez y Miguel, 2007) han puesto de relieve que no siempre sucede tal
cosa y que incluso en un mismo sector se pueden encontrar distintas dimensiones de la
calidad del servicio. Pero la mayor parte de los estudios sobre la estructura de la calidad
del servicio muestran una considerable homogeneidad dimensional, simple o
jerrquica, de manera que el propsito de disear instrumentos generales,
universales, para medir la calidad percibida en mbitos similares de servicios no
parece en absoluto injustificado. De hecho, esta es la principal razn que respalda el
intento de construir escalas que, como servqual o la propia QPSC que aqu estudiamos,
posean la suficiente versatilidad para ser aplicadas como instrumento estndar, al menos
en un mismo segmento de servicios. Con todo, es evidente que la efectiva adaptacin de
un modelo a la percepcin real de la calidad de un servicio, o de un sector de servicios
concreto, por sus clientes constituye la mejor prueba de su validez conceptual y que es
necesario probarlo empricamente en una cierta variedad de casos antes de proponerlo
como modelo general.
En cuanto al modelo de estructura dimensional subyacente en la escala QPSC
hay que sealar que es un modelo simple, no jerrquico, que distingue tres
dimensiones (o subdimensiones) de la calidad del servicio: calidad de las instalaciones
donde se presta el servicio, calidad del personal que da el servicio y calidad de la
organizacin de los trmites necesarios para recibir el servicio, y esquemticamente es
el que se muestra en la figura 1.7. Este modelo es uno de los posibles que admite el tipo
de servicios cuya calidad percibida pretende medirse con la escala QPSC y juzgamos
que resulta idneo para ese cometido. En la revisin de modelos precedente hemos visto
algn modelo de estructura conceptual semejante, como el modelo de Tres
Componentes de Rust y Oliver (1994), que tambin es simple y tridimensional. El
modelo QPSC refleja una estructura dimensional apropiada para el tipo de servicios
cuya calidad pretende medir, puesto que abarca los elementos tangibles e intangibles
involucrados en los servicios socioculturales locales.
26
Calidad
del Servicio
Calidad de
Instalaciones
Calidad del
Personal
Calidad Org.
de Trmites
Surprenant, 1982; Oliver, 1980; Rust y Oliver, 2000; Zhang, Han y Gao, 2008). En los
resultados de estos estudios se concluye que, ya sea concibiendo las expectativas como
una norma, como un deseo o como algn tipo de creencia, el consumidor parece llevar a
cabo una u otra clase de juicio comparativo, de confirmacin/desconfirmacin, a cuyo
trmino evala el servicio recibido, construyendo una valoracin subjetiva sobre el
criterio de si ese servicio se ajusta o no a lo esperado o, incluso, si se ajusta a lo
esperado en un cierto grado que puede ser medido (Oliver y Burke, 1999).
Es obvio que el esquema conceptual de la teora de las expectativas parece
plausible, ya que se fundamenta en el igualmente plausible principio lgico de que para
que un servicio resulte satisfactorio o sea enjuiciado positivamente debe producir una
sensacin de plenitud o conformidad con lo recibido, conformidad que descansara en el
grado en que se colma la expectativa sobre ese servicio. Consiguientemente, la
valoracin del servicio por el consumidor es mxima cuando la expectativa se cumple
plenamente. Adems, si en un acto de consumo puede establecerse la magnitud de lo
esperado, por un lado, y la de lo recibido, por otro, puede asimismo utilizarse una
mtrica que informe de la diferencia entre expectativa y percepcin en trminos
cuantitativos y determinar, por tanto, el nivel de calidad percibida o de satisfaccin de
cualquier consumidor. Ciertamente, no es otro el mecanismo informativo que subyace
en todos los instrumentos de medida de la calidad percibida que utilizan las expectativas
como parte del mtodo de medicin.
En efecto, es abundantsimo el nmero de casos descritos en la literatura en los
que se han realizado estudios empricos sobre calidad percibida y satisfaccin del
cliente empleando el modelo de confirmacin/desconfirmacin con expectativas. Una
parte muy considerable de esos casos est constituida por aplicaciones directas o por
versiones ms o menos modificadas de la escala SERVQUAL, que se han evaluado
positivamente en trminos psicomtricos y tambin en trminos de su utilidad para la
gestin del servicio en los ms variados campos (v.g. Daz, 2005; Heung, Wong y Qu,
2000; Saleh y Ryan, 1991; Tarranty Smith, 2002). Una revisin de las propiedades
psicomtricas de SERVQUAL a partir del anlisis de sesenta aplicaciones (Nyeck,
Morales, Ladhari y Pons, 2002) permite concluir que posee una aceptable validez
convergente, discriminante y predictiva.
Este modelo de calidad percibida basado en expectativas parece, pues,
razonablemente vlido en lo psicomtrico y en lo pragmtico, pero ha sido objeto de
numerosas crticas conceptuales, metodolgicas y prcticas, y de hecho se han
29
lo percibido, midiendo, por tanto, solamente la percepcin del cliente de los distintos
aspectos o atributos del servicio recibido.
Tambin se ha hecho notar (Gooding, 1995; Yu y Dean, 2001) que si el juicio
valorativo sobre un servicio se forma a partir de la experiencia de uso, ese juicio no es el
mero resultado de una comparacin esperado/recibido, de una especie de clculo
coste/beneficio, que sera de estricto carcter cognitivo, sino que incorpora tambin
elementos afectivos que se forman y emergen de un modo eminentemente subjetivo y
por tanto muy imprevisible, de manera que las expectativas nicamente seran una parte
de la base de la evaluacin que realiza el consumidor del servicio (y una parte, adems,
difcilmente objetivable) y fundamentar la explicacin de la respuesta del cliente en el
paradigma de la desconfirmacin resultara incompleto y sesgado. Igualmente, se ha
observado (Hughes, 1991; Morales y Hernndez, 2004) que en multitud de servicios,
especialmente si son nuevos para el cliente, si la experiencia de uso resulta agradable, la
valoracin resultar positiva, independientemente de si se confirman o no las
expectativas. Adems, se ha sealado (Johnson, Hermann y Gustafsson, 2001) que en
algunos segmentos del sector servicios las expectativas simplemente no resultan
importantes para medir la calidad percibida, idea que, por otra parte, parece corroborada
por algunas investigaciones desde la psicologa cognitiva (Ruiz y Palac, 2011), al
menos para el campo del comercio electrnico. Otras investigaciones (Martnez-Tur,
Zurriaga, Luque y Moliner, 2005) han puesto de manifiesto el dbil papel de las
expectativas de base cognitiva para los clientes de servicios en los que predomina el
carcter hedonista.
Sin embargo, una buena parte de las crticas al paradigma desconfirmatorio van
ms all de las cuestiones conceptuales y se centran ms bien en los aspectos
psicomtricos. Son numerosas las investigaciones empricas que han puesto de
manifiesto que la sola medida de las percepciones del cliente, en la experiencia del
servicio, basta para obtener una informacin vlida y fiable de la calidad percibida del
servicio, frecuentemente ms robusta en trminos psicomtricos que la medida de la
calidad percibida teniendo en cuenta las expectativas. Algunos autores (Brown,
Churchill y Peter, 1993; Peter, Churchill y Brown, 1993) observaron que la medida de
la calidad percibida basada en las expectativas planteaba problemas de fiabilidad y de
validez discriminante; otros (Cronin y Taylor, 1994) han puesto de relieve, mediante la
comparacin de escalas con y sin expectativas, que las mediciones basadas slo en
percepciones aportan mayor fiabilidad y validez convergente que las basadas en
31
expectativas; mientras que otros (Gil y Moll, 1994) afirman que medir las expectativas
provoca una escasa dispersin en los distintos atributos de una escala que dificulta la
discriminacin precisa entre tems. Los propios creadores de SERVQUAL (Parasuraman
et al., 1994) llevaron a cabo una comparacin de cuatro tipos de escala, con y sin
inclusin de las expectativas, y mostraron que los indicadores psicomtricos de las
escalas sin expectativas eran en general superiores a su modelo de desconfirmacin (sin
perjuicio de que atribuyesen a ste mayor capacidad de diagnstico, por indicar la
distancia entre lo esperado y lo percibido en los atributos del servicio).Tambin se ha
mostrado que las medidas de las percepciones por s solas ofrecen una mejor validez
predictiva: por ejemplo, algunas investigaciones empricas en el mbito de los servicios
bancarios (McDougall y Levesque, 1994; Saurina, 1997), comparando la medida de la
calidad percibida con varias escalas, han concluido que las medidas de performance
exclusivas (slo percepciones) son superiores y ms eficientes para predecir el
comportamiento de los clientes que las que consideran las expectativas. En ese mismo
mbito, distintos autores han defendido el uso de escalas para medir la calidad percibida
que se basan solo en percepciones (Sharma y Meta, 2004; Ting, 2004). Otros estudios
en el rea de la investigacin de mercados minoristas (Pascual, Pascual, Fras y Rosel,
2006; Vzquez, Daz y Rodrguez, 1997) han mostrado asimismo que las escalas sin
incluir expectativas presentan unos ndices de fiabilidad y de validez de constructo,
contenido y criterio muy satisfactorios. En la literatura tambin se encuentran anlisis
comparados de modelos de medida de la calidad percibida con y sin expectativas en
servicios tursticos y de alimentacin (Daz y Vzquez, 1997; Daz, Iglesias, Vzquez y
Ruiz, 2000) que se posicionan a favor de las escalas sin expectativas por sus mayores
virtudes psicomtricas.
Existen en otros campos numerosos ejemplos de estudios sobre calidad percibida
y satisfaccin del cliente cuyos autores optan por modelos e instrumentos de medida
que no contemplan las expectativas y que, sin embargo, encuentran buenas propiedades
psicomtricas en sus resultados. As, Chitty y Soutar (2004) y Duque (2004) en la
medida de la calidad en servicios universitarios, Lai, Briffin y Babin (2009) en la
medida de la calidad y la satisfaccin en servicios de telecomunicaciones, u OLoughlin
y Coenders (2002) en la medida de la satisfaccin y el valor percibido en servicios
postales. Hay que remarcar que, en muchas ocasiones, los investigadores optan por la
aplicacin directa de la escala sin expectativas SERVPERF, propuesta por Cronin y
Taylor (1992), o por adaptaciones de sta al servicio estudiado (v.g. Laguna y Palacios,
32
2009; Gonzlez y Carreras, 2010). Cuando los investigadores eligen abiertamente esta
ltima escala, es frecuente que argumenten a su favor en virtud de la superioridad
psicomtrica que le atribuyen con respecto a SERVQUAL (v.g. Armstrong, Mok, Go y
Chan, 1997; Hernndez, Muoz y Santos, 2007; Lee, Lee y Yoo, 2000).
En otro orden de consideracin, tambin hay que sealar que, adems de las
posibles mejores propiedades psicomtricas de los modelos de medida de la calidad
percibida sin expectativas, los especialistas han tenido en cuenta otras caractersticas de
esos modelos que entienden que hacen su uso ms ventajoso. Fundamentalmente, se han
apuntado dos de ellas: las medidas sin expectativas de la calidad percibida y la
satisfaccin del cliente son ms fciles de realizar y ms cmodas para ste y resultan
ms baratas. Lo primero, porque es menos confuso para el cliente preguntarle solamente
cmo ha percibido el servicio y ms cmodo para l responder a menos preguntas (de
hecho, las preguntas se duplican con una medida de expectativas aadida); lo segundo,
porque tiene menos costes preguntar por la percepcin del servicio sin tener en cuenta
las expectativas, pues se disminuye la tasa de no respuesta y se emplea menos tiempo en
la administracin del cuestionario y la explotacin de la informacin. Obviamente, estas
cuestiones son ajenas a las propiedades psicomtricas de los instrumentos de medicin,
pero no a la factibilidad de las prospecciones sociolgicas o mercadotcnicas, como nos
sealan los expertos (Biemer et al., 1991; Cea, 2005; Daz de Rada, 2000; Groves,
1984; De Leeuw, Hox y Dillman, 2008), ni por supuesto a la evaluacin de la utilidad
de un instrumento que debe servir para una mejor gestin de los servicios.
Como veremos posteriormente, existen modelos de medida de la calidad
percibida y la satisfaccin del cliente que si bien soslayan las expectativas, incluyen
algn otro referente de desconfirmacin como normas o puntos ideales de servicio (v.g.
Teas, 1994) o proponen una medida de la importancia que el cliente concede a las
distintas dimensiones o atributos del servicio (v.g. Ennew, Reed y Binks, 1993), para
que sirva de base de ponderacin de las puntuaciones de calidad percibida o
satisfaccin, pero aunque algunos autores sealan que parecen mostrar un mejor
funcionamiento psicomtrico que los que incorporan las expectativas (balo, Varela y
Rial, 2006), otros lo consideran semejante (Hudson, Hudson y Miller, 2004) y otros han
cuestionado consistentemente su validez y fiabilidad (Oh, 2001). Y, en todo caso,
adolecen de las mismas desventajas que aquellos presentan en relacin con las tasas de
no respuesta y los costes de recogida y tratamiento de la informacin arriba sealados.
33
SERVPERF. Es una escala con la que slo se mide la percepcin por parte del
cliente de la performance o actuacin (desempeo) del servicio. Fue propuesta por
Cronin y Taylor (1992, 1994) a partir de la revisin de SERVQUAL, de la que
aceptan sus cinco dimensiones del servicio, pero a la que critican que ms que
registrar la calidad del servicio o la satisfaccin del cliente, lo que recoge es la
disconformidad con el servicio recibido. Tambin ponen en tela de juicio la utilidad
de la medicin de las expectativas que lleva a cabo SERVQUAL, sealando adems
el problema metodolgico que comporta preguntar por stas en el mismo
cuestionario en el que se pide que se califiquen las distintas dimensiones del
servicio. Existen dos versiones de SERVPERF: la simple, en la que slo se miden
las percepciones de la actuacin, y la ponderada, en la que tambin se recoge la
importancia que el cliente otorga a los distintos aspectos que engloban las
dimensiones del servicio, operando las puntuaciones de importancia como factores
de ponderacin de las puntuaciones dadas a la actuacin.
Escala de Desempeo Evaluado. Es una escala que acepta como punto de partida las
dimensiones del servicio identificadas por SERVQUAL, as como la metodologa de
la pauta no confirmatoria substractiva (discrepancia entre expectativas y
percepciones), pero sustituyendo las expectativas por el concepto de punto ideal,
es decir, una puntuacin del nivel que los distintos aspectos del servicio deberan
tener. La escala fue propuesta por Teas (1993) como resultado de su crtica al
modelo de escala de Parasuraman, Berry y Zeithaml. Teas tambin ha propuesto
otro modelo de medida de la calidad del servicio, basado en el concepto de calidad
normada (Teas, 1993), aunque lo considera superado por su propio modelo de
Desempeo Evaluado.
Existen algunas otras escalas para medir la calidad percibida del servicio, pero son en su
mayora antecedentes, versiones o adaptaciones de las anteriormente sealadas. Entre
ellas, merece la pena mencionar, por mantener una utilidad potencial, las siguientes:
35
manifiesto que los tems de la escala no abarcan todos los atributos o dimensiones reales
de los mismos, aunque consideran que no existe evidencia suficiente para negar la
oportunidad y adecuacin de los 22 tems de SERVQUAL para medir la calidad del los
servicios (de hecho, es el aspecto de la escala al que Cronin y Taylor conceden ms
utilidad). As mismo, apuntan que, tal como parece desprenderse del anlisis factorial
llevado a cabo en cuatro servicios para analizar la escala, SERVQUAL es probablemente
una escala unidimensional y no pentadimensional como pretenden Parasuraman,
Zeithaml y Berry. Con respecto a la validez de SERVQUAL, Cronin y Taylor concluyen
que su propia escala, SERVPERF, presenta mayor validez de constructo, convergente y
discriminante, y que lo mismo sucede cuando se evala la validez predictiva de ambas
escalas. Los resultados de su trabajo de investigacin contrastando ambas escalas les
llevan a afirmar la superioridad de SERVPERF no ponderada sobre cualquiera de las
formas de SERVQUAL y sobre su propia SERVPERF ponderada por importancia.
Por su parte, Teas (1993) efecta una revisin del modelo de medicin de la
calidad del servicio sobre la discrepancia desempeo-expectativa tal como ha sido
desarrollado por Parasuraman, Zeithaml y Berry con su SERVQUAL. Este investigador
concluye que el concepto de expectativa y la operacionalizacin subsecuente del mismo
que comporta SERVQUAL presenta problemas de cierta importancia, problemas que no
quedan resueltos con el nuevo concepto de expectativa revisada (es decir, ponderada
por la importancia) con el que los creadores de SERVQUAL pretendieron mejorar su
modelo (Parasuraman et al., 1991). Los resultados de la investigacin llevada a cabo
por Teas para contrastar SERVQUAL con sus propias Escala de Calidad Normada y
Escala de Desempeo Evaluado le conducen a afirmar que la validez discriminante de
los conceptos de importancia del atributo, previsiones de desempeo y punto ideal
clsico que emplean Parasuraman, Berry y Zeithaml debe ser puesta en tela de juicio.
Concretamente, Teas seala que una parte considerable de la varianza en la medida de
las expectativas de los clientes puede estar ocasionada no tanto por sus diferentes
actitudes o percepciones sino por la incorrecta interpretacin del concepto
expectativas por aqullos. En lo que se refiere a la validez de constructo y a la
concurrente, Teas concluye que el anlisis comparativo de SERVQUAL con sus dos
escalas pone de relieve que su Escala de Desempeo Evaluado presenta una clara
superioridad, aunque apunta la conveniencia de realizar ms investigaciones al respecto.
La respuesta de Parasuraman, Zeithaml y Berry (1994) a las crticas efectuadas
por Cronin y Taylor y por Teas a su SERVQUAL constituyen una defensa de esta escala
39
y una crtica de las escalas SERVPERF y del Desempeo Evaluado. Comenzando por
Cronin y Taylor, los autores de SERVQUAL apuntan una serie de inconsistencias tanto
en las crticas de estos investigadores como en su propuesta alternativa, SERVPERF. En
primer lugar, hacen notar que las mismas fuentes que Cronin y Taylor citan para apoyar
su crtica de SERVQUAL o dicen ms bien lo contrario (caso de Bolton y Drew, 1991b)
o no mencionan los asuntos criticados (caso de Mazis, Ahtola y Klippel, 1975). En
segundo lugar, sealan que la pretendida demostracin de la unidimensionalidad de
SERVQUAL que efectan Cronin y Taylor es inconsistente, pues descansa sobre errores
conceptuales y metodolgicos que la invalidan, siendo su confusin de dimensionalidad
y fiabilidad de la escala uno de los ms notables. Parasuraman, Zeithaml y Berry
reconocen que existe el problema de solapamiento de dimensiones en SERVQUAL, pero
que no es causa suficiente para establecer la unidimensionalidad de esta escala y mucho
menos para concluir que SERVPERF constituye un constructo que capte con mayor
precisin la naturaleza multifactica de la calidad del servicio que SERVQUAL, sino
ms bien al contrario. Finalmente, al discutir los problemas relativos a la validez de
ambas escalas, Parasuraman, Zeithaml y Berry, en su interpretacin de los datos de los
cuatro servicios contrastados por Cronin y Taylor, llegan a unas conclusiones
exactamente opuestas a las que stos llegan: SERVQUAL presenta una semejante
validez convergente y una mejor validez discriminante que SERVPERF. Tambin ponen
en duda la interpretacin que Cronin y Taylor hacen de su anlisis de regresin mltiple
para probar la validez predictiva, aunque admiten que efectivamente SERVPERF puede
aportar una mejor validez de este tipo (con todo, argumentan que los administradores o
propietarios de las empresas probablemente estn ms interesados en conocer las
debilidades de los distintos aspectos del servicio para lo cual creen que SERVQUAL es
ms til que en la explicacin de la varianza de la medida global de la calidad del
servicio: si SERVQUAL tiene menor validez predictiva, tendra en cambio mayor
utilidad de diagnstico que SERVPERF).
En su respuesta a Teas, Parasuraman, Zeithaml y Berry puntualizan que este
investigador presenta tres errores o inconsistencias en su crtica de SERVQUAL: su
interpretacin del estndar de expectativas, la operacionalizacin de este estndar y la
evaluacin de modelos alternativos del constructo de calidad del servicio. Con respecto
a lo primero, los creadores de SERVQUAL indican que el concepto de punto ideal
manejado por Teas es ms bien un atributo de punto ideal clsico (lmite superior finito)
que un atributo vectorial de punto ideal (lmite superior infinito), lo cual puede llevar al
40
absurdo de que las expectativas del cliente superen el punto ideal de desempeo. Con
respecto a lo segundo, y en relacin con la duda de Teas sobre si la expectativa
ponderada con la importancia constituye realmente una mejora de la expectativa simple,
Parasuraman, Zeithaml y Berry (1994, p. 118) sealan que:
Por otra parte, tambin sealan que la especificacin del binomio DesempeoExpectativas resulta apropiada si la caracterstica de calidad de un servicio es un
atributo vectorial o es un atributo de punto ideal clsico y adems el desempeo
percibido por el cliente es menor o igual que el nivel ideal de calidad del servicio, pero
no en otra circunstancia (el hecho de que en las entrevistas cualitativas realizadas por el
propio Teas los clientes manifiesten desagrado o vean una utilidad negativa respecto de
los desempeos que superen el nivel de sus expectativas, avala para Parasuraman,
Zeithalm y Berry su conclusin de que Teas est usando un punto ideal clsico como
estndar de comparacin). Finalmente, la revisin de la crtica de Teas sobre la validez
de SERVQUAL en comparacin con las escalas de Calidad Normada y de Desempeo
Evaluado descansa de nuevo sobre el concepto de punto ideal que aqul maneja:
solamente si la discrepancia desempeo-punto ideal toma la acepcin de este ltimo
como atributo vectorial las conclusiones de Teas sobre la superioridad de su escala de
Desempeo Evaluado en lo que respecta a validez de criterio y de constructo pueden
contemplarse como acertadas, pero si no es as la mayor robustez de la validez de esta
escala es cuestionable.
Las contrarrespuestas de Cronin y Taylor y de Teas a la defensa de SERVQUAL
por parte de Parasuraman Zeithalm y Berry no se hicieron esperar. En el caso de los
primeros (Cronin y Taylor, 1994), su rplica comienza sealando que, en el contraste
SERVQUAL/SERVPERF, una de sus creadores, Valarie A. Zeithaml (Boulding, Kalra,
Staelin y Zeithalm, 1993), comparte explcitamente su convencimiento de que la
calidad del servicio est directamente influenciada slo por las percepciones (del
41
desempeo) y que otros investigadores han concluido lo mismo (Oliver, 1981; Oliver y
Bearden, 1985), debido, entre otras razones, a que existen dimensiones del desempeo
sobre las que el cliente no ha podido probablemente albergar expectativas (citan la
esttica o el placer). El resto de la rplica de Cronin y Taylor se realiza sobre la cuestin
de la distincin entre calidad del servicio y satisfaccin del cliente y sobre la discusin
de si su anlisis de la dimensionaliad de SERVQUAL es acertado. Llegan a la conclusin
de que esta escala, en ltimo trmino, no mide ni la calidad del servicio ni la
satisfaccin del cliente y que ms bien es una operacionalizacin de solamente una de
las muchas formas de disconformidad con las expectativas. Cronin y Taylor rechazan el
argumento de Parasuraman, Zeithalm y Berry en relacin con la posible inflacin
artificial de la varianza explicada de la calidad percibida total por SERVPERF e insisten
en que no puede afirmarse la multidimensionalidad de SERVQUAL cuando el anlisis
factorial no la confirma.
La rplica de Teas incide de nuevo en la cuestin de si su punto ideal es del tipo
clsico o vectorial. Atribuye a Parasuraman Zeithalm y Berry una incorrecta
interpretacin del concepto de punto ideal, as como de la frmula de clculo de la
puntuacin de la Escala de Desempeo Evaluado. Adems, Teas invoca en su defensa
que dos especialistas en el tema del punto ideal como Green y Srinivasan (1987)
afirmen que el modelo del punto ideal es ms flexible que el modelo vectorial, ya que
se ha mostrado (Carroll, 1972) que el modelo vectorial es slo un caso particular del
modelo del punto ideal. Como consecuencia de este error de comprensin de
Parasuraman Zeithalm y Berry, Teas considera que las crticas a su concepto de punto
ideal son injustificadas. Por el contrario, el punto ideal sera un referente ms relevante
que la expectativa tal y como la incorpora SERVQUAL. Teas concluye su rplica
reafirmando la superioridad de su Escala de Desempeo Evaluado sobre SERVQUAL, la
cual, incluso en la modalidad de modelo mixto que incorpora la importancia, aceptada
por Parasuraman, Zeithalm y Berry, no sera sino una versin restringida de la Escala de
Calidad Normada, que adems ya se ha visto superada por la primera.
Como vemos, las posturas son encontradas y difcilmente reconciliables. Y as
permanecen, pues en los aos siguientes y hasta la fecha el desacuerdo sobre las
cuestiones sealadas ms arriba son una constante en la literatura especializada. Las
revisiones recientes de esta literatura, como las efectuadas por Robinson (1999),
Ladhari (2009), Latu y Everett (2000), Saurina y Coenders (2001), Mont y Plepys
(2003), Morales y Hernndez (2004) o Camisn, Cruz y Gonzlez (2007), presentan
42
como actuales las mismas discrepancias que anteriormente hemos comentado. Adems,
el anlisis comparado de la validez y la fiabilidad de las distintas escalas aqu
contempladas
arroja,
como
ya
hemos
avanzado,
resultados
contradictorios:
1998) concluyen que las medidas de la performance sin ponderar poseen una mayor
validez predictiva que la de las medidas que incorporan expectativas o preferencias.
Adems, incluir la medida de las expectativas, del nivel ideal de servicio o de la
importancia atribuida a los distintos aspectos del mismo presenta dificultades
metodolgicas considerables: dificulta la comprensin del cuestionario, sobre todo si
ste es autoadministrado (Bielen y DHoore, 2002; Carman, 1990; Cronin y Taylor,
1994; Hunt, 1977) (y adems encarece la investigacin). Algunos autores concluyen que
SERVPERF es especialmente recomendable cuando el tiempo y los recursos
econmicos para investigar son escasos (Hudson et al., 2004). Alternativas puestas en
prctica, como la consistente en administrar dos cuestionarios a dos muestras diferentes
de clientes, uno para preguntar por las expectativas y otro para preguntar por la
valoracin
del
desempeo
(Comunidad
de
Madrid,
1999;
Ministerio
de
1.7.
No est claro en absoluto que la medicin de las expectativas, y tampoco del nivel
ideal de servicio o de la importancia atribuida a los distintos aspectos del mismo,
constituya una condicin necesaria para determinar la calidad percibida (ni la
satisfaccin del cliente), que se puede establecer con una simple medida de la
percepcin.
45
En primer lugar, hay que poner de relieve que el modelo de estructura dimensional de
QPSC es un modelo simple, no jerrquico, que distingue tres dimensiones (o
subdimensiones) de la calidad del servicio: calidad de las instalaciones donde se presta
el servicio, calidad del personal que da el servicio y calidad de la organizacin de los
trmites necesarios para recibir el servicio. Este modelo es uno de los posibles que
admite el tipo de servicios cuya calidad percibida pretende medirse con la escala QPSC.
En la revisin de la literatura sobre esta cuestin hemos visto algn modelo de
estructura conceptual semejante, como el modelo de Tres Componentes de Rust y
Oliver (1994), que tambin es simple y tridimensional. La eleccin de un modelo como
el mostrado parece, por tanto, correcta y apropiada, ya que, como hemos apuntado, no
existe en modo alguno un criterio nico y universal para establecer cmo es la
estructura de la calidad percibida de los servicios, de manera que este modelo QPSC
puede resultar tan aceptable como cualquier otro que se pudiera proponer, a condicin
de que responda a la naturaleza y caractersticas del servicio del que se trate. La
comprobacin de su oportunidad es una cuestin sobre todo emprica, relativa a las
propiedades del modelo para recoger efectivamente la percepcin de la calidad del
servicio por sus clientes o usuarios. Precisamente de esto trata en su mayor parte este
trabajo de investigacin, que mostrar en qu grado el modelo escogido es
suficientemente apropiado para expresarla.
Juntamente con lo dicho sobre la dimensionalidad, las cuestiones arriba
sealadas respecto de la forma de medir la calidad percibida constituyen las principales
razones que han motivado que el referente metodolgico principal de la escala QPSC
para medir la calidad percibida de los servicios socioculturales que aqu presentamos
sea sobre todo la escala SERVPERF (percepciones sin ponderar), sin perjuicio de que,
conceptualmente, las dimensiones de SERVQUAL inspiren las dimensiones de QPSC.
De hecho, se puede decir que QPSC toma de SERVPERF sus virtudes psicomtricas (y
operativas y econmicas), mientras que recoge de SERVQUAL la idea de
multidimensionalidad de la calidad del servicio diferenciando entre dimensiones
tangibles e intangibles, una distincin que se ajusta muy bien a las caractersticas de los
46
47
48
Captulo 2
Proceso de confeccin de la escala QPSC: funcin, diseo
y valoracin crtica
49
Gestin del
Personal
(9%)
Liderazgo
(10%)
Resultados en
el Personal
( 9%)
Procesos
(14%)
Poltica y
Estrategia
(8%)
Resultados
Clave
(15%)
Resultados en
los Clientes
(20%)
Recursos
(9%)
Resultados en
la Sociedad
(6%)
Agentes (50%)
Resultados (50%)
equipamiento concreto (un edificio o unas instalaciones), en todos los casos el servicio
se presta por mediacin de trabajadores de la Institucin en todo o en parte y siempre
requiere para su utilizacin un trmite burocrtico. La dimensin instalaciones est
constituida por cinco items: limpieza, accesibilidad, conservacin, seguridad y confort;
la dimensin personal comprende cuatro items: simpata, profesionalidad, motivacin y
comunicacin con el usuario; la dimensin organizacin de los trmites comprende,
tres items: horario de atencin, rapidez de los trmites y comodidad de los mismos.
En la redaccin de los tems de la escala no se menciona el trminos calidad,
sino que se pide al usuario del servicio que exprese su satisfaccin sobre cada aspecto
del servicio al que se refiere el tem, dndole una calificacin. Por consiguiente, se est
pidiendo al usuario que exprese su satisfaccin con diversos aspectos del servicio
utilizado, dando una puntuacin, dentro de un rango determinado, que la sustancie. Al
disear la escala, por tanto, se ha evitado usar trminos polismicos (como puede serlo,
sin duda, calidad), prefiriendo utilizar calificacin como conducta que exprese la
satisfacin mediante una asignacin de valor, en la idea de que cualquier usuario comn
puede plasmar mejor su actitud valorativa hacia los distintos elementos del servicio que
recibe ponindole una nota. El usuario encuestado, por tanto, da una calificacin a un
conjunto de aspectos del servicio utilizado, que expresa su mayor o menor satisfaccin
con los mismos, la cual, a su vez, es expresin de un mayor o menor grado de calidad
percibida. Y tambin: la menor o mayor calidad percibida del servicio se expresa en un
diferente grado de satisfaccin con el mismo, que se sustancia en una valoracin
expresada como una calificacin convencional. El esquema conceptual bsico de QPSC
es entonces el que se muestra en la figura 2.2.
CALIDAD PERCIBIDA
SATISFACCIN
CALIFICACIN
campos desde hace tiempo (Schneider, 1973; Wilson, 1970; cfr. Marn, 1981; Reckase,
1990).
Los tems se ofrecen a la valoracin del usuario agrupados por tema referente o
dimensin, en vez de presentarlos mezclados al azar. Pese a que esta no sera una razn
contemplada en el diseo original de la escala, diversos estudios (Franke, 1997;
Schriesheim y Denisi, 1980) han verificado que as se obtiene mayor validez
convergente/divergente.
Todos los items pueden responderse (calificarse) con un gradiente de 1 a 10
puntos, siendo 1 la puntuacin mnima de valoracin (satisfaccin mnima) y 10 la
puntuacin mxima de valoracin (satisfaccin mxima). La idea prctica que subyace
en la aplicacin de la escala es que cualquier item que no alcance la puntuacin mxima
posible -10- expresa una deficiencia del servicio que conviene subsanar para poder
prestar un servicio de calidad ptima. El uso de un gradiente 1-10 viene justificado por
dos razones fundamentales: a) es un gradiente con el que la gran mayora de la
poblacin se encuentra familiarizada (sobre todo por la experiencia tenida con el
sistema de calificacin escolar) y resulta escasamente polismico; y b) puede ser
entendido como una escala de intervalo (Hofacker, 1984; Labovitz, 1967, 1970;
Morales, 2000), con todas las ventajas que se desprenden de esta condicin para el
anlisis estadstico. El gradiente 1-10 es precisamente el que utilizan ndices de medida
de la satisfaccin del consumidor tan relevantes como el American Consumer
Satisfaction Index de la Universidad de Michigan (Fornell, Jhonson, Anderson, Cha y
Bryant, 1996; Fornell, Van Amburg, Morgeson y Bryan, 2005) y el European
Consumer Satisfaction Index de la European Foundation for Quality Management
(Eklf, 2000).
Se ha estimado en el momento de su diseo que los items de la escala renen las
caractersticas que usualmente se seala (Judd, Smith y Kidder, 1990) que deben poseer
stos: relevancia, claridad y capacidad de discriminacin. La condicin de bipolaridad,
que desde hace tiempo apuntaron algunos autores (Edwards, 1957; Jackson, 1965), no
es pertinente en este caso, ya que los items de la escala no se presentan en un formato
que la permita.
En la figura 2.3 se muestra un modelo de cuestionario con la escala QPSC tal
como se aplica en condiciones reales (en el anexo 1 se muestra una reproduccin del
mismo a tamao real). Como puede apreciarse, adems de la escala, el cuestionario
incluye una pregunta de valoracin global del servicio y las usuales preguntas de
53
SEXO
Hombre
EDAD
Mujer
Califique de 1 a 10 estos ASPECTOS del PERSONAL del Servicio (1 sera la valoracin mnima y 10 la
valoracin mxima)
Primarios/Primaria
Hasta 6 EGB
EGB/ESO/FP med.
FP-1/1 2 BUP
3BUP/COU/FP sup.
FP-2/Bachillerato
Universitarios
Califique de 1 A 10 estos ASPECTOS de los TRAMITES que ha tenido que seguir para utilizar
este Servicio (1 sera la valoracin mnima y 10 la valoracin mxima):
Parado
Ama de casa
Estudiante
Pensionista
Ahora, por favor, d una CALIFICACIN GLOBAL a ... (Servicio de que se trate) como Servicio
Horario de tarde
Y cules son sus SUGERENCIAS para mejorar el funcionamiento general de este Servicio?
TIPO DE ACTIVIDAD A LA QUE ASISTE ACTUALMENTE (cursos, talleres, reuniones, ...)
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
54
2.2.1.
La primera tarea de los tcnicos que confeccionaron la escala fue dilucidar cules son
los atributos de calidad en los que el usuario se basar a la hora de evaluar la calidad
del servicio que est utilizando. En la revisin de la bibliografa especializada
encontraron algunos referentes sobre las dimensiones de la calidad que sirvieron de
punto de partida: tomaron la escala SERVQUAL de Zeithaml, Parasuraman y Berry
(1993) como principal referencia, pues sus determinantes de la calidad de servicio
vienen a coincidir con las variables objeto de estudio propuestas en el Modelo Europeo
de Autoevaluacin EFQM (Criterio 6, subcriterio 6a), que es, como ya se ha dicho, el
marco del sistema de calidad del ayuntamiento en el que efectivamente se utiliza la
escala. Los atributos de calidad propuestos por estos autores parecan, en lneas
generales, extrapolables a los servicios pblicos en general, aunque habra que
adaptarlos a la variedad de servicios y prestaciones que se ofrecen en las
administraciones pblicas. Las dimensiones intangibles de SERVQUAL seran las
relativas a la interaccin entre empleados y usuarios o a cmo se presta el servicio;
las dimensiones tangibles se referiran a los aspectos fsicos del servicio o de soporte en
la prestacin del servicio. La versin interpretativa de los atributos de calidad incluidos
en esas dimensiones sealadas es la siguiente:
a) Dimensiones intangibles:
Fiabilidad: prestar los servicios adecuadamente, cumplir lo prometido y hacerlo sin
cometer errores.
Capacidad de respuesta: disposicin de los empleados para ayudar a los usuarios y
prestarles atencin, as como hacer las cosas puntualmente y con rapidez.
Empata: cuidado y atencin individualizada a los usuarios. El usuario debe percibir
que el empleado pblico local est a su servicio. Comprende los siguientes atributos:
Accesibilidad: los servicios son fciles de obtener y localizar, adems de
cmodos de utilizar.
Comunicacin: informar a los usuarios con un lenguaje comprensible y saber
escucharles.
Comprensin: esfuerzo por conocer a los ciudadanos y sus necesidades. El
usuario debe percibir que el ayuntamiento entiende sus problemas.
55
b) Dimensiones tangibles:
Se refieren al conjunto de atributos de los elementos tangibles, a partir del
principio de que el entorno donde se prestan los servicios socioculturales debe aportar
elementos de calidad:
56
Pragmatismo: las encuestas responden a una finalidad prctica, sirven para corregir
defectos de servicio y, por tanto, se alejan de la investigacin pura. No se trata de
realizar muestreos que supongan amplia dedicacin de tiempo a la recoleccin de
datos o cuestionarios amplsimos; basta con un nmero suficiente de usuarios
elegidos de forma correcta y unas pocas preguntas estratgicas. Deben convertirse
en una herramienta de utilidad para el conjunto de la organizacin (polticos,
gerentes, responsables, trabajadores, etc.).
57
un
cuestionario
autoadministrado,
se
consider
que
la
facilidad
de
Se coincide con todos los responsables de los servicios que en cualquiera de ellos
estn involucrados aspectos relacionados con las instalaciones, los profesionales y
los trmites administrativos, y que la escala QPSC sirve para evaluar esas tres
grandes dimensiones presentes en todos los servicios.
INSTALACIONES
Se refiere al equipamiento donde se presta el servicio, un edificio con distintas
dependencias:
Estado de conservacin (si el edificio est deteriorado y/o cuenta con un buen
mantenimiento, etc.).
Confort (comodidad de los asientos, espacio para moverse, espacio disponible para
leer/estudiar, para la prctica instrumental, etc.).
PERSONAL
Se refiere a las personas que entran en contacto con el usuario en el nivel ms
cualificado de la prestacin (profesores, educadores, psiclogos, trabajadores sociales,
etc.):
60
(En algn caso, como en las Escuelas Infantiles municipales, el tem comunicacin se
desdobla en dos: comunicacin con el nio y comunicacin con los padres. Por
otra parte, el tem dedicacin fue retirado de la escala).
La versin definitiva de la escala QPSC, por tanto, qued constituida con doce items,
cuyo enunciado y significado es el siguiente:
62
64
67
68
Captulo 3
Mtodo
En este captulo se describen todos los procedimientos metodolgicos que hemos
utilizado para el estudio psicomtrico de la escala QPSC, as como las tcnicas
estadsticas asociadas que se han empleado al efecto.
el
municipio del ayuntamiento donde se dise la escala. Los otros dos servicios
socioculturales estn ubicados en dos municipios distintos, Legans y La Corua. En
cada uno de esos servicios socioculturales se ha aplicado la escala QPSC en dos
ocasiones diferentes (T1 y T2), de tal manera que, en suma, disponemos de ocho
conjuntos de datos, dos por cada servicio sociocultural. Los servicios socioculturales
que pertenecen al ayuntamiento donde se dise la escala son una Universidad Popular
y una Escuela de Msica, y los denominamos gnericamente servicios de referencia.
Los otros dos servicios socioculturales son un Centro de Juventud, en el municipio de
Legans (Madrid), y un Centro de Jvenes, en el municipio de La Corua, y los
denominamos a ambos servicios de comparacin, precisamente porque es con las
aplicaciones de QPSC en estos ltimos con los que comparamos las aplicaciones de la
escala en los servicios para los que fue diseada (figura 3.1).
69
Servicios de referencia
Universidad
Popular
T1
T2
Servicios de comparacin
Escuela de Msica
T1
Centro de Juventud
de Legans
T2
T1
T2
Centro de Jvenes
de La Corua
T1
T2
usando para ello un conjunto de datos resultante de la unin de los provenientes de las
dos aplicaciones de la escala en uno de los servicios socioculturales de referencia, la
Universidad Popular.
Una vez realizados todos estos anlisis, se ha procedido a efectuar el estudio de
validacin de la escala propiamente dicho. En dicho estudio de validez se ha atendido a
tres tipos de evidencias: las basadas en el contenido de la escala (mediante un
procedimiento de validacin inter-jueces), las basadas en su relacin con un criterio
externo (que en este caso es la puntuacin a una variable llamada valoracin global del
servicio, que est incluida en el cuestionario con que se aplica la escala QPSC) y las
basadas en la estructura interna de la escala. Para estudiar estas ltimas propiedades
hemos llevado a cabo tres tipos de anlisis en todos los conjuntos de datos utilizados: un
anlisis factorial exploratorio, con objeto de observar la dimensionalidad del constructo
calidad percibida que mide la escala; un anlisis factorial confirmatorio, para valorar
si los datos obtenidos merced a la aplicacin de la escala QPSC en distintas muestras se
ajustan a su estructura factorial terica; y un anlisis factorial confirmatorio multigrupo,
con el fin de comprobar la estabilidad de la estructura factorial de la escala en distintas
circunstancias de aplicacin. Hemos renunciado a estudiar otros tipos de evidencias de
validez, las basadas en el proceso de respuesta y las basadas en las consecuencias del
uso de los resultados del test. Las primeras porque nos resulta imposible, especialmente
a posteriori, llevar a cabo entrevistas con los usuarios del servicio que nos permitiesen
establecer la relacin entre procesos cognitivos y pautas de respuesta a los items. Las
segundas porque, de acuerdo con la opinin de Boorsboom, Meherens, Popham y otros,
que ya hemos sealado, entendemos que la evaluacin de la validez de un instrumento
de medida debe centrarse en si se justifican determinadas inferencias sobre las
puntuaciones que proporciona pero no en qu se hace en la prctica con ellas.
Todos los anlisis antes citados persiguen obtener una informacin que permita
contrastar empricamente si las hiptesis generales de este estudio de validacin de la
escala QPSC se cumplen, para lo cual las hemos concretado en una serie de hiptesis de
investigacin. Estas hiptesis, cuya confirmacin permite asimismo establecer si la
escala QPSC es un instrumento vlido en trminos psicomtricos para medir la calidad
percibida en servicios socioculturales, son las que se enuncian a continuacin,
justificndose ms delante los valores de los ndices y coeficientes que concretan
algunas de ellas.
71
1.
2.
3.
Los tems de la escala correlacionan unos con otros de manera que los
pertenecientes a la misma subdimensin terica del constructo que mide la escala
estn ms fuertemente vinculados entre s que con los pertenecientes a distintas
subdimensiones.
4.
5.
6.
7.
8.
9.
74
bsicos que deben considerarse, como son el coste del tiempo, el coste de la realizacin
y el coste de adquirir nuevos recursos, si ello fuera necesario.
c) Factibilidad operativa. Se refiere a todos aquellos recursos donde interviene algn
tipo de actividad (procesos); depende de los recursos humanos que participen durante la
operacin del proyecto. Durante esta etapa se identifican todas aquellas actividades que
son necesarias para lograr el objetivo y se evala y determina todo lo necesario para
llevarla a cabo, de modo que finalmente se garantice la operacin prevista y el uso del
proyecto, herramienta, sistema, etc.
Por consiguiente, un estudio de factibilidad de la escala QPSC debe responder a
si ciertamente la aplicacin de la escala es posible en las circunstancias reales en las que
debe funcionar. Partiendo de que lo que la organizacin municipal busca es obtener una
medida vlida y fiable de la calidad percibida de los servicios socioculturales por parte
de sus usuarios, una primera cuestin a considerar es que el diseo del instrumento debe
llevarse a cabo teniendo muy en cuenta el tipo de personas que van a cumplimentar el
cuestionario que la contiene y las situaciones reales en las que dichos cuestionarios van
a ser administrados.
75
cuadrticas de la media). Por su parte, los coeficientes de asimetra, g1, y curtosis, g2,
son los propuestos por Fischer y se calculan con las ecuaciones siguientes:
g1 =
nM3
(n - 1)(n - 2)SY3
g2 =
B=
AT - 38
n + 14
z simetra =
76
g1
6n(n - 1)
(n + 1)(n - 2)(n + 3)
zcurtosis =
g2
4(n2 -1)Sg21
(n - 3)(n + 5)
D = mx Fn ( x ) - F0 ( x )
77
3.4. Fiabilidad
Una primera cuestin a abordar en el proceso de valoracin psicomtrica de la escala
QPSC es comprobar su fiabilidad, es decir, si la escala mide con precisin lo que
pretende medir. Desde el marco de referencia de la Teora Clsica de los test, existen
varias formas de apreciar la fiabilidad de un test, basadas unas en el criterio de
consistencia entre puntuaciones y otras en el criterio de equivalencia o en el de
estabilidad de las mismas (Martnez Arias et al., 2006; Morales, 1988; Muiz, 1992),
que habitualmente requieren llevar a cabo al menos dos aplicaciones del test sobre los
mismos sujetos para llegar a conclusiones sobre la fiabilidad del mismo. Aqu hemos
optado por emplear primeramente la estrategia de estudiar la fiabilidad de la escala
QPSC a partir del criterio de consistencia, pero en la variedad de consistencia interna,
que precisa una nica aplicacin del test, utilizando posteriormente una estrategia
basada en el criterio de estabilidad. Complementariamente, tambin se llevar a cabo un
estudio de la fiabilidad de la escala desde una perspectiva distinta a la de la Teora
Clsica de los Test: la que proporciona el marco de la Teora de la Respuesta al tem.
79
jh
J
j ,h=1
( 1- 2
J -1
x
), j h
donde jh es la covarianza entre los tems j y h (j,h =1, 2,..., J) y x2 es la varianza de las
puntuaciones totales.
Mediante el coeficiente alfa de Cronbach hemos estudiado la fiabilidad de QPSC
en todas las aplicaciones comprendidas en este trabajo, calculando la fiabilidad de la
escala con sus doce tems y la fiabilidad de los tres grupos de tems comprendidos en
las presuntas tres dimensiones de la misma (Instalaciones, Personal y Organizacin de
trmites). Hemos obtenido as, por tanto, dos medidas de fiabilidad: la global y las
parciales, en cada aplicacin de la escala. Mostraremos primero los coeficientes de
fiabilidad calculados con las aplicaciones de QPSC en algunos de los servicios
socioculturales del municipio en el que se utiliza oficialmente (servicios de referencia) y
despus los coeficientes de fiabilidad calculados con las aplicaciones de QPSC en los
servicios socioculturales de otros municipios que sirven de comparacin.
80
81
12 =
S12
S1S 2
donde S12 es la covarianza entre los momentos t1 y t2, y S1 y S2 las desviaciones tpicas
de los momentos t1 y t2.
La TRI propone la existencia de un modelo matemtico que relaciona el rasgo del sujeto
con su probabilidad de acertar el tem o, en modelos politmicos (ms de dos posibles
respuestas por tem), su probabilidad de escoger una determina alternativa de respuesta.
Este modelo est descrito habitualmente mediante una funcin que recibe el nombre de
Curva Caracterstica del tem (CCI) o, cuando hay mltiples alternativas de respuesta,
Funcin de Respuesta al tem (FRI).
Existen numerosos modelos de aplicacin de la TRI cuyas caractersticas se
describen en la literatura (Baker, 2001; Bock y Moustaki, 2007; Lpez-Pina, 1995;
Muiz, 1997). El modelo que hemos elegido para el anlisis de la escala QPSC es el
Modelo de Respuesta Graduada (MRG) de Samejima (1997), ya que es uno de los ms
utilizados y mejor estudiados cuando se trata de modelizar el comportamiento de tems
con formato ordinal o tipo Likert como el que se usa en una escala de medida de
actitudes como la nuestra (Asn y Ziga, 2008).
83
1 2j . Este
P( xij k | = i ) =
1
1 + exp[- Da j (i - b jk -1 )]
j
1 2j
y b jk =
jk
j
; y asumiendo
84
Hay que sealar asimismo que el modelo de respuesta graduada tiene tambin la
propiedad de aditividad, por la cual si dos alternativas de respuesta se funden en una
sola la probabilidad de sta es igual a la suma de las probabilidades de las dos
anteriores:
85
renumeran para seguir esta nueva ordenacin : la alternativa 6 pasa a ser la 2, la 7 pasa a
ser la 3, la 8 a ser la 4, la 9 a ser la 5 y la 10 a ser la 6. Quedarn as seis alternativas de
respuesta para cada tem, que, por otra parte, es una cantidad de opciones juzgada como
ideal para lograr el buen funcionamiento del modelo en lo que se refiere a su precisin
(Hernndez, Muiz y Garca, 2000, p. 290).
Debido a las restricciones de estimacin de los modelos TRI, se eliminarn los
casos de sujetos con valores perdidos. Como resultado de ello, el tamao de la muestra
queda reducido a 628 sujetos. Dado que el test est compuesto por 12 tems y se
agrupan las alternativas de respuesta hasta dejar slo seis de ellas, los parmetros a
estimar sern un total de 72 (seis parmetros por cada uno de los doce tems). Esto
significa que se cumplir el requisito muestral habitual de disponer de al menos cinco
sujetos por cada parmetro a estimar, quedndonos adems razonablemente cerca del
tamao ptimo de diez sujetos por cada parmetro a estimar (Raykou y Widaman,
1995).
Los anlisis estadsticos practicados en todos los rdenes (AFE, fiabilidad, etc.)
se llevarn a cabo, por consiguiente, sobre un nico conjunto de datos: el formado por la
adicin de los datos de las dos encuestas en la Universidad Popular con las
depuraciones arriba sealadas, sumando 628 casos.
Una vez preparados los datos segn la estrategia indicada, se procede al calcular
los parmetros a y b del modelo. El parmetro a es un indicador de la discriminacin
del tem y su valor es proporcional a la recta tangente a la curva caracterstica del tem
en el punto de mxima pendiente de sta. Cuanto mayor sea el parmetro, mejor
diferencian las alternativas entre diferentes niveles del rasgo medido (Muiz, 1997).
Cuando la discriminacin es alta, la probabilidad de escoger una determinada alternativa
es tambin alta para un cierto nivel del rasgo medido y baja rpidamente conforme nos
alejamos de dicho nivel, mientras que cuando la discriminacin es baja la probabilidad
de escoger la alternativa es parecida para sujetos con niveles de rasgo diferentes. Una
discriminacin alta, por lo tanto, se traduce en que cada alternativa es escogida
generalmente por sujetos muy distintos, por lo que siguiendo la lgica contraria
podemos estimar con mayor facilidad el nivel del rasgo que tendr un sujeto a partir de
la alternativa que haya escogido. En nuestro caso, los parmetros a se miden en mtrica
logstica. En esta mtrica, el valor 1,7 es un valor de discriminacin medio (Baker,
1992, p. 34). Los valores mayores de 1,7 indican que el tem es ms discriminativo y
son responsables de que las funciones de las alternativas de respuesta sean ms
87
apuntadas en el grfico con que podemos representarlas, mientras que valores menores
indican discriminaciones bajas y tienen como consecuencia funciones de las alternativas
ms aplanadas.
El parmetro b, por su parte, se interpreta normalmente como un indicador de la
dificultad del tem, est medido en la misma mtrica que y su valor es,
aproximadamente, el del punto en la escala que corresponde con una probabilidad de
acertar de 0,5 (en realidad, de (1+c)/2, pero en un modelo de dos parmetros, como el
MRG, el parmetro de acertar al azar, c, es 0). Sin embargo, en el MRG no existe un
nico parmetro b, sino K-1 parmetros (siendo K el nmero de alternativas de
respuesta al tem), o sea , bjk (bj1, bj2, ..., bjk-1), que indican el nivel de rasgo en el que
la probabilidad de escoger la alternativa k+1 o superior es 0,5 (Abad et al., 2011). Por
consiguiente, en nuestro caso hay K-1 = 6 1 = 5 parmetros bj (b1, b2, b3, b4 y b5), que,
adems, no se interpretan propiamente como parmetros de dificultad, sino como
parmetros de localizacin, que representan los umbrales de decisin: se sitan entre
las alternativas, de manera que indican el nivel de rasgo en el que la probabilidad de
escoger una alternativa o las superiores es 0,5. En cierto modo son un indicador de la
atraccin de las alternativas: reflejan el nivel del rasgo que tienen los sujetos que
prefieren una alternativa determinada. Ya que el MRG es un modelo de diferencias,
cuanto ms cerca estn los parmetros b de dos alternativas adyacentes k-1 y k del
mismo tem, menos elegida es la alternativa k. Teniendo en cuenta que se asume que el
nivel de rasgo sigue la distribucin normal, se puede colegir que prcticamente la
totalidad de los sujetos estarn comprendidos entre los valores -2 y 2. Combinando
ambas ideas, lo deseable es que los parmetros b no se alejen demasiado de ese
intervalo y que se encuentren lo suficientemente espaciados entre s, de una manera
aproximadamente equidistante, para garantizar que todas las alternativas son escogidas
en una cierta proporcin, no existiendo opciones ignoradas por los sujetos o que se
solapen entre s.
La estimacin de los parmetros se realiza mediante el procedimiento de
mxima verosimilitud marginal (Bock y Aitkin, 1981), puesto que como se trata de
estimar los parmetros a y b que maximizan la probabilidad de las respuestas
observadas, P ( x , a , b ) , y es desconocido, hay que eliminarlo de la ecuacin, lo
cual se consigue precisamente con este procedimiento (Abad et al., 2011, pp. 391-393).
88
Respecto al test completo (la escala QPSC, en nuestro caso), hay dos
informaciones complementarias que se pueden ofrecer desde la perspectiva de la Teora
de la Respuesta al tem. Se trata de la informacin del test y del error tpico de medida.
En ambos casos se trata de funciones que representan la calidad de la medida en virtud
del nivel del rasgo y nos indican, por tanto, para qu tipo de sujetos es ms adecuado el
test. La funcin de informacin es efectivamente una medida de la fiabilidad del test
desde la perspectiva de la TRI. Cuanto mayor sea su valor, ms informativo es el test y
ms preciso al estimar el nivel del rasgo de los sujetos. El error tpico de medida da
exactamente la informacin inversa: la cantidad de error que se comete al medir al
sujeto con el test en funcin de su nivel de rasgo. Un error tpico grande indica que el
nivel de rasgo del sujeto se estimar de manera inadecuada (confundiendo niveles
cercanos pero diferentes), mientras que un error pequeo permitir discriminar
adecuadamente el valor exacto del rasgo del sujeto. En efecto, la funcin de
informacin y el error de medida son conceptos inversos, tales que uno se puede definir
por el otro (Muiz et al., 2005). As, si la funcin de informacin es:
I( ) =
1
(2 )
( ) =
I ( )
IT () = I i ( )
i =1
por lo que basta con hallar las distintas funciones de informacin de los items para
establecer la funcin de informacin del test y su respectivo error tpico de medida.
Para cerrar esta aproximacin a la fiabilidad de QPSC desde la perspectiva de la
TRI conviene proporcionar una medida de la bondad de ajuste del modelo a los datos.
Habitualmente, se utilizan indicadores de ajuste basados en el estadstico 2 (Muiz,
1997). El programa XCalibre 4.1.4, que utilizamos aqu para estudiar la bondad de
ajuste del modelo, proporciona un ndice de bondad del ajuste usando la siguiente
ecuacin:
89
2j =
Q K
Nq (Ojkq - Ejkq)2
q=1k=1
Ejqk
donde:
j = el tem del que se trate
k = nmero de categoras u opciones de respuesta en el tem j
q = nmero de niveles en los que se divide el rasgo para calcular el ajuste
Ojqk = frecuencia observada de las k opciones de respuesta para cada grupo q en el tem j
Ejkq = frecuencia esperada computada como NPi, siendo N = nmero de sujetos en el
nivel q y Pi = probabilidad de respuesta k para el nivel q en el tem j
El continuum se divide en q intervalos con un rango -2,5 a +2,5. La probabilidad de
respuesta se calcula utilizando el promedio de los estimados en el intervalo. Si el
valor de 2 resultante es inferior al de 2 en las tablas de distribucin de este estadstico,
para los grados de libertad correspondientes al nmero de parmetros del modelo
utilizado y el nivel de confianza elegido, se concluye que el modelo estimado se ajusta a
los datos en el caso del tem para el que se hace la prueba de bondad de ajuste. Hay que
sealar aqu, no obstante, que el uso de 2 como estadstico de contraste se ha puesto en
ocasiones en tela de juicio, ya que, adems de su considerable sensibilidad a los
tamaos muestrales, al ser una variable latente y la clasificacin de los q grupos de
nivel de la muestra una discretizacin arbitraria de una variable continua, la distribucin
real de los estadsticos es desconocida (Sueiro y Abad, 2009).
Debido a esto ltimo, tambin hemos utilizado otro procedimiento
complementario para comprobar la bondad del ajuste del modelo a los datos: el anlisis
de residuos. Como en el procedimiento anterior, se divide en q intervalos y se calcula
para cada una de ellas el residuo estandarizado RE usando la expresin siguiente
(Muiz, 1997):
RE =
P ( j ) - Pe ( j )
P ( j )Q ( j ) / n j
donde:
nj = nmero de sujetos dentro del nivel j
P(j) = valor de la curva caracterstica del tem para el nivel j
90
Ojkq(1- Ojkq)
Nq
91
permita pronosticar alguna variable criterio distinta de la medida con el propio test. La
validez de constructo (y de la estructura del constructo), finalmente, se refiera a la
cuestin de si los resultados del test expresaban o reflejaban el constructo (rasgo,
actitud, etc.) que se pretenda medir. Frecuentemente, adems, se hacan distinciones
dentro de estos tipos de validez o se les daba denominaciones diferentes. As, dentro de
la validez de criterio se ha distinguido la validez predictiva (cuando se estudian las
correlaciones entre los resultados del test y los de otras variables medidas en un
momento posterior al de la aplicacin del test) y la validez concurrente (cuando se
estudian esas correlaciones en el mismo momento); y dentro de la validez de constructo
se ha diferenciado la validez convergente (cuando usando otros tests ideados con el
mismo fin se consigue medir el mismo rasgo igualmente bien) y la validez
discriminante (cuando usando el mismo test de inters se mide deficientemente otros
constructos distintos al que se pretende medir).
Sin embargo, a partir de la publicacin de los Standards for Educational and
Psychological Testing de las asociaciones American Educational Research Association,
American Psychological Association y National Council on Measurement in Education
(AERA-APA-NCME) de 19851, la perspectiva con que se evala la validez de un test
cambia: se establece que si bien las tres vas de comprobacin de la validez de un test
antes mencionadas son legtimas, la validez es slo una, aunque se utilicen distintas
aproximaciones para validar una prueba (Messick, 1980, 1988). Y a partir de la
publicacin de los Standards de AERA-APA-NCME de 1999 se entiende que si bien la
validez es un concepto unitario, susceptible de ser estudiado desde tres pticas
complementarias (evidencias basadas en el contenido, en la relacin con otras variables
y en la estructura interna del test), han de aadirse otras dos, hasta ahora ignoradas o
consideradas slo implcitamente: el proceso de respuesta y las consecuencias de la
aplicacin del test. En estos ltimos Standards se define la validez como el grado en
que la teora y los datos disponibles sustentan la interpretacin de las puntuaciones de
un test para un uso concreto (esta concepcin ya se encuentra en los Standards de 1974:
p. 25). Es importante destacar que esta definicin de validez comporta que a) ya no se
trata de la validez de un test o instrumento de medida propiamente dicho, sino de la
validez de las puntuaciones que produce la aplicacin del mismo (las propiedades del
Estos estndares son continuacin de las Technical Recommendations for Psychological Tests and
Diagnostics Techniques de 1954 y de los Standards for Educational and Psychological Tests and
Manuals de 1966 y 1974 de la American Psychological Association.
93
test son variables, pues dependen del contexto y de la muestra), y b) quien aplica el test
debe consultar su gua de utilizacin para saber si el uso e interpretacin que pretende
coincide con el que describe dicha gua; si no es as el usuario debe realizar un estudio
de validacin que apoye su utilizacin.
El proceso de validacin, por tanto, implica dos argumentaciones (Kane, 2006):
la relativa a la validez y la interpretativa. El proceso de validacin debe comenzar por la
ltima, que comporta proponer interpretaciones y usos de las puntuaciones que el test
arroja. El argumento de validez consiste precisamente en evaluar el argumento
interpretativo, definiendo en consecuencia cules son las evidencias necesarias para
realizar tal evaluacin. La evidencias de validez son entonces las pruebas hechas para
sostener una interpretacin determinada y las ms tiles seran aquellas que suministren
apoyo para los supuestos e inferencias que resulten ms discutibles.
Si se contempla la validacin como el procedimiento por el que se acumulan
evidencias a favor de una determinada interpretacin de los resultados del test, parece
obvio que pueden usarse todas las estrategias o tcnicas que sirvan al propsito de
obtener dichas evidencias. Por eso es seguramente ms apropiado hablar de tipos de
evidencias que de tipos de validez, ya que, como se ha sealado antes, la validez es
una, que se alcanza en mayor o menor grado mediante procedimientos diversos. Sin
perjuicio de esto ltimo, puede hablarse y de hecho as se hace de evidencias de
validez basadas en el contenido, la estructura interna, la relacin con otras variables, el
proceso de respuesta y, si se acepta la propuesta, las consecuencias de la aplicacin del
test. Nos detendremos seguidamente en exponer los fundamentos y contenidos
esenciales de cada uno de estos grupos de evidencias de validez.
A) Evidencias basadas en el contenido del test. El primer paso en el proceso de
buscar evidencias de validez en un test es examinar su contenido para juzgar si puede
utilizarse para un determinado cometido y la recomendacin de hacerlo ya aparece en
las ms tempranas recomendaciones de la APA para los tests y tcnicas de diagnstico
(APA, 1954). Es importante hacer notar que por contenido del test no se entiende
solamente de los items que lo integran, sino que tambin se incluyen en ese concepto
las indicaciones para su administracin y los criterios para calcular sus puntuaciones.
Hay que tener en cuenta al menos dos aspectos esenciales para llevar a cabo la
valoracin de las evidencias basadas en el contenido del test (Sireci y Geisinger, 1998;
Sireci, 2003): la definicin y la representacin del dominio (o rasgo o dimensin). La
94
primera se refiere a la definicin operativa del contenido del rasgo que se pretende
medir y lo que se debe de hacer es determinar con la menor ambigedad posible el
significado y sentido del trmino empleado para designar el dominio. La segunda se
refiere a la representatividad y relevancia del dominio, es decir, respectivamente, a si el
contenido del test abarca todas las facetas del dominio y al grado en que cada tem del
test mide el dominio que se haya definido.
En general, la validacin del test basada en las evidencias de contenido se lleva a
cabo a travs de valoraciones de jueces o expertos o mediante procedimientos
estadsticos. En el primer caso, un cierto nmero, no muy alto, de expertos se
pronuncian sobre el grado o intensidad con que los tems y los objetivos de medida del
test estn relacionados; los jueces evalan si el dominio est bien definido y si el test lo
representa adecuadamente mediante procedimientos de emparejamiento o correlacin
tem-objetivo que se sustancian en diversos ndices de congruencia o de relevancia.
En los procedimientos de validacin de contenido basados en juicios de
expertos, que son indudablemente los ms utilizados, suelen seguirse las siguientes
fases (Martnez Arias et al., 2006):
Obtencin de juicios de expertos sobre el grado en que el dominio est bien definido
y el contenido del test lo representa bien y es relevante.
96
Calcular algn ndice que exprese las relaciones entre test y citerio.
98
Para obtener la relacin entre el test y el criterio, si ambos son variables continuas, se
puede calcular la correlacin entre ambas y denominarla coeficiente de validez rxy, que
indica el grado en que las puntuaciones en el test sirven para pronosticar las
puntuaciones en el criterio. As, un test que mida aptitud para las matemticas debera
predecir con bastante precisin la calificacin en un examen de matemticas de nivel
semejante al medido con el test, arrojando valores del coeficiente de validez elevados.
Por otro lado, la precisin de los pronsticos (es decir, del valor de rxy) viene
condicionada por varios factores, entre los que hay que destacar (Elosa, 2003):
Otro factor que puede problematizar el valor de la relacin entre test y criterio es la falta
de validacin del constructo del criterio, aunque ha sido poco investigado (Fredericksen,
1986). Tambin se ha sealado (Aiken, 1985) que los coeficientes de validez raramente
superan en la prctica el valor de 0,60, lo que implica que gran parte de la varianza del
test no est relacionada con la varianza del criterio y que por consiguiente la utilidad
explicativa del resultado del test es ms bien escasa.
Sin perjuicio de lo anterior, es importante sealar tambin que, como el
coeficiente de validez depende del nivel de precisin con que se miden las puntuaciones
en el test y en el criterio, suele ser conveniente calcular las fiabilidades de uno y otro
para describir la reduccin en la magnitud de la correlacin entre dos medidas causada
por su dficit de fiabilidad. A este procedimiento se le denomina correccin de la
atenuacin (Morales, 2008; Osborne, 2003; Schmitt, 1996) y consiste en estimar la
correlacin en el supuesto de que las puntuaciones de test y criterio fuesen
perfectamente fiables. Si el lmite mximo que puede alcanzar rxy es
<
rVxrVy
Generar los tems del test de forma que las variaciones en su estructura
representen variaciones en los procesos de respuesta.
En los ltimos tiempos existe una pujante tendencia a relacionar ms estrechamente los
modelos cognitivos y los modelos psicomtricos para obtener evidencias de validez de
los tests basadas en los procesos de respuesta (Daniel y Embreston, 2010; Irvine y
Kyllonen, 2002; Wilson, 2005).
101
En todo caso, en los Standards (AERA, APA, NCME, 1999) se remarca la diferencia
entre la evidencia relevante para la validez y la evidencia que, aunque est relacionada
con las decisiones tomadas a partir de las puntuaciones del test, est fuera de los lmites
de un estudio de validez. As, la validacin de un instrumento ha de considerar el
anlisis de la posible infrarrepresentacin del constructo o de la existencia de
componentes irrelevantes para ste, que eventualmente pueden ser detectados como
consecuencia del uso del test (Elosa, 2003). Por otra parte, debido a que anticipar la
totalidad de las posibles consecuencias del uso del test resulta harto difcil, algunos
autores (Nichols y Williams, 2009) han recomendado centrarse solo en las que pueden
derivarse de una limitada representacin del constructo o de la presencia de factores
irrelevantes para el mismo.
se iba a medir era ciertamente la calidad del servicio desde la apreciacin del usuario (a
travs de la expresin de la satisfaccin con el mismo en un gradiente al efecto), sino
cules eran los principales factores y elementos del servicio que estaban involucrados en
la prestacin. Es decir, no se tematizaba la dicotoma calidad percibida/satisfaccin,
pues la equivalencia prctica de ambos conceptos era considerada por los gestores no
slo plausible sino evidente, prestndose atencin sobre todo a la determinacin de los
aspectos del servicio que concretaban su prestacin. En esas entrevistas con los gestores
se detect que exista una indudable singularidad de unos servicios con relacin a otros,
pero que, tambin indudablemente, haba una comunalidad de todos ellos que
permita homogeneizarlos hasta un cierto punto y registrar la valoracin de la misma
por parte de sus usuarios. La comunalidad afectaba a las instalaciones donde se prestaba
el servicio, a las personas que lo prestaban y a la organizacin de los trmites necesarios
para que el usuario lo recibiera. Estos tres factores se daban en cualquiera de los
servicios considerados y su evaluacin conjunta era la evaluacin de la calidad del
servicio general. Igualmente, se llegaron a determinar una serie de aspectos (tems en la
escala) que estaran ntimamente ligados con cada uno de los factores aludidos: los
ligados con las instalaciones, por ejemplo, se referiran a la limpieza, la conservacin, la
seguridad, el confort y la accesibilidad del equipamiento. Esto era as tanto para una
escuela infantil como para una universidad popular o una casa de la juventud y todos los
gestores coincidieron en que en sus respectivos servicios esos aspectos mencionados en
el caso del factor instalaciones eran los que efectivamente podan generar una mayor o
menor satisfaccin del usuario con el equipamiento del servicio y, por tanto, dar una
medida de su calidad percibida.
En lo que se refiere a las evidencias de la validez del contenido, pues, el
procedimiento que se ha empleado originalmente con la escala QPSC ha sido de un tipo
que podramos denominar consensual, de carcter ms bien cualitativo, ya que no se
han utilizado procedimientos numricos para cuantificar el grado de acuerdo de los
gestores respecto de la dimensionalidad de la escala y respecto de la correspondencia
entre tems y factores (subdimensiones). Sin perjuicio de que este modo de actuar puede
aceptarse como apropiado para llevar a cabo un diseo de un instrumento de medida de
manera que se cuide suficientemente su validez de contenido, parece oportuno realizar
una prueba que proporcione un resultado cuantitativo relativo a la representacin del
concepto (dimensin o dominio calidad percibida) por medio de unos determinados
factores (subdimensiones que la forman) y al grado de vinculacin entre estos factores y
104
Jueces
Subdimensiones
Estadsticos
...
Mdn
AT
Instalaciones
Personal
Trmites
Discrepancia con la
mediana
Figura 3.1: Plantilla para clculo del ndice de relevancia
Para construir el ndice de congruencia, cada uno de los gestores (jueces) expresa su
opinin acerca de en qu grado considera que cada item sirve para medir el factor
(subdimensin) que tericamente les corresponde, es decir, juzga si el tem le parece
adecuado para medir el factor, dando una puntuacin determinada: 1 significa
adecuado, -1 inadecuado y 0 duda sobre si lo mide o no. Cada juez punta de esta
forma cada tem en relacin con cada factor, de manera que es esperable que si el tem j
resulta puntuado con +1 en el factor Instalaciones, resulte puntuado con -1 en los
otros dos factores. El ndice de congruencia item-factor se calcula mediante la
expresin:
I jk =
K
(X - X j )
2K - 2 jk
106
Item
Subdimensiones
Instalaciones
Personal
Org. Trmites
Instalaciones
Personal
Org. Trmites
Etctera
Jueces
2
3
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
6
7
8
9
6
7
8
9
6
7
8
9
...
107
rxy =
Cov( Vx ,Vy )
Sx S y
rVxVy SVs SV y
SxS y
109
De modo que:
rVxVy =
rxy
rxxryy
que es la frmula que se utiliza para calcular la relacin entre test y criterio eliminada la
atenuacin, en la cual Vx y Vy son, respectivamente, las puntuaciones verdaderas de
test y criterio.
Si ahora queremos establecer la relacin entre la puntuacin de la escala QPSC y
la puntuacin de la variable criterio valoracin global del servicio, bastar con hallar
el cociente entre el coeficiente de validez rxy antes obtenido en cada aplicacin de la
escala y la raz cuadrada del producto de los coeficientes de fiabilidad, de Cronbach,
de la escala y el criterio en la aplicacin correspondiente (o entre el coeficiente de
validez rxy y el producto de los ndices de fiabilidad de test y criterio, pues estos son
precisamente las races cuadradas de los coeficientes de fiabilidad). Pero entonces
encontramos el problema de que al no ser el criterio un test propiamente dicho, sino una
puntuacin de una nica variable (Valoracin Global), no disponemos del coeficiente
de fiabilidad necesario y, consecuentemente, no podemos calcular la relacin entre test
y criterio descontada la atenuacin. Una posible solucin consiste en estimar este
coeficiente de fiabilidad a partir del coeficiente de correlacin obtenido en la prueba de
fiabilidad llevada a cabo mediante el procedimiento de test-retest en las dos aplicaciones
de la escala QPSC practicadas en el servicio de biblioteca del ayuntamiento de
Guadarrama con objeto de comprobar su fiabilidad desde el punto de vista de la
estabilidad (que hemos denominado coeficiente de estabilidad). Si hallamos el
coeficiente de correlacin de Pearson entre las puntuaciones a la variable Valoracin
Global del Servicio arrojadas en el test y en el retest, obtenemos el valor de ryy, de tal
modo que tenemos todas las incgnitas halladas y basta con realizar los clculos
pertinentes para obtener los coeficientes de validez sin atenuacin buscados.
Hay que hacer notar que el coeficiente de validez no es en realidad una
propiedad de la escala (o, ms genricamente, de un test cualquiera empleado), sino que
es especfico de cada criterio (y de cada muestra) con el que se relacionen las
puntuaciones de la escala. Merece la pena sealar tambin que, segn la distincin
clsica entre validez predictiva y validez concurrente, esta prueba de validacin que
realizamos aqu estara dentro de la ltima modalidad (concurrente), puesto que ambas
puntuaciones, la de la escala QPSC y la de la Valoracin Global del Servicio, se
110
obtienen al mismo tiempo (se recogen con el mismo cuestionario), aunque es cierto que,
si el coeficiente de validez hallado es suficientemente alto, la puntuacin de un
individuo en QPSC permitira predecir en alto grado la puntuacin de un individuo en la
Valoracin Global del Servicio. En todo caso, ya hemos apuntado anteriormente que la
distincin entre validez predictiva y concurrente se juzga hoy muy poco relevante
(Morales, 2000: p. 484).
112
X j = jm Fm + E j
m=1
113
H0: = ()
donde es la matriz de covarianzas poblacionales entre las variables observables
(items), es un vector que contiene los parmetros del modelo y () es la matriz de
covarianzas derivadas como una funcin de los parmetros contenidos en el vector .
Aqu hay que precisar que las variables implicadas en un modelo SEM son bsicamente
de tres tipos: las que hemos llamado observables son los indicadores del modelo (los
items en QPSC), las que llamamos latentes, que son las no observables o factores
especificados en el modelo y las variables aleatorias no observables que aglutinan todos
los efectos no considerados en el modelo y que tratamos como errores de medida
(equivalentes al trmino error en un modelo de regresin).
115
donde Xj representa los indicadores, m las variables latentes, j los errores de medida
del indicador correspondiente y jm los coeficientes de regresin que representan la
relacin entre la variable latente y su indicador. En este caso, slo contamos con
variables que reciben el nombre de exgenas en la terminologa SEM, ya que no
obedecen a causas previas en el modelo (las X son exgenas observables y las son
exgenas latentes o no observables). Esta metodologa tambin permite deinir otras
variables, las endgenas (asimismo diferenciables en observables, Y, y no
observables, ) que no consideraremos aqu por no formar parte del modelo estructural
que constituye el constructo de QPSC. Las covarianzas entre 1, 2 y 3 se representan
en la terminologa SEM por la letra . El modelo de medida del ejemplo anterior est
definido matricialmente por la siguiente ecuacin:
X = x +
116
X1
X2
21
X3
31
41
X4
X5
X6
X7
X8
X9
10
X10
11
X11
12
X12
11
51
21
62
72
82
31
2
92
32
10 3
11 3
12 3
118
121
Xg = xg g + g
donde Xg es el vector de medidas observadas, xg es la matriz de cargas factoriales, g es
un vector de factores comunes y g es un vector de variables nicas (denotando g el
grupo de que se trate). Asumiendo que las muestras de los grupos son independientes
entre s y que los valores de las variables son realizaciones de una poblacin normal, la
funcin logartmica de verosimilitud (log-likelihood) de cada grupo puede escribirse:
H0 : 1 = 2 = ... =G
124
M = nlog|S| - n g log S G
g =1
que est asintticamente distribuido como una chi cuadrado con d grados de libertad, tal
que d =(g 1)J(J + 1).
Si la hiptesis de igualdad de covarianzas resulta rechazada, el siguiente paso en
la secuencia de tests es comprobar la igualdad del nmero de factores, sin atender al
patrn especfico de cargas fijadas y libres. La hiptesis correspondiente se formula
como:
H0k : M1 = M2 = ... = MG
donde M es un nmero concreto de factores. Esencialmente, este test opera como si se
realizasen anlisis factoriales independientes sin restricciones, siendo cada uno de ellos
testado con chi cuadrado con d grados de libertad tales que dk =(J M) - (J + M). Y
puesto que los chi-cuadrados respectivos son independientes, pueden sumarse para
obtener el chi cuadrado total del test de igualdad del nmero de factores con d grados de
libertad tales que dM =(J M)2 - (J + M).
Si la hiptesis de igualdad del nmero de factores no se rechaza, el siguiente
paso en la secuencia de tests el comprobar la igualdad de cargas factoriales, que es la
hiptesis de invarianza factorial y se formula como:
H0: 1 = 2 = ... = G
El test de invarianza factorial se lleva a cabo estableciendo restricciones en los distintos
grupos para elementos comunes en la matriz de cargas factoriales y dejando libre el
resto de parmetros. El resultado es un chi cuadrado que puede evaluarse con d grados
de libertad tales que d =gJ(J + 1) JM + J - JM(M + 1) gJ.
Si la hiptesis de invarianza factorial se mantiene, como paso siguiente se puede
optar por evaluar la igualdad de cargas factoriales y variables reales, como recomiendan
algunos autores (Kaplan, 2000), o por comprobar primero la invarianza de todos los
parmetros en los distintos grupos aadiendo la restriccin de que las matrices de
125
covarianzas g son iguales, que es la rutina del programa AMOS. En este ltimo caso la
hiptesis correspondiente puede enunciarse como:
H0: 1 = 2 = ... = G
1 = 2 = ... =G
Para realizar este ltimo test se utiliza la muestra comn de matrices de covarianza y el
resultado es un chi cuadrado que se evala con d grados de libertad tales que d
=J(J + 1) JM + J - gM(M +1) J.
Si despus se opta por evaluar adems la igualdad de cargas factoriales y
variables reales, la hiptesis correspondiente puede escribirse:
H0: 1 = 2 = ... = G
1 = 2 = ... =G
1 = 2 = ... = G
El test para comprobar esta hiptesis se lleva a cabo estableciendo restricciones
comunes en los grupos sobre la matriz de cargas factoriales , sobre la matriz de
covarianzas g y sobre la matriz de covarianzas . Como antes, el resultado del test es
un chi-cuadrado que puede evaluarse con d grados de libertad tales que d =gJ(J +
1) JM + J - gM(M + 1) J.
El procedimiento de AFC multigrupo que hemos efectuado aqu se ha realizado
con el programa AMOS.19, tomando los conjuntos de datos correspondientes a las
encuestas llevadas a cabo en la Universidad Popular y la Escuela de Msica en el
ayuntamiento de referencia y en los Centros de Jvenes de los ayuntamientos de
comparacin, en los dos momentos que se ha llevado a cabo la aplicacin de QPSC,
suprimiendo todos los casos con valores perdidos al efecto de extraer algunos
estadsticos de bondad de ajuste del modelo (RMR, GFI) que precisan una matriz de
datos sin valores perdidos si se trabaja con el programa AMOS.
El programa AMOS proporciona una salida en la que podemos observar los
coeficientes y del AFC con el modelo de medida para cada uno de los grupos
contemplados (conjuntos de datos de las encuestas en la Universidad Popular en 2003 y
2005, por ejemplo). Estos coeficientes pueden verse en sus formas no estandarizada y
estandarizada (normalizada con puntuaciones z). El coeficiente estandarizado se
126
calcula a partir del producto entre el coeficiente bruto estimado y las desviaciones
tpicas estimadas para cada variable (Lvy y Varela, 2006, p. 266), segn la expresin:
sjm = jm ( mm )
jj
s
donde jm es el coeficiente estandarizado estimado, jm es el coeficiente bruto estimado
a los
127
128
Captulo 4
Resultados
En este captulo se muestran los resultados de todos los anlisis, pruebas y
comprobaciones avanzados en el apartado de Mtodo.
129
C.J.C B.G.
2008 2009
237
6,49
56
9,97
n = tamao muestral; e = error muestral; C.J.L.: Centro de Jvenes de Legans; C.J.C.: Centro de
Juventud de La Corua; B.G.: Biblioteca municipal de Guadarrama
U.P. 2003
U.P. 2005
E.M. 2004
E.M. 2006
Hombres
78 (25,2)
91 (21,2)
115 (44,9)
90 (42,9)
Mujeres
232 (74,8)
338 (78,6)
141 (55,1)
120 (57,1)
NS/NC
1 (0,2)
313 (100,0)
429 (100,0)
256 (100,0)
210 (100,0)
Total
130
U.P. 2005
E.M. 2004
E.M. 2006
8 (2,6)
6 (1,4)
91 (35,5)
72 (34,3)
De 19 a 29 aos
73 (23,5)
92 (21,4)
66 (25,8)
53 (25,2)
De 30 a 39 aos
61 (19,7)
72 (16,7)
11 84,3)
4 (1,9)
De 40 a 49 aos
52 (16,8)
75 (17,4)
49 (19,1)
53 (25,2)
De 50 a 64 aos
82 (26,5)
119 (27,7)
29 (11,3)
21 (10,0)
65 y ms aos
18 (5,8)
42 (9,8)
7 (2,7)
5 (2,4)
NS/NC
16 (5,2)
24 (5,6)
3 (1,2)
2 (0,8)
313 (100,0)
429 (100,0)
256 (100,0)
210 (100,0)
Grupo de edad
Hasta 18 aos
Total
UP: Universidad Popular; E.M.: Escuela de Msica; C.J.L.: Centro de Jvenes de Legans; C.J.C.:
Centro de Juventud de La Corua
U.P. 2005
E.M. 2004
E.M. 2006
25 (8,1)
52 (12,1)
41 (15,9)
35 (16,7)
Primarios/Hasta 6 EGB
52 (16,8)
79 (18,4)
44 (17,1)
35 (16,7)
EGB/ESO/FP1
2/BUP/FP grado medio
3BUP/COU/FP2 grado
superior/Bachillerato
Universitarios
73 (23,5)
92 (21,4)
61 (24,0)
56 (26,7)
62 (20,0)
86 (20,0)
49 (19,1)
37 (17,6)
85 (27,4)
112( 26,0)
59 (23,1)
47 (22,4)
NS/NC
13 (4,2)
9 (2,1)
2 (0,8)
313 (100,0)
429 (100,0)
256 (100,0)
210 (100,0)
Nivel Educativo
Total
E.M. 2006 los mayores pesos porcentuales los presentan los grupos de edad ms
jvenes. Finalmente, cuando atendemos a la distribucin por nivel educativo, vemos
que los mayores porcentajes los arrojan los niveles educativos de 3BUP/COU/FP2 y
similares en adelante, tanto en los casos de U.P. 2003 y 2005 como de E.M. 2004 y
2006. Todo ello est en correspondencia con la composicin por sexo, edad y nivel
educativo de las poblaciones de usuarios de estos servicios de las que se han extrado
estas muestras, segn la informacin disponible en los registros de usuarios de estos
servicios socioculturales.
C.J.L. 2008
C.J.C. 2006
C.J.C 2008
Hombres
51 (54,8)
33 (31,7)
166 (39,8)
93 (39,2)
Mujeres
41 (44,1)
70 6(7,3)
251 (60,2)
143 (60,3)
NS/NC
1 (1,1)
1 (1,0)
1 (0,4)
93 (100)
104 (100,0)
417 (100,0)
237 (100,0)
Sexo
Total
C.J.L. 2008
C.J.C. 2006
C.J.C 2008
Hasta 16 aos
20 (21,5)
3 (2,9)
18 (4,3)
8 (3,4)
De 17 a 20 aos
30 (32,3)
12 (11,5)
61 (14,6)
23 (9,7)
De 21 a 25 aos
31 (33,3)
15 (14,4)
144 (34,5)
57 (24,1)
De 26 a 30 aos
11 (11,8)
36 (34,6)
116 (27,8)
70 (29,5)
De 31 a 35 aos
21 (20,2)
49 (11,8)
41 (17,3)
36 y ms aos
13 (12,5)
26 (6,2)
34 (14,3)
1 (1,1)
4 (3,8)
3 (0,7)
4 (1,7)
93 (100,0)
104 (100,0)
417 (100,0)
237 (100,0)
Grupo de edad
NS/NC
Total
132
Tabla 4.7: Estructura de las muestras por nivel educativo en los servicios
socioculturales de comparacin
Servicio sociocultural y ao de la encuesta
C.J.L. 2006
C.J.L. 2008
C.J.C. 2006
C.J.C 2008
Primarios/Hasta 6 EGB
19 (20,4)
9 (8,3)
14 (3,3)
14 (5,9)
EGB/ESO/FP1
2/BUP/FP grado medio
3BUP/COU/FP2 grado
superior/Bachillerato
Universitarios
16 (17,2)
28 (26,9)
60 (14,4)
40 (16,9)
46 (49,5)
32 (30,8)
193 (46,3)
93 (39,2)
11 (11,8)
34 (32,7)
149 (35,7)
89 (37,6)
1 (1,1)
1 (1,0)
1 (0,2)
1 (0,4)
93 (100,0)
104 (100,0)
417 (100,0)
237 (100,0)
Nivel Educativo
NS/NC
Total
Observando ahora las distribuciones de frecuencia de las variables sexo, edad y nivel
educativo de los usuarios en los servicios socioculturales de comparacin (tablas 4.5,
4.6 y 4.7), vemos que la proporcin de mujeres es superior a la de hombres salvo en el
caso de C.J.L. 2006, donde se produce el fenmeno inverso. En lo relativo a la
distribucin por edad, observamos mayores pesos porcentuales en los grupos de edad
ms jvenes, algo esperable en usuarios de servicios de juventud, aunque tambin los
grupos de edad entre los 26 y los 30 aos arrojan porcentajes considerables,
especialmente en los casos C.J.L. 2008 y C.J.C. 2006 y 2008. Por ltimo, la distribucin
por niveles educativos nos ofrece los mayores pesos porcentuales en los niveles
3BUP/COU/FP2 y similares y universitarios.
Este perfil de las muestras tomadas en estos servicios tambin resulta coherente
con el de las poblaciones de sus usuarios, a tenor de lo captado por sus responsables
mediante observacin directa (estos servicios, por su naturaleza, no disponen de
registros poblacionales de sus usuarios).
El perfil de la muestra utilizada en la Biblioteca Municipal de Guadarrama es el
que mostrado en las tablas 4.8, 4.9 y 4.10. En la muestra de usuarios de este servicio
observamos tambin una mayor proporcin de mujeres que de hombres (60,7% y
39,3%, respectivamente), hecho frecuente entre los usuarios de este tipo de servicios.
Tambin observamos que los usuarios son ms numerosos en los grupos de edad ms
jvenes, disminuyendo en las edades intermedias y volviendo a ser ms numerosos en el
grupo de ms de 50 aos. Finalmente, la distribucin de los usuarios encuestados por su
133
34 (60,7)
Total
56 (100,0)
7 (12,5)
De 31 a 40 aos
12 (21,4)
De 41 a 50 aos
3 (5,4)
Ms de 50 aos
8 (14,3)
Total
56 (100,0)
9 (16,1)
3 (5,4)
17 (30,4)
23 (41,4)
1 (1,8)
56 100,0)
134
135
sido pensados para una situacin en la que el inters del usuario por responder a la
encuesta y el tiempo que puede o quiere dedicar a tal fin son relativamente escasos. Por
ello, la dimensin operativa de la escala QPSC est presidida por su efectiva viabilidad:
es fcilmente comprensible, se contesta rpidamente y es sencillo y cmodo entregar el
cuestionario cumplimentado que la contiene. La experiencia de realizacin de encuestas
de calidad percibida en los servicios socioculturales municipales ha puesto de
manifiesto la idoneidad prctica de la escala QPSC para aplicarla a sus usuarios. El
cuestionario se contesta habitualmente en menos de tres minutos y la escala QPSC
propiamente dicha se cumplimenta en un tiempo que va entre un mnimo de 45
segundos y un mximo de dos minutos. Y, como veremos posteriormente con detalle, el
anlisis de los items muestra que, en promedio, apenas un 6% de los encuestados, en el
caso ms desfavorable, deja sin contestar algn item de la escala.
4.3.1.
Estadsticos descriptivos
presentan ms bajos. Sus errores tpicos respectivos (es decir, sus desviaciones tpicas
divididas por la raz cuadrada de sus tamaos muestrales) son de pequea entidad, pero
resultan mayores en los items relativos a las Instalaciones. Y tambin apreciamos que
las mayores desviaciones tpicas las presentan los items relativos a las Instalaciones,
mientras que las menores las ofrecen los relativos al Personal.
Media
ET
media
DT
g1
ET g1
g2
ET g2
7,8912
0,0974
1,6714
-0,679
0,142
0,393
0,283
7,5510
0,1175
2,0159
-0,990
0,142
1,168
0,283
6,9834
0,1064
1,8465
-0,564
0,140
0,828
0,280
7,4276
0,1159
1,9747
-0,855
0,143
0,997
0,285
6,8725
0,1256
2,1689
-0,489
0,141
-0,078
0,281
8,7833
0,0872
1,5112
-1,483
0,141
2,819
0,281
8,8079
0,0873
1,5171
-1,654
0,140
3,972
0,280
8,6567
0,1010
1,7499
-1,753
0,141
3,959
0,281
8,7167
0,0974
1,6869
-1,630
0,141
3,199
0,281
8,2837
0,0974
1,6569
-1,211
0,143
2,397
0,286
8,3034
0,1112
1,8945
-1,485
0,143
2,618
0,285
8,4048
0,1028
1,7631
-1,316
0,142
2,124
0,283
Los ndices de asimetra, en este caso, muestran sus mayores valores (g1 > 1) en los
items relativos al Personal y los menores en los items relativos a las Instalaciones. Los
ndices de asimetra con signo negativo indican escoramiento hacia la derecha de las
puntuaciones del tem, con cola larga por su izquierda, es decir, que las frecuencias son
mayores en los valores ms altos de la escala. El tem en el que este fenmeno se
muestra ms acusado es el referido a la Motivacin del Personal (g1 = -1,753) y el tem
en el que menos se produce este efecto es en el referido al Confort de las Instalaciones
(g1 = -0,489). Los ndices de curtosis tambin muestran sus valores ms elevados en
los items relativos al Personal y los ms bajos en los relativos a las Instalaciones. Los
ndices de curtosis con signo positivo indican mayor curtosis que la de una distribucin
normal (o leptocurtosis), implicando esto colas ms pobladas que las de una
distribucin normal. Slo vemos en este caso un ndice con signo negativo, el
137
correspondiente al tem Confort de las Instalaciones (-0,078), que nos indica curtosis
inferior a la que caracterizara una distribucin normal (o platicurtosis). El tem que
arroja la mayor curtosis es el relativo a la Profesionalidad del Personal (3,972), que es, a
su vez, el que ofrece la puntuacin media ms alta en la escala QPSC. En las figuras 4.1
y 4.2 mostramos los grficos de las distribuciones de frecuencias de los items de la
escala en esta aplicacin de la misma, que representan, de forma paradigmtica, los
perfiles de las puntuaciones en QPSC. En el anexo 2 pueden verse los grficos de
frecuencias del resto de aplicaciones de la escala en los servicios socioculturales de
referencia.
138
139
140
Seguimos nuestro anlisis de los items con los datos de la encuesta en la Universidad
Popular en 2005, cuyos estadsticos descriptivos se muestran en la tabla 4.12. De nuevo
encontramos que los items que presentan las medias aritmticas ms altas son los
relativos al Personal, y, en menor medida, a los Trmites, y que los items que presentan
las medias aritmticas ms bajas son los relativos a las Instalaciones. Sus errores tpicos
son muy reducidos pero resultan algo ms elevados en los items correspondientes a las
Instalaciones y algo menos elevados en los items correspondientes al Personal. Las
desviaciones tpicas de las puntuaciones de los items muestran sus valores ms altos en
los relativos a las Instalaciones y los ms bajos en los relativos al Personal, indicando,
como sabemos, que es en estos ltimos donde se produce una menor dispersin de las
puntuaciones. Los ndices de asimetra ofrecen valores negativos en todos los items, es
decir, denotativos de asimetra negativa, ms altos en los items del Personal y ms bajos
en los items de las Instalaciones, siendo el tem ms asimtrico el referido a la Simpata
del Personal (-2,002) y el menos el tem referido a la Conservacin de las Instalaciones
(-0,300). Los ndices de curtosis presentan todos signo positivo (leptocurtosis, por
tanto), siendo ms acusado este hecho en el caso de los items relativos al Personal y
menos en el caso de los items relativos a las Instalaciones (los items relativos a los
Trmites muestran una curtosis intermedia), siendo de nuevo los items Simpata del
Personal y Conservacin de las Instalaciones los que arrojan los valores ms alto
(6,281) y ms bajo (0,028), respectivamente, de este ndice.
Tabla 4.12: Estadsticos descriptivos correspondientes a la encuesta en la
Universidad Popular 2005
Estadsticos descriptivos
TEMS
Limpieza
Accesibilidad
Conservacin
Seguridad
Confort
Simpata
Profesionalidad
Motivacin
Comunicacin
Horarios trmites
Rapidez trmites
Comodidad trmites
Media
ET
media
DT
g1
ET g1
g2
ET g2
7,361
0,096
1,928
-0,925
0,121
1,235
0,242
7,562
0,098
1,975
-0,796
0,122
0,527
0,243
6,693
0,092
1,859
-0,300
0,121
0,028
0,242
7,391
0,096
1,899
-0,664
0,123
0,643
0,245
6,871
0,102
2,067
-0,522
0,121
0,110
0,241
8,790
0,072
1,472
-2,002
0,120
6,281
0,240
8,819
0,071
1,429
-1,728
0,121
3,949
0,241
8,749
0,072
1,446
-1,769
0,121
4,919
0,241
8,891
0,073
1,487
-1,863
0,120
4,403
0,240
8,419
0,076
1,520
-1,051
0,122
1,494
0,244
8,460
0,081
1,612
-1,215
0,122
1,623
0,244
8,517
0,081
1,607
-1,247
0,123
1,633
0,246
141
Media
ET
media
DT
g1
ET g1
g2
ET g2
8,4130
0,0993
1,3481
-1,937
0,179
8,494
0,356
7,9676
0,1194
1,6248
-1,115
0,179
1,927
0,355
7,9620
0,1096
1,4871
-1,617
0,179
5,376
0,356
7,8883
0,1196
1,6001
-1,529
0,182
3,992
0,361
7,2432
0,1316
1,7907
-0,802
0,179
1,062
0,355
8,4033
1,5591
-1,619
0,181
4,575
0,359
8,4831
0,1081
1,4427
-1,827
0,182
6,708
0,362
8,3966
0,1067
1,4277
-1,417
0,182
3,739
0,361
8,3978
0,1218
1,6387
-1,908
0,181
5,640
0,359
7,1508
0,1368
1,8312
-0,847
0,182
1,037
0,361
7,2191
0,1623
2,1660
-0,947
0,182
0,577
0,362
8,0611
0,1270
1,7049
-1,649
0,181
4,751
0,360
142
Media
ET
media
DT
g1
ET g1
g2
ET g2
8,1810
0,0750
1,0873
-0,028
0,168
-0,316
0,334
7,7333
0,1138
1,6500
-0,844
0,168
0,596
0,334
7,7619
0,0804
1,1658
-0,604
0,168
1,172
0,334
7,7095
0,0897
1,3001
-0,475
0,168
0,534
0,334
7,0810
0,1131
1,6392
-0,605
0,168
0,818
0,334
8,4810
0,1063
1,5411
-1,191
0,168
1,856
0,334
8,4048
0,1136
1,6465
-1,590
0,168
3,930
0,334
8,2143
0,1152
1,6706
-1,301
0,168
2,946
0,334
8,4000
0,1041
1,5097
-1,369
0,168
3,518
0,334
6,9286
0,1088
1,5772
-0,731
0,168
1,224
0,334
7,1143
0,1148
1,6648
-1,000
0,168
1,996
0,334
7,9095
0,0953
1,3821
-0,923
0,168
2,681
0,334
143
poseen valores muy semejantes en todos los items y, salvo en el caso del tem Seguridad
de las instalaciones (con error 0,0992), siempre oscilan entre 0,10 y 0,16. Las
desviaciones tpicas muestran un patrn similar, con escasas diferencias de valor y en el
rango 1,0 y 1,5 (con las excepciones de las de los items Seguridad y Confort de las
instalaciones, donde descienden por debajo de la unidad). Los ndices de asimetra
indican asimetra negativa en todos los items, ms notable en general en los items
relativos al Personal que en el resto (especialmente que en los items referidos a las
Instalaciones), si bien observamos dos excepciones a esta pauta: en el tem Limpieza de
las instalaciones y en el tem Rapidez de los trmites, en los cuales los ndices de
asimetra son superiores a los de los items del Personal (-1,066 y -1,203,
respectivamente). Los ndiceds de curtosis muestran valores bastante heterogneos, pero
indicativos de leptocurtosis en casi todos los items, salvo en los casos de Accesibilidad,
Conservacin y Confort de las instalaciones, donde se muestran platicrticos (con
valores de -1,051, -0,187 y -0,379, respectivamente).
Media
ET
media
DT
g1
ET g1
g2
ET g2
8,4396
0,1579
1,5070
-1,066
0,253
2,189
0,500
7,4725
0,1493
1,4247
-0,179
0,253
-1,051
0,500
7,6374
0,1284
1,2248
-0,419
0,253
-0,187
0,500
7,7000
0,0992
0,9415
-0,434
0,254
0,472
0,503
8,0549
0,1040
0,9928
-0,182
0,253
-0,379
0,500
8,0330
0,1461
1,3940
-1,016
0,253
0,488
0,500
8,0879
0,1236
1,1799
-0,962
0,253
0,802
0,500
7,7582
0,1383
1,3194
-1,024
0,253
1,516
0,500
7,6044
0,1431
1,3652
-0,907
0,253
2,191
0,500
6,2967
0,1502
1,4336
-0,401
0,253
1,626
0,500
7,2418
0,1272
1,2141
-1,203
0,253
3,315
0,500
7,5385
0,1233
1,1767
-0,785
0,253
0,843
0,500
relativos a los Trmites. Los errores tpicos de las medias poseen valores muy
semejantes en todos los items, oscilando entre 0,12 y 0,15. Las desviaciones tpicas
muestran un patrn similar, con escasas diferencias de valor. Los ndices de asimetra
indican asimetra negativa en todos los items, de mayor entidad en los items relativos al
Personal que en el resto (especialmente que en los items referidos a los Trmites, los
cuales muestran valores considerablemente menores. Los ndices de curtosis muestran
valores indicativos de leptocurtosis en casi todos los items, salvo en los items relativos a
los Trmites, donde se muestran platicrticos.
Media
ET
media
DT
g1
ET g1
g2
ET g2
8,7200
0,1450
1,4500
-1,180
0,241
1,108
0,478
8,5400
0,1507
1,5070
-1,090
0,241
0,923
0,478
8,3600
0,1521
1,5210
-1,037
0,241
1,928
0,478
8,4800
0,1452
1,4528
-0,847
0,241
0,235
0,478
8,2000
0,1582
1,5827
-0,742
0,241
0,253
0,478
9,0700
0,1281
1,2812
-1,486
0,241
1,508
0,478
9,0400
0,1254
1,2546
-1,580
0,241
2,671
0,478
8,8900
0,1324
1,3249
-1,336
0,241
1,357
0,478
8,9100
0,1334
1,3340
-1,343
0,241
1,329
0,478
8,2500
0,1445
1,4451
-0,552
0,241
-0,503
0,478
8,3200
0,1427
1,4275
-0,606
0,241
-0,473
0,478
8,4200
0,1436
1,4367
-0,608
0,241
-0,594
0,478
de 2006, y los tres referidos a los Trmites, en la de 2008, presentan platicurtosis. Los
valores de los coeficientes de asimetra y de curtosis son, en general, discretos en ambas
aplicaciones, y en la mayora de los casos no exceden la unidad o son inferiores a sta.
En el aspecto de la curtosis, son notables excepciones a esta pauta general los
coeficientes correspondientes a los items Limpieza, Comunicacin y Rapidez de los
Trmites (2,189, 2,191 y 3,315, respectivamente) en la aplicacin de 2006, y el
correspondiente al tem Profesionalidad (2,671) en la aplicacin de 2008.
Observando ahora los estadsticos descriptivos de los datos de la encuesta en el
Centro de Jvenes de La Corua en 2006 (tabla 4.17), vemos que los mayores valores
de la media aritmtica los arrojan los items relativos al Personal. Las desviaciones
tpicas son apreciablemente menores tambin en los items del Personal que en el resto.
Los coeficientes de asimetra indican asimetra negativa en todos los items, de mayor
entidad en los items relativos al Personal, aunque el item Limpieza de las instalaciones
y, en menor medida, el tem Accesibilidad de las instalaciones presentan coeficientes
con valores tanto o ms elevados que los de los items referidos al Personal (-1,310 y
-1,174, respectivamente). Los coeficientes de curtosis son casi siempre indicativos de
leptocurtosis, con la excepcin de los coeficientes de curtosis de los items Horarios y
Rapidez de los trmites, que sealan platicurtosis (con valores de -0,690 y -0,631,
respectivamente).
Media
ET
media
DT
g1
ET g1
g2
ET g2
9,0073
0,0560
1,1395
-1,310
0,120
1,912
0,240
8,4512
0,0725
1,4697
-1,174
0,121
2,269
0,240
8,4512
0,0673
1,3627
-0,931
0,121
1,128
0,240
8,4694
0,0756
1,4981
-0,954
0,123
0,511
0,246
8,2512
0,0770
1,5598
-1,118
0,121
2,023
0,240
9,3130
0,0443
0,8965
-1,252
0,121
1,021
0,241
9,1630
0,0492
0,9916
-1,296
0,121
1,758
0,242
9,0418
0,0532
1,0739
-1,162
0,121
1,279
0,241
9,1271
0,0514
1,0401
-1,123
0,121
0,944
0,241
8,0738
0,0777
1,5409
-0,402
0,123
-0,690
0,246
8,2732
0,0716
1,3903
-0,384
0,126
-0,631
0,251
8,4834
0,0755
1,4379
-0,945
0,128
0,840
0,256
147
descriptivos
muestran
(tabla
4.18)
que
las
medias
aritmticas
correspondientes a los items del Personal son en general ms elevadas que el resto,
especialmente que las de los items relativos a los Trmites (excepcionalmente, el tem
Limpieza de las instalaciones arroja una puntuacin media de 8,7773 puntos, casi igual
a la del tem Profesionalidad del Personal). Las desviaciones tpicas muestran una
menor dispersin en los items relativos al Personal y, en general, oscilan dentro de un
rango de valores discretos 1,30-1,65. Los ndices de asimetra indican asimetra negativa
en todos los items, de mayor entidad en los items relativos al Personal que en el resto,
con la salvedad del tem Motivacin del personal (con valor -0,862), que es de los
menores, y de los items Limpieza y Accesibilidad de las instalaciones (con valores
1,338 y 1,399, respectivamente), que presentan ndices bastante altos respecto de los
dems. Los ndices de curtosis muestran valores indicativos de leptocurtosis en casi
todos los items, con las excepciones de los items Conservacin de las instalaciones
(valor -0,656), y Rapidez y Comodidad de los trmites (con valores -0,435 y -0,570,
respectivamente) que indican platicurtosis. Especialmente leptocrticos resultan los
items Simpata y Profesionalidad del personal, con valores de 4,441 y 8,478,
respectivamente.
Tabla 4.18: Estadsticos descriptivos correspondientes a la encuesta realizada en
el Centro de Jvenes de La Corua 2008
Estadsticos descriptivos
ITEMS
Limpieza
Accesibilidad
Conservacin
Seguridad
Confort
Simpata
Profesionalidad
Motivacin
Comunicacin
Horarios trmites
Rapidez trmites
Comodidad trmites
Media
ET
media
DT
g1
ET g1
g2
ET g2
8,7773
0,0887
1,3436
-1,338
0,161
2,837
0,320
8,1947
0,1228
1,8468
-1,399
0,162
2,495
0,322
8,3040
0,0926
1,3953
-0,468
0,162
-0,656
0,322
8,3801
0,1099
1,6349
-1,447
0,164
3,372
0,326
8,2124
0,1077
1,6190
-1,046
0,162
1,557
0,322
8,8584
0,0903
1,3588
-1,596
0,162
4,441
0,322
8,7797
0,0895
1,3485
-2,072
0,162
8,478
0,322
8,5733
0,0918
1,3775
-0,862
0,162
0,342
0,323
8,6933
0,0906
1,3592
-1,087
0,162
1,162
0,323
7,9404
0,1128
1,6659
-1,058
0,165
2,090
0,328
8,0359
0,1122
1,5676
-0,433
0,174
-0,435
0,346
8,1850
0,1065
1,5073
-0,461
0,172
-0,570
0,342
148
de Jvenes de La Corua las puntuaciones medias de los items relativos al Personal son,
en conjunto, apreciablemente superiores a las puntuaciones medias del resto de items,
sin perjuicio de que haya items (como el de Limpieza de las instalaciones, en todas las
aplicaciones de QPSC en los servicios socioculturales de comparacin) que arrojen una
puntuacin media que iguale o incluso supere a las del Personal del servicio. Las
desviaciones tpicas en los datos de las aplicaciones en ambos servicios y en los dos
momentos son ms bien bajas, variando en general entre los valores 1 y 2, pero los
ndices de asimetra muestran, tambin en las aplicaciones en ambos servicios y en
ambos momentos, considerable asimetra negativa, y los coeficientes de curtosis nos
indican, en general, una apreciable leptocurtosis.
Este perfil estadstico de los datos de las aplicaciones de la escala QPSC en los
servicios de comparacin es bsicamente coincidente con el hallado en las aplicaciones
en los servicios de referencia. En general, las puntuaciones medias ms altas
corresponden a los tems de la dimensin Personal, siendo las de los items de las otras
dos dimensiones bastante semejantes entre s. Las desviaciones tpicas tambin guardan
una estructura semejante, siendo menores las relativas a los items de la dimensin
Personal. Sin embargo, mientras que las desviaciones tpicas obtenidas en los servicios
socioculturales de referencia oscilan, en general, entre 1,5 y 2, en los servicios
socioculturales de comparacin oscilan ms bien entre 1 y 1,5. Esto significa que, en las
aplicaciones de la escala en los servicios de comparacin, las puntuaciones de los
usuarios se concentran ms en torno al promedio de cada uno de los items que en las
aplicaciones en los servicios de referencia, es decir, que en estos ltimos existe una
heterogeneidad mayor de puntuaciones que en aquellos. Resulta tambin notable que los
ndices de asimetra y curtosis obtenidos en los servicios socioculturales de referencia
arrojan, en promedio, valores considerablemente ms altos que los obtenidos en los
servicios de comparacin (especialmente los de curtosis), lo cual nos indica una mayor
asimetra negativa (pues todos los coeficientes tienen signo negativo) y, en general, una
leptocurtosis mucho ms acusada (la excepcin la constituyen los ndices de asimetra y
curtosis obtenidos en la Escuela de Msica en 2006, que ofrece en conjunto una
asimetra negativa y una curtosis menores que las que presentan los datos obtenidos en
los servicios de comparacin salvo en el caso de la aplicacin en el Centro de Juventud
de Legans en 2006, que tiene en conjunto una asimetra y una leptocurtosis menores).
Para cerrar este apartado mostraremos ahora los estadsticos descriptivos para la
puntuacin general de la escala en cada servicio (formada como promedio de las medias
150
aritmticas de las puntuaciones de cada tem). Como puede verse en la tabla 4.19, las
puntuaciones medias de la escala oscilan entre 7,66 puntos (caso del Centro de Jvenes
de Legans en 2006) y 8,68 puntos (caso del Centro de Juventud de La Corua en
2006). Los errores tpicos de las medias son modestos, excepto en el caso de la
Universidad Popular en 2003, que alcanza un valor de 0,6725. Las desviaciones tpicas
de las puntuaciones totales presentan tambin valores modestos, siendo la menor la
correspondiente al caso del Centro de Jvenes de Legans en 2006 y la mayor la
correspondiente al caso de la Escuela de Msica en 2004. El estadstico g1, ndice de
asimetra, muestra en todos los casos valores indicativos de asimetra negativa, con un
valor mximo (-1,648) en el caso de la Escuela de Msica en 2004 y con un valor
mnimo (-0,544) en el caso del Centro de Juventud de La Corua en 2006. La mayor
curtosis la apreciamos en el caso de la Escuela de Msica en 2004 (6,735) y la menor en
el caso del Centro de Jvenes de La Corua en 2006 (0,132). La representacin grfica
de las distribuciones de frecuencia de las puntuaciones generales de la escala en las
distintas aplicaciones realizadas podemos observarla en la figura 4.3.
Media
ET
media
DT
g1
ET g1
g2
ET g2
8,0498
0,6725
1,1707
-0,717
0,140
0,993
0,279
8,0514
0,0563
1,1481
-0,818
0,120
1,076
0,239
7,9619
0,0868
1,1806
-1,648
0,179
6,735
0,335
7,8266
0,0701
1,0151
-0,457
0,168
0,296
0,334
7,6563
0,0893
0,8518
-0,907
0,253
0,606
0,500
8,600
0,1144
1,1442
-0,972
0,241
1,049
0,478
8,6812
0,0425
0,8636
-0,544
0,120
0,132
0,239
8,400
0,07541
1,1437
-0,787
0,160
1,269
0,320
U.P. Universidad Popular; E. Msica: Escuela de Msica; C.J. Legans.: Centro de Jvenes de
Legans; C.J. La Corua.: Centro de Juventud de La Corua
151
153
Figura 4.4: Grficos P-P de los primeros seis items de la escala QPSC en la aplicacin
en la Universidad Popular en 2003
154
Figura 4.5: Grficos P-P de los seis ltimos items de la escala QPSC en la aplicacin
en la Universidad Popular en 2003
155
156
-4,75
-7,59
-10,67
-0,17
1,38
5,07
23,39
-0,93
Accesibilidad
-6,93
-6,53
-6,14
-4,99
4,09
2,16
5,31
1,76
Conservacin
-3,99
-2,46
-8,91
-3,57
2,93
0,11
14,80
3,47
Seguridad
-5,94
-5,45
-8,42
-2,81
2,88
2,64
10,99
1,58
Confort
-3,45
-4,28
-4,42
-3,58
-0,27
0,45
2,92
2,42
Simpata
-10,49
-16,43
-8,92
-7,05
9,97
25,77
12,60
5,49
Profesionalidad
-11,73
-14,18
-10,06
-9,41
14,09
16,20
18,47
11,63
Motivacin
-12,40
-14,52
-7,80
-7,70
14,00
20,18
10,30
8,71
Comunicacin
-11,53
-15,29
-10,51
-8,10
22,62
18,06
15,53
10,41
Horarios trmites
-8,40
-8,62
-4,66
-4,32
8,32
6,13
2,86
3,62
Rapidez trmites
-10,32
-9,97
-5,22
-5,92
9,10
6,66
1,59
5,90
Comodidad trmites
-9,21
-10,23
-9,08
-5,476
7,43
6,70
13,08
7,93
CJ
Legans
Legans
Corua
Corua
Legans
Legans
Corua
Corua
Limpieza
2006
-4,15
2008
-4,82
2006
-10,70
2008
-8,19
2006
4,26
2008
2,26
2006
7,81
2008
8,69
Accesibilidad
-0,70
-4,45
-9,59
-8,57
-2,05
1,88
9,26
7,64
Conservacin
-1,63
-4,23
-7,60
-2,87
-0,36
3,94
4,61
-2,01
Seguridad
-1,69
-3,46
-7,79
-8,86
0,92
0,48
2,09
10,32
Confort
-0,71
-3,03
-9,13
-6,41
-0,74
0,52
8,26
4,77
Simpata
-3,96
-6,07
-10,22
-9,77
0,95
3,08
4,17
13,60
Profesionalidad
-3,75
-6,45
-10,58
-12,69
1,56
5,45
7,18
25,96
Motivacin
-3,99
-5,45
-9,49
-5,28
2,95
2,77
5,22
1,05
Comunicacin
-3,53
-5,48
-9,17
-6,66
4,27
2,71
3,85
3,56
Horarios trmites
-1,56
-2,25
-3,28
-6,48
3,17
-1,03
-2,82
6,40
Rapidez trmites
-4,69
-2,47
-3,14
-2,65
6,46
-0,97
-2,58
-1,33
Comodidad trmites
-3,06
-2,48
-7,72
-2,82
1,64
-1,21
3,43
-1,75
158
159
160
Ya que la hiptesis nula sometida a contraste es que los datos provienen de una
poblacin normal, valores del estadstico cuya valor p sea menor de 0,05 nos llevarn a
rechazar la hiptesis nula y a concluir, por tanto, que los datos no proceden de una
poblacin normal. Comoquiera que, tal como se observa en las tablas, todos los valores
p son menores que 0,05, rechazamos la hiptesis nula y concluimos que las
distribuciones observadas en estas aplicaciones, no parecen que procedan de una
poblacin normal.
La prueba de normalidad de Kolmogorov-Smirnov con los datos de los servicios
socioculturales de comparacin arroja un resultado como el que se muestra en las tablas
4.26, 4.27, 4.28 y 4.29. Nuevamente observamos que todos los valores p son menores
que 0,05. Por consiguiente, podemos rechazar la hiptesis nula y concluir que las
distribuciones observadas tampoco parece que procedan de una poblacin normal.
161
162
163
Tabla 4.30: Correlaciones entre los items QPSC en el caso Universidad Popular 2003
Items
1
2
3
4
5
6
7
8
9
10
11
12
1
0,500
0,573
0,588
0,408
0,500
0,475
0,437
0,374
0,504
0,399
0,299
0,265
0,279
0,293
0,192
0,326
0,217
0,232
0,295
0,224
0,839
0,312
0,272
0,268
0,291
0,160
0,787
0,804
0,217
0,234
0,161
0,323
0,137
0,772
0,810
0,838
10
0,327
0,202
0,216
0,272
0,156
0,378
0,404
0,325
0,372
11
0,304
0,263
0,282
0,304
0,132
0,351
0,359
0,375
0,360
0,664
12
0,301
0,219
0,198
0,255
0,186
0,285
0,313
0,261
0,295
0,570
0,760
Los coeficientes de correlacin toman valores ms altos entre los items relativos a la
misma dimensin terica y ms bajos entre los items pertenecientes a distintas
dimensiones. Las correlaciones entre los items pertenecientes a la dimensin
Instalaciones presentan valores de 0,500 o superiores, con las excepciones de los
coeficientes entre Limpieza y Seguridad, y Limpieza y Confort, que son de 0,408 y
0,437, respectivamente, entre Accesibilidad y Confort, que es de 0,374, entre
Conservacin y Seguridad, que es de 0,475, y entre Seguridad y Confort, que es de
164
0,399. Las correlaciones entre los items pertenecientes a la dimensin Personal ofrecen
valores de 0,770 o superiores. Las correlaciones entre los items pertenecientes a la
dimensin Trmites arrojan valores entre 0,570 y 0,760. Por el contrario, los
coeficientes de correlacin entre los items pertenecientes a distintas dimensiones
raramente superan el valor 0,300 y resultan especialmente bajos entre el tem Confort y
el resto de items que no pertenecen a la dimensin Instalaciones. Un caso notable es la
correlacin existente entre el tem Horarios para hacer los trmites y el tem
Profesionalidad del Personal, que alcanza el valor 0,404, mayor que el de algn
coeficiente entre tems de la misma dimensin.
Procediendo del mismo modo con las datos de la Universidad Popular en 2005 y
con los datos de la Escuela de Msica en 2004 y 2006, vemos en las tablas 4.31, 4.32 y
4.33 unos resultados en gran medida semejantes a los observados en el caso de los
coeficientes hallados con los datos de la Universidad Popular en 2003. En el caso
Universidad Popular 2005, los coeficientes de correlacin entre los items pertenecientes
a la misma dimensin muestran valores ms altos que entre los items pertenecientes a
distintas dimensiones. Las correlaciones entre los items de la dimensin Instalaciones
arrojan en su mayora valores superiores a 0,480, aunque hay algunas correlaciones,
como las existentes entre el tem Limpieza y los items Accesibilidad, Seguridad y
Confort, que bajan de 0,400. Las correlaciones entre los items pertenecientes a la
dimensin Personal son mayores de 0,650 y en algn caso alcanzan un valor superior a
0,800, como es el caso de la correlacin entre los items Profesionalidad y Motivacin.
Las correlaciones entre los items de la dimensin Trmites son todas superiores al valor
0,710. La excepciones a este patrn general se producen dentro de los items de la
dimensin Instalaciones donde encontramos algunos valores del coeficiente de
correlacin inferiores a las que observamos entre items de distintas dimensiones: las
correlaciones antes mencionadas, con valores inferiores a 0,400, son tambin menores
que las que observamos entre los items Accesibilidad y Horarios para trmites,
Seguridad y Horarios para trmites o Profesionalidad y Rapidez de los trmites (0,407,
0,418 y 0,473, respectivamente), por ejemplo. A pesar de ello, ningn tem
perteneciente a una dimensin determinada correlaciona con otro tem de la misma con
un valor ms bajo que el que presenta con otro tem perteneciente a una dimensin
distinta.
En el caso de la Escuela de Msica en 2004, observamos de nuevo la pauta
general de que las correlaciones entre los items que pertenecen a la misma dimensin
165
presentan un valor ms alto que las correlaciones entre estos y los de otras dimensiones.
Las correlaciones entre los items de la dimensin Instalaciones son siempre iguales o
mayores que 0,400 (salvo la del tem Accesibilidad con el tem Confort, que es de
0,399) y en algn caso supera el valor 0,740. Los coeficientes de correlacin entre los
items de la dimensin Personal son casi siempre superiores al valor de 0,700 (la
excepcin la constituye la correlacin entre el tem Simpata y el tem Profesionalidad,
que es de 0,691). Los coeficientes de correlacin entre los items de la dimensin
Trmites oscilan entre los valores 0,610 y 0,760. La excepcin ms notable a la pauta de
que los coeficientes de correlacin entre los items pertenecientes a la misma dimensin
presentan mayores valores que entre los items pertenecientes a distintas dimensiones la
ofrece la correlacin entre el tem Limpieza y el tem Accesibilidad, que arroja un valor
de 0,443, inferior al valor de la correlacin entre el tem Limpieza y los items Simpata
y Comunicacin de la dimensin Personal y los tres items de la dimensin Trmites,
que tienen valores superiores a 0,443.
En el caso de la Escuela de Msica en 2006, apreciamos nuevamente el patrn
general de que las correlaciones entre los items que pertenecen a la misma dimensin
presentan un valor ms alto que las correlaciones entre estos y los de otras dimensiones.
Las correlaciones entre los items de la dimensin Instalaciones son casi siempre iguales
o mayores que 0,400 y en algn caso alcanzan el valor 0,630. Los coeficientes de
correlacin entre los items de la dimensin Personal son casi siempre superiores al valor
de 0,800. Los coeficientes de correlacin entre los items de la dimensin Trmites
oscilan dentro de los valores 0,500 y 0,630. Las excepcin ms notable a la pauta de que
los coeficientes de correlacin entre los items pertenecientes a la misma dimensin
presentan mayores valores que entre los items pertenecientes a distintas dimensiones la
ofrece la correlacin entre el tem Accesibilidad y el tem Confort, que arroja un valor
de 0,277, inferior incluso al valor de la correlacin entre los items de las Instalaciones y
la mayora de los items de la dimensin Personal (que ofrecen, en general, coeficientes
superiores a 0,300).
166
Tabla 4.31 Correlaciones entre los items QPSC en el caso Universidad Popular 2005
Items
1
2
3
4
5
6
7
8
9
10
11
12
1
0,326
0,406
0,516
0,323
0,490
0,605
0,316
0,481
0,597
0,559
0,264
0,308
0,221
0,317
0,232
0,218
0,341
0,312
0,359
0,304
0,731
0,182
,0,299
0,266
0,296
0,289
0,652
0,812
0,188
0,325
0,286
0,300
0,295
0,663
0,773
0,734
10
0,272
0,407
0,304
0,418
0,312
0,404
0,485
0,420
0,467
11
0,218
0,389
0,352
0,365
0,301
0,366
0,473
0,398
0,445
0,727
12
0,254
0,346
0,304
0,329
0,293
0,343
0,429
0,365
0,412
0,714
0,794
Tabla 4.32: Correlaciones entre los items QPSC en el caso Escuela Msica 2004
Items
1
2
3
4
5
6
7
8
9
10
11
1
0,443
0,749
0,575
0,543
0,403
0,602
0,552
0,399
0,646
0,629
0,547
0,285
0,491
0,530
0,481
0,368
0,331
0,360
0,383
0,413
0,691
0,365
0,312
0,360
0,404
0,359
0,764
0,857
0,497
0,327
0,507
0,535
0,461
0,777
0,770
0,764
10
0,455
0,361
0,493
0,356
0,429
0,331
0,240
0,249
0,381
11
0,462
0,301
0,440
0,320
0,380
0,325
0,324
0,316
0,451
0,756
12
0,550
0,359
0,586
0,486
0,513
0,491
0,374
0,370
0,473
0,612
0,680
167
12
Tabla 4.33: Correlaciones entre los items QPSC en el caso Escuela Msica 2006
Items
1
2
3
4
5
6
7
8
9
10
11
1
0,475
0,630
0,559
0,542
0,434
0,592
0,435
0,277
0,416
0,451
0,348
0,340
0,346
0,359
0,331
0,288
0,295
0,307
0,357
0,270
0,875
0,353
0,354
0,354
0,379
0,334
0,846
0,895
0,308
0,306
0,306
0,393
0,341
0,830
0,830
0,897
10
0,220
0,355
0,355
0,214
0,163
0,367
0,361
0,380
0,358
11
0,292
0,299
0,299
0,199
0,174
0,385
0,378
0,375
0,343
0,623
12
0,425
0,310
0,310
0,390
0,259
0,456
0,424
0,450
0,421
0,506
0,612
12
Por su parte, las correlaciones entre los items en las aplicaciones de la escala QPSC en
los servicios socioculturales de comparacin muestran los valores recogidos en las
tablas 4.34, 4.35, 4.36 y 4.37. En la correspondiente a la aplicacin en el Centro de
Juventud de Legans en 2006 vemos que los coeficientes entre los items relativos a la
misma dimensin adoptan valores en general superiores a los coeficientes de
correlacin entre los items de distintas dimensiones. Sin embargo, observamos algunas
excepciones, sobre todo en los items pertenecientes a la dimensin Instalaciones, pues
los coeficientes entre el item Limpieza de las instalaciones y los items Seguridad y
Confort de las instalaciones (0,391 y 0,385, respectivamente) son menores que los
coeficientes entre el tem Limpieza y varios de los items de las otras dimensiones (por
ejemplo, el coeficiente entre Limpieza y Motivacin del personal es 0,412). Los
coeficientes entre los items de la dimensin Personal son todos mayores que los
coeficientes de estos items con los de las otras dimensiones. Pero en las correlaciones
entre los items de la dimensin Trmites tambin observamos algunos coeficientes que
poseen menor valor que el que arroja la correlacin con otros items pertenecientes a
168
otras dimensiones: as, por ejemplo, el tem Horarios de atencin para realizar los
trmites correlaciona con los items Profesionalidad y Comunicacin de la dimensin
Personal (0,615 y 0,526, respectivamente) ms de lo que correlaciona con Rapidez y
Comodidad de los trmites (0,526 y 0,372, respectivamente).
Tabla 4.34: Correlaciones entre los items QPSC en el caso Centro de Juventud de
Legans 2006
Items
1
2
3
4
5
6
7
8
9
10
11
1
0,585
0,503
0,462
0,391
0,497
0,350
0,385
0,288
0,364
0,459
0,337
0,221
0,189
0,440
0,312
0,384
0,101
0,338
0,306
0,290
0,728
0,412
0,221
0,296
0,308
0,316
0,687
0,735
0,453
0,257
0,332
0,314
0,328
0,649
0,684
0,711
10
0,258
0,050
0,207
0,214
0,269
0,468
0,615
0,455
0,526
11
0,409
0,235
0,321
0,188
0,293
0,383
0,574
0,543
0,621
0,526
12
0,454
0,251
0,307
0,174
0,317
0,335
0,542
0,457
0,508
0,372
0,779
12
Todas las correlaciones son estadsticamente significativas al nivel 0,01(bilateral), excepto las
subrayadas
1: Limpieza; 2: Accesibilidad; 3: Conservacin; 4: Seguridad; 5: Confort; 6: Simpata;
7: Profesionalidad; 8: Motivacin; 9: Comunicacin; 10: Horario; 11:Rapidez; 12: Comodidad
Tabla 4.35: Correlaciones entre los items QPSC en el caso Centro de Juventud de
Legans 2008
Items
1
2
3
4
5
6
7
8
9
10
11
1
0,893
0,820
0,822
0,841
0,822
0,812
0,887
0,835
0,822
0,874
0,489
0,514
0,469
0,497
0,456
0,500
0,507
0,538
0,527
0,449
0,884
0,510
0,541
0,531
0,558
0,483
0,867
0,866
0,593
0,617
0,554
0,601
0,559
0,778
0,757
0,840
10
0,516
0,587
0,556
0,457
0,543
0,514
0,529
0,505
0,546
11
0,537
0,576
0,570
0,514
0,553
0,573
0,602
0,564
0,540
0,783
12
0,474
0,533
0,554
0,493
0,513
0,533
0,573
0,513
0,505
0,805
0,874
12
Observando ahora las correlaciones entre items en el caso del Centro de Jvenes de La
Corua en 2006, vemos de nuevo que, en general, las correlaciones entre los items de
una misma dimensin son mayores que las correlaciones entre items de distintas
dimensiones. Este hecho se produce sin excepciones en el caso de los items relativos al
Personal, pero presenta algunas en el caso de los items de las otras dos dimensiones.
As, observamos por ejemplo que el valor de la correlacin entre el tem Accesibilidad y
Confort de las instalaciones (0,261) es inferior al valor de la mayor parte de las
correlaciones entre los items de las Instalaciones y los items de las otras dos
dimensiones. Tambin podemos apreciar que las correlaciones entre los items Rapidez y
Comodidad de los trmites y el tem Horarios de los trmites presentan valores (0,404 y
0,442, respectivamente) inferiores a los que arroja la correlacin entre estos tems y
algunos de las otras dos dimensiones (por ejemplo, la correlacin entre Comodidad de
170
los trmites y Motivacin del personal arroja un valor de 0,482 y la correlacin entre
Rapidez de los trmites y Profesionalidad del personal ofrece un valor de 0,502).
Tabla 4.36: Correlaciones entre los items QPSC en caso Centro de Jvenes de
La Corua 2006
Items
1
2
3
4
5
6
7
8
9
10
11
1
0,432
0,543
0,482
0,432
0,364
0,545
0,401
0,261
0,533
0,519
0,418
0,334
0,361
0,278
0,251
0,370
0,360
0,335
0,315
0,278
0,722
0,407
0,333
0,336
0,367
0,272
0,703
0,811
0,339
0,326
0,317
0,322
0,219
0,707
0,749
0,786
10
0,344
0,306
0,228
0,246
0,129
0,296
0,342
0,305
0,329
11
0,366
0,340
0,383
0,342
0,306
0,456
0,435
0,469
0,482
0,404
12
0,354
0,389
0,364
0,323
0,321
0,434
0,502
0,488
0,455
0,442
12
0,678
Todas las correlaciones son estadsticamente significativas al nivel 0,01( bilateral) excepto la subrayada
1: Limpieza; 2: Accesibilidad; 3: Conservacin; 4: Seguridad; 5: Confort; 6: Simpata;
7: Profesionalidad; 8: Motivacin; 9: Comunicacin; 10: Horario; 11:Rapidez; 12: Comodidad
el tem Comodidad de los trmites y el tem Rapidez de los Trmites (0,518) es inferior
al valor de la correlacin entre este ltimo tem y los items Simpata, Profesionalidad y
Motivacin del personal (0,580, 0,639 y 0,684, respectivamente).
Tabla 4.37: Correlaciones entre los items QPSC en caso Centro de Jvenes de
La Corua 2008
Items
1
2
3
4
5
6
7
8
9
10
11
1
0,425
0,607
0,585
0,566
0,428
0,617
0,507
0,538
0,679
0,474
0,521
0,395
0,549
0,418
0,449
0,620
0,440
0,530
0,490
0,495
0,765
0,542
0,416
0,550
0,444
0,516
0,721
0,830
0,593
0,410
0,591
0,502
0,511
0,721
0,784
0,789
10
0,357
0,392
0,398
0,312
0,462
0,431
0,475
0,426
0,456
11
0,524
0,513
0,601
0,455
0,605
0,627
0,659
0,681
0,686
0,599
12
0,490
0,434
0,618
0,413
0,598
0,580
0,639
0,684
0,641
0,518
0,842
12
En definitiva, el estudio de las correlaciones entre los items de la escala QPSC en todas
las aplicaciones aqu contempladas muestra que el valor de los coeficientes que las
expresan suele ser mayor entre los items pertenecientes a una misma dimensin que
entre los items pertenecientes a dimensiones diferentes. Pero tambin podemos observar
que si bien este patrn general se cumple siempre en el caso de las correlaciones entre
los items de la dimensin Personal, presenta bastantes excepciones en el caso de las
correlaciones entre los items de las dimensiones Instalaciones y Trmites, pues con
cierta frecuencia observamos coeficientes cuyo valor es inferior al que arrojan las
correlaciones entre items de dimensiones diferentes. Este fenmeno se produce con
mayor frecuencia en el caso de los items pertenecientes a la dimensin Instalaciones que
en el caso de los items de la dimensin Trmites y tiene lugar, aunque en diferente
172
medida, en todas las aplicaciones de la escala QPSC consideradas. Cabe aadir aqu que
lo prolijo de los datos que acabamos de comentar es una de las razones que hace
recomendable la realizacin de un anlisis factorial para analizar y estudiar mejor estas
matrices de correlaciones.
Tabla 4.38: Valores perdidos en los items QPSC en las encuestas de los servicios
Universidad Popular (UP) y Escuela de Msica (EM)
N valores perdidos
% valores perdidos
ITEMS
UP
UP
EM
EM
UP
UP
EM
EM
2003 2005 2004 2006 2003 2005 2004 2006
Limpieza
16
26
5,16
6,06
0,54
0,00
Accesibilidad
16
27
5,16
6,29
0,00
0,95
Conservacin
25
2,90
5,83
0,54
0,00
Seguridad
20
35
6,45
8,16
3,24
3,33
Confort
12
22
3,87
5,13
0,00
0,00
Simpata
10
18
3,23
4,20
2,16
0,48
Profesionalidad
21
2,58
4,90
3,78
3,81
Motivacin
10
22
10
3,23
5,13
3,24
4,76
Comunicacin
10
19
3,23
4,43
2,16
0,00
Horarios trmites
21
31
6,77
7,23
3,24
3,81
Rapidez trmites
20
33
6,45
7,69
3,78
2,86
Comodidad trmites
16
37
5,16
8,62
2,70
2,86
N muestral
310
429
185
210
100,00
100,00
100,00
100,00
14,00
26,33
4,52
6,14
2,12
1,90
3,92
4,00
Como puede verse, los porcentajes de los valores perdidos en el conjunto de items de la
escala alcanzan valores bajos, pues slo en el caso de la encuesta en la Universidad
Popular en 2005 superan el 5% en promedio. Tambin es destacable que se dan ms
173
valoran la comodidad o la rapidez del trmite (aunque s el horario para hacer los
trmites pertinentes si usaran alguna otra prestacin del servicio, y por eso lo valora un
porcentaje superior, como se ve en la tabla). Los conjuntos de items relativos a las
Instalaciones y al Personal ofrecen porcentajes de valores perdidos bastante semejantes
entre s en cada una de las aplicaciones en ambos servicios y es notable que en el caso
de la aplicacin en el Centro de Juventud de Legans en 2006 la magnitud de los valores
perdidos en todos los items es la menor de los cuatro casos ahora considerados. En
resumen, salvo en los items sealados relativos a los Trmites en los servicios del
municipio de La Corua, el porcentaje de valores perdidos indica que los items de la
escala tambin ahora ofrecen una alta capacidad informativa, ya que, como suceda en
las aplicaciones en el municipio de referencia, son muy pocos los usuarios que no los
contestan. Este resultado, como el relativo a los servicios socioculturales de referencia,
refuerza la factibilidad de la escala.
Tabla 4.39: Valores perdidos en los items QPSC en las encuestas en el Centro de
Juventud de Legans y en el Centro de Jvenes de La Corua
N valores perdidos
% valores perdidos
TEMS
CJ
CJ
CJ
CJ
CJ
CJ
CJ
CJ
Legans
Legans
Corua
Corua
Legans
Legans
Corua
Corua
2006
2008
2006
2008
2006
2008
2006
2008
Limpieza
2,17
3,85
0,96
3,38
Accesibilidad
11
2,17
4,81
1,68
4,64
Conservacin
10
2,17
3,85
1,68
4,22
Seguridad
25
16
3,26
4,81
6,00
6,75
Confort
11
2,17
3,85
1,68
4,64
Simpata
11
2,17
3,85
1,92
4,64
Profesionalidad
12
10
2,17
4,81
2,88
4,22
Motivacin
10
12
2,17
3,85
2,40
5,06
Comunicacin
12
2,17
3,85
1,92
5,06
Horarios trmites
24
19
2,17
4,81
5,76
8,02
Rapidez trmites
40
42
2,17
4,81
9,59
17,7
Comodidad trmites
55
37
2,17
5,77
13,19
15,6
N muestral
92
104
417
237
100,00
100,00
100,00
100,00
2,08
17,25
16,58
2,26
4,41
4,14
7,00
4,58
175
de la escala por debajo y por encima del primer y tercer cuartiles arrojan diferencias de
medias en cada uno de los items de la escala. El 25% de los sujetos que presentan las
puntuaciones menores en la escala tambin ofrecen una puntuacin media ms baja en
cada uno de los items, y el 25% de los sujetos que presentan las puntuaciones ms altas
en la escala tambin arrojan una puntuacin media ms alta en cada uno de los items.
Por tanto, existe una correspondencia entre segmentos de puntuaciones altas y bajas de
la escala QPSC y segmentos de puntuaciones altas y bajas en los items de sta. Todas
las diferencias entre unas y otras medias resultan estadsticamente significativas al nivel
= 0,01.
Gr1
Gr4
Gr1
Gr4
Gr1
Gr4
Gr1
Gr4
Gr1
Gr4
Gr1
Gr4
Gr1
Gr4
Gr1
Gr4
Gr1
Gr4
Gr1
Gr4
Gr1
Gr4
Gr1
Gr4
2006
2008
2006
2008
7,0
9,7
6,5
8,3
6,6
8,4
7,0
8,3
7,3
8,8
6,5
9,0
6,7
8,8
6,3
8,7
6,2
8,9
5,0
7,2
5,9
8,2
6,3
8,3
7,0
10,0
6,7
10,0
6,5
9,8
6,7
9,9
6,3
9,9
7,7
10,0
7,7
10,0
7,5
9,9
7,4
9,9
6,8
9,6
6,6
9,7
7,0
9,9
8,0
9,9
7,1
9,6
7,2
9,7
7,1
9,7
7,1
9,5
8,5
10,0
8,2
9,9
8,0
9,9
8,1
9,9
7,0
9,2
7,0
9,7
7,1
9,8
7,5
9,9
6,5
9,8
6,7
9,7
6,9
9,9
6,6
9,8
7,4
10,0
7,4
10,0
7,1
9,9
7,1
9,9
6,6
9,2
6,4
9,6
6,7
9,7
Todas las diferencias entre medias son estadsticamente significativas al nivel = 0,01
Gr1: Grupo 1; Gr4: Grupo 4; C.J. Legans: Centro de Juventud de Legans; C.J. La Corua: Centro de Jvenes de La
Corua
177
Los resultados de esta prueba con los datos de los servicios socioculturales de
los otros municipios de comparacin arroja unos resultados como los mostrados en la
tabla 4.41. A la vista de los resultados de la prueba de igualdad de medias con los datos
de estas encuestas, podemos concluir que en todos los casos existen diferencias
estadsticamente significativas entre las puntuaciones medias de los distintos items de la
escala en virtud de la correspondencia con el segmento inferior y superior (al primer y
tercer cuartil, respectivamente) de las puntuaciones medias de la escala en su conjunto.
Quienes puntan alto en los tems de la escala tambin puntan alto en la escala QPSC
y quienes puntan bajo en los items de la escala tambin puntan bajo en esta escala,
confirmndose as que todos los tems de la escala discriminan en la misma direccin
que la puntuacin total de la misma.
178
Tabla 4.42: Coeficientes de fiabilidad global y parcial obtenidos con los datos de los
servicios socioculturales de referencia
Fiabilidad parcial
Datos
Fiabilidad global
Items
Items
Items
QPSC
Instalaciones
Personal
Trmites
U. Popular 2003
0,874
0,829
0,944
0,853
U. Popular 2005
0,883
0,808
0,915
0,897
E. Msica 2004
0,912
0,857
0,930
0,863
E. Msica 2006
0,893
0,801
0,961
0,804
Como puede apreciarse, los coeficientes de fiabilidad para el conjunto de la escala son
notablemente superiores al valor de 0,70 generalmente aceptado para su lmite inferior
(Hair et al., 2001; Martnez Arias et al., 2006; Morales et al., 2003; Nunnally y
Berstein, 1994; Robinson, Shaver y Wrightsman, 1991), de manera que puede
concluirse que en las aplicaciones ahora consideradas la escala muestra una fiabilidad
muy buena. Y a la misma conclusin llegamos si observamos las que hemos
denominado fiabilidades parciales, aunque resulta evidente que la subescala formada
con los items relativos a la dimensin Personal arrojan valores del coeficiente
apreciablemente superiores a los que ofrecen las otras dos subescalas para todas las
aplicaciones de la escala QPSC contempladas ahora.
Por otra parte, como puede verse en el anexo 5, los valores del coeficiente no
presentan ganancias dignas de tener en cuenta si se eliminan los distintos items de la
escala, tomando sta en su conjunto, en los casos de las encuestas en los servicios
Universidad Popular en 2003 y en 2005 y en la Escuela de Msica en 2004 y 2006
(bien al contrario, la pauta general es que al suprimir cualquier tem el coeficiente alpha
disminuye en algunas centsimas). Se deduce de esto, obviamente, que es improcedente
retirar tem alguno de la escala QPSC en su versin global, porque se perdera fiabilidad
al hacerlo.
Cuando tomamos una a una las diferentes subescalas formadas con los items que
presuntamente conforman las distintas dimensiones de QPSC, en las encuestas
realizadas en estos servicios ahora considerados, los coeficientes de fiabilidad
correspondientes presentan, en general, un patrn semejante al observado para la escala
en su versin global, es decir, los coeficientes no presentan ganancias de valor si se
179
eliminan uno a uno los diferentes items que constituyen las diversas subescalas; y de
nuevo se aprecia que lo que sucede es lo contrario: alfa disminuye al retirar cualquier
tem. Generalmente, al retirar un tem la prdida de valor del coeficiente es muy leve
(del orden de una o dos dcimas, como mximo), pero hay algunos casos (vase anexo
5) en los que la disminucin del coeficiente es apreciable. Sucede esto, sobre todo, en
los casos en que se retiran los items Rapidez de los trmites y Comodidad de los
trmites y casi todos los items correspondientes a la dimensin Instalaciones en la
encuesta Universidad Popular 2003; cuando se retiran la mayor parte de los items
correspondientes a la dimensin Instalaciones en la encuesta Universidad Popular 2005;
cuando se retira el tem Conservacin de las instalaciones y los items Horarios de los
trmites y Agilidad de los trmites en la encuesta Escuela de Msica 2004; y cuando
se retiran los items Limpieza, Conservacin y Seguridad de la dimensin
Instalaciones y cuando se retira cualquiera de los items de la dimensin Trmites (sobre
todo cuando se retira el tem Rapidez de los trmites) en la encuesta Escuela de
Msica 2006. Esto no indica otra cosa que en todos estos casos resultara especialmente
improcedente suprimir determinados items de la escala, sin perjuicio de que observemos
que en los casos en los que se elimina un tem y eso produce una disminucin
considerable del coeficiente alfa de la subescala correspondiente este fenmeno est
relacionado con que habra una menor varianza de las puntuaciones escalares y una
mayor correlacin tem/total, o, dicho de otro modo, que cuanto menor es la correlacin
tem/total, mayor es la ganancia de fiabilidad de la escala al eliminar ese tem concreto
de ella.
Por otro lado, y habida cuenta de que la correlacin tem/total corregida (la
correlacin del tem con la suma de todos los dems, excepto l mismo) nos da noticia
de en qu medida unos y otros items tienen ms en comn, y en consecuencia colegir
que miden lo mismo que los dems (Morales et al., 2003, p. 81), la observacin de los
valores de la correlacin tem/total en el estudio de la fiabilidad de las distintas
aplicaciones de la escala QPSC en su versin global (todos los items) permite definir el
grado en que cada tem de la escala se refiere al mismo constructo medido. En este
sentido, puede percibirse que en trminos generales todos los items estn
considerablemente relacionados con el constructo calidad percibida, pues el valor de
la correlacin raramente desciende de 0,500, con frecuencia supera el valor de 0,600 y
en numerosas ocasiones alcanza o supera el valor de 0,700 (vase anexo 5). Resulta
destacable que los mayores valores de la correlacin tem/total los ofrecen casi siempre
180
los items relativos a la dimensin Personal, de lo cual podramos deducir que son los
que con ms fuerza tienen que ver con el constructo calidad percibida que
supuestamente mide la escala.
Abundando en lo anterior, puede procederse a la misma observacin en las
subescalas formadas por los conjuntos de items que presuntamente conforman las
dimensiones de la escala. Ahora encontramos (vase anexo 5) que los valores de las
correlaciones tem/total corregidas son algo superiores a los hallados para la escala
global, pues es raro que desciendan de 0,60 y muy frecuentemente superan 0,70 y aun
0,80. Y de nuevo resulta notable que los mayores valores de la correlacin tem/total
corresponden casi siempre a los items relativos a la dimensin Personal (valores por
encima de 0,80 e incluso por encima de 0,90), que nos lleva a concluir que estos items
se refieren a la dimensin Personal con ms fuerza (la miden mejor) que con la que
los otros items de la escala se refieren a la dimensin correspondiente.
Ahora procedemos a mostrar el mismo estudio de fiabilidad con los datos de las
encuestas realizadas en los servicios socioculturales de los otros municipios donde se ha
aplicado la escala. Los resultados del clculo del coeficiente de fiabilidad alpha para las
versin global de la escala QPSC y para las subescalas son los mostrados en la tabla
4.43.
Tabla 4.43: Coeficientes de fiabilidad global y parcial obtenidos con los datos de los
servicios socioculturales de comparacin
Fiabilidad
Fiabilidad parcial
Datos
global
Items
Items
Items
QPSC
Instalaciones
Personal
Trmites
Centro Juventud
0,885
0,783
0,901
0,779
Legans 2006
Centro Juventud
0,938
0,889
0,935
0,778
Legans 2008
Centro Jvenes
0,878
0,798
0,925
0,753
La Corua 2006
Centro Jvenes
0,934
0,853
0,929
0,851
La Corua 2008
182
0,823
Conservacin
0,860
Seguridad
0,811
Confort
0,798
Simpata
0,690
Profesionalidad
0,860
Motivacin
0,875
Comunicacin
0,779
Horarios trmites
0,945
Rapidez trmites
0,884
Comodidad trmites
0,917
Dimensin Instalaciones
0,822
Dimensin Personal
0,801
Dimensin Trmites
0,915
Total escala
0,838
Como puede verse en la tabla 4.44, los coeficientes de correlacin entre los
mismos items en los dos momentos de aplicacin de la escala arrojan valores altos,
oscilando entre 0,7 y 0,9, aproximadamente, en todos los casos. Esto significa que las
puntuaciones de los usuarios en la escala muestran una alta estabilidad, pues, incluso
183
transcurridos ms de 100 das entre una y otra ronda de encuestas, su percepcin de los
elementos de calidad del servicio (items) presenta escasa variacin (slo el tem
Simpata del personal presenta un coeficiente ligeramente por debajo de 0,7). Al utilizar
este coeficiente se ha vigilado que ni la naturaleza del servicio ni las formas de prestarlo
en lo que se refiere a Instalaciones, Personal y Trmites han experimentado variaciones
dignas de mencin.
Por consiguiente, y a la vista de los resultados de esta prueba de la fiabilidad de
la escala, podemos afirmar que efectivamente QPSC muestra una alta fiabilidad desde la
perspectiva de la estabilidad de la medida.
5,354
44,615
44,615
1,934
16,120
60,735
1,396
11,633
72,368
0,703
5,857
78,225
0,548
4,570
82,795
0,482
4,016
86,811
0,401
3,339
90,150
0,339
2,821
92,971
0,255
2,126
95,098
10
0,222
1,850
96,948
11
0,199
1,659
98,607
12
0,167
1,393
100,000
185
corregida
elemento
0,452
0,555
0,575
0,591
0,504
0,634
0,673
0,602
0,614
0,607
0,610
0,560
0,877
0,871
0,869
0,868
0,875
0,867
0,865
0,868
0,867
0,868
0,867
0,870
186
0,01 0,01 0,01 0,02 0,09 0,11 0,17 0,24 0,13 0,20
Conservacin
0,01 0,01 0,03 0,04 0,14 0,20 0,20 0,21 0,08 0,09
Seguridad
0,02 0,00 0,02 0,03 0,08 0,14 0,20 0,23 0,12 0,17
Confort
0,02 0,01 0,03 0,06 0,13 0,16 0,18 0,18 0,11 0,12
Simpata
0,01 0,00 0,00 0,00 0,02 0,04 0,10 0,17 0,23 0,43
Profesionalidad
0,00 0,00 0,00 0,00 0,02 0,04 0,08 0,17 0,23 0,44
Motivacin
0,01 0,00 0,00 0,01 0,01 0,05 0,10 0,18 0,22 0,42
Comunicacin
0,00 0,00 0,01 0,01 0,02 0,05 0,09 0,14 0,21 0,48
Horarios trmites
0,00 0,00 0,00 0,00 0,03 0,07 0,13 0,24 0,20 0,31
Rapidez trmites
0,01 0,00 0,01 0,01 0,03 0,07 0,11 0,19 0,21 0,35
Comodidad trmites
0,00 0,00 0,01 0,01 0,03 0,07 0,12 0,19 0,20 0,37
187
0,15
0,11
0,17
0,24
0,13
0,20
Conservacin
0,23
0,20
0,20
0,21
0,08
0,09
Seguridad
0,14
0,14
0,20
0,23
0,12
0,17
Confort
0,25
0,16
0,18
0,18
0,11
0,12
Simpata
0,03
0,04
0,10
0,17
0,23
0,43
Profesionalidad
0,03
0,04
0,08
0,17
0,23
0,44
Motivacin
0,03
0,05
0,10
0,18
0,22
0,42
Comunicacin
0,04
0,05
0,09
0,14
0,21
0,48
Horarios trmites
0,05
0,07
0,13
0,24
0,20
0,31
Rapidez trmites
0,06
0,07
0,11
0,19
0,21
0,35
Comodidad trmites
0,06
0,07
0,12
0,19
0,20
0,37
b5
2,07
a
0,93
Accesibilidad
-1,87
-1,19
-0,38
0,74
1,56
1,13
Conservacin
-1,52
-0,46
0,53
1,96
2,95
0,95
Seguridad
-1,90
-1,02
-0,13
0,93
1,67
1,17
Confort
-1,43
-0,48
0,42
1,54
2,61
0,90
Simpata
-1,96
-1,55
-1,03
-0,49
0,15
3,96
Profesionalidad
-1,93
-1,49
-1,03
-0,49
0,11
4,61
Motivacin
-1,89
-1,45
-0,99
-0,42
0,19
3,75
Comunicacin
-1,87
-1,47
-1,01
-0,55
0,05
3,84
Horarios trmites
-2,51
-1,72
-0,98
-0,05
0,74
1,57
Rapidez trmites
-2,33
-1,61
-1,00
-0,24
0,57
1,53
Comodidad trmites
-2,47
-1,78
-1,13
-0,32
0,51
1,39
188
189
muy
improbables),
la
precisin
de
la
medida
desciende
190
Opcin 1
Opcin 2
Opcin 3
Opcin 4
Opcin 5
Opcin 6
LIMPIEZA
ACCESIBILIDAD
CONSERVACIN
SEGURIDAD
CONFORT
SIMPATA
Figura 4.7: Funciones de Respuestas al tem de los seis primeros tems del test.
191
Opcin 1
Opcin 2
Opcin 3
Opcin 4
Opcin 5
Opcin 6
PROFESIONALIDAD
MOTIVACIN
COMUNICACIN
HORARIOS
RAPIDEZ
COMODIDAD
Figura 4.8: Funciones de Respuestas al tem de los seis ltimos tems del test
192
Figura 4.9: Funciones de informacin y de error tpico de medida del test completo.
Por consiguiente, el test, la escala QPSC, ofrece una estimacin muy adecuada del nivel
de rasgo de los sujetos con bajo nivel de rasgo, mientras que la medida se vuelve poco
precisa conforme el nivel de rasgo de los sujetos crece: el test no parece muy adecuado
para discriminar entre dos sujetos con un nivel de rasgo medio-alto y alto, pero
detectar con precisin a los sujetos que tengan niveles de rasgo por debajo de la media.
193
En cuanto a la bondad del ajuste del modelo a los datos desde un punto de vista
estadstico, los resultados son los mostrados en la tabla 4.50. Vemos que hay cuatro
tems (Conservacin de las instalaciones, Simpata, Profesionalidad y Motivacin del
personal) que arrojan valores de 2 estadsticamente significativos (p < 0,05) y que por
tanto no permiten concluir que en estos casos el modelo ajusta suficientemente bien a
los datos (rechazamos la hiptesis nula de igualdad entre modelo y datos). El conjunto
del test arroja igualmente un valor de 2 estadsticamente significativo, indicativo por
consiguiente de que el modelo utilizado no se ajusta bien a los datos provenientes de la
aplicacin de la escala QPSC.
Tabla 4.50 Bondad del ajuste del modelo MRG a los datos
TEMS
2
g.l.
p
Limpieza
37,706
36
0,391
Accesibilidad
31,027
35
0,660
Conservacin
76,281
32
0,000
Seguridad
33,327
35
0,549
Confort
43,292
35
0,159
Simpata
39,713
19
0,004
Profesionalidad
48,642
19
0,000
Motivacin
44,507
20
0,001
Comunicacin
32,008
21
0,058
Horarios trmites
32,032
27
0,231
Rapidez trmites
30,791
29
0,375
Comodidad trmites
28,214
30
0,559
477,540
338
0,000
Por su parte, el anlisis grfico de residuos entre las curvas que representan las
probabilidades observadas y tericas de elegir las distintas alternativas u opciones de
respuesta (1, 2, , 6) de los tems que componen QPSC muestran unos resultados no
del todo coincidentes con los resultados del estudio de la bondad del ajuste basado en
2. Hemos representado aqu solamente los grficos de las curvas de algunos tems que
en el anlisis estadstico mostraba desajuste entre datos y modelo (figuras 4.10 y 4.11).
En el anexo 6 pueden verse todos los dems grficos. En la mayora de los casos los
194
195
Figura 4.10:: Curvas terica y emprica de las distintas opciones del tem Conservacin
de las instalaciones en la aplicacin de la escala QPSC en la Universidad Popular
196
Figura 4.11: Curvas tericas y empricas de las opciones del item Profesionalidad del
Personal en la aplicacin de la escala QPSC en la Universidad Popular
197
4.5.
En este apartado se exponen los resultados del estudio de validez de la escala QPSC
llevado a cabo, mostrando las evidencias de validez basadas en tres criterios: contenido,
relacin con otras variables y estructura interna.
4,9
Trmites
4,4 4,5
1
2
A la vista estos resultados, la conclusin que podemos extraer es clara: los ndices de
representacin o relevancia sustentan consistentemente que el concepto de calidad
percibida del servicio tiene que ver fundamentalmente con las instalaciones, el
personal y la organizacin de trmites del servicio, pues las medias y las medianas,
tomadas como ndices de relevancia, son muy superiores al valor de corte mnimo que
hemos fijado para ambos estadsticos: 3,5 para la media y 3,0 para la mediana.
Para calcular los ndices de congruencia tem/objetivo, se ordenan primero los
datos adecuadamente segn provienen de las evaluaciones de los jefes de cada servicio
198
sociocultural, arrojando unos valores como los que se presentan en las tablas 4.52, 4.53
y 4.54.
199
Trmites
Limpieza
1,000
-0,500
-0,500
Accesibilidad
1,000
-0,500
-0,500
Conservacin
1,000
-0,500
-0,500
Seguridad
1,000
-0,500
-0,500
Confort
1,000
-0,500
-0,500
Simpata
-0,375
0,750
-0,375
Profesionalidad
-0,500
1,000
-0,500
Motivacin
-0,500
1,000
-0,500
Comunicacin
-0,475
0,950
-0,475
Horarios trmites
-0,500
-0,500
1,000
Rapidez trmites
-0,600
-0,150
0,750
Comodidad trmites
-0,475
-0,475
0,950
200
Como vemos en la tabla 4.56, los valores del coeficiente de validez son altos, lo cual
indicara que efectivamente las puntuaciones de la escala y las de la Valoracin Global
201
del Servicio estn correlacionan fuertemente y que, consiguientemente, hay una alta
correspondencia entre puntuar alto o bajo en la una y hacer lo propio en la otra. De
acuerdo con el principio de las evidencias de validez basadas en la relacin con un
criterio, podramos concluir que a la vista de estos resultados la escala QPSC posee en
estos casos estudiados una considerable validez.
Realizando la misma operacin con los datos de las encuestas realizadas en los
servicios socioculturales de los otros municipios considerados, el resultado es el
siguiente (tabla 4.57):
El valor del coeficiente en estos casos es semejante al hallado en los casos anteriores y
la consecuencia, por tanto, tambin lo es: todo apunta a un elevado grado de validez de
la escala QPSC en estas aplicaciones, segn el principio de las evidencias de validez
basadas en la relacin con un criterio.
Si hallamos el coeficiente de correlacin de Pearson entrevaloracin global del
servicio en el test y en el retest (datos de la biblioteca municipal de Guadarrama),
obtenemos un valor de 0,918. Con este coeficiente, usado como estimador general del
coeficiente de fiabilidad del criterio, podemos corregir la atenuacin en las relaciones
entre puntuaciones de QPSC y Valoracin Global del Servicio, de manera que, por
ejemplo, para el caso de la Universidad Popular en 2003, calculamos:
rV
xV y
rxy
rxx r yy
0 , 6811
= 0 , 7604
0 ,874 ( 0 , 918 )
Y procediendo de igual modo para el resto de los casos, obtenemos los siguientes
resultados (tablas 4.58 y 4.59):
202
203
Tabla 4.60: KMO y Prueba de esfericidad de Barlett en el AFE con los datos
de los servicios socioculturales de referencia
Estadsticos
U. Popular U. Popular E. Msica E. Msica
2003
2005
2004
2006
KMO
0,847
0,881
0,871
0,869
2 Test de Barlett
2038,98
2564,18
1431,35
1735,14
Grados de libertad
66
66
66
66
0,000
0,000
0,000
0,000
Tabla 4.61: Varianza total explicada con los datos de la Universidad Popular
Datos de 2003
Datos de 2005
Factor
%
%
%
%
Total
Total
varianza
acum.
varianza
acum.
1
5,069
42,244
42,244
5,435
45,292
45,292
2
2,005
16,707
58,952
1,750
14,584
59,876
3
1,549
12,911
71,863
1,305
10,871
70,747
4
0,671
5,593
77,456
0,780
6,503
77,250
5
0,633
5,278
82,735
0,549
4,573
81,823
6
0,495
4,124
86,859
0,485
4,045
85,868
7
0,436
3,634
90,493
0,416
3,470
89,339
8
0,391
3,256
93,750
0,364
3,037
92,376
9
0,253
2,109
95,858
0,280
2,336
94,711
10
0,206
1,717
97,575
0,257
2,140
96,852
11
0,153
1,271
98,846
0,204
1,698
98,549
12
0,138
1,154
100,000
0,174
1,451
100,000
204
Figura 4.12: Grficos de sedimentacin del AFE con los datos de la Universidad
Popular en 2003 y 2005
Podemos observar (tabla 5.4.3.2) que en los anlisis factoriales con los datos de las dos
aplicaciones de la escala en la Universidad Popular aparecen siempre tres factores, con
autovalores superiores a la unidad, que explican ms del 70% de la varianza total
(71,86% en el caso de la Universidad Popular en 2003 y 70,75% en el caso de la
Universidad Popular en 2005), lo cual puede interpretarse como que poseen una gran
potencia explicativa del constructo, pues apenas una cuarta parte de la varianza global
emprica de los items quedara sin explicar una vez encuadrados en los tres factores
enunciados. En los grficos de sedimentacin correspondientes (figura 4.12),
observamos cmo la pendiente suavemente ascendente de la lnea que va uniendo los
autovalores sufre un brusco cambio de inclinacin cuando llega al punto del factor tres,
corroborando, por tanto, lo apreciado numricamente en la tabla 4.61, en el sentido de
que son esos tres factores los que explican proporcionalmente mucha ms varianza que
los otros con autovalores inferiores a la unidad y los que conforman la estructura
dimensional subyacente.
205
En la tabla 4.62, construida con los datos de la matriz factorial sin rotar, apreciamos
que todos los items presentan cargas sobre el primer factor superiores a 0,30 como
mnimo, que es el criterio comnmente aceptado para concluir que un tem puede
incluirse dentro de un factor (Aron y Aron, 2001; Hair et al., 2001; Nunnaly y Berstein,
1995) y para que algunos autores concluyan que un test es bsicamente unidimensional
(Morales, 2000; Garca et al., 2000; Comrey, 1985).
206
207
Tabla 4.64: Matriz de estructura factorial con los datos de la Universidad Popular
en 2003 y 2005
Datos de 2003
Datos de 2005
ITEMS
Factor
Factor
1
2
3
1
2
3
Limpieza
0,315
0,684
0,353
0,243
0,460
-0,277
Accesibilidad
0,273
0,702
0,273
0,371
0,651
-0,421
Conservacin
0,257
0,817
0,275
0,318
0,814
-0,353
Seguridad
0,329
0,608
0,323
0,369
0,736
-0,399
Confort
0,200
0,596
0,184
0,330
0,729
-0,334
Simpata
0,880
0,380
0,396
0,738
0,367
-0,415
Profesionalidad 0,912
0,363
0,422
0,924
0,439
-0,509
Motivacin
0,900
0,369
0,388
0,857
0,382
-0,437
Comunicacin
0,902
0,294
0,399
0,852
0,402
-0,490
Horarios
0,390
0,304
0,699
0,515
0,477
-0,816
Rapidez
0,393
0,353
0,928
0,488
0,462
-0,891
Comodidad
0,315
0,313
0,805
0,448
0,424
-0,878
Por ltimo, la matriz de estructura de los anlisis factoriales con los datos de las dos
encuestas en la Universidad Popular (tabla 4.64) representa las correlaciones de los
items con los factores de la solucin rotada, y en ella se recogen tanto los efectos
directos del factor sobre el tem, como los efectos indirectos de otros factores a travs de
su correlacin con ese factor; es, por tanto, particularmente interesante en nuestro caso,
ya que presuponemos que los factores (dimensiones) que comprende la escala QPSC
estn relacionados entre s y ello debera implicar la observacin de correlaciones de
mayor entidad entre los factores tericos y los items correspondientes y correlaciones
ms bajas, pero apreciables, entre estos items y el resto de factores. Vemos, en efecto,
que en la matriz de estructura el primer factor aglutina las cuatro variables relativas al
Personal del servicio; el segundo factor comprende las cinco variables correspondientes
a las Instalaciones; y, finalmente, el tercer factor engloba las tres variables referidas a
los Trmites para usar el servicio. Slo encontramos algn problema para incluir al tem
Limpieza dentro del factor correspondiente en el caso de la matriz obtenida con los
datos de la encuesta de 2005, pues su peso factorial (0,460) es notablemente menor que
los pesos de los otros cuatro tems que se agrupan en el segundo factor y menor incluso
que los de otros tems de la escala en la columna de este factor, pero el hecho de que
esta variable presente pesos mucho menores en los otros dos factores nos lleva a
concluir que la Limpieza efectivamente satura en el factor Instalaciones.
208
Los resultados del AFE con los datos de la Escuela de Msica ofrecen cierta semejanza
con los de la Universidad Popular que acabamos de comentar, tal como puede
apreciarse en las tablas y grficos siguientes.
Tabla 4.65: Varianza total explicada con los datos de la Escuela de Msica
Datos 2004
Datos 2006
Factor
%
%
%
%
Total
Total
varianza
acum.
varianza
acum.
1
6,194
51,615
51,615
5,684
47,369
47,369
2
1,703
14,189
65,804
1,740
14,501
61,870
3
1,098
9,149
74,953
1,344
11,199
73,069
4
0,698
5,815
80,768
0,731
6,088
79,157
5
0,503
4,194
84,962
0,587
4,889
84,046
6
0,421
3,504
88,466
0,473
3,946
87,991
7
0,365
3,044
91,510
0,397
3,305
91,297
8
0,287
2,393
93,903
0,332
2,765
94,062
9
0,238
1,980
95,883
0,316
2,635
96,697
10
0,214
1,786
97,669
0,189
1,576
98,273
11
0,166
1,385
99,054
0,137
1,145
99,418
12
0,114
,946
100,000
0,070
,582
100,000
En la tabla 4.65 observamos que tambin aparecen tres factores, con autovalores
superiores a la unidad, que explican ms del 73% de la varianza total (74,95% en el caso
de 2004 y 73,07% en el caso de 2006), permitindonos interpretar tambin ahora que
tienen una gran potencia explicativa, pues apenas una cuarta parte de la varianza total de
209
los items quedara sin explicar una vez descontados esos tres factores. En los grficos de
saturacin correspondientes (figura 4.13), observamos que la pendiente de la lnea que
va uniendo los autovalores sufre un notable cambio de inclinacin cuando llega al punto
del factor tres, corroborando, por tanto, lo apreciado numricamente en la tabla 4.65, en
el sentido de que tambin ahora son esos tres factores los que explican
proporcionalmente mucha ms varianza que los otros factores y que son los que
conforman la estructura dimensional del constructo.
En la tabla 4.66, relativa a los datos de la matriz factorial sin rotar, apreciamos que
todos los items presentan saturaciones sobre el primer factor apreciablemente superiores
a 0,30, que ya hemos sealado que es el criterio comnmente aceptado para concluir
que un tem puede incluirse dentro de un factor y tambin que un test es bsicamente
unidimensional.
210
211
Si observamos la matriz de correlaciones entre los factores de los AFE practicados con
los datos de la Escuela de Msica (tabla 4.68), vemos de nuevo que los coeficientes
toman valores intermedios, indicativos de que los tres factores son diferentes pero
relacionados. Este resultado lo interpretamos asimismo como que efectivamente el
constructo calidad percibida presenta
Finalmente, en la matriz de estructura del AFE realizado con los datos de la Escuela de
Msica (tabla 4.69) encontramos que, en el caso de los correspondientes a la encuesta
de 2004, el primer factor aglutinara a los tems relativos al Personal, el segundo a los
tems relativos a las Instalaciones y el tercer factor a los relativos a los Trmites,
mientras que en el caso del anlisis practicado con los datos de 2006 se reproducira la
relacin entre factores y variables que hemos observado en el caso del AFE realizado
con los datos de la Universidad Popular. Ahora encontramos tambin algn problema
para incluir al tem Accesibilidad dentro del factor Instalaciones en el caso de la matriz
obtenida con los datos de la encuesta de 2004, pues su peso factorial (0,570) es menor
que los de los otros cuatro tem que se agrupan en el primer factor y menor incluso que
los de otros tems de la escala en la columna de este factor, pero el hecho de que este
tem presente pesos mucho menores en los otros dos factores nos lleva a concluir, como
lo hicimos con el item Limpieza en el caso del anlisis con los datos de la Universidad
212
Popular, que la Accesibilidad forma parte asimismo del factor relativo a las
Instalaciones.
En definitiva, el anlisis factorial exploratorio practicado con los datos de las cuatro
encuestas realizadas en los dos servicios socioculturales de referencia ofrece unos
resultados coherentes con la teora: el constructo calidad percibida posee tres
dimensiones (factores), cada una conformada por el correspondiente conjunto de
variables hipotetizado. En la tabla 4.70 mostramos el resumen de los principales
indicadores del AFE realizado con los datos de las cuatro encuestas efectuadas en los
servicios socioculturales de referencia.
2005
2004
2006
N factores extrados
N factores con
autovalor inicial >1
71,863
70,747
74,953
73,069
0,389
0,387
0,520
0,461
% varianza acumulado
de los 3 primeros
factores
Valor mnimo de
saturacin de tem en la
matriz factorial
Identificacin de 3
factores en la matriz de
estructura
Una vez hallados esos resultados con el AFE realizado con los datos de las encuestas de
los servicios socioculturales de referencia, procedemos a mostrar el realizado tambin
con los datos de las encuestas practicadas en los servicios socioculturales considerados
de los ayuntamientos de Legans y La Corua, con el fin de comprobar si en estos se
reproduce la misma estructura factorial de la escala QPSC hallada en el anlisis factorial
practicado con los datos de las encuestas en los servicios socioculturales de referencia.
213
El AFE se lleva a cabo con las mismas especificaciones antes apuntadas para el AFE en
los servicios de referencia.
575,157
1365,125
2124,090
1905,912
Grados de libertad
66
66
66
66
0,000
0,000
0,000
0,000
Tambin ahora comprobamos primero que el anlisis factorial en todos los casos es
pertinente, puesto que el estadstico KMO alcanza un valor cercano o superior a 0,85, y
el test de esfericidad de Barlett resulta estadsticamente significativo (tabla 4.71).
Mostramos seguidamente los resultados del AFE con los datos obtenidos en el Centro
de Juventud de Legans.
Tabla 4.72: Varianza total explicada con los datos del Centro de Juventud
de Legans
Datos de 2006
Datos de 2008
Factor
%
%
%
%
Total
Total
varianza
acum.
varianza
acum.
1
5,478
45,649
45,646
7,083
65,024
65,024
2
1,740
14,497
60,146
1,585
13,207
78,232
3
1,092
9,096
69,242
1,135
9,461
87,692
4
0,768
6,396
75,638
0,312
2,603
90,295
5
0,627
5,228
80,866
0,229
1,908
92,203
6
0,556
4,269
85,495
0,214
1,785
93,988
7
0,463
3,861
89,356
0,179
1,495
95,482
8
0,371
3,088
92,444
0,142
1,181
96,663
9
0,304
2,536
94,980
0,120
1,003
97,666
10
0,269
2,242
97,222
0,113
0,945
98,612
11
0,182
1,518
98,740
0,096
0,800
99,411
12
0,151
1,260
100,0
0,071
0,589
100,0
214
Figura 4.14: Grficos de sedimentacin del AFE con los datos de Centro de
Juventud de Legans en 2006 y 2008
Observamos ahora (tabla 4.72) que en los AFE realizado con los datos obtenidos en el
Centro de Juventud de Legans se extraen tres factores con autovalores iguales o
superiores a la unidad, que explican una varianza que oscila entre casi el 70% y el 88%
de la total emprica (69,24% en el caso de 2006 y 87,69% en el caso de 2008). La
conclusin es la misma que hemos apuntado en el AFE en los servicios socioculturales
de referencia: los tres factores poseen un gran poder explicativo, porque dejan
solamente una pequea parte de la varianza total sin explicar. En los grficos de
sedimentacin correspondientes (figura 4.14) se observa el pronunciado cambio de
inclinacin que experimenta la lnea que une los autovalores cuando se llega al punto
correspondiente al factor 3 (especialmente en el caso del AFE con los datos de 2008),
corroborndose as la estructura dimensional de tres factores prevista.
215
Vemos tambin (tabla 4.73) que todos los items saturan sobre el primer factor en la
matriz factorial por encima del valor 0,30 (y aun por encima de 0,40), dato que permite
entender que los todos los tems pertenecen a un factor y que el test es esencialmente
unidimensional.
En la matriz de configuracin obtenida con los datos del Centro de Juventud de Legans
en 2006 (tabla 4.74) observamos que se pueden identificar claramente tres factores, cada
uno de los cuales comprende los tems previstos en la teora. Existe sin embargo una
excepcin con el tem Horarios de los trmites, que presenta una saturacin con valor
216
Por su parte, vemos que las correlaciones entre los factores (tabla 4.75) oscilan dentro
de un rango ms amplio que el que observamos entre las correlaciones de los factores
del AFE practicado con los datos de los servicios socioculturales del ayuntamiento de
referencia, pero que presentan una magnitud que entendemos que tambin ahora permite
concluir que efectivamente constituyen factores diferentes pero relacionados.
Los resultados del AFE con los datos del Centro de Jvenes de La Corua tambin
ofrecen cierta semejanza con los del Centro de Juventud que acabamos de comentar, tal
como puede apreciarse en las tablas que se muestran seguidamente.
218
Figura 4.15: : Grficos de sedimentacin del AFE con los datos de Centro
de Jvenes de La Corua en 2006 y 2008
Observamos de nuevo (tabla 4.77) que en los AFE realizado con los datos obtenidos en
el Centro de Jvenes de La Corua se extraen tres factores con autovalores iguales o
superiores a la unidad, que explican una varianza que oscila entre casi el 68% y el 76%
de la total emprica (67,69% en el caso de 2006 y 75,57% en el caso de 2008). La
conclusin es la misma que hemos apuntado en el AFE realizado con los datos
obtenidos en el Centro de Juventud de Legans y en los servicios socioculturales de
referencia: los tres factores poseen un gran poder explicativo, ya que dejan solamente
una pequea parte de la varianza total sin explicar. En los grficos de sedimentacin
correspondientes (figura 4.15) se observa el notabale cambio de inclinacin que
experimenta la lnea que une los autovalores cuando se llega al punto correspondiente al
factor 3, corroborndose as la estructura dimensional de tres factores prevista.
219
Observamos ahora tambin (tabla 4.78) que todos los items saturan sobre el primer
factor en la matriz factorial por encima del valor 0,40, especialmente en el caso de 2008,
lo que permite concluir que los todos los tems pertenecen a un factor y que el test es
bsicamente unidimensional.
220
En las matrices de configuracin del AFE realizado con los datos del Centro de Jvenes
de La Corua en 2006 y 2008 (tabla 4.79) observamos una clara correspondencia entre
los factores hallados y los items relacionados con las dimensiones que tericamente los
agrupan. As, en la columna del primer factor en el AFE con los datos de 2006
observamos pesos muy elevados para los item relativos al Personal, en la columna del
segundo factor para los items relativos a las Instalaciones y en la columna del tercer
factor para los items relativos a los Trmites. Slo en el caso del item Accesibilidad
vemos una saturacin ms baja en el segundo factor (el que identificamos con la
dimensin Instalaciones), pero en todo caso superior a las correspondientes a los otros
dos factores. En la matriz de configuracin del AFE con los datos de 2008 observamos
tambin una muy buena correspondencia entre cargas factoriales de los items y las
dimensiones tericas en las que se encuadran, aunque apreciamos en la columna del
segundo factor (que identificamos con la dimensin Instalaciones) un caso, el de la
saturacin del item Limpieza, con un valor (0,522) que no resulta tan elevado como las
de los otros items englobados en la dimensin terica correspondiente (Instalaciones) en
comparacin con la saturacin de ese item en la columna del primer factor (0,358),
aunque en cualquier caso es notablemente superior a sta.
Por su parte, el rango dentro del cual oscilan las correlaciones entre los factores (tabla
54.80) tiene valores algo superiores, pero de menor amplitud, que el que observamos
entre las correlaciones de los factores del AFE practicado con los datos del Centro de
Juventud de Legans y tambin del realizado con los datos de los servicios
socioculturales de referencia, pero que presentan una magnitud que entendemos que
tambin ahora permite concluir que efectivamente constituyen factores diferentes pero
relacionados.
221
En las matrices de estructura factorial (tabla 4.81) podemos identificar tres factores, que
casi siempre engloban los items previstos en la teora para las dimensiones de la escala
(Instalaciones, Personal y Trmites). Sin embargo, de nuevo en un caso encontramos
alguna dificultad para vincular un tem con el factor correspondiente: la saturacin
correspondiente al tem Horarios de los trmites (0,533) es inferior a la que presentan
otros items en la columna del tercer factor (que agrupa ntidamente los otros dos que
conforman tericamente el factor Trmites), aunque es superior a la que presenta este
tem en las columnas de los otros dos factores.
A modo de resumen, mostramos en la tabla 4.82 un cuadro sinttico con los
principales indicadores del AFE realizado con los datos de las cuatro encuestas
efectuadas en los servicios socioculturales de comparacin.
222
% varianza acumulado de
los 3 primeros factores
69,242
87,692
67,689
75,566
0,430
0,734
0,463
0,590
Identificacin de 3 factores
en la matriz de estructura
En definitiva, el AFE realizado con los datos obtenidos en los servicios socioculturales
municipales de Legans y La Corua pone de manifiesto que, con la salvedad de las
ms bien leves incongruencias antes sealadas, la estructura factorial de la escala QPSC
hallada en los servicios socioculturales del ayuntamiento de referencia se reproduce y
mantiene en estas aplicaciones de comparacin. Entendemos que los problemas de
correspondencia de algn tem con su factor terico previsto no son de la suficiente
entidad como para poner en tela de juicio la validez estructural de la escala.
Hemos considerado especialmente los valores que toman los coeficientes entre
las variables del modelo (observables y latentes) para comprobar nuestros supuestos
sobre la estructura de la escala (tablas 4.83 y 4.84). En este sentido, hay que sealar que
en ninguna de las aplicaciones con el modelo utilizado existen casos Heywood, es
decir, parmetros que toman valores impropios (varianzas negativas o correlaciones >1
<-1) y que todos los coeficientes resultan estadsticamente significativos (p<0,05). Los
principales estadsticos de ajuste se muestran en la tabla 4.85 (en la que se han omitido
los estadsticos de los modelos saturado y de independencia).
UP
03
UP EM EM UP
05 04 06 03
Limpieza
Accesibil.
Conservac.
Seguridad
Confort
UP EM EM UP
05 04 06 03
Simpata
Profesion.
Motivacin
Comunic.
UP EM EM
05 04 06
Horarios
Rapidez
Comodidad
224
Las figuras 4.16, 4.17, 4.18 y 4.19 ilustran las representaciones grficas del
modelo estructural con las soluciones no estandarizada y estandarizada en el caso del
AFC con los datos de la encuesta en la Universidad Popular en 2005 (el que presenta un
mejor ajuste) y con los datos de la encuesta de la Escuela de Msica en 2004 (el ms
problemtico a efectos confirmatorios).
225
Figura 4.16: Diagrama del modelo del AFC con datos Universidad
Popular 2005. Solucin no estandarizada
226
Figura 4.17: Diagrama del modelo del AFC con datos Universidad
Popular 2005. Solucin estandarizada
227
Figura 4.18: Diagrama del modelo del AFC con datos Escuela
Msica 2004. Solucin no estandarizada
228
Figura 4.19: Diagrama del modelo del AFC con datos Escuela
Msica 2004. Solucin estandarizada
229
NPAR
27
27
27
27
CMIN
90,630
94,949
170,173
101,331
DF
51
51
51
51
P
0,053
0,001
0,000
0,000
RMR, GFI
Modelo especificado
Datos U.P. 2003
Datos U.P. 2005
Datos E.M. 2004
Datos E.M.2006
RMR
0,212
0,108
0,181
0,099
GFI
0,943
0,960
0,865
0,928
AGFI
0,913
0,939
0,794
0,889
PGFI
0,616
0,628
0,566
0,607
CMIN/DF
1,777
1,862
3,337
1,987
NFI
Delta1
0,764
0,963
0,894
0,943
RFI
rho1
0,694
0,953
0,862
0,926
IFI
Delta2
0,881
0,983
0,923
0,971
TLI
rho2
0,838
0,978
0,899
0,962
RMSEA
Modelo especificado
Datos U.P. 2003
Datos U.P. 2005
Datos E.M. 2004
Datos E.M.2006
RMSEA
0,054
0,049
0,113
0,069
LO 90
0,035
0,033
0,094
0,049
HI 90
0,071
0,064
0,132
0,088
PCLOSE
0,034
0,531
0,000
0,059
Modelo especificado
CFI
0,875
0,983
0,922
0,971
con un valor de 0,049 y una pclose con un valor superior al mnimo aconsejado de 0,05
(Jreskog y Srborm, 1996). Inversamente, es en el caso de la Escuela de Msica en
2004 donde, en general, los ndices muestran un peor ajuste modelo/datos.
Por otro lado, los coeficientes correspondientes nos muestran pesos notables
entre las variables observables y las latentes (tabla 4.83) y, lo que es ms importante, los
coeficientes entre las variables latentes (factores), ni muy altos ni muy bajos (tabla
4.84), nos indican que, efectivamente, Instalaciones, Personal y Trmites, son
dimensiones diferentes, pero relacionadas entre s, del constructo que denominamos
calidad percibida. El anlisis factorial confirmatorio practicado pone de relieve, con
razonable consistencia, que efectivamente la escala para medir la calidad percibida del
servicio, en las aplicaciones en los servicios socioculturales de referencia, comprende
tres dimensiones distintas pero vinculadas entre s, tal como pareca indicar el anlisis
factorial exploratorio.
Veamos ahora los resultados del AFC con los datos provenientes de las encuestas
llevadas a cabo en los servicios socioculturales de los municipios de comparacin. En
primer lugar, se muestran los valores que toman los coeficientes entre las variables
observables y latentes para comprobar nuestros supuestos sobre la estructura de la
escala (tablas 4.86 y 4.87). Tambin hacemos notar aqu que en ninguna de las
aplicaciones con el modelo utilizado existen casos Heywood y que todos los
coeficientes resultan estadsticamente significativos (p<0,05). Los principales
estadsticos de ajuste se muestran posteriormente en la tabla 4.88 (en la que se han
omitido asimismo los estadsticos de los modelos saturado y de independencia).
232
tems
CJL CJL CJC CJC CJL CJL CJC CJC CJL CJL CJC CJC
06 08 06 08 06 08 06 08 06 08 06 08
Limpieza
Accesibil.
Conservac.
Seguridad
Confort
Simpata
Profesion.
Motivacin
Comunic.
Horarios
Rapidez
Comodidad
Tabla 4.87: Correlaciones entre variables latentes del AFC en los servicios de
comparacin
Variables latentes
INSTALACIONES
PERSONAL
TRMITES
Variabs. CJL CJL CJC CJC CJL CJL CJC CJC CJL CJL CJC CJC
latentes 06 08 06 08 06 08 06 08 06 08 06 08
INSTL. 1,00 1,00 1,00 1,00 0,54 0,60 0,56 0,75 0,50 0,62 0,61 0,74
PERS. 0,54 0,60 0,56 0,75 1,00 1,00 1,00 1,00 0,71 0,64 0,68 0,79
TRM. 0,50 0,62 0,61 0,74 0,71 0,64 0,68 0,79 1,00 1,00 1,00 1,00
CJL: Centro de Juventud de Legans; CJC: Centro de Jvenes de La Corua
233
Tabla 4.88: Estadsticos de ajuste del AFC con los datos de los servicios de
comparacin
Estadsticos de ajuste del AFC
CMIN
Modelo especificado
Datos Enc. CJL 2006
Datos Enc. CJL 2008
Datos Enc. CJC 2006
Datos Enc. CJC 2008
NPAR
27
27
27
27
CMIN
93,100
77,034
124,533
108,093
DF
51
51
51
51
P
0,000
0,011
0,000
0,000
RMR
0,132
0,084
0,080
0,098
GFI
0,856
0,888
0,943
0,911
AGFI
0,780
0,828
0,913
0,864
PGFI
0,560
0,580
0,617
0,596
CMIN/DF
1,825
1,510
2,442
2,119
RMR, GFI
Modelo especificado
Datos Enc. CJL 2006
Datos Enc. CJL 2008
Datos Enc. CJC 2006
Datos Enc. CJC 2008
NFI
Delta1
0,847
0,946
0,942
0,938
RFI
rho1
0,802
0,931
0,925
0,920
IFI
Delta2
0,924
0,981
0,965
0,966
TLI
rho2
0,900
0,985
0,954
0,956
RMSEA
Modelo especificado
Datos Enc. CJL 2006
Datos Enc. CJL 2008
Datos Enc. CJC 2006
Datos Enc. CJC 2008
RMSEA
0,096
0,072
0,065
0,078
LO 90
0,065
0,035
0,051
0,057
HI 90
0,127
0,103
0,080
0,098
PCLOSE
0,011
0,140
0,041
0,014
Modelo especificado
CFI
0,920
0,981
0,965
0,966
En los resultados del AFC con los datos obtenidos en los servicios socioculturales de
comparacin (tabla 4.88), vemos que el estadstico ji-cuadrado corregido arroja valores
dentro del rango indicativo de un ajuste aceptable en todos los casos (inferiores a 3, e
incluso en el caso de los datos de las encuestas en el Centro de Juventud de Legans,
inferiores a 2). Continuando con el estadstico RMR (residuo cuadrtico medio), que
como se ha dicho debe arrojar deseablemente valores de 0,5 o inferiores para indicar un
buen ajuste, vemos que en los cuatro casos considerados los valores son satisfactorios.
Si atendemos al ndice de bondad de ajuste GFI, observamos valores de que nos indican
234
un ajuste algo pobre en los dos casos relativos a los datos de las encuestas en el Centro
de Juventud de Legans, ya que valores inferiores a 0,90 de este ndice hacen pensar
que el ajuste no sea aceptable. El ndice GFI corregido, AGFI, tambin arroja valores
inferiores al valor mnimo aconsejado de 0,90 en estos dos casos y asimismo en el caso
de los datos de la encuesta en el Centro de Jvenes de La Corua en 2008 (aunque no
descienden en general demasiado por debajo de 0,90).
Los ndices de ajuste incremental y parsimonia, de comparacin entre el modelo
nulo y el propuesto, arrojan casi siempre valores aceptables (0,90 o superior): vemos
que el NFI o el derivado del mismo RFI muestran valores indicativos de buen ajuste en
todos los casos salvo en el relativo a los datos de la encuesta en el Centro de Juventud
de Legans en 2006, aunque ya hemos sealado la relativa debilidad estos ndices
porque favorecen la adopcin de modelos sobreparametrizados. El IFI (ndice de ajuste
incremental), que s tiene en cuenta los grados de libertad del modelo, y el TLI arrojan
unos valores indicativos de un ajuste aceptable en todos los casos considerados.
El estadstico RMSEA, por su parte, con un valor inferior al mximo aconsejado
de 0,08, nos indica tambin un grado de ajuste aceptable en todos los casos salvo en el
del Centro de Juventud de Legans en 2006, pues en ste es superior, aunque
ligeramente, a dicho valor aconsejado.
Por otra parte, los coeficientes entre las variables observables y las latentes
muestran pesos notables y los coeficientes entre las variables latentes arrojan valores
que, en general, no son ni muy altos ni muy bajos (si bien en el caso de los datos de la
encuesta en el Centro de Jvenes de La Corua de 2008 son ms elevados que en el
resto: en torno a 0,70), que nos indican de nuevo que, efectivamente, Instalaciones,
Personal y Trmites, son dimensiones diferentes, pero relacionadas entre s, del
constructo que denominamos calidad percibida. El anlisis factorial confirmatorio
practicado pone de relieve de modo bastante consistente que, en los casos de los datos
relativos a los servicios socioculturales de comparacin, efectivamente la escala para
medir la calidad percibida del servicio comprende tres dimensiones distintas pero
vinculadas entre s, tal como indicaba el anlisis factorial exploratorio correspondiente.
En definitiva, el AFC llevado a cabo tanto con los datos de los servicios
socioculturales de referencia como con los de comparacin resulta en trminos
generales satisfactorio a los efectos confirmatorios perseguidos, corroborando la solidez
de la estructura factorial tridimensional del constructo calidad percibida que habamos
observado con el AFE previamente practicado.
235
Simpata del personal y Horarios de los trmites ( (211) = 0,912 versus (212) = 0,801y (321) =
0,715 versus (322 ) = 0,826, respectivamente) en el caso de los estandarizados.
236
0,786
0,615
1,967
0,558
0,692
y
1,366
( 2) =
0,465
0,589
1,289
0,819
1,594
237
238
(1)
1,083
= 0,553
1,917
0,578
0,784
y
1,698
( 2)
0,562
0,658
1,364
0,796
1,439
239
240
(1)
1,086
= 0,560
1,609
0,628
0,799
y
1,542
( 2)
0,560
0,628
1,609
0,799
1,542
241
0,994
0,530
1,582
0,585
0,771
y
1,491
( 2) =
0,530
1,582
0,585
0,771
1,491
Como puede verse, tambin los coeficientes estandarizados son iguales en ambos
grupos. Es este un resultado lgico, ya que los estimadores estandarizados (los
coeficientes ) se igualan cuando el modelo est completamente restringido y las
varianzas pronosticadas para ambos grupos son idnticas (y, por tanto, su cociente es la
unidad). Lo cual no implica, sin embargo, que esas predicciones se ajusten o no a las
matrices originales de cada uno de los grupos, que es lo que en definitiva determina la
idoneidad del modelo.
242
NPAR
54
45
39
27
24
CMIN
199,473
233,747
254,591
333,938
4722,246
DF
102
111
117
129
132
P
0,000
0,000
0,000
0,000
0,000
RMR, GFI
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
RMR
0,127
0,157
0,205
0,213
1,114
GFI
0,951
0,943
0,938
0,919
0,330
AGFI
0,925
0,920
0,917
0,903
0,208
PGFI
0,662
0,671
0,703
0,760
0,279
TLI
rho2
0,973
0,968
0,966
0,954
0,000
RMSEA
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
RMSEA
0,039
0,042
0,043
0,050
0,236
LO 90
0,031
0,034
0,036
0,044
0,230
243
HI 90
0,047
0,050
0,051
0,057
0,241
PCLOSE
0,989
0,960
0,934
0,452
0,000
CMIN/DF
1,956
2,106
2,176
2,589
35,775
CFI
0,979
0,973
0,970
0,955
0,000
Tabla 4.98: Significacin estadstica del cambio en 2 entre los distintos modelos
del AFC multigrupo en la Universidad Popular 2003-2005
Modelo
CMIN
DF
P
2
DF
P
Sin restricciones
199,473
102
0,000
Fija cargas factoriales 233,747
111
0,000 34,274
9
0,000
Fija var./cov. factores 254,591
117
0,000 20,844
6
0,002
Fija varianzas errores 333,938
129
0,000 79,347
12
0,000
NPAR
54
45
39
27
24
CMIN
266,443
288,229
312,474
365,112
3226,869
DF
102
111
117
129
132
P
0,000
0,000
0,000
0,000
0,000
RMR
0,145
0,195
0,300
0,305
1,076
GFI
0,893
0,884
0,871
0,840
0,291
AGFI
0,836
0,837
0,827
0,806
0,162
PGFI
0,584
0,629
0,653
0,694
0,246
CMIN/DF
2,612
2,597
2,671
2,830
24,446
RMR, GFI
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
NFI
Delta1
0,917
0,911
0,903
0,887
0,000
RFI
rho1
0,893
0,894
0,891
0,884
0,000
IFI
Delta2
0,947
0,943
0,937
0,924
0,000
TLI
rho2
0,931
0,932
0,929
0,922
0,000
RMSEA
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
RMSEA
0,066
0,065
0,067
0,070
0,251
LO 90
0,056
0,056
0,058
0,062
0,243
HI 90
0,075
0,075
0,076
0,079
0,258
PCLOSE
0,004
0,003
0,001
0,000
0,000
Modelo
CFI
0,947
0,943
0,937
0,924
0,000
Tabla 4.100: Significacin estadstica del cambio en 2 entre los distintos modelos
del AFC multigrupo en la Escuela de Msica 2004-2006
Modelo
CMIN
DF
P
2
DF
P
Sin restricciones
266,443
102
0,000
Fija cargas factoriales 288,229
111
0,000 21,786
9
0,010
Fija var./cov. factores 312,474
117
0,000 24,245
6
0,000
Fija varianzas errores 365,112
129
0,000 52,638
12
0,000
247
NPAR
54
45
39
27
24
CMIN
170,134
189,439
220,389
357,368
2043,379
DF
102
111
117
129
132
P
0,000
0,000
0,000
0,000
0,000
RMR
0,111
0,142
0,385
0,365
0,945
GFI
0,873
0,858
0,846
0,764
0,234
AGFI
0,805
0,800
0,795
0,714
0,095
PGFI
0,571
0,611
0,635
0,631
0,198
CMIN/DF
1,668
1,707
1,884
2,770
15,480
RMR, GFI
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
NFI
Delta1
0,917
0,907
0,892
0,825
0,000
RFI
rho1
0,873
0,858
0,846
0,764
0,000
IFI
Delta2
0,965
0,959
0,946
0,881
0,000
TLI
rho2
0,954
0,951
0,939
0,878
0,000
RMSEA
0,060
0,061
0,069
0,097
0,278
LO 90
0,043
0,046
0,055
0,085
0,267
HI 90
0,075
0,076
0,082
0,109
0,288
PCLOSE
0,155
0,106
0,016
0,000
0,000
CFI
0,964
0,959
0,946
0,881
0,000
RMSEA
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
Tabla 4.102: Significacin estadstica del cambio en 2 entre los distintos modelos
del AFC multigrupo en el Centro Juventud de Legans 2006-2008
Modelo
CMIN
DF
P
2
DF
P
Sin restricciones
170,134
102
0,000
Fija cargas factoriales 189,439
111
0,000 19,305
9
0,023
Fija var./cov. factores 220,389
117
0,000 30,950
6
0,000
Fija varianzas errores 357,368
129
0,000 136,979
12
0,000
248
NPAR
54
45
39
27
24
CMIN
232,626
247,727
275,358
368,993
3904,356
DF
102
111
117
129
132
P
0,000
0,000
0,000
0,000
0,000
RMR
0,090
0,118
0,343
0,348
0,938
GFI
0,932
0,927
0,918
0,893
0,280
AGFI
0,895
0,898
0,890
0,871
0,150
PGFI
0,609
0,660
0,688
0,739
0,237
CMIN/DF
2,281
2,232
2,353
2,860
29,578
RMR, GFI
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
NFI
Delta1
0,940
0,937
0,929
0,905
0,000
RFI
rho1
0,923
0,925
0,920
0,893
0,000
IFI
Delta2
0,966
0,964
0,958
0,936
0,000
TLI
rho2
0,955
0,957
0,953
0,935
0,000
RMSEA
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
RMSEA
0,050
0,049
0,051
0,060
0,234
LO 90
0,041
0,041
0,043
0,0,53
0,228
HI 90
0,058
0,057
0,059
0,067
0,241
PCLOSE
0,519
0,598
0,407
0,013
0,000
Modelo
CFI
0,965
0,964
0,958
0,936
0,000
Tabla 4.104: Significacin estadstica del cambio en 2 entre los distintos modelos
del AFC multigrupo en el Centro Jvenes de La Corua 2006-2008
Modelo
CMIN
DF
P
2
DF
P
Sin restricciones
232,626
102
0,000
Fija cargas factoriales 247,727
111
0,000 15,100
9
0,088
Fija var./cov. factores 275,358
117
0,000 27,631
6
0,000
Fija varianzas errores 368,993
129
0,000 93,635
12
0,000
249
Como podemos ver, los indicadores de bondad de ajuste en los AFC multigrupo con
SEM con los datos de las encuestas en los otros servicios socioculturales son
esencialmente positivos. La ji-cuadrado corregida presenta siempre valores inferiores a
3 para todos los modelos testados, incluso en los ms restringidos, aunque son mejores
en el caso del Centro de Juventud Legans y peores en el caso de Escuela de Msica del
municipio de referencia, siendo los del Centro de Jvenes de La Corua intermedios.
Los ndices de bondad de ajuste simple y ajustado (GFI y AGFI) tambin presentan
unos valores aceptables en todos los casos, especialmente en los modelos sin
restricciones y con fijacin de cargas factoriales (en torno a 0,90 o ms), si bien son
peores en los casos de la Escuela de Msica y el Centro de Juventud de Legans. El
ndice de parsimonia PGFI nos muestra valores siempre superiores al punto mnimo
aceptable de 0,5 en todos los casos y para todos los modelos. Los ndices de ajuste
incremental y parsimonia (comparacin con el modelo nulo) son en general prximos
o superiores al valor 0,90, especialmente para los modelos sin restricciones y con
fijacin de cargas factoriales, en todos los casos. Finalmente, los indicadores relativos al
error cuadrtico medio, RMSEA, presentan valores en torno a 0,05, sobre todo en los
modelos sin restricciones y con fijacin de cargas factoriales, en todas las ocasiones, y,
en todo caso, inferiores al valor mximo deseable de 0,08 (la nica excepcin la
constituye el error cuadrtico medio de valor 0,097 en el caso del modelo con fijacin
de covarianzas y varianzas de los errores de Centro de Juventud de Legans). Las
diferencias entre los CFI de los distintos modelos restringidos son, como en el caso de
la Universidad Popular, siempre inferiores a 0,01 salvo cuando se fijan las varianzas de
los errores.
Sin embargo, los cambios en el estadstico 2 (2) resultan siempre
estadsticamente significativos (tablas 4.100, 4.102 y 4.104), excepto en el que tiene
lugar entre el modelo sin restricciones y el modelo con fijacin de cargas factoriales en
el caso del AFC multigrupo con los datos del Centro de Jvenes de La Corua, que no
es significativo (p > 0,05). Esto ltimo se interpreta como que en este caso no hay duda
de que existe suficiente evidencia de invarianza mtrica como para concluir que hay una
invarianza factorial menos dudosa que en el resto de casos.
En consecuencia, podemos concluir que el conjunto de indicadores de bondad de
ajuste de los AFC multigrupo con SEM sobre los conjuntos de datos obtenidos en los
servicios socioculturales del ayuntamiento de referencia y los de contraste pueden
considerarse aceptables, si bien los cambios en el estadstico de contraste 2 son
250
251
1,102
0,506
1,636
0,452
0,694
( 2) =
1,443
0,531
0,619
1,565
0,781
1,503
El resultado de restringir las cargas factoriales en el modelo puede verse en las tablas
4.107 y 4.108. Vemos que aunque las saturaciones no estandarizadas son ya iguales con
esta restriccin, las saturaciones estandarizadas presentan ciertas diferencias, aunque no
muy acusadas, entre los dos grupos de sujetos, y que las matrices de covarianzas entre
los factores y los vectores error son apreciablemente diferentes.
252
253
(1)
1,074
= 0,476
1,799
0,571
0,710
( 2)
1,360
0,510
0,615
1,495
0,770
1,522
son
muy
semejantes
en
los
dos
grupos.
Las
matrices
de
254
1,010
0,524
1,571
0,580
0,756
y
1,481
( 2) =
0,524
1,571
0,580
0,756
1,481
255
256
1,013
1,013
(1) =
0,528
1,577
0,584
0,764
y
1,486
( 2)
= 0,528
1,577
0,584
0,764
1,486
En definitiva, en el AFC multigrupo con segmentacin por sexo con los datos de la
Universidad Popular 2003-2005 resulta observable un patrn de resultados muy
semejante al observado en el AFC multigrupo segmentado por momentos de medicin,
si bien las diferencias entre grupos son menores que las halladas entre momentos.
Los principales estadsticos de bondad del ajuste y el cambio 2 que tiene lugar al
restrigir el modelo son los que se muestran en las tablas 4.113 y 4.114.
257
Tabla 4.113: Estadsticos de ajuste del AFC multigrupo (hombres/mujeres) con los
datos de la Universidad Popular 2003-2005
Estadsticos de ajuste del AFC multigrupo
CMIN
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
NPAR
54
45
39
27
24
CMIN
213,362
217,483
224,882
241,488
4643,263
DF
102
111
117
129
132
P
0,000
0,000
0,000
0,000
0,000
RMR
0,137
0,139
0,207
0,203
1,108
GFI
0,948
0,947
0,946
0,943
0,334
AGFI
0,921
0,926
0,928
0,931
PGFI
0,620
0,674
0,710
0,780
0,283
CMIN/DF
2,092
1,959
1,922
1,872
35,176
RMR, GFI
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
NFI
Delta1
0,954
0,953
0,952
0,948
0,000
RFI
rho1
0,941
0,944
0,945
0,947
0,000
IFI
Delta2
0,975
0,977
0,976
0,975
0,000
TLI
rho2
0,968
0,972
0,973
0,974
0,000
RMSEA
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
RMSEA
0,042
0,039
0,038
0,037
0,234
LO 90
0,034
0,031
0,031
0,030
0,228
HI 90
0,050
0,047
0,046
0,045
0,239
PCLOSE
0,958
0,991
0,995
0,998
0,000
Modelo
CFI
0,975
0,976
0,976
0,975
0,000
Tabla 4.114: Significacin estadstica del cambio en 2 entre los distintos modelos
del AFC multigrupo hombres/mujeres con los datos de la Universidad
Popular 2003-2005
Modelo
CMIN
DF
P
2
DF
P
Sin restricciones
213,362
102
0,000
Fija cargas factoriales 217,483
111
0,000
4,122
9
0,903
Fija var./cov. factores 224,882
117
0,000
7,399
6
0,286
Fija varianzas errores 241,488
129
0,000 16,606
12
0,165
258
Como vemos, los ndices de bondad del ajuste en el AFC multigrupo hombres/mujeres
en el caso de la Universidad Popular resultan considerablemente satisfactorios,
comenzando por la 2 corregida, que siempre presenta valores dentro del rango de los
aceptables (slo en una ocasin supera ligeramente el valor 2). El RMR ofrece siempre
valores inferiores a 0,5 y los ndices GFI y AGFI arrojan valores superiores a 0,90 en
todos los modelos. Los ndices de ajuste incremental y parsimonia con respecto al
modelo nulo (NFI, RFI, IFI, TLI y CFI) tambin presentan valores por encima del punto
de corte aceptable (salvo el RFI en el modelo que fija las varianzas de los errores,
aunque casi lo alcanza). Podemos concluir, por tanto, que el grado de ajuste del modelo
a los datos es bueno en todos los modelos considerados y ello constituye una evidencia
a favor de la estabilidad de la estructura del modelo.
Si ahora observamos los cambios que se producen en 2 al ir restrigiendo
progresivamente el modelo, vemos que no resultan estadsticamente significativos, ya
que las probabilidades asociadas en los tres cambios producidos son superiores al punto
de corte establecido al efecto (P 0,05). Esto es una indudable prueba a favor de la
estabilidad de la estructura del modelo que subyace en la escala QPSC entre grupos de
usuarios del servicio diferenciados por sexo.
En resumen, podemos concluir, a la vista de los ndices de ajuste y de los
cambios que se producen en 2 al restringir el modelo, que en esta ocasin se produce
una clara invarianza factorial, ahora reforzada por el alto grado de invarianza mtrica (e
incluso estricta ) observado. Todo ello constituye una prueba de validez de la escala
QPSC a partir de las evidencias basadas en su estructura interna.
259
Tabla 4.115: Estadsticos de ajuste del AFC multigrupo (hombres/mujeres) con los
datos del Centro de Jvenes de La Corua de 2006-2008
Estadsticos de ajuste del AFC multigrupo
CMIN
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
NPAR
54
45
39
27
24
CMIN
252,436
267,992
271,046
307,664
4011,507
DF
102
111
117
129
132
P
0,000
0,000
0,000
0,000
0,000
RMR
0,091
0,107
0,127
0,135
0,837
GFI
0,929
0,924
0,923
0,911
0,275
AGFI
0,891
0,893
0,897
0,893
0,144
PGFI
0,607
0,657
0,692
0,754
0,233
CMIN/DF
2,475
2,414
2,317
2,385
30,390
RMR, GFI
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
NFI
Delta1
0,937
0,933
0,932
0,923
0,000
RFI
rho1
0,919
0,921
0,924
0,922
0,000
IFI
Delta2
0,962
0,960
0,960
0,954
0,000
TLI
rho2
0,950
0,952
0,955
0,953
0,000
RMSEA
Modelo
Sin restricciones
Fija cargas factoriales
Fija var./cov. factores
Fija varianzas errores
Independencia
RMSEA
0,053
0,052
0,050
0,052
0,238
LO 90
0,045
0,044
0,042
0,044
0,231
HI 90
0,062
0,060
0,058
0,059
0,244
PCLOSE
0,252
0,321
0,465
0,354
0,000
Modelo
CFI
0,961
0,960
0,960
0,954
0,000
Tabla 4.116: Significacin estadstica del cambio en 2 entre los distintos modelos
del AFC multigrupo hombres/mujeres con los datos del Centro de
Jvenes de La Corua de 2006-2008
Modelo
CMIN
DF
P
2
DF
P
Sin restricciones
252,436
102
0,000
Fija cargas factoriales 267,992
111
0,000 15,556
9
0,077
Fija var./cov. factores 271,046
117
0,000
3,054
6
0,802
129
0,000 36,617
12
0,000
Fija varianzas errores 307,664
260
Observamos que los estadsticos de ajuste en el caso del AFC con segmentacin por
sexo en el Centro de Jvenes de La Corua son esencialmente positivos. Todos los chicuadrado corregidos son inferiores a 2,5, el RMR siempre es inferior a 0,5 y el GFI
supera en todos los modelos el punto de corte 0,90 (el ndice AGFI casi alcanza ese
punto de corte). Los ndices de comparacin con el modelo nulo superan asimismo el
valor 0,90 y el RMSEA apenas supera en centsimas el valor 0,05. Y de nuevo
observamos que las diferencias en los valores del CFI entre los modelos
progresivamente restringidos son inferiores siempre a 0,01, sugiriendo, como ya se ha
dicho, invarianza factorial.
Adems, el cambio que se produce en 2 al restringir progresivamente el modelo
slo resulta estadsticamente significativo cuando se fijan las varianzas de los errores, lo
cual indica una casi completa invarianza mtrica y, por tanto, una robusta invarianza
factorial del modelo de medida.
Todo ello significa, en definitiva, que la estructura factorial de la escala QPSC
mantiene una considerable estabilidad cuando se aplica en grupos de sujetos de distinto
sexo, superior a la que observamos cuando se aplica en diferentes momentos de
medicin.
261
262
Captulo 5
Discusin y conclusiones
La revisin del concepto de calidad implica distinguir ente calidad de los productos
bienes y calidad de los productos servicios. En los primeros existen numerosas
propiedades intrnsecas y condiciones fsicas de suministro que pueden ser medidas
objetivamente para evaluar su calidad, pero en los segundos, por su intangibilidad, la
medicin de la calidad ha de hacerse casi exclusivamente sobre su efecto en la
percepcin del cliente. La mayor parte de las aproximaciones tericas a esta cuestin
diferencia entre la calidad fsica, tcnica u objetiva y la calidad subjetiva, interactiva o
percibida, siendo esta ltima, sobre todo, aquella que debe evaluarse para dar cuenta de
la calidad de un servicio.
En trminos generales, se asume que la calidad percibida del servicio tiene su
principal indicador en la satisfaccin que la recepcin del mismo produce en el cliente
(Martnez-Tur, Peir y Ramos, 2001; Rebolloso et al., 2003), de manera que clarificar
la relacin entre calidad percibida y satisfaccin resulta obligado para establecer si
efectivamente medir la satisfaccin del cliente implica medir indirectamente la calidad
percibida del servicio.
Hemos visto que el concepto de satisfaccin del cliente presenta algunos
problemas interpretativos. La revisin de este concepto pone de manifiesto que resulta
en cierto modo polismico, pues los especialistas no han llegado a una postura comn
respecto de si la satisfaccin con algo consiste en el mero cumplimiento de expectativas
previas, en una actitud de conformidad con ello o en una sensacin subjetiva que
emerge en el momento de experimentarlo, sin que necesariamente exista una idea previa
sobre ese algo. No est claro que la satisfaccin sea el resultado de un proceso
cognitivo, afectivo, de ambas cosas, que incluso incorpore elementos sociales, culturales
263
o histricos cambiantes o que sea una combinacin de todo ello en la que resulta muy
difcil separar unos y otros componentes, aunque esta ltima concepcin es la que hoy
resulta ms generalmente aceptada (Caro y Garca, 2007; Moliner, Marzo y Solanes,
2005).
Tambin han debatido los expertos sobre si en la relacin entre calidad percibida
del servicio y satisfaccin con el servicio, la primera es un antecedente o una
consecuencia de la segunda. Es decir, se ha discutido extensamente acerca de si un
cliente valora un servicio como satisfactorio porque percibe que es de calidad (y as la
calidad sera un antecedente de la satisfaccin) o si un cliente valora un servicio como
de calidad porque ha quedado satisfecho con el mismo (y entonces la satisfaccin
sera un antecedente de la calidad percibida). Pero nosotros hemos intentado mostrar
que esta cuestin, pese a su posible relevancia para la ciencia psicolgica, resulta a
efectos prcticos poco menos que ftil, pues ms all de que probablemente es
imposible concluir en qu orden aparecen la calidad percibida y la satisfaccin, como
han apuntado algunos autores (Iacobucci et al., 1995; McAlexander et al., 1994), lo
cierto es que tanto los clientes como los gestores de los servicios identifican ambas
cosas, concluyendo que se est satisfecho si el servicio es de calidad y se estima que el
servicio es de calidad si se est satisfecho con el mismo. Por tanto, si se acepta que la
calidad percibida de un servicio se manifiesta mediante la satisfaccin, alta o baja, con
el mismo, se sigue de ello que medir la satisfaccin comportara medir, indirectamente
si se quiere, la calidad percibida. Esta es, efectivamente, la postura que asume el modelo
de medicin de la escala QPSC, que nos parece la ms acertada y la que hemos asumido
en este trabajo.
Otro aspecto del estudio de la calidad percibida es el que hace referencia a la
dimensionalidad de este constructo. Los especialistas han mostrado que la calidad de un
servicio puede concebirse de distintas maneras, como un todo que depende de una serie
de atributos variables o como un concepto multidimensional, que se expresa en
diferentes planos que pueden definirse como dimensiones (o subdimensiones, en los
modelos jerrquicos). Existe cierta base psicomtrica para entender la calidad del
servicio como un constructo unidimensional (Babakus y Mangold, 1989; Cronin y
Taylor, 1992), pero parece ms consistente la evidencia emprica que prueba la
generalizada estructura multidimensional de la calidad en los servicios (Grnroos, 1984;
Dahbolkar, Thorpe y Rentz, 1996). En efecto, la corriente dominante en la investigacin
sobre calidad percibida y satisfaccin del cliente es la de los modelos
264
que sobre
posiciones
de los investigadores
son
La revisin de las escalas para medir la calidad percibida del servicio que hemos
efectuado pone de relieve que las ms conocidas y empleadas han sido sobre todo la
escala SERVQUAL, la escala SERVPERF y, en menor medida, la escala de Desempeo
Evaluado, si bien hay que hacer notar que las dos ltimas se inspiran en diverso grado
en la primera. Hemos sealado tambin que la literatura evaluativa y la mercadotcnica
dan cuenta de otras escalas ideadas para medir la calidad percibida, pero hemos hecho
notar que son en gran parte antecedentes, versiones o adaptaciones de las anteriormente
mencionadas (siendo tal vez la ms conocida y utilizada la denominada IPA, que
Martilla y James idearon en 1977 y que an hoy se emplea con cierta frecuencia).
Resulta indudable que la escala SERVQUAL, de Parasuraman, Berry y Zeithalm,
diseada a finales de los aos 80 del pasado siglo, ha sido la que ha gozado de una
mayor aceptacin desde su creacin hasta nuestros das, tanto en lo que se refiere a su
concepcin multidimensional de la calidad percibida como a su propuesta de
consideracin de las expectativas del cliente respecto del servicio recibido.
Efectivamente, la escala SERVPERF, ideada por Cronin y Taylor a principios de los
aos 90 del siglo pasado, es de hecho una suerte de versin de SERVQUAL sin incluir la
medicin de expectativas. Este ltimo aspecto es precisamente el que le ha conferido su
principal atractivo, pues son numerosos los estudios (Carrillat et al., 2007; Crompton y
Love, 1995; y otros ya citados) que le conceden un mayor poder predictivo del
comportamiento del consumidor y que la ven como un instrumento de aplicacin menos
complicada para los clientes (adems de ms econmica por diversas razones).
Fueron estas ltimas consideraciones las que hicieron que la escala QPSC,
cuando se dise, adoptase como referente metodolgico sobre todo la escala
SERVPERF, es decir, de percepciones sin ponderar, por sus mayores virtudes
psicomtricas y econmicas, sin perjuicio de que se tomase de SERVQUAL su idea
bsica de multidimensionalidad de la calidad del servicio. Es posible que otro tipo de
escala pudiese haber sido utilizada para medir la calidad percibida en los servicios
socioculturales, pero el hecho es que en el ayuntamiento donde se confeccion QPSC la
base conceptual desde la que se parti estaba constituida por estas dos conocidas escalas
que acabamos de mencionar. La eleccin de un formato SERVPERF para QPSC nos ha
parecido una opcin apropiada y defendible tanto metodolgicamente como en trminos
prcticos, sin perjuicio de que hayamos juzgado conveniente evaluar la bondad de sus
propiedades psicomtricas para conseguir captar fielmente la percepcin de los usuarios
de estos servicios.
266
tcnicos, gestores y polticos del ayuntamiento que utilizan la informacin que sta
proporciona, que esa calificacin expresa el grado de calidad que percibe el usuario del
servicio, entonces la escala permite saber qu nivel de calidad tienen los distintos
servicios socioculturales y, lo que es ms importante, cules de sus aspectos concretos
(limpieza, horarios, profesionalidad del personal, etc.) presentan un dficit de calidad
con respecto al punto ptimo que es la puntuacin o calificacin 10 y concluir, en ese
caso, que hay que llevar a cabo acciones correctoras para mejorarlo. Hay que recordar
aqu que en los cuestionarios que contienen la escala QPSC y que se administran a los
usuarios de los servicios socioculturales no se empleaba nunca el trmino calidad
percibida, pues se entenda que poda resultar impreciso y equvoco para los usuarios:
se les peda simplemente que calificasen de 1 a 10 los distintos aspectos del servicio y
tambin que diesen una calificacin global, dentro de ese mismo rango de puntuaciones,
al servicio en su conjunto.
En el orden metodolgico, el anlisis previo de la escala QPSC presentaba cierta
fortaleza en dos clases de evidencias de validez: las relativas al contenido y las relativas
a la relacin con un criterio externo. Las primeras porque a travs del proceso de
elaboracin de la escala se aprecia que los items de la escala representan el constructo
que se desea medir (Morales, 2000, p. 427), que es precisamente lo que clsicamente
caracterizaba la llamada validez de contenido de un test. Las relativas a la relacin
con un criterio externo porque, como hemos sealado, la puntuacin en el tem
Valoracin Global del Servicio puede en efecto considerarse como la puntuacin de
un criterio externo, de modo que relacionar las puntuaciones de la escala con las
puntuaciones de valoracin global constituye una evidencia de validez basada en un
criterio externo, en su vertiente de validez concurrente si se entiende que ambas
puntuaciones han sido obtenidas en el mismo momento (Morales, 1998).
Sin embargo, en el diseo de la escala no se tuvieron en cuenta otras evidencias
de validez que hubiesen puesto de manifiesto si la escala meda un constructo
unidimensional o no, o si las tres dimensiones que aparentemente subyacan cuando se
prestaba un servicio sociocultural realmente se reproducan en todos los servicios en los
que se aplicaba la escala, o si esa estructura dimensional se mantena en el tiempo.
Tampoco se comprob con carcter previo a su aplicacin generalizada si la escala
presentaba una suficiente fiabilidad, es decir, si las puntuaciones que arrojaba eran
suficientemente precisas respecto del constructo medido. En definitiva, la escala QPSC
presentaba sus principales carencias de carcter metodolgico sobre todo en relacin
268
con la ausencia de las necesarias pruebas que garantizasen una suficiente fiabilidad del
instrumento y con la falta de comprobacin de las evidencias de validez basadas en la
estructura interna o validez de constructo. El grueso del trabajo de investigacin
realizado en estas pginas ha tenido que ver precisamente con estas cuestiones, sin
perjuicio de que tambin se haya analizado si efectivamente existen suficientes
evidencias de validez de la escala basadas en el contenido y en la relacin con un
criterio externo.
Una cuestin de importancia que tambin hemos considerado en nuestra primera
evaluacin psicomtrica de la escala QPSC ha sido la relativa a su factibilidad.
Aunque el concepto de factibilidad alude en trminos generales a la viabilidad de la
escala como instrumento de medida, la prctica habitual es atender especialmente a los
valores perdidos que presenta cada tem, puesto que indican no respuesta al mismo (por
inadecuacin, incomprensibilidad o inoportunidad), y al tiempo en que un sujeto
cualquiera tarda en responder al conjunto de items de la escala, ya que debe ser
suficientemente corto como para no desanimar su cumplimentacin en la situacin real
de aplicacin. En ambas cuestiones la escala QPSC ha mostrado una factibilidad
satisfactoria, habida cuenta de que, en promedio, apenas un 6% de los sujetos a los que
se aplica la escala, en el caso ms desfavorable, deja sin contestar alguno de los tems, y
de que, segn lo observado empricamente durante su aplicacin, la escala tarda en
cumplimentarse entre un mnimo de 45 segundos y un mximo de dos minutos (con un
lmite de tres minutos mximo para el cuestionario completo que contiene la escala).
En el captulo 3 (Mtodo) hemos expuesto el diseo general del estudio
psicomtrico de la escala QPSC sealando que se utilizan los datos que provienen de la
aplicacin de la escala en cuatro servicios socioculturales distintos en dos ocasiones
sucesivas. Dos de esos servicios, una Universidad Popular y una Escuela de Msica, los
hemos denominado servicios de referencia, por cuanto pertenecen al entramado de
servicios socioculturales del ayuntamiento donde se crea y se comienza a aplicar la
escala QPSC. Los otros dos servicios, un Centro de Juventud y un Centro de Jvenes,
pertenecen a otros ayuntamientos, el de Legans (Madrid) y el de La Corua,
respectivamente, y los hemos nombrado como servicios de comparacin (tambin
hemos contado con otros dos conjuntos de datos con un reducido nmero de casos, los
provenientes de la aplicacin de la escala en dos momentos distintos en la biblioteca
municipal del ayuntamiento de Guadarrama, pero solamente se han empleado a los
efectos de obtener una medida de la fiabilidad de la escala basada en el criterio de
269
estabilidad temporal). La configuracin de este diseo viene motivada por la idea de que
circunscribir el estudio de validacin a los servicios de referencia adolecera de un
excesivo particularismo que podra sesgar las conclusiones de esta investigacin, puesto
que podra pensarse que estos servicios socioculturales pueden ser tan singulares que
sus caractersticas, las condiciones de aplicacin de la escala o cualquier otra
circunstancia especfica que les afectase tal vez podra propiciar un resultado
psicomtrico que no podra generalizarse del caso concreto estudiado. Por esa razn
tambin se ha aplicado la escala en otros servicios socioculturales distintos en sus
caractersticas funcionales y en su ubicacin socio-geogrfica de los considerados de
referencia, de tal manera que el estudio de validacin efectuado albergara una
pluralidad suficiente de casos con los que establecer las comparaciones pertinentes.
Adems, no nos hemos limitado a analizar psicomtricamente los resultados de la
aplicacin de la escala en diferentes servicios socioculturales, sino que hemos llevado a
cabo sendas aplicaciones de la misma en esos servicios socioculturales en dos
momentos diferentes, con objeto de evitar el efecto distorsionador de una posible
situacin excepcional en las condiciones de su aplicacin o en las circunstancias de todo
tipo que concurran en un momento dado en cada servicio.
Por consiguiente, si exceptuamos el caso de la biblioteca municipal de
Guadarrama, del que nos hemos servido solamente a los efectos antes sealados, para
realizar esta investigacin hemos contado con ocho conjuntos de datos, en todos los
cuales hemos aplicado, en general, los mismos anlisis estadsticos. Hemos estudiado
las caractersticas de las distribuciones de los tems. La consistencia interna se ha
estudiado aplicando el coeficiente de fiabilidad alfa de Cronbach. La estabilidad
temporal se ha estudiado mediante el coeficiente de correlacin de Pearson entre dos
aplicaciones sucesivas de la escala, utilizando para esto solamente los datos
provenientes de una muestra de la biblioteca del municipio de Guadarrama.
Complementariamente, hemos efectuado un estudio de la fiabilidad de la escala desde el
punto de vista de la Teora de la Respuesta al tem, aglutinando para ello los dos
conjuntos de datos de uno de los servicios de referencia, con el objetivo de evaluar la
precisin de la escala desde esta perspectiva psicomtrica.
Dado que el objetivo principal de esta investigacin es llevar a cabo un estudio
de valoracin de las propiedades psicomtricas de la escala QPSC y considerando la
importancia del concepto de validez en este contexto, pareca obligado establecer con
claridad en qu consiste la validez de un instrumento de medida y cmo se puede
270
evaluar. A tal fin hemos dedicado varios apartados de este trabajo. La validez de un
instrumento de medida alude a si efectivamente el instrumento sirve para medir lo que
se pretende medir. Hemos mostrado que el concepto de validez ha experimentado una
cierta evolucin en los ltimos decenios, pasando de una nocin vinculada sobre todo a
la capacidad de un test para predecir un determinado resultado observable en un
criterio externo a una concepcin de la validez como una propiedad del test relativa a si
es capaz de abarcar o contener el rasgo que se pretenda medir y a que los resultados de
su aplicacin efectivamente reflejan dicho rasgo o constructo. En definitiva, la manera
de evaluar la validez de un test o instrumento de medida consista en determinar en qu
grado posee tres tipos distintos, pero no necesariamente excluyentes, de validez: de
contenido, de criterio y de constructo. Desde 1954 hasta 1985 estas tres formas de
comprobacin de la validez fueron las que los estndares de pruebas psicolgicas y
educacionales de las asociaciones American Educational Research Association,
American Psychological Association y National Concil on Measurement in Education
(AERA-APA-NCME) defendan como apropiadas para establecer la validez de un test.
Pero hemos sealado que desde entonces la perspectiva con la que se evala la
validez de un test ha cambiado, ya que la edicin de 1985 de estos estndares dispone
que si bien las tres vas de comprobar la validez antes mencionadas son apropiadas, la
validez es slo una, aunque pueda haber distintos modos de evaluarla. Y en la edicin
de 1999 de los estndares se seala que a las evidencias de validez de los tipos antes
enunciados conviene aadir otras dos, las que tienen que ver con el proceso de respuesta
y con las consecuencias del uso del test. Por otra parte, hemos destacado que en esta
ltima edicin de los estndares se enfatiza la idea de que la validez debe concebirse
como el grado en que la teora y los datos disponibles apoyan la interpretacin de las
puntuaciones del test para un uso concreto, de manera que lo que se debe someter a
validacin no es tanto el test o instrumento de medida propiamente dicho, sino las
puntuaciones que se obtienen con la aplicacin del mismo.
En este contexto se distinguen cinco tipos de evidencias relacionadas con la
validez: (a) las evidencias de validez de contenido se obtienen sobre todo mediante
procedimientos de contraste de valoraciones de jueces o expertos sobre el grado en que
los tems del test y los objetivos de medicin estn relacionados apropiadamente; (b) las
evidencias basadas en la estructura interna del test se suelen determinar a travs de
estudios de dimensionalidad realizados sobre todo mediante el empleo de tcnicas de
anlisis factorial; (c) las evidencias basadas en la relacin con otras variables (ms
271
precisamente, en la relacin entre las puntuaciones del test y las de otra u otras variables
criterio) se establecen habitualmente mediante el estudio de la covariacin de los
resultados del test con otros datos referidos a variables externas al test; (d) las
evidencias basadas en los procesos de respuesta se obtienen mediante el estudio de los
procesos cognitivos que siguen los sujetos para llegar a la respuesta (revisin de
protocolos de administracin de cuestionarios, entrevistas con los sujetos para apreciar
su grado de comprensin de los items, ...); y (e) las evidencias basadas en las
consecuencias del uso de los resultados del test se determinan mediante el seguimiento
de los efectos que tiene servirse de la informacin que proporciona el test.
Nosotros hemos renunciado a estudiar estos dos ltimos tipos de validez. La
relativa a los procesos de respuesta porque nos resulta imposible, especialmente a
posteriori, llevar a cabo entrevistas con los usuarios del servicio que nos permitiesen
establecer la relacin entre procesos cognitivos y pautas de respuesta a los items. La
relativa a las consecuencias del uso de los resultados del test porque, de acuerdo con la
opinin de Boorsboom y Mellenbergh (2007), Meherens (1997), Popham (1997) y otros
ya citados, entendemos que la evaluacin de la validez de un instrumento de medida
debe centrarse en si se justifican determinadas inferencias sobre las puntuaciones que
proporciona pero no en qu se hace en la prctica con ellas.
Por consiguiente, el estudio de la validez de la escala se ha centrado finalmente
sobre tres tipos de evidencias: las referidas al contenido, las basadas en la relacin con
un criterio externo y las que tienen que ver con su estructura interna. En lo que respecta
a estas ltimas, el estudio se ha realizado mediante diversas tcnicas de anlisis factorial
que permiten observar cul es la estructura del constructo calidad percibida y en qu
medida se reproduce y mantiene en las aplicaciones de la escala en todos los servicios
socioculturales considerados en este trabajo. Evidentemente, es sobre todo el resultado
de estos anlisis el que permite determinar el grado en que la escala QPSC posee la
validez suficiente como para ser considerada un instrumento apropiado para medir la
calidad percibida en servicios como los aqu contemplados. Una prueba complementaria
de la estabilidad estructural de la escala en distintas condiciones de aplicacin ha sido el
anlisis factorial confirmatorio multigrupo con segmentacin por sexo para comprobar
si el funcionamiento de la escala es equiparable en distintos tipos de sujetos.
Adems de que, como ya se dijo, el grado de satisfaccin que la experiencia del
servicio produce en el usuario es el indicador medible de la calidad percibida del
servicio, los supuestos fundamentales respecto de la escala QPSC son los siguientes: (a)
272
3. Los tems de la escala correlacionan unos con otros de manera que los
pertenecientes a la misma subdimensin terica del constructo que mide la escala
estn ms fuertemente vinculados entre s que con los pertenecientes a distintas
276
subdimensiones. El estudio de las correlaciones entre los tems indica que la relacin
entre los tems pertenecientes a una misma dimensin suele ser mayor que entre los
tems pertenecientes a dimensiones diferentes. Este patrn general se cumple
siempre en el caso de la dimensin Personal, pero ofrece un cierto nmero de
excepciones en el caso de las dimensiones Instalaciones y Trmites, donde
observamos algunas correlaciones entre tems cuyo valor es menor que el de algunas
correlaciones entre tems de dimensiones diferentes. Este fenmeno se produce con
mayor frecuencia en el caso de la dimensin Instalaciones que en el de la dimensin
Trmites y tiene lugar, aunque en diferente medida, en todas las aplicaciones de la
escala QPSC consideradas. En todo caso, la pauta general de que los tems
agrupados en una misma dimensin (o mejor, subdimensin) correlacionan ms
entre s que con los tems agrupados en otras dimensiones (subdimensiones) se
cumple en general lo bastante como para pensar que en efecto estn correctamente
agrupados.
Instalaciones
estos
parmetros
se
distribuyen
de
manera
8. Los ndices de bondad del ajuste del modelo de medida de la Teora de la Respuesta
al tem empleado ofrecen valores ji-cuadrado no significativos estadsticamente y
presentan diferencias no significativas estadsticamente entre curvas tericas y
curvas empricas de las probabilidades de dar una u otra puntuacin en cada tem,
indicativos de un buen ajuste entre modelo de medida y datos. Para contrastar esta
hiptesis, hemos usado dos mtodos de comprobacin, uno estadstico y otro
grfico. La comprobacin de la bondad del ajuste del modelo arroja, como hemos
visto, algn resultado contradictorio entre uno y otro mtodo. Los contrastes
basados en la prueba ji-cuadrado indican mal ajuste en los tems Conservacin de
las instalaciones y Simpata, Profesionalidad y Motivacin del personal, que
arrojan valores ji-cuadrado estadsticamente significativos (p < 0,05) y que por tanto
no permiten concluir que en estos casos el modelo ajuste suficientemente bien a los
datos (el conjunto del test arroja igualmente un valor ji-cuadrado estadsticamente
significativo, lo cual indica que el modelo utilizado no se ajusta bien a los datos).
Pero los contrastes basados en los residuos grficos limitan el mal ajuste al tem
Conservacin de las instalaciones. Teniendo en cuenta los problemas sealados en
la literatura para esta ltima prueba, como son una gran sensibilidad de 2 a los
tamaos muestrales, sobre todo, pero tambin cierta incertidumbre sobre su
distribucin muestral (Sueiro y Abad, 2009), no parece injustificado dar mayor
prevalencia al mtodo grfico para valorar la bondad del ajuste del modelo. Por
280
consiguiente, puede concluirse que casi todos los tems de la escala evaluada
presentan una bondad de ajuste satisfactoria o aceptable y que, por consiguiente, la
escala en su conjunto es capaz de predecir la puntuacin emprica del usuario del
servicio a la calidad percibida del mismo con una buena precisin.
0,7618 (caso del Centro de Jvenes de La Corua 2006) y 0,9336 (caso del Centro
de Juventud de Legans 2008), en los de comparacin. En suma, todo parece indicar
que las evidencias de validez de la escala basada en la relacin con un criterio
apuntan a un alto grado de validez.
11. En la solucin del anlisis factorial exploratorio realizado se espera que, tanto en
la matriz de configuracin como en la de estructura, cada uno de los tems sature
en el factor terico correspondiente ms que en los otros factores, indicando esto
que la estructura factorial de la escala es la prevista tericamente. Como se ha
sealado en el captulo de Mtodo, la utilizacin del anlisis factorial exploratorio es
una tcnica estadstica muy utilizada en la construccin y validacin de escalas
psicomtricas (Morales, 2000). En este trabajo hemos utilizado el mtodo de
estimacin ejes principales con rotacin oblimin porque presuponemos que los
factores (subdimensiones tericas del constructo calidad percibida) estn
relacionados. Una primera apreciacin en los resultados del anlisis factorial es que
en todas las aplicaciones, tanto en los servicios socioculturales de referencia como
en los de comparacin, se observan tres factores con autovalores mayores que la
unidad, que explican una importante cantidad de la varianza total: desde un mnimo
de 69,242% (caso del Centro de Juventud de Legans 2006) hasta un mximo de
87,692% (caso del Centro de Juventud de Legans 2008), lo cual significa que la
solucin de tres factores ofrece una gran potencia explicativa del constructo, pues
apenas una cuarta parte de la varianza global emprica, en promedio, quedara sin
explicar.
Los valores de las matrices de configuracin indican claramente que un factor
aglutina los cuatro tems que tericamente se corresponden con la dimensin
Personal; otro factor aglutina los cinco tems que se corresponden con la dimensin
Instalaciones; y otro factor engloba los tres tems correspondientes a la dimensin
Trmites. Esto se observa en todas las matrices de configuracin y da noticia de una
excelente correspondencia entre el supuesto tridimensional del constructo calidad
percibida y la evidencia emprica que muestra el AFE. Existe, sin embargo, una
excepcin en el caso del Centro de Juventud de Legans 2006 con el tem Horarios
de los trmites, que presenta una saturacin con valor 0,560 en la columna del
primer factor (el correspondiente a la dimensin Personal) y de slo -0,206 en la
columna del tercer factor, de manera que parece contribuir netamente ms a la
282
12. Se espera que las correlaciones entre los factores del anlisis factorial exploratorio
estn entre 0,30 y 0,60, valores indicativos de que los factores son diferentes pero
relacionados entre s, corroborando esto que la estructura factorial se corresponde
con un nico constructo, aunque multidimensional. Con esta hiptesis se incide en
la cuestin de la dimensionalidad de la calidad percibida. Los valores que toman
las correlaciones entre los factores de la solucin del AFE (en torno a 0,50) indican
que, aunque los factores hallados en el anlisis pueden considerarse diferentes, estn
relacionados entre s (Lvy, 2003, p. 772): efectivamente, los valores de las
correlaciones entre los factores oscilan entre 0,30 y 0,60, en los anlisis practicados
con los datos de las aplicaciones de la escala en los servicios socioculturales de
referencia, y entre 0,40 y 0,66 en los anlisis practicados con los datos de los
servicios de comparacin (el valor 0,66 est algo por encima del mximo apuntado
en la hiptesis, pero entendemos que resulta aceptable). La conclusin es que el
constructo calidad percibida que mide la escala QPSC es probablemente
unidimensional, pero presenta tres subdimensiones que lo constituyen, que es
precisamente lo tericamente previsto.
13. Los ndices de bondad del ajuste del anlisis factorial confirmatorio se espera que
arrojen valores iguales o mayores de 0,90, indicativos de que el conjunto de datos
proveniente de la aplicacin de la escala se ajusta a la estructura terica
propuesta. En el AFC llevado a cabo con el fin de comprobar si los datos empricos
obtenidos con las aplicaciones de la escala QPSC se ajustan efectivamente al
modelo dimensional terico que sugiere el AFE, la evidencia fundamental de que tal
ajuste se produce es que los diversos ndices de bondad de ajuste arrojan valores
iguales o mayores de 0,90 (Hair et al., 2001), sin perjuicio de considerar tambin
relevante para esto mismo el estadstico 2 corregido por sus grados de libertad
(precisamente este estadstico muestra valores menores de 3, considerado como
mximo aceptable en todos los casos contemplados, excepto en el caso de la Escuela
284
de Msica 2004, que toma un valor ligeramente mayor). Los ndices GFI y AGFI
presentan valores aceptables prcticamente en todos los casos, aunque en la Escuela
de Msica 2004 y en el Centro de Juventud de Legans 2006 estos ndices sealan
un ajuste ms dudoso. Y el ndice NFI tambin indica ajuste aceptable en la mayor
parte de los casos, pero ya se ha apuntado la relativa debilidad de este ndice porque
favorece la adopcin de modelos sobreparametrizados. El ndice TLI arroja valores
aceptables en todos los casos, aunque en el relativo a la Universidad Popular 2003
su valor est algo por debajo del punto de corte 0,90 deseado.
Por otro lado, los coeficientes de correlacin entre las variables latentes
(factores), que arrojan valores intermedios (en torno a 0,500), indican que,
efectivamente,
Instalaciones,
Personal
Trmites
son
dimensiones
modelo especificado. Otros estadsticos no indican un ajuste tan bueno, pero hemos
sealado su valor relativo al depender del nmero de parmetros incluidos en el
modelo y del tamao muestral. Concretamente, el mejor ajuste entre la matriz de
datos emprica y la matriz de datos reproducida lo encontramos en el caso de la
encuesta en la Universidad Popular en 2005. El peor ajuste lo encontramos en la
encuesta en la Escuela de Msica en 2004, que arroja un nmero considerable de
estadsticos de ajuste cuyos valores rebasan los lmites sealados comnmente para
aceptar un modelo.
Cabe sospechar que en este caso el problema se deba a que hemos incluido
en el modelo estructural la variable Accesibilidad de los trmites, que mostraba
cierta dificultad para ser incluida dentro de la subdimensin correspondiente y,
ciertamente, suprimirla del AFE hace que los tres primeros factores con autovalores
mayores de uno alcancen a explicar tres puntos porcentuales ms de la varianza total
que el AFE con esa variable, y si la retiramos del clculo del coeficiente alfa de
Cronbach la fiabilidad de la escala llega a ser de una dcima ms en promedio que
con ella. Pero si reespecificamos el modelo factorial confirmatorio suprimiendo el
tem Accesibilidad de los trmites, los estadsticos de ajuste apenas mejoran
sustancialmente y siguen ofrecindonos dudas sobre la pertinencia del modelo.
En consecuencia, cabra pensar que en el caso de la Escuela de Msica 2004
el modelo escalar utilizado es inapropiado, y eso permitira dudar de la efectividad
de la escala QPSC para medir la calidad percibida en estos servicios, pero pensamos
que sta sera una conclusin precipitada y probablemente desafortunada. Si
atendemos al anlisis de fiabilidad de la escala, es precisamente en la aplicacin
realizada entre los usuarios de la Escuela de Msica en 2004 donde encontramos el
alfa de Cronbach ms elevado, es decir, donde la escala se muestra ms precisa para
medir el constructo investigado. Adems, el AFC mediante ecuaciones estructurales
no es una tcnica estadstica exenta de controversia y no puede decirse que exista
unanimidad entre los especialistas a la hora de establecer cules son los valores de
los ndices de bondad de ajuste fuera de discusin (Bollen y Long, 1993; Byrne,
2001; Schumacker y Lomas, 1996), y son numerosos los investigadores que sealan
que incluso ndices de bondad de ajuste comunes, como el NFI, que carece de
distribucin conocida, implican una interpretacin totalmente subjetiva (GarcaCueto, Gallo y Miranda, 1998, p. 718).
286
14. Los ndices de bondad de ajuste del anlisis factorial confirmatorio multigrupo se
espera que arrojen valores iguales o mayores de 0,90, indicativos de que el
conjunto de datos proveniente de la aplicacin de la escala se ajusta a la estructura
propuesta, y asimismo se espera que los cambios en el estadstico ji-cuadrado
corregido
no
sean
estadsticamente
significativos
cuando
se
restringe
288
15. Los ndices de bondad de ajuste del anlisis factorial confirmatorio multigrupo
segmentando a los usuarios por sexo se espera que arrojen valores iguales o
mayores que 0,90 y, asimismo, se espera que los cambios en el estadstico jicuadrado corregido no sean estadsticamente significativos cuando se restringe
progresivamente el modelo, indicativo de invarianza factorial de la estructura
propuesta en distintos grupos de usuarios del mismo servicio. El grado de ajuste es
bueno en todos los modelos considerados y ello constituye una evidencia a favor de
la estabilidad de la estructura dimensional del modelo propuesto. Adems, las
diferencias entre los CFI a medida que restringimos el modelo son menores de 0,01
en todos los casos. Los cambios observados en ji-cuadrado al ir restringiendo
progresivamente el modelo no son estadsticamente significativos. Por consiguiente,
el AFC multigrupo con la segmentacin de los datos por sexo resulta muy favorable
al supuesto de estabilidad estructural del modelo, pues no solo los estadsticos de
ajuste indican permanencia de su estructura tridimensional bsica en distintos
grupos de sujetos (en los servicios de referencia y comparacin considerados), sino
que, puesto que el cambio que se observa en ji-cuadrado cuando se imponen
restricciones al modelo es estadsticamente no significativo, puede inferirse una
clara invarianza de medida que refuerza el supuesto de invarianza factorial estricta
de la escala. De nuevo, este dato permite concluir que la escala QPSC mide
bsicamente lo mismo y con similar precisin en distintas muestras (hombres y a
mujeres), lo cual constituye otra prueba de validez en lo que se refiere a su
290
estructura interna: tres dimensiones con sus correspondientes tems cada una de
ellas.
tambin bastante alto (mayor de 0,85), demostrndose as que la escala mide con buena
precisin.
Las pruebas encaminadas a evaluar la validez de la escala a partir de las
evidencias basadas en el contenido y en la relacin con un criterio externo han resultado
plenamente satisfactorias y permiten concluir que la escala QPSC es efectivamente un
instrumento vlido para medir la calidad percibida del servicio.
Todas las pruebas dirigidas a comprobar la validez de la escala a partir de las
evidencias basadas en la estructura interna han resultado asimismo bastante
satisfactorias. Precisamente era sobre este tipo de validez donde se podan albergar las
mayores dudas antes de comenzar este estudio y, en consecuencia, ha sido tambin
donde en mayor medida hemos dirigido nuestra atencin llevando a cabo diversos
anlisis factoriales. El AFE llevado a cabo en todas las muestras disponibles ha
mostrado consistentemente la existencia de los tres factores previstos en la teora. El
AFC ha mostrado un ajuste suficientemente bueno, en trminos generales, entre la
estructura propuesta y los datos muestrales, tanto en los servicios de referencia como en
los de comparacin. El AFC multigrupo ha ofrecido unos resultados razonablemente
satisfactorios, especialmente en lo que se refiere a la invarianza de la configuracin
dimensional. Y el AFC multigrupo con la segmentacin de las muestras por sexo ha
arrojado unos resultados sobre la invarianza mtrica que ofrecen pocas dudas respecto
de la estabilidad estructural de la escala entre sujetos de distinto sexo.
En consecuencia, todo parece indicar que si bien la estructura de la escala no
permanece completamente invariable en distintos contextos y momentos, puesto que,
como hemos visto, su invarianza estricta no se puede asegurar (los coeficientes entre
variables observables y latentes y las covarianzas entre stas arrojan variaciones
estadsticamente significativas en distintas aplicaciones de la escala), la estabilidad del
constructo tridimensional de la calidad percibida propuesto s ha quedado
suficientemente probada. E igualmente ha quedado probado que la estructura de la
escala en su conjunto permanece casi inalterable para hombres y para mujeres
(presentando, pues, invarianza estricta en lo que a esta cuestin se refiere), lo cual
constituye una indudable ventaja psicomtrica del instrumento.
La mayor fortaleza de la escala, por consiguiente, es la estabilidad del constructo
tridimensional propuesto, en diversos servicios socioculturales, en distintos tiempos y
diferentes contextos socioculturales. Tambin creemos que es una fortaleza relativa que
la estructura de la escala globalmente considerada resulta bastante estable, en el sentido
293
de que en todas las aplicaciones estudiadas los distintos indicadores de la escala (sus
tems) se corresponden con cada una de las dimensiones propuestas en la teora, as
como que la intensidad de las relaciones entre stas no sufren cambios de tal magnitud
que hagan pensar en una dimensionalidad distinta a la prevista. Finalmente, otra
fortaleza de la escala es que constituye un recurso evaluativo de la calidad de los
servicios socioculturales locales excepcional, toda vez que, como ya se ha sealado en
este trabajo, no est documentada en la literatura otra escala semejante para aplicarse en
este mbito de servicios.
La principal debilidad de la escala tiene que ver con el hecho de que, a pesar de
mantener una apreciable estabilidad en su conjunto, y que siempre mide calidad
percibida segn una determinada concepcin de la misma, no parece que la mida
exactamente del mismo modo en todas las aplicaciones en los diferentes servicios
socioculturales, adoleciendo de una cierta falta de invarianza mtrica. Tambin puede
considerarse una debilidad de la escala que muestra una cierta asimetra en su capacidad
para discriminar: la escala en su conjunto es ms adecuada para detectar baja calidad
percibida que alta, es decir, que discrimina mejor entre los usuarios menos satisfechos
con el servicio recibido que entre los que estn ms satisfechos. Aunque ya hemos
sealado que cuando el fin perseguido con la medicin de la calidad percibida es
corregir debilidades del servicio (insatisfaccin con algunos aspectos), este defecto no
reviste gran importancia.
Para terminar, queremos sealar las que son a nuestro juicio las ms importantes
fortalezas y debilidades, no ya de la escala QPSC, sino de la investigacin realizada en
este trabajo. Respecto de las primeras, y ms all anlisis estadstico llevado a cabo para
valorar las propiedades psicomtricas de la escala, que creemos que ha sido adecuado y
suficiente, pensamos que la variedad y el tamao de las muestras utilizadas, recogidas
en servicios socioculturales diferentes en sus caractersticas y en sus contextos sociales
(diferentes municipios e incluso diferentes regiones), y en diferentes momentos, otorgan
un considerable valor cualitativo al estudio realizado. La variedad de las muestras
conseguidas ha permitido disponer de una informacin lo suficientemente heterognea
como para evitar el riesgo de una excesiva singularidad de los resultados obtenidos.
Respecto de las debilidades, pensamos que constituye una limitacin de cierta
importancia no haber llevado a cabo aplicaciones de la escala en ms servicios
socioculturales de diverso tipo, ubicados en contextos socio-demogrficos variados,
para comprobar si los resultados de nuestra investigacin se mantienen. La extensin de
294
las aplicaciones de la escala QPSC en ese sentido, probablemente supusiera una mayor
garanta de su validez externa, es decir, de la posibilidad de generalizar con mayor
confianza las propiedades psicomtricas que ha demostrado poseer, y aumentara su
utilidad prctica. Tambin creemos que supone una limitacin de algn relieve el hecho
de no haber comparado el funcionamiento de la escala con otros tipos de escala, con
formato diferente (incluyendo expectativas o importancia atribuida a los tems, por
ejemplo) o con distintos procedimientos de administracin, entre otras posibles
variaciones, ya que eso hubiese permitido contrastarlo en trminos de fiabilidad y
validez y extraer conclusiones previsiblemente relevantes para el estudio de la medida
de la calidad percibida en los servicios socioculturales. Las circunstancias reales en las
que hemos tenido que realizar nuestra investigacin han impedido efectuar tales
comparaciones, aunque convenimos que hubiese sido deseable llevarlas a cabo y
consideramos que abundar en ellas en el futuro probablemente comporte un mejor
conocimiento de las cuestiones aqu abordadas.
En todo caso, y a pesar de las debilidades y limitaciones sealadas, pensamos
que la escala QPSC posee buenas cualidades psicomtricas y que constituye un
instrumento de medida valioso y til para desarrollar una mejor gestin tcnicocientfica de la calidad de los servicios socioculturales municipales, con lo que ello
significa para el bienestar social de los ciudadanos. Confiamos en que con este trabajo
de investigacin hayamos contribuido, siquiera modestamente, a la consecucin de ese
loable propsito.
295
296
REFERENCIAS BIBLIOGRFICAS
Abad. F. J., Garrido, J., Olea, J. y Ponsoda, V. (2006). Introduccin a la psicometra:
teora clsica de los tests y teora de la respuesta al tem. Madrid: Universidad
Autnoma de Madrid.
Abad. F. J., Olea, J.; Ponsoda, V. y Garca, C. (2011). Medicin en ciencias sociales y
de la salud. Madrid: Sntesis.
balo, J., Varela, J. y Rial, A. (2006). El anlisis de importancia-valoracin aplicado a
la gestin de servicios. Psicothema, 18, 730-737.
Aguirre, J.A. (2009). A practical application of statistical gap analysis in National Park
Management in Costa Rica. Pasos. Revista de Turismo y Patrimonio Cultural, 7
(2), 141-162.
Aiken, L. R. (1985). Three coefficients for analyzing the reliability and validity of
ratings. Educational and Psychological Measurement, 45, 131-142.
Aln, M.E. y Fraiz, J. A. (2006). Relacin entre la calidad de servicio y la satisfaccin
del consumidor. Su evaluacin en el mbito del turismo termal. Investigaciones
Europeas en Direccin y Economa de la Empresa, 12 (1), 251-272.
Alet, J. (1994). Cmo obtener clientes leales y rentables. Barcelona: Gestin 2000.
lvarez, A., Lorca, T., Martnez, I., Merchn, F. y Prez, H. (2003). Cmo medir la
satisfaccin del cliente, Madrid: Asociacin Espaola para la Calidad.
lvarez, R. (2007). Estadstica aplicada a las ciencias de la salud. Madrid: Daz de
Santos.
American
Psychological
Association
(1954). Technical
recommendations
for
and
Psychological
Testing.
Washington
DC:
American
Psychological Association.
American Educational Research Association, American Psychological Association and
National Council on Measurement in Education (1999). Standards for
Educational
and
Psychological
Testing.
Washington
DC:
American
Psychological Association.
Andaleeb, S. S. (2001). Service quality perceptions and patient satisfaction: a study of
hospitals in a developing country. Social Science and Medicine, 52, 1359-1370.
Anderson, E. W., Fornell, C. y Lehmann, D. R. (1994). Customer satisfaction, market
share, and profitability: Findings from Sweden. Journal of Marketing, 58 (4),
53-66.
Andreasen, T. (2000). Antecedents to satisfaction with service recovery. European
Journal of Marketing, 34, 156-175.
Antony, F., Antony, F. F. y Ghosh, S. (2004). Evaluating service quality in a UK hotel
chain: a case study. International Journal of Contemporary Hospitality
Management, 16, 380-384.
Armstrong, R. W., Mok, C., Go, F. M. y Chan, A. (1997). The importance of crosscultural expectations in the measurement of service quality perceptions in the
hotel industry. International Journal of Hospitality Management, 16 (2), 181190.
Aron, A. y Aron, E. (2001). Estadstica para Psicologa. Buenos Aires: Pearson.
Asn, R. y Ziga, C. (2008). Ventajas de los modelos politmicos de Teora de
Respuesta al tem en la medicin de actitudes sociales. Un estudio de caso.
Psykhe, 17, 103-115.
Babakus, E. y Boller, G.W. (1992). An empirical assessment of the Servqual scale.
Journal of Business Research, 24, 235-268.
298
299
Borsboom, D., Mellenbergh, G.J. y Van Heerden, J. (2004). The concept of validity.
Psychological Review, 111, 1061-1071.
Boulding, W., Kalra, A., Staelin, R. y Zeithalm, V.A. (1993). A dynamic model of
service quality: From expectations to behavioral intentions. Journal of
Marketing Research, 30 (1), 7-27.
Brady, M.K. y Cronin, J.J. (2001). Some new thoughts on conceptualizing perceived
service quality: A hierarchical approach. Journal of Marketing, 65 (3), 34-49.
Brown, T.A. (2006): Confirmatory Factor Analysis for Applied Research. New York:
Guilford Press.
Brown, S. A., Venkatesh, V., Kuruzovich, J. y Massey, A. P. (2008). Expectation
confirmation: an examination of the three competing models. Organizational
Behavior and Human Decision Processes, 105, 52-66.
Brown, T. J., Churchill, G. A. y Peter, J. P. (1993). Improving the measurement of
service quality. Journal of Retailing, 69, 127-139.
Browne, M. W. y Cudeck, R. (1993). Alternative ways of assessing model fit. En K. A.
Bollen y J. Scott-Long (eds.). Testing structural equations models (pp. 136-162).
Newbury Park (CA): Sage.
Byrne, B. M. (2001). Structural equation modeling with AMOS. Basic concepts,
applications and programming. London: Lawrence Erlbaum Associates.
Byrne, B. M. (2008). Testing for multigroup equivalence of a measuring instrument: a
walk through the process. Psicothema, 20, 872-882.
Byrne, B.M., Shavelson, R. y Muthn, B. (1989). Testing for the equivalence of factor
covariance and mean structures: the issue of partial measurement invariance.
Psychological Bulletin, 105, 456-466.
Cadotte, E. R., Woodruff, R. B. y Jenkins, R. L. (1987). Expectation and norms in
models of customer satisfaction. Journal of Marketing Research, 24, 305-314.
Camilli, G. y Sephard, L.A. (1994). Methods for identifying biased test items. Newbury
Park (CA): Sage.
Camisn, C., Cruz, S. y Gonzlez, T. (2007). Gestin de la calidad: conceptos,
enfoques, modelos y sistemas. Madrid: Pearson.
Campbell, D. T. y Fisk, A. W. (1959). Convergent and discriminant validation by the
multitrait-multimethod matrix. Psychological Bulletin, 56, 81-105.
Capelleras, J.L. y Veciana, J.M. (2001). Calidad de servicio en la enseanza
universitaria: desarrollo y validacin de una escala de medida. Documents de
301
302
303
C.
(2002).
The
Nature
of
Service
Quality.
Disponible
en:
http://www.developing-mangement.com/tom/downloads/9.pdf (22.11.2007).
Drudis, A. (1992). Planificacin, organizacin y gestin de proyectos. Barcelona:
Gestin 2000.
Dumenci, L. (2000). Multitrait-multimethod analysis. En H. E. A. Tinsley y S. D.
Brown (eds.). Handbook of Applied Statistics and Mathematical Modeling (pp.
583-611). San Diego (California): Academic Press.
305
J.
A.
(2000).
European
Customer
Satisfaction
Index
pan-European
306
Falces, C., Sierra, B., Briol, P. y Becerra, A. (1999). Hotelqual: una escala para medir
calidad percibida en servicios de alojamiento. Revista de Estudios Tursticos,
139, 95-110.
Feigenbaum, A. V. (1951). Quality control: Principles, practice and administration.
New York: Mc Graw Hill.
Fernndez, M. C. y Bedia, A. M. S. (2004). Is the hotel classification system a good
indicator of hotel quality? An application in Spain. Tourism Management, 25,
771-775.
Fernndez, K., Lpez, C. y Mariel, P. (2005). La satisfaccin del consumidor: una
aplicacin del anlisis factorial confirmatorio a la industria automovilstica
espaol. Estadstica Espaola, 158, 117-141.
Ferrando, P.J. (1996). Evaluacin de la unidimensionalidad de los tems mediante
anlisis factorial. Psicothema, 8, 397-410.
Fisk, R. P. y Coney, K. H. (1982). Postchoice evaluation: An equity analysis of
consumer satisfaction/dissatisfaction with service choices. En H. K. Hunt and R.
L. Day (eds.) Conceptual and empirical contributions to consumer satisfaction
and complaining behavior (pp. 9-16). Bloomington (IN): Indiana University.
Fisk, R. P. y Coney, K. H. (1985). Disconfirmation of equity expectations: Effects on
consumer satisfaction with services. Advances in Consumer Research, 12, 340345.
Flipo, J. P. (1989). Gestin de empresas de servicios. Barcelona: Gestin 2000.
Flgel, Y. y Young, K. (2000). Psicologa de las actitudes. Barcelona: Paids.
Folkes, V. S. (1988). The avalaibility heuristic and perceived risk. Journal of Consumer
Research, 15, 13-23.
Folkes, V. S. (1994). How consumers predict service quality. En R. T. Rust y R. L.
Oliver (eds.). Service quality. New directions in theory and practice (pp. 21-71).
Beverly Hills (CA): Sage.
Fornell, C. (2007). The satisfied customer: winners and losers in the battle for buyer
preference. New York: Palgrave-Macmillan.
Fornell, C., Johnson, M. D., Anderson, E. W., Cha, J. y Bryant, B. E. (1996). The
American Customer Satisfaction Index: nature, purpose, and findings. Journal of
Marketing, 60 (4) 7-18.
307
Customer Satisfaction Index. Ann Arbor (MI): The Stephen M. Ross School of
Business.
Franke, G. H. (1997). The sum is more than de sum of its parts: The effects of grouping
and randomizing items on the reliability and validity of questionnaires.
European Journal of Psychological Assessment, 13 (2), 67-74.
Fredericksen, N. (1986). Toward a broader conception of human intelligence. American
Psychologist, 41, 445-452
Gadotti, S. J. y Frana, A. (2009). La medicin de la calidad del servicio: una aplicacin
en empresas hoteleras. Revista Europea de Direccin y Economa de la
Empresa, 18 (2), 175-186.
Galbraith, J. K. (1992). La cultura de la satisfaccin. Barcelona: Ariel.
Galgano, A. (1995). Los siete instrumentos de la calidad total. Madrid: Daz de Santos.
Garca-Cueto, E., Gallo, P. y Miranda, R. (1998). Bondad de ajuste en el anlisis
factorial confirmatorio. Psicothema, 10, 717-724.
Garca Jimnez, E., Gil Flores, J. y Rodrguez Gmez, G. (2000). Anlisis factorial.
Madrid: La Muralla-Hesprides.
Georgakellos, D. A. y Marcis, A. M. (2009). Application of the semantic learning
approach in the feasibility studies preparation training process. Information
Systems Management, 26 (3) 231-240.
Gefen, D. (2002). Customer loyalty in e-commerce. Journal of the Association for
Information Systems, 3, 27-51.
Gerrig, R. J. y Zimbardo, P. G. (2005). Psicologa y vida, Mxico: Prentice Hall
Giese, J. L. y Cote, J. A. (2000). Defining consumer satisfaction. Academy of Marketing
Science Review, 2000 (1). Disponible en http://www.amsreview.org/articles
/giese01-2000.pdf. (10.11 2008).
Gil, I. y Molla, A. (1994). La evaluacin de la calidad de servicio en distribucin
comercial minorista. Investigacin y Mrketing, 46, 60-71.
Gonzlez, B. y Carreras E. (2010). Estrategias metodolgicas para medir las opiniones y
actitudes: validacin emprica de la Escala de Calidad Percibida de los Servicios
Locales. X Congreso Espaol de Sociologa. Disponible en: http://www.fesweb.org/archivos/congresos/congreso_10/grupos-trabajo/ponencias/39.pdf.
(28.10.11).
308
309
Hambleton, R. K. (1984). Validating scores. En R. A. Berk (ed.). A guide to criterionreferenced test construction (pp. 199-230). Baltimore (MA): John Hopkins
University Press.
Harman, H. H. (1980). Anlisis factorial moderno. Madrid: Salts
Hayes, B. E. (1995). Cmo medir la satisfaccin del cliente. Barcelona: Gestin 2000.
Helson, H. (1964). Adaptation-Level Theory: an experimental and systematic approach
to behavior. New York: Harper and Row.
Hendrickson, A., Massey, P. y Cronan, T. (1993). On the test-retest reliability of
perceived ease of use scales. Management Information Systems Quarterly, 17,
227-230.
Heredia, J. A. (2001). Sistema de indicadores para la mejora y el control integrado de
la calidad de los procesos. Castelln de la Plana: Universitat Jaume I.
Hernndez Baeza, A., Muiz, J. y Garca-Cueto, E. (2000). Comportamiento del modelo
de respuesta graduada en funcin del nmero de categoras de la escala.
Psicothema, 12 (suplemento 2), 288-291.
Hernndez, R.M.; Muoz, P.; Santos, L. (2007). The moderating role of familiarity in
rural tourism in Spain, Tourism Management, 28, 951-964.
Herrero, J. (2010). El anlisis factorial confirmatorio en el estudio de la estructura y
estabilidad de los instrumentos de evaluacin: Un ejemplo con el cuestionario de
autoestima CA-14. Intervencin Psicosocial, 19, 289-300.
Heung, V. C. S., Wong, M. Y. y Qu, H. (2000). Airport-restaurant service quality in
Hong Kong: an application of SERVQUAL. Cornell Hotel and Restaurant
Administration Quarterly, 41 (3): 86-97.
Hoagland, H. y Williamson, L. (2000). Feasibility studies. Kentucky: University of
Kentucky Publications.
Hochschild, A. R. (1975). The sociology of feeling and emotion: selected possibilities.
En M. Millman y R.M. Kanter (eds.). Another voice. Feminist perspectives on
social life and social science (pp. 280-307). NewYork: Anchor Books.
Hochschild, A.R. (1979). Emotion work, feeling rules and social structure. American
Journal of Sociology, 85, 551-575.
Hofacker, C.F. (1984). Categorical judgement scaling with ordinal assumptions.
Multivariate Behavioral Research, 19, 91-106.
Holland, P. W. y Wainer, H. (eds.) (1993). Differential item functioning. Hillsdale (NJ):
Lawrence Erlbaum Associates.
310
Journal of Consumer
Psychology, 4, 277-303.
International Standard Organization (1995). ISO 8420: Gestin de la Calidad.
Vocabulario. Gneve (Switzerland): International Standard Organization.
Ishikawa, K. (1985). What is total quality control?. The Japanese way. Englewood
Cliffs (NJ): Prentice Hall.
Jackson, D. N. (1965). Acquiescense: the nonvanishing variance component. American
Psychologist, 20, 498-501.
311
313
Lee, H., Lee, Y. y Yoo, D. (2000). The determinants of perceived quality and its
relationship with satisfaction. Journal of Services Marketing, 14 (3), 217-231
Lvy, J. P. (2003). Modelizacin y anlisis con ecuaciones estructurales. En J. P. Lvy y
J. Varela (comps.). Anlisis multivariable para las Ciencias Sociales (pp. 767814). Madrid: Prentice.
Lvy, J. P. y Varela, J. (2006). Modelizacin con estructuras de covarianzas en ciencias
sociales, s.l.: Gesbiblo.
Lewin, K., Dembo, T., Festinger, L. y Sears, P.S. (1944). Level of aspiration. En M.V.
Hunt (ed.). Personality and the behavior disorders: A handbook of experimental
and clinical research (pp. 333-378). New York: The Ronald Press, volume I.
Lewis, B. R. y Mitchell, V. W. (1990). Defining and measuring the quality of customer
service. Marketing Intelligence and Planning, 8 (6), 11-17.
Liljander, V. (1994). Modeling perceived service quality using different comparison
standards. Journal of Consumer Satisfaction, Dissatisfaction and Complaining
Behaviour, 7, 126-142.
Lilliefors, H. W. (1967). On the Kolmogorov-Smirnov test for normality with mean and
variance unknown. Journal of the American Statistical Association, 62, 399-402.
Long, J. S. (1986). Confirmatory Factor Analysis. Beverly Hills (CA): Sage.
Lpez, J. y Gadea, A. (1995). Servir al ciudadano. Gestin de la calidad en la
Administracin Pblica. Barcelona, Gestin 2000.
Lpez, M. C. y Serrano, A. (2001). Dimensiones y medicin de la calidad de servicio en
empresas hoteleras. Revista Colombiana de Marketing, 2 (3), 1-13.
Lpez Pina, J. P. (1995). Teora de la respuesta al tem: fundamentos. Barcelona:
Promociones y Publicaciones Universitarias.
Lovelock, C. H. y Wright, L. (2001). Principles of service marketing and management.
Lebanon (IN): Prentice Hall.
Lord, F. (1952) A theory of test scores. Psychometrika Monograph N 7.
Lord, F.M. (1980). Applications of Item Response Theory to practical testing problems.
Hillsdale (NJ): Lawrence Erlbaum Associates.
Lord, F. M. y Novick, M. R. (1968). Statistical theories of mental test scores. Reading,
(MA): Addison Wesley.
Llorens, F. J. (1996). Una evaluacin de la relacin entre calidad y servicio, satisfaccin
y actitudes del cliente. ESIC Market, 3, 121-132.
314
Matos, C. A., Henrique, J. L. y Vargas, C. A. (2007). Service recovery paradox: a metaanalysis. Journal of Service Research, 10, 60-77.
Mazis, M. B., Ahtola, O. T. y Klippel, R. E. (1975). A comparison of four multiattribute models in the prediction of consumer attitudes. Journal of Consumer
Research, 2 (1), 38-52.
Mehrens, W. A. (1997). The consequences of consequential validity. Educational
measurement: Issues and Practice, 16 (2) 16-18.
McAlexander, J. H., Kaldenberg, D. O. y Koenig, H. F. (1994). Service quality
measurement. Journal of Health Care Marketing, 14 (3), 34-39.
McDougall, G. H. G. y Levesque, T. J. (1994). A revised view of service quality
dimensions: An empirical investigation. Journal of Professional Service
Marketing, 11(1), 189-209.
McLeod, L. D., Swygert, K. A. y Thyssen, D. (2001). Factor analysis for item scored in
two categories. En D. Thyssen, y H. Wainer, (eds.). Test scoring (pp. 189-206).
Mahwah (NJ): Lawrence Erlbaum Associates.
Mei, A. W. O., Dean, A. M. y White, C. J. (1999). Analyzing service quality in the
hospitality industry. Managing Service Quality, 9, 136-143.
Meli, J. L. (2001). Teora de la fiabilidad y la validez. Valencia: Cristbal Serrano.
Mels, G., Boshoff, C. y Nel, D. (1997). The dimensions of service quality: The original
european perspective revisited. Services Industries Journal, 17, 173-189.
Mengak, K. K., Dottavio, F. D. y OLeary, J. T. (1986). Use of importance-performance
analysis to evaluate a visitor center. Journal of Interpretation, 11 (2), 1-13.
Meredith, W. (1993). Measurement invariance, factor analysis and factorial invariance.
Pshicometrika, 58, 525-543.
Messick, S. (1980). Test validity and the ethics of assessment. American Psychologist,
35, 1.012-1.027.
Messick, S. (1989). Validity. En R. L. Linn (ed.). Educational Measurement (pp. 13104). New York: American Council on Education-Macmillan Publishing
Company, 3 ed.
Messick, S. (1998). The role of consequences in validity theory. Educational
Measurement: Issues and Practices, 17, 6-12.
Ministerio de Administraciones Pblicas (2006). Gua de orientacin para la
realizacin de estudios de anlisis de la demanda y de encuestas de satisfaccin,
Madrid: Ministerio de Administraciones Pblicas.
316
Disponible
en
http://www.efdeportes.com/efd73/calidad.htm
(03.05.2004).
Moss, P. A. (1998). The role of consequences in validity theory. Educational
measurement: Issues and Practice, 17 (2) 6-12.
Muiz, J. (1996). Psicometra. Madrid: Universitas.
Muiz J. (1997). Introduccin a la Teora de Respuesta a los Items. Madrid: Pirmide.
Muiz, J. (2003). Teora clsica de los tests. Madrid: Pirmide.
Muiz, J. (2004). La validacin de los tests. Metodologa de las Ciencias del
Comportamiento, 5, 121-141.
Muiz, J. (2005). La validez desde una ptica psicomtrica. Jornadas en Internet sobre
Teoras conductuales y Tests psicolgicos, Universidad de Sevilla, EneroFebrero,1-15. Disponible en http://www.aristidesvara.com/ metodologia/
psicometria/validez/ valpsic_aristidesvara.pdf (21.04.11)
317
Muiz, J., Fidalgo, A. M., Garca-Cueto, E., Martnez, R. y Moreno, R. (2005). Anlisis
de los items. Madrid: La Muralla.
Muoz, A. (1999). La gestin de la calidad total en la administracin pblica, Madrid:
Daz de Santos.
Navas, M. J. (2001). Mtodos, diseos y tcnicas de investigacin psicolgica, Madrid:
Universidad Nacional de Educacin a Distancia.
Nichols, P. D. y Williams, N. (2009). Consequences of test score use as validity evidence: roles and responsibilities. Educational Measurement: Issues and
Practice, 28 (1), 3-9.
Noda, M., Gonzlez, J. y Prez, R. (2005). Dimensiones esenciales de la satisfaccin del
cliente en hoteles. Investigacin y Marketing, 88, 31-36.
Nunnally, J. C. (1978): Psychometric theory, New York: McGraw-Hill.
Nunnally, J. C. y Bernstein, I. H. (1995). Teora Psicomtrica, Mxico: McGraw-Hill,
2 ed.
Nyeck, S., Morales, M., Ladhari, R. y Pons, F. (2002). Ten years of service quality
measurement: reviewing the use of the SERVQUAL instrument. Cuadernos de
Difusin, 13, 101-107.
Oh, H. (2001). Revisiting Importance-Performance Analysis. Tourism Management, 22,
617-627.
Oh, H. y Parks, S. C. (1997). Customer satisfaction and quality: A critical review of the
literature and research implications for the hospitality industry. Hospitality
Research Journal, 20, 35-64.
Olfield, B. y Baron, S. (2000). Student perceptions of service quality in a UK university
business and management faculty. Quality Assurance in Education, 8, 85-95.
Oliete, F. (1998). Calidad del Servicio: cmo medir la satisfaccin del cliente. Revista
Outsourcing, 4, 14 -15
Oliver, R. L. (1977). Effect of expectation and disconfirmation on post-expense product
evaluations: An alternative interpretation. Journal of Applied Psychology, 62,
480-486.
Oliver, R. L. (1980). A cognitive model of the antecedents and consequences of
satisfaction decisions. Journal of Marketing Research, 17, 460-469.
Oliver, R. L. (1981). Measurement and evaluation of satisfaction process in retail
setting. Journal of Retailing, 57 (3), 25-48.
318
319
/ponencias/22.pdf (22.11.2010).
Prez-Gil, J. A., Chacn, S. y Moreno, R. (2000). Validez de constructo: el uso del
anlisis factorial exploratorio-confirmatorio para obtener evidencias de validez.
Psicothema, 12 (suplemento n 2), 442-446.
Peter, J. P., Churchill, G. A. y Brown, T. J. (1993). Caution in the use of difference
scores in consumer research. Journal of Consumer Research, 19, 655-662.
Philip, G. y Hazlett, S. A. (1997). The measurement of service quality: a new P-C-P
attributes model. International Journal of Quality and Reliability Management, 14, 260286.
Pic, E., Varela, J. y Braa, T. (2011). La representacin de los datos mediante el
Anlisis de Importancia-Valoracin: problemas y alternativas. Metodologa de
encuestas, 13, 121-142.
Pollit, C. y Bouckaert, G. (2004). Public management: a comparative analysis. Oxford:
Oxford University Press.
Popham, W. J. (1997). Consecuential validity: right concern-wrong concept.
Educational measurement: Issues and practice, 16, 9-13.
Prieto, C. (1991): La medicin de la calidad percibida por el cliente. MK: Marketing y
ventas, 51, 16-21.
Prieto, G. y Delgado, A. R. (1999). Medicin cognitiva de las actitudes. En J. Olea, V.
Ponsoda y G. Prieto, Tests informatizados: fundamentos y aplicaciones (pp. 207226). Madrid: Pirmide.
Rasch, G. (1960). Probabilistic models for some intelligence and attainment tests.
Copenhagen: Danish Institute for Educational Research.
Ramos, J., Collado, G., Marzo, J. C., Subirats, M. y Martn, P.(2001). Calidad del
servicio percibida por gerentes, empleados y clientes en hoteles y restaurantes.
Revista de Psicologa Social Aplicada, 11 (1), 49-68.
Raykou, T. y Widaman, K. F. (1995). Issues in applied Structural Equation Modeling
research. Structural Equation Modeling, 2, 289-318.
Rebolloso, E., Fernndez, B. y Cantn, P. (2001). Satisfaccin de los usuarios con un
servicio universitario. Elaboracin de un instrumento de evaluacin. Revista de
Psicologa Social Aplicada, 11 (3), 27-47.
Rebolloso, E., Salvador, C., Fernndez, B. y Cantn, P. (2003). Anlisis de la
percepcin y expectativas de los clientes y su impacto en la satisfaccin. Revista
de Psicologa Social Aplicada, 13 (3) 5-18.
321
323
Scheff, T. J. (1997). Emotions, the social bond, and human reality. Cambridge:
Cambridge University Press.
Schmitt, N. (1996). Uses and abuses of coefficient alpha. Psychological Assessment, 8,
350-353.
Disponible
en
http://ist-socrates.berkeley.edu/~maccoun/PP279_
Schmitt.pdf (03.04.2009).
Schneider, J. F. (1973). The conservatism scale: Independent of social desirability?.
British Journal of Social and Clinical Psychology, 12, 90-91.
Schriesheim, C. A. y Denisi, A. S. (1980). Item presentation as an influence on
questionnaire validity: A field experiment. Educational and Psychological
Measurement, 40, 175-182.
Schumaker, R. E. y Lomas, R. G. (1996). A beginners guide to Structural Equation
Modeling. Mahwah (NJ): Lawrence Eirbaum Associates.
Sealy, R. y Stout, W. (1993). An item response theory model for test bias. En P. W.
Holland y H. Wainer (eds.). Differential item functioning (pp. 197-239).
Hillsdale (NJ): Lawrence Erlbaum Associates.
Senlle, A. y Vilar, J. (1996). ISO 9000 en empresas de servicios. Barcelona: Gestin
2000.
Seto, D. (2005). La relacin entre la calidad de servicio percibida por el cliente y la
fidelidad de servicio. Revista Europea de Direccin y Economa de la Empresa,
14 (1), 141-156.
Sharma, A. y Mehta, V. (2004). Service quality perceptions in financialservices. A case
study of banking services. Journal of Services Research, 4, 205-223.
Shavelson, R. J., Gao, X. y Baxter, G. P. (1995). On the content validity of performance
assessmentes: centrality of domain specification. En M. Bierembaum y F.
Douchy (eds.). Altenatives in assessment of achivements, learning process, and
prior knowledge (pp. 131-141). Boston (MA): Kluver.
Sierra, B., Falces, C. Ruiz, M. A. Y Alier, E. (2003). Estructura de la calidad percibida
en servicios de hostelera con clientelas cautivas. ESIC Market, 116, 21-44.
Silva, L. C. (1997). Cultura estadstica e investigacin cientfica en el campo de la
salud: una mirada crtica. Madrid: Daz de Santos.
Sireci, S. G. (1998). Gathering and analyzing content validity data. Educational
Assesment, 5, 299-321.
Sireci, S. G. (2003). Content validity. Encyclopedia of Psychological Assessment.
London: Sage, 1.075-1.077
324
Sireci, S. G. y Geisinger, K. F. (1992). Analyzing test content using cluster analysis and
multidimensional scaling. Applied Psychological Measurement, 16, 17-31.
Sireci, S. G. y Geisinger, K. F. (1995). Using subject matter experts to assess content
representation: a MDS analysis. Applied Psychological Measurement, 19, 241255.
Sitgreaves, R. (1961). A statistical formulation of the attenuation paradox in test theory.
En H. Solomon (ed.). Studies in item analysis and prediction (pp. 17-28).
Stanford (CA): Stanford University Press.
Snow, R. E. y Lohman, D. F. (1993). Cognitive psychology, new test design and new
test theory: an introduction. En N. Frederiksen, R. J. Misley y I. I. Bjar (eds.).
Test theory for a new generation of tests (pp. 1-18). Hillsdale (NJ): Lawrence
Erlbaum Associates.
Steenkamp, J-B. E. M. y Baumgartner, H. (1998). Assessing measurement invariance in
cross-national consumer research. The Journal of Consumer Research, 25, 7890.
Sueiro, M. J. y Abad, J. F. (2009). Bondad de ajuste en tems politmicos: tasas de error
tipo I y potencia de tres ndices de ajuste. Psicothema, 21, 639-645.
Sul, M. A. y Lvy, J. P. (1999). Estrategias de diferenciacin en calidad percibida: Un
anlisis de la invarianza factorial en muestras mltiples. En J .C. Ayala (coord..).
La gestin de la diversidad: XIII Congreso Nacional, IX Congreso HispanoFrancs (pp. 209-220). Logroo (La Rioja), 16, 17 y 18 de junio.
Suhr, D. D. (2006). Exploratory or confirmatory factor analysis?. SAS Users Group
International Proceedings, Paper 231. Disponible en http://www2.sas.com/
Proceedings/sugi31/200-31.pdf. (12.06.2011).
Summers, J. O. y Granbois, D. H. (1977). Predictive and normative expectations in
consumer dissatisfaction and complaining behavior. Advances in Consumer
Research, 4, 155-158.
Swan, J. E., Trawick, I. F. y Carroll, M. G. (1982). Satisfaction related to predictive,
desired expectations: a field study. En R. L. Day and H. Hunt (eds.). New
Findings on Consumer Satisfaction and Complaining (pp. 15-22). Bloomington
(IN): Indiana University.
Tabacknick, B. G. y Fidell, L. S. (1989). Using multivariate statistics. New York:
Harper and Publishers.
325
literature:
suggestions,
practices
and
recomendations
for
327
perspective
in
services
marketing
into
the
traditional
329
330
ANEXOS
331
332
Anexo 1
Cuestionarios
333
SEXO
Hombre
EDAD
Mujer
Primarios/Primaria
Hasta 6 EGB
3BUP/COU/FP sup.
FP-2/Bachillerato
EGB/ESO/FP med.
FP-1/1 2 BUP
Universitarios
Parado
Ama de casa
Estudiante
Pensionista
Horario de tarde
334
Califique de 1 a 10 estos ASPECTOS del PERSONAL del Servicio (1 sera la valoracin mnima y 10 la
valoracin mxima)
Califique de 1 A 10 estos ASPECTOS de los TRAMITES que ha tenido que seguir para utilizar
este Servicio (1 sera la valoracin mnima y 10 la valoracin mxima):
Horarios de atencin al pblico
Rapidez en la realizacin de trmites
Comodidad en la realizacin de trmites (telfono, fax, en persona, etc. )
Ahora, por favor, d una CALIFICACIN GLOBAL a ... (Servicio de que se trate) como Servicio
(1 sera la valoracin mnima y 10 la valoracin mxima):
Y cules son sus SUGERENCIAS para mejorar el funcionamiento general de este Servicio?
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
335
5
Muy
relevante
Instalaciones
Personal
Trmites
2. Consideras que la puntuacin dada por el usuario del Servicio a cada uno de los
siguientes aspectos es apropiada, inapropiada o no sabes si es apropiada o
inapropiada para medir los factores instalaciones, personal y trmites para usar el
Servicio? (Escribe A [apropiada], I [inapropiada] o NS [no sabes] en las casillas
correspondientes).
ASPECTOS
Limpieza
Accesibilidad
Conservacin
Seguridad
Confort
Simpata
Profesionalidad
Motivacin
Comunicacin con usuario
Horarios para hacer los trmites
Rapidez realizacin de trmites
Comodidad de trmites
Instalaciones
Factores
Personal
336
Trmites
Anexo 2
Histogramas de puntuaciones de los items de la escala
QPSC
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
Anexo 3
Grficos P-P normal de las puntuaciones de los items
de la escala QPSC en sus diversas aplicaciones
353
Anexo 3
Grficos P-P de las aplicaciones de la escala en los servicios socioculturales
Grficos P-P normal, datos Universidad Popular 2005
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
Anexo 4
Grficos de dispersin de las puntuaciones de la escala
QPSC en sus diversas aplicaciones
369
Anexo 4
Grficos de dispersin de los tems de la escala QPSC en las aplicaciones de los
casos Universidad Popular 2005, Escuela de Msica 2006; Centro de juventud de
Legans 2008 y Centro de Jvenes de La Corua 2006
Caso Universidad Popular 2005
370
371
372
373
374
375
376
377
378
Anexo 5
Coeficientes de fiabilidad de la escala QPSC en sus
diversas aplicaciones
379
Anexo 5
Coeficientes de fiabilidad en las distintas aplicaciones de la escala QPSC
Caso Universidad Popular 2003
Tabla A5.1.Estadsticos de fiabilidad de la escala en la Universidad Popular
2003
Media de la Varianza de Correlacin
Alfa de
escala si se la escala si se elementoCronbach si
ITEMS
elimina el
elimina el
total
se elimina el
elemento
elemento
corregida
elemento
88,8060
165,153
0,564
0,865
LIMPIEZA
89,1567
161,129
0,526
0,868
ACCESIBILIDAD
89,7239
161,834
0,565
0,865
CONSERVACION
89,1567
160,657
0,588
0,864
SEGURIDAD
89,8097
163,735
0,435
0,875
CONFORT
87,9328
163,186
0,664
0,860
SIMPATIA
87,8881
163,635
0,673
0,860
PROFESIONALIDAD
88,0522
160,095
0,633
0,861
MOTIVACION
87,9888
162,775
0,613
0,862
COMUNICACION
88,3881
166,523
0,531
0,867
HORARIO
88,3582
160,770
0,575
0,865
RAPIDEZ
88,2500
166,226
0,500
0,869
COMODIDAD
380
381
382
383
384
385
386
387
ITEMS
Media de la
escala si se
elimina el
elemento
Varianza de la
Alfa de
escala si se
Correlacin Cronbach si se
elimina el
elemento-total
elimina el
elemento
corregida
elemento
LIMPIEZA
83,3111
84,554
0,612
0,875
ACCESIBILIDAD
84,2778
90,810
0,403
0,888
CONSERVACIN
84,1000
90,810
0,488
0,881
SEGURIDAD
84,0333
93,965
0,489
0,881
CONFORT
83,6889
93,745
0,470
0,882
SIMPATA
83,7111
85,264
0,641
0,873
PROFESIONALIDAD
83,6444
86,007
0,743
0,868
MOTIVACIN
83,9889
84,865
0,706
0,869
COMUNICACIN
84,1444
83,383
0,743
0,867
HORARIOS
85,4444
87,508
0,527
0,880
RAPIDEZ
84,5111
87,354
0,663
0,872
COMODIDAD
84,2111
89,000
0,605
0,875
ITEMS
Media de la
escala si se
elimina el
elemento
Varianza de la
Alfa de
escala si se
Correlacin Cronbach si se
elimina el
elemento-total
elimina el
elemento
corregida
elemento
LIMPIEZA
30,8333
11,713
0,639
0,717
ACCESIBILIDAD
31,8000
12,319
0,623
0,721
CONSERVACIN
31,6222
13,878
0,565
0,741
SEGURIDAD
31,5556
15,576
0,553
0,751
CONFORT
31,2111
15,921
0,463
0,772
388
ITEMS
Media de la
escala si se
elimina el
elemento
Varianza de la
Alfa de
escala si se
Correlacin Cronbach si se
elimina el
elemento-total
elimina el
elemento
corregida
elemento
SIMPATA
23,4505
12,050
0,764
0,878
PROFESIONALID
23,3956
13,108
0,806
0,865
MOTIVACIN
23,7253
12,268
0,798
0,864
COMUNICACIN
23,8791
12,285
0,756
0,880
ITEMS
Media de la Varianza de la
Alfa de
escala si se
escala si se
Correlacin Cronbach si se
elimina el
elimina el elemento-total elimina el
elemento
elemento
corregida
elemento
HORARIOS
14,7802
5,084
0,478
0,875
AGILIDAD
13,8352
4,695
0,771
0,535
COMODIDAD
13,5385
5,362
0,639
0,684
389
ITEMS
Media de la Varianza de la
Alfa de
escala si se
escala si se Correlacin Cronbach si
elimina el
elimina el elemento-total se elimina el
elemento
elemento
corregida
elemento
LIMPIEZA
96,3750
127,458
0,776
0,931
ACCESIBILIDAD
96,5521
129,387
0,754
0,932
CONSERVACIN
96,7396
125,984
0,799
0,930
SEGURIDAD
96,6979
129,160
0,698
0,934
CONFORT
96,8958
124,768
0,677
0,936
SIMPATA
96,1771
131,726
0,793
0,931
PROFESIONALIDAD
96,2917
129,851
0,856
0,929
MOTIVACIN
96,3646
129,139
0,850
0,929
COMUNICACIN
96,2500
133,621
0,769
0,932
HORARIOS
97,1354
134,076
0,489
0,942
RAPIDEZ
96,7604
131,447
0,693
0,934
COMODIDAD
96,7708
131,800
0,675
0,934
Media de la Varianza de la
Alfa de
escala si se
escala si se
Correlacin Cronbach si se
elimina el
elimina el elemento-total elimina el
elemento
elemento
corregida
elemento
LIMPIEZA
34,5000
24,809
0,792
0,852
ACCESIBILIDAD
34,7245
25,521
0,742
0,863
CONSERVACIN
34,8776
24,954
0,747
0,862
SEGURIDAD
34,8776
24,995
0,723
0,867
CONFORT
35,0612
23,419
0,676
0,883
390
ITEMS
Media de la Varianza de la
Alfa de
escala si se
escala si se Correlacin Cronbach si
elimina el
elimina el elemento-total se elimina el
elemento
elemento
corregida
elemento
SIMPATA
27,2222
10,236
0,861
0,911
PROFESIONALIDAD
27,3333
9,878
0,905
0,896
MOTIVACIN
27,4040
9,692
0,891
0,900
COMUNICACIN
27,3434
10,922
0,734
0,950
ITEMS
Media de la Varianza de la
Alfa de
escala si se
escala si se Correlacin Cronbach si
elimina el
elimina el elemento-total se elimina el
elemento
elemento
corregida
elemento
HORARIOS
17,2449
5,692
0,521
0,819
RAPIDEZ
16,8571
6,082
0,629
0,687
COMODIDAD
16,8776
5,676
0,715
0,594
391
ITEMS
Media de la Varianza de la
Alfa de
escala si se
escala si se
Correlacin Cronbach si se
elimina el
elimina el elemento-total elimina el
elemento
elemento
corregida
elemento
LIMPIEZA
95,05
90,947
0,592
0,868
ACCESIBILIDAD
95,62
88,704
0,502
0,874
CONSERVACIN
95,63
87,700
0,598
0,867
SEGURIDAD
95,65
87,237
0,546
0,871
CONFORT
95,84
88,979
0,470
0,877
SIMPATA
94,74
93,244
0,645
0,868
PROFESIONALIDAD
94,89
91,050
0,693
0,864
MOTIVACIN
95,02
90,026
0,693
0,864
COMUNICACIN
94,93
91,291
0,659
0,866
HORARIOS
96,02
90,139
0,432
0,879
RAPIDEZ
95,78
86,424
0,644
0,864
COMODIDAD
95,58
85,817
0,648
0,864
Varianza de la
escala si se
elimina el
elemento
Correlacin
elemento-total
corregida
Alfa de
Cronbach si se
elimina el
elemento
LIMPIEZA
33,63
20,214
0,583
0,763
ACCESIBILIDAD
34,19
19,037
0,480
0,792
CONSERVACIN
34,19
17,490
0,706
0,720
SEGURIDAD
34,17
17,503
0,615
0,748
CONFORT
34,37
18,054
0,548
0,771
ITEMS
392
ITEMS
Media de la
escala si se
elimina el
elemento
Varianza de la
Alfa de
escala si se
Correlacin Cronbach si se
elimina el
elemento-total
elimina el
elemento
corregida
elemento
SIMPATA
27,34
8,211
0,786
0,916
PROFESIONALIDAD
27,50
7,434
0,856
0,891
MOTIVACIN
27,62
7,078
0,846
0,895
COMUNICACIN
27,53
7,369
0,821
0,903
ITEMS
Media de la Varianza de la
Alfa de
escala si se
escala si se
Correlacin Cronbach si se
elimina el
elimina el elemento-total elimina el
elemento
elemento
corregida
elemento
HORARIOS
16,76
6,803
0,463
0,809
RAPIDEZ
16,54
6,440
0,635
0,611
COMODIDAD
16,34
6,107
0,661
0,577
393
ITEMS
Media de la Varianza de la
Alfa de
escala si se
escala si se
Correlacin Cronbach si se
elimina el
elimina el elemento-total elimina el
elemento
elemento
corregida
elemento
LIMPIEZA
100,8270
196,937
0,689
0,934
ACCESIBILIDAD
101,4162
191,190
0,608
0,938
CONSERVACIN
101,2865
193,945
0,771
0,932
SEGURIDAD
101,2162
194,877
0,620
0,937
CONFORT
101,3838
190,368
0,721
0,933
SIMPATA
100,6919
196,040
0,742
0,933
PROFESIONALIDAD
100,7676
193,484
0,788
0,931
MOTIVACIN
101,0054
194,462
0,775
0,932
COMUNICACIN
100,8703
193,255
0,813
0,931
HORARIOS
101,5946
196,318
0,569
0,939
RAPIDEZ
101,6000
189,350
0,793
0,931
COMODIDAD
101,4324
192,160
0,753
0,932
ITEMS
Media de la Varianza de la
Alfa de
escala si se
escala si se
Correlacin Cronbach si se
elimina el
elimina el elemento-total elimina el
elemento
elemento
corregida
elemento
LIMPIEZA
33,1455
27,367
0,649
0,828
ACCESIBILIDAD
33,7000
24,394
0,604
0,844
CONSERVACIN
33,6000
25,511
0,800
0,792
SEGURIDAD
33,5409
25,336
0,634
0,831
CONFORT
33,6864
25,056
0,683
0,817
394
ITEMS
Media de la
escala si se
elimina el
elemento
Varianza de la
Alfa de
escala si se
Correlacin Cronbach si se
elimina el elemento-total elimina el
elemento
corregida
elemento
SIMPATA
26,0942
14,293
0,787
0,923
PROFESIONALIDAD
26,1704
13,710
0,869
0,896
MOTIVACIN
26,3677
13,810
0,850
0,902
COMUNICACIN
26,2735
13,866
0,831
0,908
ITEMS
Media de la
escala si se
elimina el
elemento
Varianza de la
Alfa de
escala si se
Correlacin Cronbach si se
elimina el elemento-total elimina el
elemento
corregida
elemento
HORARIOS
16,2188
8,737
0,598
0,914
RAPIDEZ
16,2135
7,834
0,827
0,688
COMODIDAD
16,0365
8,622
0,755
0,763
395
396
Anexo 6
Grficos de bondad del ajuste del modelo MRG en los
items de la escala QPSC
397
Anexo 6
Grficos de bondad de ajuste del modelo MRG en los tems de la escala QPSC
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
398
1,0
2,0
3,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
399
1,0
2,0
3,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
400
1,0
2,0
3,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
401
1,0
2,0
3,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
3,0
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
402
1,0
2,0
3,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
403
1,0
2,0
3,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
404
1,0
2,0
3,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
405
1,0
2,0
3,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
406
1,0
2,0
3,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
407
1,0
2,0
3,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
408
1,0
2,0
3,0
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-2,0
-1,0
0,0
1,0
2,0
0,6
0,4
Terica
0,2
Emprica
0,0
3,0
-3,0
-2,0
-1,0
0,6
0,4
Terica
0,2
Emprica
0,0
1,0
2,0
3,0
1,0
2,0
3,0
0,8
0,0
0,0
Theta
1,0
-1,0
3,0
0,8
-2,0
2,0
1,0
Theta
-3,0
1,0
-3,0
0,0
Theta
1,0
0,8
0,6
0,4
Terica
0,2
Emprica
0,0
-3,0
Theta
-2,0
-1,0
0,0
Theta
409
1,0
2,0
3,0
410
Anexo 7
Resultados del Anlisis Factorial Multigrupo
411
412
0,679
0,458
( 2) = 0,573
1,344
0,489
1,930
0,860
1,291
413
0,670
0,510
y
1,576
( 2) = 0,561 1,910
0,428
0,762
1,057
414
415
0,747
0,642
y
1,312
( 2) = 0,486 1,637
0,603
0,642
1,312
416
0,757
0,627
y
1,298
( 2) = 0,481 1,601
0,611
0,627
1,298
417
418
1,888
0,631
( 2) = 0,985
0,654
1,053
1,406
0,939
1,507
419
1,939
0,729
y
0,850
( 2) = 1,002 1,414
1,041
0,919
1,432
diag( ( 2 ) ) = [0,191; 0,298; 0,497; 0,460; 0,416; 0,219; 0,223; 0,201; 0,466; 0,572; 0,241;
0,277]
420
421
0,747
0,822
( 2) = 0,486
0,603
1,163
1,637
0,642
1,312
422
1,546
0,798
y
1,064
( 2) = 0,835 1,330
0,755
0,798
1,064
423
424
1,028
(1)
= 0,307 0,517
0,365
0,390
y ( 2) = 0,867
0,629
0,966
1,291
0,813
1,161
425
0,618
0,429
y
0,698
( 2) = 0,770 1,115
0,738
0,853
1,037
426
427
0,731
0,573
y
0,817
( 2) = 0,482
0,520
0,743
0,573
0,817
428
0,745
0,586
y
0,807
( 2) =
0,503
0,520
0,789
0,586
0,807
429