Apostila SPSS PDF
Apostila SPSS PDF
Apostila SPSS PDF
Juliana-Bahiense
[email protected]
Anlise Estatstica Utilizando o SPSS
Guia prtico de comandos
Juliana-Bahiense de Sousa Guimares.
Salvador/BA
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
Sumrio
1. Introduo..................................................................................................................................... 3
2. Primeiro Passo............................................................................................................................ 3
3. As Janelas .................................................................................................................................... 4
4. Os Menus...................................................................................................................................... 6
4.1 Data Editor.............................................................................................................................. 6
4.2 Output...................................................................................................................................... 9
5. Anlise de Dados...................................................................................................................... 10
6. Bibliografia Consultada.............................................................................................................. 19
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
1. Introduo
O Statistical Package for Social Science for Windows (SPSS) um software para anlise estatstica
de dados, em um ambiente amigvel, utilizando-se de menus e janelas de dilogo, que permite realizar
clculos complexos e visualizar seus resultados de forma simples e autoexplicativas.
Segundo o site Wikipedia, SPSS um software aplicativo (programa de computador) do tipo
cientfico, acrnimo de Statistical Package for the Social Sciences - pacote estatstico para as cincias
sociais. Pacote este de apoio a tomada de deciso que inclue: aplicao analtica, Data Mining, Text
Mining e estatstica que transformam os dados em informaes importantes que proporcionam reduzir
custos e aumentar a lucratividade. Um dos usos importantes deste software para realizar pesquisa de
mercado.
A primeira verso data de 1968 e, a mais recente a SPSS for Windows 16 (2007).
Para exemplificar utilizaremos os bancos de dados 1991 U.S. General Social Survey.sav e
anorectic.sav que se encontra no diretrio SPSS.
Para um melhor aproveitamento das rotinas apresentadas nesta apostila faz-se necessrio um
prvio conhecimento de tcnicas estatsticas de explorao de dados.
2. Primeiro Passo
Assim que voc inicia o programa aparece a seguinte tela:
Nela voc poder abrir um arquivo j existente (banco de dados ou sintaxe ou output), ir ao tutorial,
criar um novo banco de dados.
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
3. As Janelas
No SPSS existem 7 tipos de janelas, so elas:
SPSS Data Editor: permite a entrada, modificao e visualizao dos dados.
Output SPSS Viewer: a janela de resultados, tabelas e grficos.
Syntax SPSS Syntax Editor: janela onde guardamos os comandos do SPSS para reutilizarmos
em outra ocasio.
SPSS Pivot Table Object: permite editar e modificar tabelas.
SPSS Chart Object: permite editar e modificar grficos.
Script Editor: cria e modifica scripts para automatizar tarefas.
Text Output Editor: altera texto no visveis no Pivot Table Editor.
Porm, ele trabalha basicamente com as trs primeiras, que estaro expostas nesta apostila.
O aspecto inicial do editor apresentado nas figuras a seguir.
Na Figura 1 temos o Data View (Data Editor), em que as colunas so as variveis e as linhas os
casos (ou indivduos). As clulas podem conter valores numricos ou alfanumricos, mas no podem conter
frmulas.
Figura 1 - Tela dos dados banco anorectic.sav
Na Figura 2 temos o Variable View (Data Editor), local onde definimos as caractersticas das
variveis:
Name: nome da varivel, mximo de 64 caracteres, letras maisculas e minsculas so iguais.
Type: tipo da varivel (numrica, data, monetria, alfanumrica (string))
Width: comprimento da varivel, isto , a quantidade de dgitos que possui.
Decimals: nmero de casas decimais que a varivel possui.
Label: descritivo da varivel
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
Values: rtulos dos valores das variveis (pe, 1=feminino e 2=masculino).
Missing: para indicar a codificao dos valores perdidos, aqueles que no sero considerados para
efeito de clculo estatstico.
Columns: indica o numero de caracteres que formam a coluna, ou seja, a largura da coluna.
Align: alinhamento dos dados.
Measure: seleciona a escala de medida da varivel (intervalar/razo, ordinal ou nominal).
Figura 2 - Tela das variveis banco anorectic.sav
Na Figura 3 temos o View (Output), que mostra todas as sadas solicitadas, como grficos, tabelas,
e resultados estatsticos. Na Figura 4 temos a tela de sintaxe do comando Frequencies do tpico
Descriptive Statistics.
Figura 3 - Tela de sada Output banco anorectic.sav
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
Figura 4 - Tela de sintaxe Syntax banco anorectic.sav
4. Os Menus
4.1 Data Editor
File tem as funes de criar, abrir, ler, imprimir, salvar, mostra os arquivos recentemente
utilizados, para o processo, sai do programa.
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
Edit gerencia comandos de edio dos arquivos, modificar, copiar, colar, cortar, apagar, localizar
e manipula o formato de sada (default).
View formato das telas: barras de ferramentas, fontes, status e linha de grade e rtulos de
variveis.
Data inserir varivel ou dados, define formato dos dados, ordena o arquivo segundo valores de
uma varivel, transpe variveis (em um novo arquivo transpose), agrupa arquivos (merge files), cria novo
arquivo com valores agregados das variveis originais, divide um arquivo segundo uma varivel qualitativa,
seleciona casos em que cumprem uma certa condio, pondera os valores da varivel.
Transform para alterar variavel selecionada, calcular novas variveis a partir das existentes, gera
amostra aleatria, cria nova varivel atravs de uma existente, recodifica variveis, transforma varivel
qualitativa em categrica, atribui postos aos valores de uma varivel (segundo outra), cria varivel Lag de
uma srie temporal, substitui valores perdidos, roda as transformaess pendentes.
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
Analyze Funes estatsticas como Anlise Descritiva, Tabelas de Freqncias, Anlise de
Varincia, Correlao, Regresso, Anlise Fatorial, Anlise de confiabilidade, Anlise de respostas
mltiplas, Testes No-paramtricos, Anlise de Sobrevivncia, etc.
Graphs Criar grficos de barras, setorial, Boxplot, linha, histograma, etc.
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
Utilities para obteno de informaes acerca das variveis, alterar menus, scripts...
Window comutar entre as vrias janelas do SPSS que esto abertas.
Help Tpicos de ajuda, tutorial, Home page do SPSS.
4.2 Output
A barra de menus do Output similar a da janela Data Editor, acrescido dos itens Insert e Format
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
5. Anlise de Dados
No SPSS podemos criar um banco novo no prprio programa ou importar de um outro software, tais
com Excel, Acess, DBase.
Aps carregar o banco de dados o SPSS est pronto para ser explorado.
Iniciaremos com procedimentos mais simples de estatstica descritiva.
Para esta anlise utilizaremos o banco de dados 1991 U.S. General Social Survey.sav
Tabela de Distribuio de Freqncia
Para gerar a tabela de freqncia seguimos os seguintes comandos na barra de menu nas janelas Data
Editor ou Output:
Analyze >> Descriptive Statistics >> Frequecies
Ou, podemos utilizar os comandos diretamente da janela Syntax, como segue:
FREQUENCIES
VARIABLES=sex
/ORDER= ANALYSIS .
Para este exemplo selecionamos a varivel sex (sexo dos respondentes), obtendo a seguinte
sada:
Respondent's Sex
Frequency Percent Valid Percent
Cumulative
Percent
Male
636 41,9 41,9 41,9
Female
881 58,1 58,1 100,0
Valid
Total
1517 100,0 100,0
Podemos formatar os dados da tabela, como nmero de casas decimais, incluir %, fonte, etc. Para
isto, necessrio, ainda na janela Output, darmos duplo clique com o boto esquerdo do mouse na tabela,
para que se abra a ilha de edio, selecionamos os dados que queremos formatar e damos um clique com
o boto direito para que se abra a lista de opes do menu.
Tambm possvel solicitar a tabela de freqncia de diversas variveis ao mesmo tempo,
bastando seleciona-las na janela de dilogo, ou acrescent-las nos comandos do Syntax:
FREQUENCIES
VARIABLES=sex sibs
/ORDER= ANALYSIS .
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
Ainda neste item, podemos solicitar, atravs do boto Statistics e Charts algumas estatsticas
resumo e grficos para representar as variveis.
Quando necessitamos descrever variveis quantitativas atravs de estatsticas gerais podemos
utilizar o comando:
Analyze >> Descriptive Statistics >> Descriptives
Ou mesmo os comandos em:
Analyze >> Descriptive Statistics >> Explore
Neste item do menu Analyze podemos obter alm de parmetros estatsticos, grficos boxplot e
ramo-e-folha e testes de normalidade Kolmogorov-Smirnov e Shapiro-Wilk (em que a hiptese nula, H
0
, nos
diz que a varivel estudada segue distribuio Normal, versus a hiptese alternativa, H
a
, a varivel no
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
segue uma distribuio Normal, cuja regra de deciso se p-valor < ento rejeitamos H
0
) e a analise
visual utilizando os grfico QQ e QQ detrended (normalidade quando os pontos esto distribudos de forma
aleatria em torno da reta).
Para fazermos a analise da varivel X segundo os fatores da varivel Y devemos inserir X em
Dependent list e Y em Factor List.
Para analisarmos variveis quantitativas em funo de uma qualitativa, por exemplo, queremos
saber se o sexo (sex) pode explicar variaes no tempo de estudo (educ). Podemos fazer esta verificao
usando:
I. Analyze >> Explore
II. Analyze >> Reports >> Report Summary in Row
III. Analyze >> Compare Means >> Means
IV. Analyze >> Compare Means >> Independet Sample T Test
V. Graphs >> Boxplot
Para aplicarmos o test t-Student devemos verificar se a varivel testada atendem aos pressupostos
de normalidade e homocedasticidade, este ltimo pode ser verificado pelo teste Levene cuja hiptese nula
diz no existir diferena entre as varincias. O teste t-student tem como hiptese nula a no existncia de
diferena entre a mdia da varivel por grupo (fator). Para os dois testes temos como regra de deciso se
p-valor < ento rejeitamos H
0
.
Cruzamento de Variveis pode ser feito atravs dos comandos:
Analyze >> Descriptive Statistics >> Crosstable
Ento selecionamos as variveis que iro compor as linhas e as colunas. Podemos acrescentar as
percentagens clicando no Cell Display.
Podemos ainda usar um dos comandos do Tables, por exemplo:
Analyze >> General Tables >> General Tables
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
Anlise de Correlao pode ser feita para responder como as variveis se relacionam. Podemos obter os
coeficientes de Correlao de Pearson e o Coeficiente de Correlao de Spearman (variveis cujas
distribuio no seja Normal).
Analyze >> Correlate >> Bivariate
Correlations
Number of
Children
Highest Year of
School Completed
Highest Year School
Completed, Father
Spearman's rho Number of Children Correlation Coefficient
1,000 -,262(**) -,297(**)
Sig. (2-tailed)
. ,000 ,000
N
1509 1507 1064
Highest Year of School
Completed
Correlation Coefficient
-,262(**) 1,000 ,450(**)
Sig. (2-tailed)
,000 . ,000
N
1507 1510 1065
Highest Year School
Completed, Father
Correlation Coefficient
-,297(**) ,450(**) 1,000
Sig. (2-tailed)
,000 ,000 .
N
1064 1065 1069
** Correlation is significant at the 0.01 level (2-tailed).
A hiptese nula testada de correlao nula (teste bicaudal).
Anlise de Regresso pode ser feita para modelar uma varivel em funo de outra (s).
Analyze >> Regression >> (selecionamos o tipo de modelo)
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
A seguir apresentamos a sada do comando Regresso Linear Em que a varivel dependente
educ e as variveis independentes so: sex, paeduc e maeduc.
Variables Entered/Removed(b)
Model Variables Entered
Variables
Removed Method
1
Highest Year
School Completed,
Mother,
Respondent's Sex,
Highest Year
School Completed,
Father(a)
. Enter
a All requested variables entered.
b Dependent Variable: Highest Year of School Completed
Model Summary(b)
Model R
R Square Adjusted R Square
Std. Error of the
Estimate
1
,486(a) ,236 ,234 2,448
a Predictors: (Constant), Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father
b Dependent Variable: Highest Year of School Completed
ANOVA(b)
Model
Sum of Squares df Mean Square F Sig.
1 Regression
1796,560 3 598,853 99,934
,000(a)
Residual
5806,745 969 5,993
Total
7603,305 972
a Predictors: (Constant), Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father
b Dependent Variable: Highest Year of School Completed
Coefficients(a)
Unstandardized Coefficients
Standardized
Coefficients
B Std. Error Beta
t
Sig.
1 (Constant)
9,902 ,384 25,782 ,000
Respondent's Sex
-,380 ,160 -,067 -2,381 ,017
Highest Year School
Completed, Father ,196 ,026 ,288 7,574 ,000
Highest Year School
Completed, Mother ,189 ,031 ,231 6,085 ,000
a Dependent Variable: Highest Year of School Completed
A equao do modelo proposto :
maeduc paeduc sex educ 189 0 196 0 380 0 902 9 , , , , + + =
Coeficiente de determinao:
R
2
= 23,6%. Este modelo
explica 23,6% da variao de
educ.
Com p-valor= 0,000
rejeitamos H0 e educ pode
ser modelado por uma reta
com os preditores
selecionados.
Todos os preditores so
estatisticamente
significantes.
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
Residuals Statistics(a)
Minimum Maximum Mean Std. Deviation N
Predicted Value
9,14 17,22 13,54 1,360 973
Std. Predicted Value
-3,239 2,707 ,000 1,000 973
Standard Error of Predicted
Value ,104 ,379 ,151 ,041 973
Adjusted Predicted Value
9,11 17,20 13,54 1,359 973
Residual
-9,603 8,277 ,000 2,444 973
Std. Residual
-3,923 3,381 ,000 ,998 973
Stud. Residual
-3,930 3,399 ,000 1,001 973
Deleted Residual
-9,636 8,365 ,000 2,455 973
Stud. Deleted Residual
-3,959 3,418 ,000 1,002 973
Mahal. Distance
,744 22,354 2,997 2,499 973
Cook's Distance
,000 ,045 ,001 ,003 973
Centered Leverage Value
,001 ,023 ,003 ,003 973
a Dependent Variable: Highest Year of School Completed
1,0 0,8 0,6 0,4 0,2 0,0
Observed Cum Prob
1,0
0,8
0,6
0,4
0,2
0,0
E
x
p
e
c
t
e
d
C
u
m
P
r
o
b
Dependent Variable: Highest Year of School Completed
Normal P-P Plot of Regression Standardized Residual
A Anlise Fatorial tem como objetivo principal descrever a variabilidade de um conjunto de
variveis em termos de um nmero menor de variveis que esto relacionadas com o grupo original atravs
do modelo linear, sem perda de informao. O SPSS usa os comandos a seguir:
Analyze >> Data Reduction >> Factor
Anlise visula dos
resduos para avaliar a
qualidade do ajuste.
Indica normalidade dos
dados educ.
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
.
Interpretao do teste KMO:
<0,50 Inaceitvel
0,50 0,60 M
0,60 0,70 Razovel
0,70 0,80 Mdia
0,80 0,90 Boa
0,90 1 Muito boa
A hiptese nula do teste de Esfericidade de Bartlett afirma no haver correlao entre as variveis
iniciais.
Na mesma caixa de dilogo podemos definir tambm a Rotao (Rotation), que aplicada para
transformar os coeficientes das componentes principais numa estrutura simplificada pelos mtodos:
Varimax: alguns pesos significativos e os outros prximos de zero
Quartimax: pesos elevados para um nmero reduzido de componentes e prximos a zero para as restantes.
Equamax: combinao do Varimax e Quartimax.
Direct Oblimin e Promax: mtodos no ortogonais, observa-se o pressuposto de independncia das
componentes.
Os mtodo de clculo dos escores so definidos em Scores. E em Options podemos escolher como
ser tratado o valor missing, por exemplo.
No SPSS temos alguns testes de hipteses, por exemplo, temos com testes paramtricos
disponveis o teste t e o ANOVA e como testes no paramtricos, o teste dos sinais, McNemar, Wilcoxon,
Mann-whitney, Kruskal-wallis, Aleatoriedade, Binomial e o Qui-quadrado.
Nesta caixa de dilogo,
podemos especificar
estatsticas descritivas e
coeficientes e correlao.
Selecionamos o mtodo
de extrao dos fatores.
Testes para validade da
aplicao da anlise fatorial.
Initial solution apresenta as
comunalidades, os valores
prprios e a percentagem
de varincia explicada.
Matriz de correlao: variveis em
escalas diferentes.
Matriz de covarincia: mltiplos
grupos, com diferentes varincias
para cada varivel.
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
O teste t pode ser feito atravs dos comandos:
Analyze >> Compare Means >> Independent Samples T test
Os grupos da varivel definido em Define Groups.
A sada apresentada :
Group Statistics
633 13,23 3,143 ,125
877 12,63 2,839 ,096
Respondent's
Sex Male
Female
Highest Year of
School
Completed
N Mean Std. Deviation Std. Error Mean
Independent Samples Test
11,226 ,001 3,887 1508 ,000 ,602 ,155 ,298 ,906
3,824 1276,454 ,000 ,602 ,157 ,293 ,911
Equal variances assumed
Equal variances not
assumed
Highest Year of
School
Completed
F Sig.
Levene's Test for Equality of
Variances
t df Sig. (2-tailed) Mean Difference
Std. Error
Difference Lower Upper
95% Confidence Interval of
the Difference
t-test for Equality of Means
Esses valores correspondem
aos cdigos usados na varivel,
neste caso, sex, 1=masculino e
2=feminino
% de possibilidade de observar
uma diferena de mdias desse
valor, se H
0
for verdadeira.
Mdia de anos para as amostras
(mas. e fem.) difere de 0,602
anos.
Teste da igualdade de
varincias. H
0
varincias iguais.
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
A ANOVA pode ser feita atravs dos comandos:
Analyze >> Compare Means >> One-Way ANOVA
Para os Testes No PAramtricos procedemos da seguinte maneira:
Analyze >> Nonparametric Tests
Temos, nesta ordem, os testes Qui-quadrado, Binomial, Aleatoriedade, Kolmogorov-Smirnov, testes
para duas amostras independentes, testes para duas amostras relacionadas, Kruskal-Wallis e Mediana (k
Independent Samples)
Para fazermos Anlise de Cluster, seguimos os seguintes comandos:
Analyze >> Classify >> Hierarchical Cluster
Obter resumo dos
dados.
Obter testes de comparao
mltipla de Bonferroni.
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
[email protected]
Para colocar as variveis numa mesma escala devemos padroniz-la atravs do mtodo de transformao
encontrado na caixa de dilogo . Para dendogramas,
6. Bibliografia Consultada
CAZORLA, Irene M. Curso de Pacotes Estatsticos. UESC. Ilheus. Ago 2003.
FERREIRA, Armando M. SPSS Manual de Utilizao. Escola Superior Agrria de Castelo Branco. 1999.
PEREIRA, Alexandre. Guia Prtico de Utilizao do SPSS. Anlise de dados para Cincias Sociais e
Psicologia. 4 ed. Edies Silabo. Lisboa. Mar 2003.
SANTANA, Cora. LISBOA, Graa. Manual Bsico do SPSS para Windows. CPD/ UFBA.
SPSS Inc. Statistical Analysis Using SPSS. Chicago. 2001
Wikipedia. SPSS. Disponvel em: <http://pt.wikipedia.org/wiki/SPSS>.