PK

CAPÍTULO 1 Apresentação Geral do SPSS Atualmente a pesquisa científica tem avançado muito a partir dos recursos da estatística. Esse avanço requer que o usuário saiba operar o software, além de ser capaz de compreender e analisar os resultados que o programa oferece, além de organizar as informações a serem inseridas no programa de análise de dados. O objetivo desta apostila é introduzir o usuário ao programa estatístico SPSS – Statistical Package for the Social Science – que se tornou o principal software para análise de dados nas ciências humanas e sociais. Esta apostila possui a pretensão de aliar informações sobre o software com informações sobre estatística a partir de alguns recursos gerais do software. Não se pretende exaurir as possibilidades, tendo em vista que as informações foram elaboradas a partir da versão 18.0 do software e explora apenas os recursos principais. A versão 18.0 possui o nome PASW em virtude da aquisição dos direitos do programa pela IBM. O SPSS (Statistical Package for the Social Science) como o próprio nome sugere, é um software com pacote estatístico para construção, controle, inserção, obtenção de resultados e tomada de decisões baseadas em estatísticas. Entre muitos outros softwares, o SPSS caracterizase pela fácil utilização do usuário final, ou seja, como tudo que se deseja no programa pode ser feito através do sistema point and click (apontar e clicar), não é necessário que o usuário final seja programador, como acontece com muitos outros programas estatísticos. Outra vantagem é que a quantidade de observações (número de linhas de um banco de dados) não é limitada, como por exemplo, no software Excel, que limita a quantidade de linhas em 65 mil. Isso é muito importante quando utilizamos banco de dados com um número grande de observações ou casos, como por exemplo, nos microdados da polícia civil, onde um arquivo anual pode chegar a mais de dois milhões de observações, ou como no caso das muitas pesquisas realizadas pelo IBGE (Instituto Brasileiro de Geografia e Estatística), em que o número de observações por pesquisa é grande. Com o aplicativo SPSS, podemos calcular, filtrar, recodificar, agregar e obter resultados sobre variáveis de maneira simples e direta, sendo esses os recursos mínimos do programa. Neste pequeno manual, veremos como aplicar algumas das possibilidades do SPSS sobre banco de dados. Esta apostila define-se por sua aplicabilidade básica e uso introdutório do programa, ou ainda, esta apostila não tenciona exaurir todas as possibilidades que o programa oferta, sendo apenas uma ferramenta inicial para o usuário de banco de dados. Vale repetir que, os passos aqui apontados garantem apenas uma noção introdutória, porém necessária ao analista de dados. Deste modo, vamos ao programa... Apresentação das Janelas de Trabalho O SPSS está baseado no ambiente Windows, de fácil operação e possui grande abrangência, pois permite realizar uma diversidade de análises estatísticas e gráficas. A principal janela de trabalho é apresentada abaixo e ela compõe o arquivo inicial do software: o arquivo de dados cuja extensão é .sav. A figura 1.0 mostra a janela inicial de digitação de dados do SPSS Data Editor, na qual os bancos de dados são gerados e analisados. Figura 1.0 – Janela principal do SPSS O SPSS possui quatro janelas, a saber: (i) INPUT ou janela de entrada de dados; (ii) OUTPUT ou janela de resultados; (iii) SYNTAX ou janela de programação sobre a janela de entrada de dados; (iv) SCRIPT ou janela de programação sobre a janela de resultados. Nesta apostila concentraremos a atenção somente em duas janelas: SAV e OUTPUT, que estão nas figuras 1.1 e 1.2. JANELA de INPUT Na janela inicial, são apresentadas colunas e linhas para inserção de dados, além de um menu de opções de análises e tarefas que podem ser realizadas pelo software. Na janela SPSS/PASW Data Editor, as linhas indicam os casos (participantes, respondentes, sujeitos) da pesquisa e as colunas representam as variáveis de pesquisa. Essa janela é a principal e gera três tipos de arquivos usados pelo SPSS: o arquivo .sav; o arquivo de resultados ou output de terminação .spo; e o arquivo syntax de terminação .sps. O arquivo .sav armazena todas as informações do banco de dados, como definição de variáveis e dados inseridos. Figura 1.1 Janela de output Navegador do output Na janela de INPUT existem duas planilhas: uma de dados e outra de metadados. A primeira refere-se à entrada de dados propriamente dita e a segunda é onde armazenamos as informações de cada variável do nosso banco de dados, já que variáveis podem ter formatos e configurações diferentes. Por exemplo, a variável sexo é definida por somente duas categorias e pode ser de formato numérico ou de texto. Já uma outra variável, por exemplo, cor ou raça, possui mais de duas categorias. Estas categorias devem ser definidas na planilha de metadados, mas voltaremos a este assunto mais tarde. Pasta de Resultados do output A janela de INPUT do SPSS se parece muito com uma planilha do Excel, mas possui conformação diferente, ou ainda, no INPUT as variáveis são tratadas em conjunto e não podem ter alterações diversas em uma mesma variável. Por exemplo, no excel podemos realizar cálculos diferentes em várias células diferentes numa mesma coluna. No SPSS, pelo menos em princípio, isso não é possível. No SPSS cada coluna refere-se a uma única variável, enquanto que cada linha refere-se a um caso. Se definirmos a segunda coluna como sendo a variável SEXO, em todo o banco de dados àquela coluna só deverá receber informações sobre o sexo dos observados. Numa outra coluna definida como COR ou RAÇA, esta variável só deverá receber informações de cor ou raça dos observados, e assim por diante. Quando nos referimos às linhas, cada uma referese a um conjunto organizado de variáveis sobre um mesmo indivíduo. Portanto, o número total de linhas refere-se ao número total de observações ou indivíduos dentro do nosso banco de dados e o número de colunas refere-se ao número total de variáveis dentro deste mesmo banco de dados. A seguir temos um exemplo de como ficaria um pequeno banco de dados com sexo e cor ou raça. Figura 1.2 Janela principal do SPSS com separação da planilha de dados e de metadados. Planilha de metadados Planilha de dados Como dito anteriormente, na janela de INPUT existem duas planilhas: uma de dados e outra de metadados. A planilha de metadados é o local de definição de cada variável, por exemplo, o tamanho da variável, a definição do seu rótulo, suas categorias etc. Nesta planilha cada linha contém informações sobre uma única variável e cada coluna a definição de cada uma das variáveis constantes num banco de dados qualquer. No exemplo abaixo temos uma visualização melhor disso, de acordo com a figura 1.3. Figura 1.3 – Planilha de metadados. A janela acima apresentada na Figura 1.3 possui várias colunas relativas aos principais parâmetros de cada uma das variáveis da planilha. São oito colunas: Name: refere-se ao nome da variável, composto de até oito caracteres (a depender da versão do programa), que será colocado nas colunas da janela de input de dados. Deve-se clicar em qualquer cela dessa coluna para que se possa digitar o nome da variável; Type: refere-se ao tipo Especificações das variáveis nas colunas Linhas: apresentam as variáveis de variável, ou seja, sua característica de notação (numérica, qualitativa, etc). Clicando-se na cela desta coluna abre-se a caixa de diálogo da Figura 1.3. Observe que a caixa de diálogo Variable Type permite a escolha de vários tipos de variáveis. A definição de cada uma pode ser acessada clicando-se no botão direito do mouse colocado em cima da opção (ver reprodução na Figura 1.3). Esta mesma caixa de diálogo também permite a escolha de outras características da variável (width e decimal places – ver definições abaixo). Width: diz respeito ao número de caracteres da variável. Pode ser definido diretamente na cela ou através da caixa de diálogo Variable Type reproduzida na Figura 1.4. Decimals define o número de casas decimais, a direita da vírgula, que serão apresentadas. Da mesma forma que o Width, pode ser definido diretamente na cela ou na caixa de diálogo Variable Type. Label define o nome atribuído a uma variável e não possui restrição de número de caracteres (e.g., idade, escolaridade, descrição do item de um questionário, entre outras); Value refere-se aos valores que os labels podem assumir. Neste parâmetro o pesquisador deve definir todos os possíveis valores que uma variável pode assumir. Um tipo comum nas ciências sociais é a escala Likert (1 = discordo totalmente; 2 = discordo...); Missing define o tipo de tratamento para os casos ausentes que o pesquisador quer adotar. O Default do programa geralmente é usado, mas outros valores podem ser definidos (e.g. 999 ou 99); Columns define o tamanho da coluna da variável, que será apresentada na janela de input de dados; Align define o alinhamento dentro de cada célula da planilha de dados; Measure que informa o tipo de variável (contínua ou discreta) sendo estudada pelo pesquisador. Esta definição é fundamental, pois o software habilitará o uso das variáveis em certos procedimentos a partir do tipo de medida (measure) selecionada. Na construção de um arquivo de dados para digitação de dados é importante criar como primeira variável uma coluna de identificação. A função desta é criar um rótulo (variável nominal) de identificação do questionário dentro do banco de dados. A Figura 1.4 apresenta, na primeira coluna, uma variável denominada Id ou identificação dos sujeitos. Este rótulo é importante para que o questionário possa ser identificado a qualquer momento, para correção de erros de digitação ou retorno ao questionário para coletar qualquer tipo de informação. A contagem automática do SPSS não é confiável, pois a exclusão de qualquer caso acarretará na modificação da numeração de todos os subsequentes. Na planilha de metadados iremos definir como será cada variável de nosso banco de dados, usaremos o exemplo da variável SEXO para demonstrar como inserir informações que definem uma variável qualquer. Na coluna chamada “Name” criamos o nome que a variável vai ter no banco de dados, lembrando sempre que uma variável não pode ter o mesmo nome que outra. Este nome é único e é ele que distingue a variável dentro do conjunto de variáveis do banco de dados. A segunda coluna chamada “Type” define que tipo de variável ela será: numérica, texto, data etc. No exemplo vamos utilizar o tipo numérico, pois a variável sexo é do tipo categórica e pode, desta maneira, ter números associados a um texto qualquer. Ao clicarmos na célula da coluna “Type” uma pequena caixa com três pontos aparece, se clicarmos nele aparece uma nova caixa de diálogo para escolhermos o tipo da variável. É possível escolher ainda o tamanho dos caracteres da variável, bem como o número de casas decimais. Figura 1.4. Apresentação da janela Variable Type Na coluna chamada “Width” definimos o número de caracteres da variável e na columa “Decimals” definimos as casas decimais da variável numérica. Na coluna “Label” entra a definição do que exatamente se refere a variável, no exemplo refere-se ao sexo dos entrevistados. Na coluna chamada “Values” definimos os valores associados a cada categoria da variável. No exemplo, a categoria “masculino” será definda como número “1” e a categoria “Feminino” como número “2”. Isso fica mais bem exemplificado na figura 1.5. Ao clicarmos na célula da coluna “Values” uma pequena caixa com três pontos aparece, se clicarmos nele aparece uma nova caixa de diálogo para associarmos os valores às categorias: O primeiro quadro branco é destinado para o número e o segundo é destinado para a categoria, feito isso, basta clicar no botão “Add” e a associação passa para o quadro maior. A mesma coisa deve ser feita com a segunda categoria ou com quantas categorias tiverem de ser. Terminado o processo, é só clicar no botão “OK”. Figura 1.5. Inserção de rótulos Abaixo do botão “Add” existem mais dois botões: “Change” que é utilizado para trocar valores ou categorias digitados errados e “Remove” que é utilizado para remover uma categoria indesejada. Na Coluna chamada “Missing” é possível escolher valores que queremos descartar numa dada estatística, este recurso permite que os valores inseridos como missing, por exemplo, não estejam incluídos numa freqüência ou tabela de duas entradas qualquer, porém estes valores não se perdem no banco de dados. As três últimas colunas referem-se a: “Columns” que define o tamanho físico da variável no banco de dados; “Align” para o alinhamento da informação na célula, se à direita ou esquerda ou centro; “Measure” para o tipo de mensuração da variável, se escalar ou nominal ou ordinal. O SPSS possui ainda mais janelas de trabalho. A próxima a ser apresentada refere-se ao output do programa. Nesta janela são geradas as tabelas e os gráficos processados a pedido do usuário. Quando qualquer tipo de procedimento é executado, mesmo na janela de input, os resultados são gerados na janela de output, que se abre automaticamente quando o procedimento de análise é solicitado. Essa janela é, também, um outro tipo de arquivo, com terminação .spo. É importante o usuário ter em mente que deve executar o procedimento de nomeação e salvamento desta janela, para que se torne uma janela de resultados do SPSS. A Figura 1.5 apresenta esta janela do programa. Figura 1.5 Janela de output do programa A outra janela de trabalho do SPSS é a de syntax. Esta janela possibilita a execução de análises estatísticas e a geração de gráficos a partir dos códigos de comando do programa. Este tipo de janela é muito útil quando o padrão de análise de dados é extremamente complexo e/ou exige que as análises sejam feitas com frequência (como aquelas para relatórios periódicos) ou quando as mesmas análises devem ser feitas com diferentes variáveis, o que possibilita apenas que o nome das variáveis seja modificado, sem precisar repetir os procedimentos nos menus do programa. Também é importante ressaltar que, a exemplo da janela de output, a janela de syntax também é um arquivo diferenciado, com terminação .sps A Figura 1.6 apresenta esta janela de trabalho do SPSS. A janela de Syntax é ativada sempre que, ao realizar uma análise, selecionamos a opção paste que informa a programação de procedimentos a serem realizados. Figura 1.6 Janela de Syntax do SPSS Ative o comando Run quando quiser que a programação seja executada!!! MENUS DE COMANDO Na janela SPSS Data Editor o programa possui uma série de menus de comandos, que possibilitam a manipulação e análise dos dados, bem como os procedimentos do windows para trabalhar com arquivos. O primeiro desses menus é denominado File e tem como principais funções a abertura, salvamento, importação, além de outras funções comuns aos diferentes programas da mesma plataforma operacional ou específicos do SPSS. A figura 1.7 apresenta o menu File. No SPSS o menu é bem parecido com os de outros programas, pelo menos até o menu VIEW. No menu FILE temos a possibilidade de abertura das várias janelas do SPSS, podemos abrir um novo banco de dados ou buscar um base de dados em outro tipo de linguagem, podemos ainda salvar uma base já feita por nós, imprimir resultados etc. Neste menu também ficam armazenados os últimos arquivos trabalhados por nós. Figura 1.7 Apresentação do Menu File O segundo menu é o Edit, apresentado pela figura 1.8, que possui as seguintes funções: voltar a última ação, copiar, colar, cortar, procurar (find) e opções. O menu opções tem como objetivo definir diferentes parâmetros do programa, como formato de apresentação dos dados digitados na SPSS Data Editor, o formato de geração das tabelas na janela de output de dados, entre outras funções. Figura 1.8 Opções do menu Edit A Figura 1.8.1 apresenta a janela de diálogo do menu edit/opções. No menu EDIT é possível desfazer uma ação, além de copiar, colar, excluir, procurar informações, e também entrar na caixa de diálogo das OPÇÕES do SPSS, para mudança no Default do sistema. Figura 1.8.1 Apresentações do menu Edit/opções Este menu de opções é importante para adaptar o padrão de apresentação do programa às características ou preferências de trabalho do usuário. Por exemplo, na pasta output labels é importante a definição de apresentação do nome das variáveis e também de seus labels, para que a tabela de resultados já possa fornecer todas as informações necessárias para a interpretação dos resultados das análises. No menu VIEW é possível retirar a barra de status que fica na parte inferior da janela de INPUT, modificar as fontes, retirar as linhas de grade da planilha, e mostrar os valores dos rótulos das variáveis, além de possibilitar a adição de “botões” no menu principal, mas não tente fazer isso em casa. A figura 1.9 apresenta o menu View. Figura 1.9 Apresentação do menu View O próximo menu da barra de comandos é denominada Data. Esse menu possibilita manipular o arquivo de dados de diferentes maneiras. A figura 1.10 apresenta a tela do SPSS com este menu aberto. No menu DATA, nas primeiras opções, podemos definir os valores de uma variável, definir datas, inserir variáveis e casos, além de direcionar o cursor para um caso específico. Como pode ser observado na Figura 1.10, o menu Data possui vários comandos. Estes comandos serão apresentados em tópicos a seguir: • O comando insert variable permite a inserção de uma nova coluna na planilha de dados, ao lado esquerdo da coluna onde se encontra a cela ativa da planilha; • o comando insert case irá inserir uma nova linha em uma planilha de dados, acima da linha em que está a cela ativa da planilha; • o sort cases realiza um ordenamento de todos os casos de uma planilha (linhas) a partir da seleção de uma das colunas do arquivo de dados; este ordenamento pode ser em ordem ascendente ou descendente, como a especificação apontada na janela de diálogo deste comando; Figura 1.10: Apresentação do menu Data No comando Sort Cases, quando a caixa de diálogo é aberta, no lado esquerdo, temos o conjunto de variáveis do banco de dados. Quando clicamos em qualquer uma variável podemos passá-la para o quadro em branco da direita, clicando na seta que fica entre os dois quadros. Podemos também escolher se queremos uma ordem ascendente ou descendente de classificação. Após a escolha das variáveis ou da variável que irá classificar o banco de dados e só clicar no botão “OK”. Essas informações estão na figura 1.11. Figura 1.11: Apresentação do comando Sort Cases • o comando merge files, que possibilita a inserção de novos casos (linhas) ou variáveis (colunas) provenientes de um outro arquivo de dados; • o split files possibilita a separação do banco de dados a partir de uma das variáveis deste banco. Quando este comando está acionado, por exemplo, as análises resultantes serão apresentadas para cada uma das categorias definidas por uma variável. Se for acionado o comando split files para a variável escolaridade na Figura 1.7 serão apresentados os resultados para os sujeitos pertencentes a cada grupo de escolaridade; • o comando select cases possibilita a seleção de um grupo de casos em um mesmo arquivo ou a criação de um outro arquivo a partir de um grupo de casos inicial. Na opção “Select Cases”, no menu DATA, podemos filtrar algumas observações segundo uma cláusula condicional qualquer ou podemos selecionar apenas parte do banco de dados para análises mais refinadas. Ao clicarmos na opção “Select Cases” a seguinte caixa de diálogo abaixo é aberta. Existem três possibilidades de seleção de casos: (i) “If condition is satisfied”; (ii) Random sample of cases”; (iii) “Based on time or case range”. A quarta opção é para quando já criamos uma variável de filtro, e aí podemos usá-la novamente como filtro. Existe ainda a opção de apenas filtrar o banco de dados sem apagar as observações que não desejamos no momento utilizando a opção “Filtered”, ou podemos apagar as opções que não desejamos clicando em “Deleted” no subitem “Unselected Cases Are”. Figura 1.12: Janela Select Cases Quando clicamos na opção “If condition is satisfied” o botão “IF” é habilitado para escolhermos que casos deverão ficar no banco de dados para análise, ou ainda, que casos satisfazem a condição criada e portanto devem constar do banco de dados. Por exemplo, quando queremos filtar somente as delegacias da cidade do Rio de Janeiro, estamos criando uma cláusula condicional de seleção, ou ainda, somente as delegacias que satisfizerem a condição serão mantidas no banco de dados. Quando clicamos no botão “IF” outra caixa de diálogo é aberta, esta caixa é para a construção da cláusula condicional. No nosso exemplo, a condição é a seguinte: vamos selecionar apenas as respostas da função gerencial, da variável função. Figura 1.13: Janela Select Cases com exemplo A variável pode ser escolhida no quadro à esquerda e inserido no quadro da direita através do botão com a seta. Feito isso clicamos no botão “Continue” e a caixa se fechará, voltando para a caixa anterior. Percebe-se que ao lado do Botão “IF” está descrita nossa cláusula condicional e neste momento precisamos decidir se vamos apenas filtrar a função gerencial sem apagar as demais ou se vamos apagar as demais, escolhendo “Filtered” ou “Deleted” no subitem “Unselected Cases Are”. Clicamos em “OK” e o filtro estará acionado. Cumpre ressaltar que, cada vez que fazemos uma seleção sem apagar as observações que não cumprem as condições impostas, quando realizamos nova seleção o programa desconsidera a primeira seleção. Para resolver isso, podemos realizar sucessivas seleções apagando as observações que não queremos e depois salvar o arquivo com outro nome. Dessa maneira o arquivo original fica intacto e podemos trabalhar num arquivo novo de tamanho menor, o que facilita a agilidade computacional do programa, já que o software irá trabalhar sobre menos observações. Figura 1.14: Banco de dados com filtro A segunda opção de seleção “Random sample of cases” é utilizada para selecionar uma amostra aleatória sobre o total do banco de dados. Por exemplo, vamos observar a dinâmica de um certo número de casos, mas não podemos analisar todas as dinâmicas pois o trabalho demandaria muito tempo. Então de posse de todos os casos, poderíamos selecionar apenas a quantidade suficiente para análise. Quando clicamos no botão “Sample”, e na opção “Approximately”, é só escolher o percentual do total de casos que desejamos manter no banco de dados para análise. Por exemplo, podemos escolher apenas 5% do total de casos. A segunda opção “Exactly” é para quando precisamos, ao invés de um percentual, um número fixo, por exemplo, queremos 400 casos. Neste sentido clicamos na opção “Exactly” e escrevemos o total de casos que desejamos. Se o banco de dados tem 24.000 observações, então na segunda caixa da mesma opção escrevemos este número (no caso 400). A terceira opção de seleção “Based on time or case range” é utilizada para selecionar uma faixa de observações contínua no banco de dados. Neste caso escolhemos o número da primeira observação que queremos deixar e o número da última observação. Por exemplo, podemos escolher o intervalo que vai da observação 450 até a observação 950. Clicamos no Botão “Continue” e clicamos em “OK”, o filtro será acionado e só teremos na análise os casos que estão entre 450 e 950. Se por outro lado não queremos mais nenhuma seleção podemos clicar na primeira opção que aparece (“All Cases”) e o filtro é retirado do banco de dados, se e somente se não apagamos os dados que não satisfizeram as condições. Se por acaso apagarmos os dados que não satisfizeram as condições impostas não podemos tornar a mostrá-los de novo no banco de dados, eles são permanentemente excluídos. Por isso, muito cuidado ao apagar os dados numa seleção qualquer, devemos lembrar sempre de salvar o arquivo com outro nome quando selecionamos qualquer coisa apagando. O próximo menu da barra de menus do SPSS é denominado Transform. Este menu possibilita a transformação de variáveis do arquivo, assim como a criação de novas variáveis no arquivo de dados a partir de variáveis já presentes no mesmo. No menu TRANSFORM é possível transformar as variáveis do banco de dados, bem como criar novas variáveis, executar cálculos, gerar séries temporais e números aleatórios etc. A Figura 1.15 apresenta o referido menu na janela de input do SPSS. A seguir são apresentados os comandos desse menu. • compute é um comando de geração de novas variáveis (ou sobreposição de antigas) a partir de variáveis já existentes no arquivo de dados. Este comando é que possibilitará, por exemplo, a geração dos escores fatoriais, gerados a partir da média aritmética de cada um dos itens componentes do fator. Ele permite a composição e manipulação de variáveis por meio de dezenas de funções matemáticas; • o comando recode possibilita a recodificação de valores (labels) de uma variável nela mesma ou na criação de uma nova variável; • automatic recode possibilita a recodificação de variáveis em novas variáveis, mas de forma automática, diferentemente do que possibilita o comando recode, onde a estipulação dos valores é manual; • create time series possibilita a geração de uma variável de série temporal dentro de um arquivo de dados já existentes; • o comando replace missing values realiza substituições automáticas de casos omissos nas variáveis selecionadas. Esta substituição pode ser feita pelo valor médio ou mediano, além de outros métodos. Também é importante ressaltar que o comando gera um novo conjunto de variáveis, onde a substituição é apresentada. Na opção “Compute”, no menu TRANSFORM, podemos executar cálculo simples e complexos e convertê-los em uma nova variável. Ao clicarmos na opção “compute a seguinte caixa de diálogo é aberta. Figura 1.15: Janela do menu Transform Figura 1.16: Janela Compute Onde está escrito “Target Variable” deverá constar o nome da nova variável. No quadro “Numeric Expression”, fica o local da expressão numérica do cálculo a ser realizado. Esta função é achada no quadro à direita chamado “Functions and Special Variables” e inserida no quadro da expressão numérica através do botão com uma seta que situa-se imediatamente acima do quadro central, que contém a descrição da função escolhida. A função é representada pela expressão inserida na janela. Concluída a expressão podemos clicar no botão “OK” e a nova variável será gerada no final da última coluna ou variável do banco de dados. Ainda no menu TRANSFORM, temos a opção de recodificar as variáveis, ou seja, fazer a junção ou modificação dos valores antigos das variáveis para valores novos. As recodificações podem ser feitas numa mesma variável (Into Same Variables), com a perda definitiva dos valores da variável antiga, ou pode ser feita criando uma outra variável (Into Different Variables), que é mais recomendável. Neste caso, a nova variável recodificada será gerada no fim do banco de dados, logo após a última variável. Ao clicarmos na opção “Into Different Variables” a seguinte caixa de diálogo aparece a caixa de diálogo da figura 1.17. Figura 1.17: Janela Recode into diferente variable Devemos, a seguir, colocar dentro do quadro “Numeric Variable - Output Variable” a variável antiga que será recodificada e depois dar um nome a nova variável que será criada. Após isso, clicamos no botão “Change”. No exemplo a variável antiga é representada pela variável função e o nome da nova variável é Função2. Feito isso, o botão “Old and New Values” é habilitado e podemos clicar sobre ele para definir a recodificação; outra caixa de diálogo é aberta. Figura 1.18: Opções da janela recode No quadro “Old Value” é onde devem entrar os valores antigos da variável, um de cada vez. No quadro “New Value” é onde ficam os novos valores da nova variável. Na medida que inserimos os valores novos e antigos, o botão “Add” é habilitado e clicando nele a transformação segue para o quadro “Old - New” à direita. No exemplo, temos uma inversão da escala de 1 a 4, passando para 4 a 1. Terminado de tranformar todos os valores é só clicar no botão “Continue” e voltaremos à caixa de diálogo anterior. Esse procedimento se encontra na figura 1.19. Figura 1.19: Exemplo de recodificação de variável Com a opção “Range” podemos transformar um intervalo de dados em apenas um número, por exemplo, o intervalo que vai do valor “1” até o valor “18” de uma variável antiga qualquer pode ser transformado no valor “1” da variável nova, e assim por diante. O próximo menu de comando é denominado Analyze. Neste menu todos os procedimentos estatísticos estão concentrados. Aqui são apresentadas todas as técnicas descritivas e inferenciais, univariadas e multivariadas. Vale uma ressalva: as técnicas descritivas são aquelas que sintetizam os dados brutos, apresentando os padrões de dispersão (e.g. variância, desvio padrão) e tendência central (e.g. média, moda e mediana), assim como as medidas de posicionamento (e.g. quartil, decil, percentil). As análises inferenciais são aquelas que aplicam modelos probabilísticos, estimando a chance do comportamento observado na amostra se repetir na população. Quanto a técnicas univariadas, estas levam em consideração apenas uma variável e as multivariadas levam em consideração múltiplas variáveis. São comandos do menu analyze: report cases, descriptive statistics, compare means, correlate, regression, data reduction, scale, entre outros. Durante este curso serão abordadas técnicas estatísticas básicas que se encontram nos comandos descriptives statistics, correlate e compare means. Esses comandos serão explorados em outras partes da apostila. As opções do menu Analyse estão na figura 1.20. Figura 1.20: Opções do menu Analyse O próximo menu é denominado graph. Este é relativo aos módulos de geração de gráficos do SPSS, que apresenta uma grande quantidade de recursos de geração e manipulação de dados a partir de gráficos. A Figura 1.21 apresenta a tela do SPSS com esse menu aberto. São tipos de gráficos gerados por este menu do SPSS: • bar apresenta gráficos de barras, ideais para comparação de categorias de uma variável categórica, como escolaridade, sexo, entre outras. Esse tipo de apresentação também é importante para aquelas variáveis categóricas que não tem um somatório total de 100%; • pie é um tipo de gráfico conhecido por pizza. Ele é ideal para variáveis discretas (categóricas) que possuem somatório total de categorias de 100%; • box-plot é um gráfico que apresenta o tipo de dispersão de uma variável, apresentando o mínimo, o máximo, o primeiro e o terceiro quartil e a mediana em uma única representação gráfica. É direcionado para variáveis contínuas e ideal para observar casos extremos univariados. O SPSS trabalha a perspectiva de amplitude interquartílica para a identificação de casos extremos; • histogram é o gráfico de barras direcionado para variáveis contínuas, onde todas as observações são encaixadas em intervalos e sua freqüência contatada (eixo X é o conjunto de intervalos e o Y é a contagem de casos dentro daquela amplitude). Este gráfico é ideal para observar a normalidade das distribuições; • scatter é conhecido em português como gráfico de dispersão e apresenta o relacionamento entre duas variáveis, buscando captar o componente linear de correlação entre essas variáveis. É uma forma gráfica de captar um coeficiente de correlação bivariada ou um coeficiente de regressão simples; • interactive é um módulo do SPSS para trabalhar com todos os gráficos descritos anteriormente e muitos outros, mas com a possibilidade de geração e manipulação tridimensional. Figura 1.21: Opções do menu Graphs Os gráficos dos SPSS podem ser formatados na janela de output do programa. Para isso basta clicar duas vezes sobre o gráfico, na janela de output, que uma terceira janela será aberta e vários procedimentos de formatação podem ser executados, como nomear o gráfico, inserir notas de rodapé, modificar a cor de partes do gráfico, transpor os eixos, entre muitas outra opções. Esses procedimentos são importantes para que os gráficos possam sair do SPSS com a aparência desejada para serem inseridos no corpo de relatórios ou textos. O menu Analyse e o menu Graphs não serão explorados aqui porque farão parte de outros tópicos da apostila. Resumindo... (Obs: esse resumo foi feito com os comandos da versão 13.0; observe as alterações que o software sofreu). As telas ou janelas do SPPS O SPSS trabalha com quatro telas: a) a tela de dados - PROGRAM EDITOR - onde se colocam os dados a serem trabalhados ou onde são carregados os dados criados anteriormente pelo próprio SPSS ou criados por outros programas. Todos os arquivos de dados do SPSS tem como extensão .SAV b) a tela de saída - OUTPUT - gerado pelo SPSS ao rodar algum comando. A extensão destes arquivos são .LST c) a tela de sintaxe (opcional, caso você queira repetir sequências de procedimentos no SPSS), cuja extensão é .SPS d) a tela de gráficos, denominado CHART CARROUSEL, que pode conter um ou mais gráficos. Cada gráfico deve ser editado e gravado, a extensão é .CHT. A tela de dados Ao abrir o SPSS, a primeira tela que ele mostra é a tela de dados – NEWDATA – que é uma matriz formada por linhas e colunas. Cada linha é um registro, que contém os dados de uma unidade amostral (sujeitos da pesquisa) e cada coluna é uma variável. Praticamente não existe limite para linhas e colunas. var var var var var Var ... ... 1 2 3 ... Suponha que você tem o seguinte banco de dados: nome do aluno, sexo, idade, série, turma nome sexo idade serie turma ... 1 Luiz Masculino 9 3ª A 2 Carla Feminino 8 2ª B 3 Leonardo Masculino 8 3ª C 4 Paula Feminino 7 2ª D ... Lembre-se que o SPSS é um pacote em inglês, logo os nomes das variáveis não aceitam acentos, ç, ífem, etc., use no máximo oito letras. Os rótulos ou LABELS aceitam qualquer símbolo, logo podemos usar os símbolos próprios do português. Como veremos mais tarde não é necessário escrever por extenso os rótulos das variáveis, podemos usar códigos e depois dar nome aos códigos, que podem ser copiados e colados para uso em outras variáveis ou em trabalhos futuros. Recomenda-se codificar todas as variáveis, mesmo sendo estas de caráter qualitativas, ou seja entrar como se fosse uma variável numérica, isto facilitará muito o trabalho futuro, como por exemplo quando estamos usando a técnica da análise de variância. Ao gravar um banco de dados do SPSS este automaticamente o fará com extensão .SAV, por essa razão basta dar o nome, também gravará o arquivo no diretório SPSSWIN que contém apenas arquivos de dados gerados pelo SPSS, a menos que você tenha selecionado um outro diretório. variáveis Registros ou sujeitos A tela de saída A tela de saída - OUTPUT - guarda todas as tabelas, estatísticas, testes, resultantes da aplicação dos comandos nos dados. Às vezes estamos rodando várias vezes o mesmo comando, ou porque erramos, ou porque inserimos novas opções, cada rodada gera uma saída, logo, a tela de saída acumula, via de regra, muito lixo, que deve ser limpo para não gravar resultados desnecessários. Por isso não se esqueça de limpar a tela. Para limpar a tela de saída, ir no EDIT, clicar SELECT ALL e acionar a tecla DELETE. Caso você queira guardar a saída num documento WORD, selecione toda a saída, indo no EDIT e clicando SELECT ALL, copiar com o comando CONTROL C, ou clicando o comando COPY do comando EDIT e colar no WORD, com o comando COLAR ou CONTROL V. não esqueça de arrumar a saída, pois via de regra o WORD utiliza o formato padrão e fica desarrumado. Para arrumar selecione todo o documento e use o tipo de letra COURIER NEW e diminuir o tamanho da letra. Outra forma de inserir a saída do SPSS no seu texto do WORD é fazê-lo de forma direta com o comando copiar/colar. Neste caso, apenas cuide do formato das tabelas, utilize a letra COURIER NEW . A tela de sintaxe Geralmente, em pequenas análises não será necessário usar este recurso, que é muito útil para rodar um mesmo programa com vários bancos de dados. A tela de gráficos O SPSS cria uma tela para cada gráfico e os guarda no CHART CARROUSSEL, caso você queira gravar um gráfico você deverá editá-lo e depois salvá-lo com um nome, automaticamente o SPSS colocará a extensão .CHT. Caso você queira colar esse gráfico no seu relatório, no WORD, por exemplo, você deverá executar os seguintes passos: 1. Com o gráfico editado no SPSS, ir no menu EDITAR e clicar em COPY CHART; 2. Abrir seu relatório no WORD, colocar o cursor onde você deseja inserir o gráfico e clicar COLAR ESPECIAL, o WORD abrirá um menu indicando a natureza do gráfico, ai é só dar enter. Outra forma é copiar e colar direto (Control C no gráfico no SPSS e Control V no WORD). No WORD para evitar que seu gráfico mude de local a cada alteração é recomendável inseri-lo em uma caixa de texto. Um outro cuidado a ser observado com os gráficos gerados pelo SPSS é que editá-los a partir do WORD aumenta significativamente a quantidade de memória utilizada pelo documento, por esta razão é melhor deletá-lo e fazer as correções no próprio SPSS e colar de novo. O menu principal do SPSS O SPSS é um programa estatístico amigável, praticamente auto-explicativo, conta com a ajuda - HELP. Os principais comandos são: File Manipula arquivos de dados, de saída, de sintaxe e de gráficos. Abre arquivos novos e já existentes, fecha, salva e salva com outro nome; Imprime e outros subcomandos mais específicos do SPSS. Edit Edita os arquivos, copia, cola, deleta, seleciona, busca, substitui, entre outros. Data Manipula os dados, seleciona, sorteia, insere variáveis, renomeia, entre outros Transform Transforma os dados e variáveis, através de cálculos, recodifica, entre outros Statistics Disponibiliza as técnicas estatísticas mais usuais na pesquisa científica Utilities Alguns comandos úteis Windows Mostras as janelas, em cada janela há um arquivo, geralmente dados, saída e gráficos Help Tela de ajuda O Comando FILE File Função Nome Significado New Abre um arquivo novo Data SPSS Syntax SPSS Output Arquivo de dados Arquivo de sintaxe Arquivo de saída Open Abre um arquivo já existente Data Oracle SQL server SPSS Syntax SPSS Output Arquivo de dados Arquivo de sintaxe Arquivo de saída Read ASCII data Lê um arquivo gravado em ASCII, por exemplo com o EDIT do DOS Close Save Save As Fecha o arquivo Salva o arquivo Salva o arquivo com outro nome Display data Info Apply Data Dictionary Apply Chart Template Mostra os dados (*) Mostra a natureza das variáveis Print Print Setup Stop processor Imprime Pára o programa Exit Sair Para abrir um banco de dados já existente, seguir os passos: ! File !Open !Data ! o SPSS abre um menu onde mostra o diretório SPSSWIN e mostrará os arquivos com extensão .SAV. Clicar duas vezes o arquivo desejado Para salvar um banco de dados, seguir os passos: ! File !Save as ! o SPSS abre um menu onde mostra o diretório SPSSWIN e mostrará os arquivos com extensão .SAV deixando um espaço, para colocar o nome desejado. Quando você está digitando seus dados é recomendável gravar a cada certo tempo, neste caso: ! File !Save data Este procedimento pode ser usado tanto para abrir como salvar dados, saídas, gráficos e programas. Para isto você deve estar na tela que deseja gravar. Na tela de saída: ! File !Save as ! o SPSS abre um menu onde mostra o diretório SPSSWIN e mostrará os arquivos com extensão .LST deixando um espaço, para colocar o nome desejado. Na tela de gráficos, editar o gráfico: ! File !Save as ! o SPSS abre um menu onde mostra o diretório SPSSWIN e mostrará os arquivos com extensão .CHT deixando um espaço, para colocar o nome desejado. O mesmo procedimento para leitura de saídas e/ou gráficos já existentes: ! File !Open ! OUTPUT ! File !Open ! CHART O Comando EDIT Como já foi dito, o comando EDIT gerencia os comandos de edição dos arquivos, copia, cola, procura, limpa, etc. Edit Teclado Significado Undo Cut Desfaz o último corte Cut Copy Copy Table Copy Chart Shift+Del Ctrl+Ins Corta a parte selecionada do arquivo Copia a parte selecionada do arquivo Copia uma tabela selecionada Copia um gráfico (Use para levar o gráfico para o WORD) Paste Clear Select all Shift+Ins Del Cola a parte selecionada do arquivo Deleta a parte selecionada do arquivo Seleciona o arquivo inteiro Search For Data Search For Text Replace Text Round Alt+F5 F5 Shift+F5 Procura por um dado específico, da variável onde está o cursor Procura por um texto específico Substitui um texto selecionado Preferences Você pode manipular o formato de saída. Por exemplo, a ordem “default” das variáveis é alfabética, você pode modificar para que o SPSS processe na ordem de entrada dos dados. Aqui, você pode modificar o comprimento dos valores das variáveis, bem como o número de casas decimais. No OUTPUT você pode modificar o número de linha e colunas das páginas da saída. O Comando DATA Manipula os dados, tanto as variáveis quanto os registros. Para selecionar uma variável clicar uma vez no nome dela, a coluna ficará em preto. O comando DATA Data Função Como acionar e os subcomandos Define variable Define as características da variável em questão Clicar duas vezes no nome da variável Name: colocar o nome da variável Type: diz o tipo de variável (Numérica, StringAlfanumérica, Data, etc.), quantas casas ela tem e quantos números decimais Label: são os rótulos para as variáveis qualitativas. É recomendável definir uma variável qualitativa como numérica e depois atribuir os rótulos ou labels. Por exemplo a variável sexo, digitar 1 para sexo feminino e 2 para sexo masculino e nos labels colocar a equivalência. Missing values: define como deve ser os valores da variável que não tem informação Column format: formata a coluna de dados Templates É uma biblioteca de rótulos que podem ser atribuído as variáveis. Recomendasse usar quando várias variáveis possuem os mesmos labels, como por exemplo o caso das variáveis da escala de atitudes Para acionar, selecionar as variáveis desejadas e clicar em templates. Clicar em define, que abre uma tela inferior. Digitar o nome desejado em name e em value labels colocar para cada valor digitado e o nome desejado. Clicar em ADD para adicionar à BIBLIOTECA. Clicar em apply, value labels e dar OK. Insert Variable Insere uma nova variável Selecionar a variável depois de onde você queira que o SPSS insira a nova variável, depois e só clicar este comando. Insert Case Insere um novo registro (sujeito) Selecionar o registro variável depois de onde você queira que o SPSS insira o novo registro, depois e só clicar este comando. Go to case Vai para o registro desejado Digitar o número do registro desejado Sort cases Ordena o arquivo segundo os valores de uma variável Ao clicar neste comando ele abre uma tela onde você seleciona a variável desejada e a ordem, A- ascendente, D – descendente Transpose Cria um novo arquivo onde as linhas viram colunas e as colunas linhas Selecione as variáveis a ser transpostas em variable(s) a variável chave em variable name. Está última vai virar nome das variáveis recém criadas. Merge Files Junta dois ou mais arquivos. Os arquivos devem estar ordenados (Usar SORT) ADD CASES: Adiciona novos registros ou junta dois arquivos, um debaixo do outro. Cuidado pois as variáveis tem que ter os mesmos nomes. O SPSS guarda os dados em um novo arquivo, ou seja não compromete os dados originais ADD VARIABLES: Adiciona novas variáveis que estão em outro arquivo. Neste caso o cuidado é ter uma variável indexadora, tipo RA, número de matrícula, número do questionário, etc. Data Função Como acionar e os subcomandos Aggregate Cria um novo arquivo com valores de variáveis agregadas, pode ser a soma, média, etc. Selecionar a variável(s) de agregação e colocar em break variable, que pode ser mais de uma. Selecionar a variável(s) que deverão ser agregadas e colocar em aggregate variable, que pode ser mais de uma. O defaul é calcular a média, mas se você quiser usar outras funções entrar em funtion e trocar. Se você quiser trocar o nome do novo arquivo que o SPSS criará entrar em file. Split file Divide (virtualmente) um arquivo segundo uma variável qualitativa Clicar em repeat analysis for each group Selecionar a variável desejada e colocar em group based on. Este recurso é útil quando temos de fazer relatórios iguais por grupos. Selected cases Seleciona os casos que cumprem uma certa condição Clicar em if condition is satisfied. Clicar em if. Selecionar a variável e especificar a condição. O SPSS cria um filtro e não considerará os casos que não satisfazem a condição. Este recurso é bom para encontrar erros no Banco de dados. Depois de processar voltar a este comando e clicar em all cases, para rodar o arquivo completo. Weight cases Pondera os valores da variável É muito útil quando temos valores que devem tomar pesos ou ponderações diferentes O Comando TRASFORM Transforma as variáveis, criando novas a partir de outras, recodifica variáveis, etc. Transform Função Como acionar e os subcomandos Compute Calcula uma nova variável a partir de outras já existentes, podendo usar todas as funções matemáticas e estatísticas Colocar o nome da nova variável em target variable. Em numerical expression colocar as variáveis existentes e as operações entre elas. Por exemplo soma=a1+a2+a3+a4. Ainda você pode selecionar os casos que você deseje trabalhar clicando em if Random Number Seed É a semente para gerar um número aleatório Count Recode Recodifica variáveis • Into the same variable: altera os valores da variável e guarda as alterações na mesma variável. Selecionar a variável e entrar em Old and new values, e a cada valor antigo colocar o valor novo e adicionar clicando add, no fim dar continue. • Into the diferent variable: cria uma nova variável em função de uma já existente, seguir o mesmo esquema do item anterior Rank cases Atribui postos na variável segundo uma outra Automatic recode Cria uma nova variável com o mesmo conteúdo da variável desejada Run Pending transforms Roda as transformações pendentes O Comando ANALYSE Oferece vários procedimentos estatísticos Analyse Subcomandos Função Summarize Frequencies Calcula a tabela de distribuição de frequências. Descriptives Calcula as principais estatísticas descritivas. Explore Faz uma análise completa das variáveis, podendo ainda repetir essas analises por outra variável. Crosstabs Calcula a tabela de distribuição de frequências cruzadas, calcula o teste chi-quadrado para associação de variáveis e outros testes. List cases Lista casos escolhendo as variáveis desejadas Report Summaries in Rows Organiza relatórios em linhas, segundo uma variável Compare means Means Calcula a média, o desvio padrão, soma, etc. das variáveis desejadas. Independent–sampled Ttest Calcula o teste de diferença de duas médias de populações independentes Paired-sampled T-test Calcula o teste de diferença de duas médias de populações emparelhadas. One-Way ANOVA Testa a diferença de médias de mais de duas amostras ANOVA models Simple factorial Testa a diferença de médias do modelo fatorial General factorial Testa a diferença de médias do modelo geral Multivariate Calcula o teste de análise de variância multivariada Correlate Bivariate Partial Calcula a matriz de correlação, tomando as variáveis de duas em duas Calcula o coeficiente de correlação parcial Calcula a distância euclidiana entre os casos Distances (sujeitos) Regression Linear Logistic Probit Nonlinear Ajusta o modelo de regressão linear Ajusta o modelo de regressão logística Ajusta o modelo Probit Ajusta um modelo não linear Loglinear General Hierarchical Logit Classify K-means cluster Hierarchical clusters Discriminant Análise de clusters Análise de clusters hierárquicos Análise discriminante Data Reduction Factor Análise factorial Scale Reliabity analysis Multidimensional Scaling Análise de confiabilidade Non Parametric Test Chi-square Binomial Runs 1-Sample K-S 2-Independent Samples k-Independent Samples 2-Related Samples K-Related Samples Testes não paramétricos ou de distribuição livre Survival Análise de sobrevivência Multiple response Análise de respostas múltiplas Comando GRAPHS Oferece vários tipos de gráficos Graphs Função Tipo de variáveis Bar Gráfico de barra Qualitativas, discretas de poucos valores Line De linha Séries de tempo Area De área Série de tempo Pie Circular Qualitativas Boxplot Da caixa Quantitativas Scatter De dispersão Relação entre duas variáveis quantitativas, podendo colorir segundo outra variável Histogram Histograma Quantitativa (de preferência contínua). Tem a opção de desenhar a curva normal superposta ao histograma O Comando UTILITIES Oferece vários procedimentos úteis no gerenciamento das informações Utilities Função Command Index Fonts Fonte da letra usada na tela de dados e de saída Variable Mostra a definição utilizada para a variável File Info Mostra a definição utilizada para todas as variáveis do arquivo ativo Output Page Titles Coloca título em todas as páginas Define sets Use sets Grid lines Coloca (ou tira) as linhas de grade da tela de dados Value labels Mostra os rótulos das variáveis Auto New case Designate window 2.3.8 O Comando WINDOWS Manipula a apresentação das janelas e serve para mudar de janela. Windows Função Tile Coloca todas as janelas ativas uma ao lado da outra Cascade Coloca as janelas em cascata, para mudar de tela é só clicar na tela desejada Icon Bar Status Bar Mostra as janelas ativas Criando um banco de dados no SPSS O SPSS oferece a opção de criar o banco de dados no próprio SPSS, bem como importar um banco de dados do EXCEL ou de qualquer outro banco de dados de extensão dbf. Para criar um banco de dados no próprio SPSS, basta definir cada uma das variáveis e para isso clicar duas vezes no cabeçalho da variável, o SPSS abre uma tela de definição, onde você indica o tipo de variável (numérica, string-alfanumérica-, data, etc.), os labels (rótulos), formatos, nome da variável. Aqui recomenda-se o uso de códigos numéricos para as variáveis qualitativas. Por exemplo: 1=Masculino, 2=Feminino. Os rótulos podem ser guardados em uma biblioteca que você pode acessar em qualquer momento, isso economiza tempo e trabalho. Uma vez criadas as variáveis, você está pronto para digitar seus dados. Retomando o exemplo anterior: nome sexo idade serie turma ... 1 Luiz Masculino 9 3ª A 2 Carla Feminino 8 2ª B 3 Leonardo Masculino 8 3ª C 4 Paula Feminino 7 2ª D ... Codigo nome sexo idade serie turma ... 1 1 Luiz 1 9 3 1 2 2 Carla 2 8 2 2 3 3 Leonardo 1 8 3 3 4 4 Paula 2 7 2 4 ... 5 Tabela de códigos: Embora o SPSS tenha a numeração das linhas, recomenda-se codificar todos os sujeitos isso facilita a identificação dos questionários, principalmente na hora da crítica e consistência da digitação e das respostas Sexo: 1=Masculino 2=Feminino Série: 1=1ª série 2=2ª série ... Turma: 1=A 2=B .... OUTROS MENUS O menu GRAPHS possibilita a confecção de gráficos ao invés de tabelas ou em conjunto com elas, porém os recursos gráficos do SPSS, pelo menos os que integram o pacote básico, não são muito amigáveis. Deste modo, recomenda-se a migração dos resultados obtidos no SPSS para o Excel, que possui uma interface mais amistosa e conhecida. O menu utilities possui vários comandos que auxiliam na manipulação dos dados e das variáveis de um arquivo. Existem comandos para a visualização das variáveis e seus respectivos critérios de definição, estipulados na janela do SPSS Data Editor (input) chamada variable view. O menu UTILITIES é voltado para informações gerais das variáveis bem como informações do sistema operacional do SPSS. Os menus WINDOW e HELP estão comumente presentes em muito sofwares, não apresentando nenhuma variação significativa nas suas opções. O menu Window possibilita a mudança de janelas do SPSS, como em qualquer programa de ambiente windows. O último menu é denominado Help. Nele estão inseridas muitas informações sobre o programa, desde como executar determinados procedimentos até a explicação da função de diferentes técnicas estatísticas. Este menu possui um tutorial de procura de termos, que pode ser muito útil para a proficiência na operação do SPSS.

PK

quarta-feira, 4 de dezembro de 2019

Sem comentários:

Enviar um comentário