Um Modelo em Análise de Regressão para Avaliar o Conhecimento
Transcrição
Um Modelo em Análise de Regressão para Avaliar o Conhecimento
XLVI SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL Pesquisa Operacional na Gestão da Segurança Pública 16 a 19 Setembro de 2014 Salvador/BA Um Modelo em Análise de Regressão para Avaliar o Conhecimento Fonológico de Crianças com Desenvolvimento Típico Gastão Coelho Gomes (UFRJ) Suzana do Couto Mendes (UFRJ) Christina Abreu Gomes (UFRJ/CNPq) Resumo: Aplicação de modelo em regressão para tratamento de dados lingüísticos de crianças com desenvolvimento típico, obtidos através da aplicação de teste de repetição de pseudopalavras, com o objetivo de checar o conhecimento fonológico e sua relação com o tamanho do léxico da criança. A acuracidade das crianças na repetição das pseudopalavras foi medida através de um índice que computou cada som produzido em comparação com os apresentados nos estímulos. Os escores obtidos foram avaliados em função da frequência de tipo das sílabas que constituem as pseudopalavras e o tamanho do léxico das crianças. Um modelo estatístico único foi proposto para abranger as duas variáveis simultaneamente (frequência e tamanho do léxico) na explicação da acuracidade de repetição (escore), o que foi uma escolha importante para viabilizar a realização dos testes de hipóteses relativos a diferentes modelos encaixantes. Os resultados obtidos pela análise exploratória subsidiaram a interpretação das hipóteses linguísticas, motivação inicial do problema, e conduziram à observação de questões da metodologia de análise de regressão com modelos encaixantes e variáveis indicadoras. Palavras-chave: Lingüística; Análise de Regressão; Variáveis Indicadoras. Abstract: Application of regression model in modeling linguistic data from children with Specific Language Impairment (SLI) obtained through the application of ABFW Test (naming and repetition of lexical items), in order to check their phonological knowledge and its relationship with the size of child's lexicon. The accuracy of children in the repetition of pseudowords was measured by an index that computed each sound produced compared with those presented in the stimuli. The scores were evaluated according to the type frequency of the syllables constituting pseudowords and the size of the children’s lexicon. A single statistical model was proposed to handle both variables simultaneously (frequency and lexicon’ size) in explaning the accuracy of repetition (score), which was an important decision to make possible hypothesis tests related to nested models. The results obtained using the exploratory analysis give a subsidy to interpreting the linguistic hypothesis proposed, the original motivation for the study, and conduct to some methodological issues about regression analysis of nested models and dummy variables. Keywords: Linguistics; Regression Analysis; Dummy variables. XLVI SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL Pesquisa Operacional na Gestão da Segurança Pública 16 a 19 Setembro de 2014 Salvador/BA 1. Introdução Nesse trabalho procuramos explicar, através de modelos de análise de regressão, o comportamento observado em crianças com desenvolvimento típico com idades entre 5 e 12 anos, em dados obtidos em situação de teste. O objetivo foi avaliar o conhecimento fonológico em função do desempenho no teste de repetição de pseudopalavras. Os resultados aqui apresentados foram obtidos por Mendes (2014). De acordo com Mendes (2014) a hipótese que sustenta este estudo é que o conhecimento fonológico dos falantes é abstraído das representações das palavras no léxico. As palavras estão organizadas em redes de conexões lexicais por semelhança sonora, semântica ou ambas, e essas relações permitem a inferência de relações fonotáticas (distribuição, frequência de tipo, etc) bem como outros níveis mais altos de abstração, dando suporte, portanto, para o processamento de pseudopalavras, que são estímulos ou palavras formadas por combinações possíveis dos sons da língua, mas inexistentes no léxico (Bybee, 2001; Pierehumbert, 2003). Estudos têm mostrado que as inferências probabilísticas no léxico proveem sustentação para o processamento da informação sonora processada e que a frequência de tipo das combinações de segmentos constituintes das pseudopalavras pode afetar a avaliação (Frisch, Large e Pisoni, 2010). Estudos com crianças com desenvolvimento típico e de população clínica, utilizando a medida de acuracidade em teste de repetição de pseudopalavras mostraram que a frequência de tipo dos constituintes tem relação com o desempenho observado (Gathercole, 1995, Esteves, 203). O léxico de um adulto teria tamanho suficiente para garantir robustez a qualquer representação da gramática fonológica, assim, o esperado é que para os adultos não haja diferença de grau de acuracidade em função da frequência de tipo dos constituintes das pseudopalavras. Mas em relação às crianças, que tamanho do léxico é suficiente para conferir robustez às representações? É objetivo deste estudo avaliar o conhecimento fonológico das crianças com desenvolvimento típico através da medida de acuracidade de repetição de pseudopalavras. O teste foi elaborado por Esteves (2013) e é constituído de 30 estímulos, todos com sílaba CV com as seguintes características: 10 estímulos com duas sílabas (CV.CV), 10 estímulos de 3 sílabas (CV.CV.CV) e 10 estímulos de 4 sílabas (CV.CV.CV.CV), sendo metade de cada tamanho de constituintes de alta frequência de tipo e de baixa frequência de tipo. A frequência de tipo foi obtida na base do Projeto Aspa/UFMG (http://www.projetoaspa.org). Na dissertação de Mendes (2014) foram analisados o tamanho do item lexical bem como a idade da criança. Neste trabalho focalizaremos o tamanho do léxico e sua relação com a acuracidade. O tamanho do léxico de cada criança foi obtido através da aplicação do teste Peabody (Dunn&Dunn, 1997), que avalia o tamanho do léxico receptivo de crianças e adultos. O teste foi gravado por uma voz feminina de 24 anos, em ambiente preparado acusticamente e foi apresentado pelo software DMDX, que apresenta os estímulos em ordem aleatória a cada aplicação. As crianças foram instruídas a repetir os estímulos. Primeiramente foram apresentados 5 estímulos na fase treino e, em seguida, os 30 estímulos do teste. Constitui o conjunto de observações: 1. a variável dependente, y = escore, que foi obtido como medida de acuracidade na repetição de pseudopalavras, de acordo com o índice utilizado em Esteves (2013) = 2 pontos para o som igual ao do estímulo, 1 para substituição e 0 para ausência, dividido pelo número de segmentos do estímulo. A escala contém índices entre 0 e 1. 2. a variável explicativa, Peabody, tamanho do léxico das crianças que foi obtido através da aplicação do teste Peabody; XLVI SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL Pesquisa Operacional na Gestão da Segurança Pública 16 a 19 Setembro de 2014 Salvador/BA O teste foi aplicado a 66 crianças com desenvolvimento típico recrutadas em escola particular de um subúrbio da cidade do Rio de Janeiro. Todas as sessões de aplicação do teste de repetição de pseudopalavras foram gravadas e a identificação da forma usada pelas crianças foi estabelecida com base nas gravações e avaliada por mais de um julgador. Conforme já mencionado, o tamanho do léxico da criança foi obtido através do teste Peabody, que é um teste padronizado adaptado para o português e utilizado com aplicação clinica. O teste de vocabulário receptivo de Peabody (Dunn&Dunn, 1997) é um teste de compreensão que visa quantificar o conhecimento do vocabulário em crianças (a partir de 2 anos e meio) e adultos. Consiste de uma série de cartões, cada qual contendo 4 gravuras diferentes, num total de 204 cartões. A criança é solicitada a identificar a gravura que melhor representa o significado da palavra enunciada pelo examinador. O teste foi administrado conforme as instruções especificadas no manual, com as palavras traduzidas para o português, e os scores já estabelecidos para cada idade utilizados como referência para a análise (ver tabela A2 no anexo). Para a faixa etária das crianças da amostra, o score esperado para as crianças com desenvolvimento típico está entre 51e 79 pontos. O score pode estar adequado, abaixo ou acima do esperado. A amostra foi constituída de três grupos de crianças na faixa de 5 a 12 anos de idade, divididas em três grupos: 5 anos, 7 anos e de 9 a 12 anos. As crianças foram escolhidas em função da idade e por não apresentarem queixas ou histórico de quaisquer desordens significativas de aprendizagem, linguagem e/ou audição e por não terem repetência escolar. 2. Análise Estatística A técnica estatística que usamos é Análise de Regressão sendo y=escore, a variável a explicar. A variável explicativa é o tamanho do léxico (Peabody) e algumas variáveis indicadoras, ou seja, variáveis que assumem o valor um quando a característica está presente e o valor zero quando ela está ausente. Um bom exemplo do uso de variáveis indicadoras pode ser visto em Weisberg (1985, pag.177-183). As 2 variáveis indicadoras aqui usadas são: If1 para indicar se o estímulo repetido é constituído de sílabas de alta freqüência. If2 para indicar se o estímulo repetido é constituído de sílabas de baixa freqüência. As indicadoras If1, If2, são excludentes entre si: quando para uma observação uma delas assume o valor um, as outras assumem o valor zero. 2.1 Análise Exploratória A seguir apresentamos, para efeito descritivo das observações, os gráficos com os escores de acuracidade para cada tipo de estímulo, de alta ou baixa freqüência, em função do tamanho do léxico das crianças. XLVI SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL Pesquisa Operacional na Gestão da Segurança Pública 16 a 19 Setembro de 2014 Salvador/BA Gráficos 1: Escore versus Tamanho do Léxico para cada tipo de estímulo Observam-se escores altos de repetição tanto com o índice de tamanho do léxico baixo quanto com índice alto para os dois tipos de estímulo (baixa e alta freqüência). No entanto, pode-se observar, nos dois gráficos, que a partir de um determinado tamanho (em torno de 140 pontos) os índices baixos (abaixo de 0.70) de acuracidade desaparecem. As curvas de tendência, cujos valores dos parâmetros D e E estão apresentados na Tabela 1 a seguir, tanto para os estímulos de baixa frequência de tipo quanto para os estímulos de alta frequência de tipo, revelaram que há relação entre escore de acuracidade e tamanho do léxico. Começaremos a nossa análise dos dados com os modelos completos para explicar a acuracidade (Y=escore) em função do tamanho do léxico (X= Peabody) nos dois tipos de estímulos, conforme a equação a seguir: Escore = D1 If1 + D2 If2 + E1 If1 Peabody + E2 If2 Peabody (eq. 1) 2.2 Análise de Regressão Basicamente este modelo ajusta 2 retas de regressão, uma para cada um dos 2 tipos de estímulos. A Tabela 1 apresenta os coeficientes e os testes t como em Montgomery (1982) da equação 1 referente ao modelo completo. XLVI 16 a 19 SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL Setembro de 2014 Pesquisa Operacional na Gestão da Segurança Pública Salvador/BA Tabela 1. Estimação dos α e β da equação 1 correspondente aos dois tipos de estímulos Indicador Coef. Do Grupo α β If1 If2 If1X If2X 0.8688 0.9198 0.0007 0.0004 Estat. - t p.valor 99.8383 105.6653 8.0457 4.8221 0.0000 0.0000 0.0000 0.0000 Medidas sobre o ajuste: Erro Padrão do resíduo = 0.0892, R2= 0.9912 N = 1972, F = 55657.5 com 4 e 1968 gl, p-valor = 0.0000 SQR=0.9912 De acordo com a tabela acima, todos os parâmetros do modelo completo, tanto dos D’s e E’s nos dois estímulos são significativamente diferentes de zero. Assim, os parâmetros devem ser considerados. A questão que se levanta então é se as retas são iguais ou diferentes, isto é, se alguns dos parâmetros D’s (intercepto) ou E’s (inclinação) podem ser considerados iguais nos dois estímulos. Propomos um teste, apresentado na seção a seguir, para avaliar conjuntamente estes parâmetros. 2.3 Análise Estatística visando à identificação dos estímulos com comportamento equivalente Além desta formulação geral temos também como interesse juntar processos que apresentam comportamentos equivalentes conforme sugerido pela análise exploratória precedente aliada às hipóteses lingüísticas referidas anteriormente na introdução. Para isso consideraremos modelos aninhados (Weisberg, 1985). Para decidirmos sobre a semelhança dos dois modelos em questão, o completo e o reduzido, com menos variáveis explicativas, será testada uma hipótese de igualdade dos parâmetros (inclinação e/ou intercepto) para os diferentes processos. A estatística de teste F estará baseada nas SQR (soma dos quadrados dos resíduos) dos modelos em questão com os seus respectivos gl (graus de liberdade): FCR SQR R SQR C / gl R gl C SQR C / gl C (eq. 2) onde, o índice C significa modelo completo e o R significa reduzido, assim. O objetivo é juntar parâmetros sem que aumente significativamente a SQR, sendo a medida para esta verificação a estatística FCR acima. A tradução de FCR foi expressa numa função, mostrada no apêndice a seguir, feita no software “R”. XLVI 16 a 19 SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL Setembro de 2014 Pesquisa Operacional na Gestão da Segurança Pública Procuraremos identificar se os dois tipos de estímulos têm Salvador/BA uma proximidade dos E ' s (inclinação), o que indicaria o mesmo comportamento de acuracidade (y=Escore) em função do tamanho do léxico (x=Peabody) para estímulos constituídos por tipos silábicos diferentes (baixa e alta freqüência). Testaremos então a hipótese de que os E' s correspondentes a esses estímulos são iguais. Caso a hipótese nula (de igualdade dos E' s ) seja aceita, poderemos concluir que o modelo reduzido é mais indicado que o modelo completo para aquele particular Problema. O p-valor correspondente à estatística FCR acima mencionada é o instrumento que nos permitirá decidir pela aceitação ou pela rejeição dessa hipótese. O mesmo tipo de raciocínio também foi tentado com relação aos D' s (intercepto) conforme desenvolvido na seção a seguir. 2.3.1Em Busca de um modelo adequado para o Problema Sugerido pela análise dos gráficos 1 procuramos checar se os interceptos e as inclinações observadas dos estímulos podem ser consideradas iguais no modelo reduzido. Testamos os seguintes modelos reduzidos comparados com o modelo completo já apresentado na eq.1, a representação gráfica de cada uma das três tentativas está na figura abaixo, gráficos 2. Gráficos 2: Visualização dos comportamentos possíveis com relação as duas retas. Tentativa 1 Tentativa 1) Tentativa 2 Tentativa 3 H0: As duas retas independentemente do estímulo são iguais Escore = D3 (If1 + If2) + E3 (If1+If2) Peabody (eq. 3) O resultado foi que o modelo reduzido não é tão bom quanto o completo, com FCR= 31,9 com 2 e 1967 graus de liberdade, resultando num p-valor de 2,3e-14 que rejeita a hipótese de que os dois modelos, o completo e o reduzido, não têm o mesmo poder explicativo. XLVI 16 a 19 SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL Setembro de 2014 Pesquisa Operacional na Gestão da Segurança Pública Salvador/BA Tentativa 2) H0: As duas retas independentemente do estímulo têm inclinações iguais com diferentes interceptos Escore = D4 If1 + D5 If2 + E4 (If1+If2) Peabody (eq. 4) O resultado foi que o modelo reduzido não é tão bom quanto o completo, com FCR= 27,1 com 1 e 1967 graus de liberdade, resultando num p-valor de 2,1e-07 que rejeita a hipótese H0 de que os dois modelos, o completo e o reduzido, não têm o mesmo poder explicativo. Tentativa 3) H0: As duas retas independentemente do estímulo têm interceptos iguais com diferentes inclinações Escore = D6 (If1+If2) + E5 If1+ E6 If2 Peabody (eq. 5) O resultado foi que o modelo reduzido não é tão bom quanto o completo, com FCR= 39,0 com 1 e 1967 graus de liberdade, resultando num p-valor de 5.2e-10 que rejeita a hipótese H0 de que os dois modelos, o completo e o reduzido, não têm o mesmo poder explicativo. Esses resultados das 3 tentativas de unir os parâmetros nos 3 modelos reduzidos indicam que as duas retas não podem ser consideradas com algum dos parâmetros comuns, o que significa dizer que as retas são diferentes, isto é, têm inclinação e intercepto diferentes.. 3. Conclusões Do ponto de vista da análise estatística, a busca dos modelos mais adequados para explicação do escore de acuracidade, a variável resposta, revelou um modelo em que não há redução de parâmetros tanto das inclinações quanto dos interceptos. Do ponto de vista das hipóteses linguísticas, a análise estatística permitiu identificar, através dos coeficientes angulares (E) e dos coeficientes lineares (D), que a acuracidade de repetição de pseudopalavras de crianças com desenvolvimento típico tem relação com o tamanho do léxico. Além disso, o tamanho do léxico também parece ser o responsável pelo desaparecimento do efeito da freqüência, uma vez que se observou que as retas não são paralelas através da diferença dos E’s. Esses resultados constituem evidência adicional para a hipótese de Pierrehumbert (2003) segundo a qual a gramática fonológica é emergente das representações das palavras no léxico e que o falante faz inferências sobre as distribuições de unidades abstratas como as sílabas. Ou seja, o grau de acuracidade na repetição de pseudopalavras aumenta em função do tamanho do léxico, que provê robustez tanto à representação de sílabas de alta freqüência quanto de baixa freqüência de ocorrência, e o efeito de freqüência tende a desaparecer à medida que o léxico aumenta de tamanho. XLVI SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL Pesquisa Operacional na Gestão da Segurança Pública 16 a 19 Setembro de 2014 Salvador/BA 4. Referências Bibliográficas Bybee, J. Phonology and Language Use. Cambridge, Cambridge University Press, 2001. Dunn, L. M., Dunn, D., Capovilla, F. C. & Capovilla, A.G. S. (1997). Teste de Vocabulário por Figuras Peabody – Versão Brasileira. São Paulo: Casa do Psicólogo. Esteves, C. O. O Conhecimento Fonológico de Crianças com Dislexia, Desvio Fonológico e Distúrbio Específico de Linguagem: Uma Análise Multirrepresentacional da Linguagem.Tese (Doutorado) - Universidade Federal Do Rio De Janeiro, 2013. Frisch, S.; Large N.; Pisoni D. Perception of Wordlikeness: Effects of Segment Probability and Length on the Processing of Nonwords Journal of Memory and Language 42: p. 481– 496, 2000. Gathercole, S. (1995).Is Nonword Repetition a Test of Phonological Memory or Long-term Knowledge? It all Dependson Nonwords.Memory & Cognition 23(1): p. 83-94. Mendes, S. do C. Habilidades do processamento auditivo e conhecimento fonológico em crianças comdesenvolvimento típico. Dissertação (Mestrado) - Universidade Federal Do Rio De Janeiro, 2014. Montgomery, D. C. & Peck, E. (1982) A. Introduction to Linear Regression Analysis, John Wiley and Sons. Pierrehumbert, J. Probabilistic Phonology: discrimination and robustness. In: R. Bod, J. Hay, S. Jannedy (eds). Probabilistic Linguistics.Cambridge/Massachussets, MIT Press, 2003. Weisberg, S. Applied Linear Regression, 2nd ed, John Wiley and Sons, 1985. ANEXOS Função de FCR realizada no “R” f.encaixante=function(xc, xr, y){ reg.c=lsfit(xc, y,int=F) #Modelo Completo reg.r=lsfit(xr, y, y,int=F) #Modelo Reduzido rss.c=sum(reg.c$resid^2) rss.r=sum(reg.r$resid^2) gl.c=length(y)-dim(xc)[2]-1 gl.r=length(y)-dim(xr)[2]-1 f=((rss.r-rss.c)/(gl.r-gl.c))/(rss.c/gl.c) pvalor=1-pf(f, gl.r-gl.c, gl.c) c(f, pvalor)} XLVI 16 a 19 SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL Setembro de 2014 Pesquisa Operacional na Gestão da Segurança Pública Salvador/BA Tabela A1. Peabody – Tabela de Idades Pontos Idade Média 0-22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 <1-09 1-9 1-10 1-11 2-00 2-01 2-02 2-04 2-05 2-06 2-07 2-08 2-09 2-10 2-11 3-00 3-00 3-01 3-02 3-03 3-04 3-05 3-06 3-07 3-08 3-09 3-10 3-11 3-11 4-00 4-01 4-02 4-03 4-04 4-05 4-05 4-06 4-07 4-08 IDADE EQUIVALENTE A PONTUAÇÃO Idade Pontos Idade Média Pontos Média 61 4-09 100 7-06 62 101 4-10 7-07 63 102 4-10 7-08 64 103 411 7-09 65 104 5-00 7-10 66 105 5-01 7-11 67 106 5-02 8-00 68 107 5-03 8-01 69 108 5-03 8-02 70 109 5-04 8-03 71 110 5-05 8-04 72 111 5-06 8-05 73 112 5-07 8-06 74 113 5-08 8-07 75 114 5-08 8-08 76 115 5-09 8-09 77 116 5-10 8-10 78 117 5-11 8-11 79 118 6-00 9-00 80 119 6-01 9-01 81 120 6-01 9-02 82 121 6-02 9-03 83 122 6-03 9-04 84 123 6-04 9-06 85 124 6-05 9-07 86 125 6-06 9-08 87 126 6-06 9-09 88 127 6-07 9-11 89 128 6-08 10-00 90 129 6-09 10-01 91 130 6-10 10-03 92 131 6-11 10-04 93 132 7-00 10-05 94 133 7-01 10-06 95 134 7-02 10-08 96 135 7-02 10-09 97 136 7-03 10-11 98 137 7-04 11-00 99 138 7-05 11-02 Pontos Idade Média 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 11-04 11-05 11-07 11-09 11-11 12-00 12-02 12-04 12-06 12-08 12-11 13-01 13-03 13-05 13-08 13-10 14-01 14-03 14-06 14-09 15-00 15-03 15-06 15-09 16-01 16-04 16-08 17-00 17-05 17-09 18-02 18-07 19-01 19-09 20-04 20-11 21-10 22+ 22+