Um Modelo em Análise de Regressão para Avaliar o Conhecimento

Transcrição

XLVI
SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL
Pesquisa Operacional na Gestão da Segurança Pública
16 a 19
Setembro de 2014
Salvador/BA
Um Modelo em Análise de Regressão para Avaliar o Conhecimento
Fonológico de Crianças com Desenvolvimento Típico
Gastão Coelho Gomes (UFRJ)
Suzana do Couto Mendes (UFRJ)
Christina Abreu Gomes (UFRJ/CNPq)
Resumo: Aplicação de modelo em regressão para tratamento de dados lingüísticos de crianças com
desenvolvimento típico, obtidos através da aplicação de teste de repetição de pseudopalavras, com o
objetivo de checar o conhecimento fonológico e sua relação com o tamanho do léxico da criança. A
acuracidade das crianças na repetição das pseudopalavras foi medida através de um índice que
computou cada som produzido em comparação com os apresentados nos estímulos. Os escores
obtidos foram avaliados em função da frequência de tipo das sílabas que constituem as
pseudopalavras e o tamanho do léxico das crianças. Um modelo estatístico único foi proposto para
abranger as duas variáveis simultaneamente (frequência e tamanho do léxico) na explicação da
acuracidade de repetição (escore), o que foi uma escolha importante para viabilizar a realização dos
testes de hipóteses relativos a diferentes modelos encaixantes. Os resultados obtidos pela análise
exploratória subsidiaram a interpretação das hipóteses linguísticas, motivação inicial do problema, e
conduziram à observação de questões da metodologia de análise de regressão com modelos
encaixantes e variáveis indicadoras.
Palavras-chave: Lingüística; Análise de Regressão; Variáveis Indicadoras.
Abstract: Application of regression model in modeling linguistic data from children with Specific
Language Impairment (SLI) obtained through the application of ABFW Test (naming and repetition
of lexical items), in order to check their phonological knowledge and its relationship with the size of
child's lexicon. The accuracy of children in the repetition of pseudowords was measured by an index
that computed each sound produced compared with those presented in the stimuli. The scores were
evaluated according to the type frequency of the syllables constituting pseudowords and the size of
the children’s lexicon. A single statistical model was proposed to handle both variables
simultaneously (frequency and lexicon’ size) in explaning the accuracy of repetition (score), which
was an important decision to make possible hypothesis tests related to nested models. The results
obtained using the exploratory analysis give a subsidy to interpreting the linguistic hypothesis
proposed, the original motivation for the study, and conduct to some methodological issues about
regression analysis of nested models and dummy variables.
Keywords: Linguistics; Regression Analysis; Dummy variables.
XLVI
16 a 19
Setembro de 2014
Salvador/BA
1. Introdução
Nesse trabalho procuramos explicar, através de modelos de análise de regressão, o
comportamento observado em crianças com desenvolvimento típico com idades entre 5 e 12 anos,
em dados obtidos em situação de teste. O objetivo foi avaliar o conhecimento fonológico em função
do desempenho no teste de repetição de pseudopalavras. Os resultados aqui apresentados foram
obtidos por Mendes (2014).
De acordo com Mendes (2014) a hipótese que sustenta este estudo é que o conhecimento
fonológico dos falantes é abstraído das representações das palavras no léxico. As palavras estão
organizadas em redes de conexões lexicais por semelhança sonora, semântica ou ambas, e essas
relações permitem a inferência de relações fonotáticas (distribuição, frequência de tipo, etc) bem
como outros níveis mais altos de abstração, dando suporte, portanto, para o processamento de
pseudopalavras, que são estímulos ou palavras formadas por combinações possíveis dos sons da
língua, mas inexistentes no léxico (Bybee, 2001; Pierehumbert, 2003). Estudos têm mostrado que as
inferências probabilísticas no léxico proveem sustentação para o processamento da informação
sonora processada e que a frequência de tipo das combinações de segmentos constituintes das
pseudopalavras pode afetar a avaliação (Frisch, Large e Pisoni, 2010). Estudos com crianças com
desenvolvimento típico e de população clínica, utilizando a medida de acuracidade em teste de
repetição de pseudopalavras mostraram que a frequência de tipo dos constituintes tem relação com o
desempenho observado (Gathercole, 1995, Esteves, 203).
O léxico de um adulto teria tamanho suficiente para garantir robustez a qualquer
representação da gramática fonológica, assim, o esperado é que para os adultos não haja diferença de
grau de acuracidade em função da frequência de tipo dos constituintes das pseudopalavras. Mas em
relação às crianças, que tamanho do léxico é suficiente para conferir robustez às representações? É
objetivo deste estudo avaliar o conhecimento fonológico das crianças com desenvolvimento típico
através da medida de acuracidade de repetição de pseudopalavras.
O teste foi elaborado por Esteves (2013) e é constituído de 30 estímulos, todos com sílaba
CV com as seguintes características: 10 estímulos com duas sílabas (CV.CV), 10 estímulos de 3
sílabas (CV.CV.CV) e 10 estímulos de 4 sílabas (CV.CV.CV.CV), sendo metade de cada tamanho de
constituintes de alta frequência de tipo e de baixa frequência de tipo. A frequência de tipo foi obtida
na base do Projeto Aspa/UFMG (http://www.projetoaspa.org). Na dissertação de Mendes (2014)
foram analisados o tamanho do item lexical bem como a idade da criança. Neste trabalho
focalizaremos o tamanho do léxico e sua relação com a acuracidade.
O tamanho do léxico de cada criança foi obtido através da aplicação do teste Peabody
(Dunn&Dunn, 1997), que avalia o tamanho do léxico receptivo de crianças e adultos.
O teste foi gravado por uma voz feminina de 24 anos, em ambiente preparado acusticamente
e foi apresentado pelo software DMDX, que apresenta os estímulos em ordem aleatória a cada
aplicação. As crianças foram instruídas a repetir os estímulos. Primeiramente foram apresentados 5
estímulos na fase treino e, em seguida, os 30 estímulos do teste.
Constitui o conjunto de observações:
1. a variável dependente, y = escore, que foi obtido como medida de acuracidade na
repetição de pseudopalavras, de acordo com o índice utilizado em Esteves (2013) =
2 pontos para o som igual ao do estímulo, 1 para substituição e 0 para ausência,
dividido pelo número de segmentos do estímulo. A escala contém índices entre 0 e
1.
2. a variável explicativa, Peabody, tamanho do léxico das crianças que foi obtido
através da aplicação do teste Peabody;
XLVI
16 a 19
Setembro de 2014
Salvador/BA
O teste foi aplicado a 66 crianças com desenvolvimento típico recrutadas em escola
particular de um subúrbio da cidade do Rio de Janeiro. Todas as sessões de aplicação do teste de
repetição de pseudopalavras foram gravadas e a identificação da forma usada pelas crianças foi
estabelecida com base nas gravações e avaliada por mais de um julgador.
Conforme já mencionado, o tamanho do léxico da criança foi obtido através do teste
Peabody, que é um teste padronizado adaptado para o português e utilizado com aplicação clinica. O
teste de vocabulário receptivo de Peabody (Dunn&Dunn, 1997) é um teste de compreensão que visa
quantificar o conhecimento do vocabulário em crianças (a partir de 2 anos e meio) e adultos. Consiste
de uma série de cartões, cada qual contendo 4 gravuras diferentes, num total de 204 cartões. A
criança é solicitada a identificar a gravura que melhor representa o significado da palavra enunciada
pelo examinador. O teste foi administrado conforme as instruções especificadas no manual, com as
palavras traduzidas para o português, e os scores já estabelecidos para cada idade utilizados como
referência para a análise (ver tabela A2 no anexo). Para a faixa etária das crianças da amostra, o score
esperado para as crianças com desenvolvimento típico está entre 51e 79 pontos. O score pode estar
adequado, abaixo ou acima do esperado.
A amostra foi constituída de três grupos de crianças na faixa de 5 a 12 anos de idade,
divididas em três grupos: 5 anos, 7 anos e de 9 a 12 anos. As crianças foram escolhidas em função da
idade e por não apresentarem queixas ou histórico de quaisquer desordens significativas de
aprendizagem, linguagem e/ou audição e por não terem repetência escolar.
2. Análise Estatística
A técnica estatística que usamos é Análise de Regressão sendo y=escore, a variável a explicar. A
variável explicativa é o tamanho do léxico (Peabody) e algumas variáveis indicadoras, ou seja,
variáveis que assumem o valor um quando a característica está presente e o valor zero quando ela
está ausente. Um bom exemplo do uso de variáveis indicadoras pode ser visto em Weisberg (1985,
pag.177-183). As 2 variáveis indicadoras aqui usadas são:

If1 para indicar se o estímulo repetido é constituído de sílabas de alta freqüência.
If2 para indicar se o estímulo repetido é constituído de sílabas de baixa freqüência.
As indicadoras If1, If2, são excludentes entre si: quando para uma observação uma delas
assume o valor um, as outras assumem o valor zero.
2.1 Análise Exploratória
A seguir apresentamos, para efeito descritivo das observações, os gráficos com os escores de
acuracidade para cada tipo de estímulo, de alta ou baixa freqüência, em função do tamanho do léxico
das crianças.
XLVI
16 a 19
Setembro de 2014
Salvador/BA
Gráficos 1: Escore versus Tamanho do Léxico para cada tipo de estímulo
Observam-se escores altos de repetição tanto com o índice de tamanho do léxico baixo
quanto com índice alto para os dois tipos de estímulo (baixa e alta freqüência). No entanto, pode-se
observar, nos dois gráficos, que a partir de um determinado tamanho (em torno de 140 pontos) os
índices baixos (abaixo de 0.70) de acuracidade desaparecem. As curvas de tendência, cujos valores
dos parâmetros D e E estão apresentados na Tabela 1 a seguir, tanto para os estímulos de baixa
frequência de tipo quanto para os estímulos de alta frequência de tipo, revelaram que há relação
entre escore de acuracidade e tamanho do léxico.
Começaremos a nossa análise dos dados com os modelos completos para explicar a
acuracidade (Y=escore) em função do tamanho do léxico (X= Peabody) nos dois tipos de estímulos,
conforme a equação a seguir:
Escore = D1 If1 + D2 If2 + E1 If1 Peabody + E2 If2 Peabody
(eq. 1)
2.2 Análise de Regressão
Basicamente este modelo ajusta 2 retas de regressão, uma para cada um dos 2 tipos de
estímulos. A Tabela 1 apresenta os coeficientes e os testes t como em Montgomery (1982) da
equação 1 referente ao modelo completo.
XLVI
16 a 19
Setembro de 2014
Salvador/BA
Tabela 1. Estimação dos α e β da equação 1 correspondente aos dois tipos de estímulos
Indicador Coef.
Do Grupo
α
β
If1
If2
If1X
If2X
0.8688
0.9198
0.0007
0.0004
Estat. - t p.valor
99.8383
105.6653
8.0457
4.8221
0.0000
0.0000
0.0000
0.0000
Medidas sobre o ajuste:
Erro Padrão do resíduo = 0.0892,
R2= 0.9912
N = 1972, F = 55657.5 com 4 e 1968 gl, p-valor = 0.0000
SQR=0.9912
De acordo com a tabela acima, todos os parâmetros do modelo completo, tanto dos D’s e E’s
nos dois estímulos são significativamente diferentes de zero. Assim, os parâmetros devem ser
considerados. A questão que se levanta então é se as retas são iguais ou diferentes, isto é, se alguns
dos parâmetros D’s (intercepto) ou E’s (inclinação) podem ser considerados iguais nos dois
estímulos. Propomos um teste, apresentado na seção a seguir, para avaliar conjuntamente estes
parâmetros.
2.3 Análise Estatística visando à identificação dos estímulos com comportamento equivalente
Além desta formulação geral temos também como interesse juntar processos que apresentam
comportamentos equivalentes conforme sugerido pela análise exploratória precedente aliada às
hipóteses lingüísticas referidas anteriormente na introdução. Para isso consideraremos modelos
aninhados (Weisberg, 1985). Para decidirmos sobre a semelhança dos dois modelos em questão, o
completo e o reduzido, com menos variáveis explicativas, será testada uma hipótese de igualdade dos
parâmetros (inclinação e/ou intercepto) para os diferentes processos. A estatística de teste F estará
baseada nas SQR (soma dos quadrados dos resíduos) dos modelos em questão com os seus
respectivos gl (graus de liberdade):
FCR
SQR R
SQR C / gl R gl C SQR C / gl C
(eq. 2)
onde, o índice C significa modelo completo e o R significa reduzido, assim.
O objetivo é juntar parâmetros sem que aumente significativamente a SQR, sendo a medida para esta
verificação a estatística FCR acima. A tradução de FCR foi expressa numa função, mostrada no
apêndice a seguir, feita no software “R”.
XLVI
16 a 19
Setembro de 2014
Procuraremos identificar se os dois tipos de estímulos têm
Salvador/BA
uma
proximidade dos
E ' s (inclinação), o que indicaria o mesmo comportamento de acuracidade (y=Escore) em função do
tamanho do léxico (x=Peabody) para estímulos constituídos por tipos silábicos diferentes (baixa e
alta freqüência). Testaremos então a hipótese de que os E' s correspondentes a esses estímulos são
iguais. Caso a hipótese nula (de igualdade dos E' s ) seja aceita, poderemos concluir que o modelo
reduzido é mais indicado que o modelo completo para aquele particular Problema. O p-valor
correspondente à estatística FCR acima mencionada é o instrumento que nos permitirá decidir pela
aceitação ou pela rejeição dessa hipótese.
O mesmo tipo de raciocínio também foi tentado com relação aos D' s (intercepto) conforme
desenvolvido na seção a seguir.
2.3.1Em Busca de um modelo adequado para o Problema
Sugerido pela análise dos gráficos 1 procuramos checar se os interceptos e as inclinações
observadas dos estímulos podem ser consideradas iguais no modelo reduzido. Testamos os seguintes
modelos reduzidos comparados com o modelo completo já apresentado na eq.1, a representação
gráfica de cada uma das três tentativas está na figura abaixo, gráficos 2.
Gráficos 2: Visualização dos comportamentos possíveis com relação as duas retas.
Tentativa 1
Tentativa 1)
Tentativa 2
Tentativa 3
H0: As duas retas independentemente do estímulo são iguais
Escore = D3 (If1 + If2) + E3 (If1+If2) Peabody
(eq. 3)
O resultado foi que o modelo reduzido não é tão bom quanto o completo, com FCR= 31,9 com 2 e
1967 graus de liberdade, resultando num p-valor de 2,3e-14 que rejeita a hipótese de que os dois
modelos, o completo e o reduzido, não têm o mesmo poder explicativo.
XLVI
16 a 19
Setembro de 2014
Salvador/BA
Tentativa 2)
H0: As duas retas independentemente do estímulo têm inclinações iguais com
diferentes interceptos
Escore = D4 If1 + D5 If2 + E4 (If1+If2) Peabody
(eq. 4)
1967 graus de liberdade, resultando num p-valor de 2,1e-07 que rejeita a hipótese H0 de que os dois
Tentativa 3)
H0: As duas retas independentemente do estímulo têm interceptos iguais com
diferentes inclinações
Escore = D6 (If1+If2) + E5 If1+ E6 If2 Peabody
(eq. 5)
1967 graus de liberdade, resultando num p-valor de 5.2e-10 que rejeita a hipótese H0 de que os dois
Esses resultados das 3 tentativas de unir os parâmetros nos 3 modelos reduzidos indicam que
as duas retas não podem ser consideradas com algum dos parâmetros comuns, o que significa dizer
que as retas são diferentes, isto é, têm inclinação e intercepto diferentes..
3. Conclusões
Do ponto de vista da análise estatística, a busca dos modelos mais adequados para explicação
do escore de acuracidade, a variável resposta, revelou um modelo em que não há redução de
parâmetros tanto das inclinações quanto dos interceptos.
Do ponto de vista das hipóteses linguísticas, a análise estatística permitiu identificar, através
dos coeficientes angulares (E) e dos coeficientes lineares (D), que a acuracidade de repetição de
pseudopalavras de crianças com desenvolvimento típico tem relação com o tamanho do léxico. Além
disso, o tamanho do léxico também parece ser o responsável pelo desaparecimento do efeito da
freqüência, uma vez que se observou que as retas não são paralelas através da diferença dos E’s.
Esses resultados constituem evidência adicional para a hipótese de Pierrehumbert (2003) segundo a
qual a gramática fonológica é emergente das representações das palavras no léxico e que o falante faz
inferências sobre as distribuições de unidades abstratas como as sílabas. Ou seja, o grau de
acuracidade na repetição de pseudopalavras aumenta em função do tamanho do léxico, que provê
robustez tanto à representação de sílabas de alta freqüência quanto de baixa freqüência de ocorrência,
e o efeito de freqüência tende a desaparecer à medida que o léxico aumenta de tamanho.
XLVI
16 a 19
Setembro de 2014
Salvador/BA
4. Referências Bibliográficas
Bybee, J. Phonology and Language Use. Cambridge, Cambridge University Press, 2001.
Dunn, L. M., Dunn, D., Capovilla, F. C. & Capovilla, A.G. S. (1997). Teste de Vocabulário
por Figuras Peabody – Versão Brasileira. São Paulo: Casa do Psicólogo.
Esteves, C. O. O Conhecimento Fonológico de Crianças com Dislexia, Desvio Fonológico e
Distúrbio Específico de Linguagem: Uma Análise Multirrepresentacional da Linguagem.Tese
(Doutorado) - Universidade Federal Do Rio De Janeiro, 2013.
Frisch, S.; Large N.; Pisoni D. Perception of Wordlikeness: Effects of Segment Probability and
Length on the Processing of Nonwords Journal of Memory and Language 42: p. 481– 496, 2000.
Gathercole, S. (1995).Is Nonword Repetition a Test of Phonological Memory or Long-term
Knowledge? It all Dependson Nonwords.Memory & Cognition 23(1): p. 83-94.
Mendes, S. do C. Habilidades do processamento auditivo e conhecimento fonológico em crianças
comdesenvolvimento típico. Dissertação (Mestrado) - Universidade Federal Do Rio De Janeiro,
2014.
Montgomery, D. C. & Peck, E. (1982) A. Introduction to Linear Regression Analysis, John Wiley
and Sons.
Pierrehumbert, J. Probabilistic Phonology: discrimination and robustness. In: R. Bod, J. Hay, S.
Jannedy (eds). Probabilistic Linguistics.Cambridge/Massachussets, MIT Press, 2003.
Weisberg, S. Applied Linear Regression, 2nd ed, John Wiley and Sons, 1985.
ANEXOS
Função de FCR realizada no “R”
f.encaixante=function(xc, xr, y){
reg.c=lsfit(xc, y,int=F)
#Modelo Completo
reg.r=lsfit(xr, y, y,int=F) #Modelo Reduzido
rss.c=sum(reg.c$resid^2)
rss.r=sum(reg.r$resid^2)
gl.c=length(y)-dim(xc)[2]-1
gl.r=length(y)-dim(xr)[2]-1
f=((rss.r-rss.c)/(gl.r-gl.c))/(rss.c/gl.c)
pvalor=1-pf(f, gl.r-gl.c, gl.c)
c(f, pvalor)}
XLVI
16 a 19
Setembro de 2014
Salvador/BA
Tabela A1. Peabody – Tabela de Idades
Pontos Idade Média
0-22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
<1-09
1-9
1-10
1-11
2-00
2-01
2-02
2-04
2-05
2-06
2-07
2-08
2-09
2-10
2-11
3-00
3-00
3-01
3-02
3-03
3-04
3-05
3-06
3-07
3-08
3-09
3-10
3-11
3-11
4-00
4-01
4-02
4-03
4-04
4-05
4-05
4-06
4-07
4-08
IDADE EQUIVALENTE A PONTUAÇÃO
Idade
Pontos Idade Média Pontos
Média
61
4-09
100
7-06
62
101
4-10
7-07
63
102
4-10
7-08
64
103
411
7-09
65
104
5-00
7-10
66
105
5-01
7-11
67
106
5-02
8-00
68
107
5-03
8-01
69
108
5-03
8-02
70
109
5-04
8-03
71
110
5-05
8-04
72
111
5-06
8-05
73
112
5-07
8-06
74
113
5-08
8-07
75
114
5-08
8-08
76
115
5-09
8-09
77
116
5-10
8-10
78
117
5-11
8-11
79
118
6-00
9-00
80
119
6-01
9-01
81
120
6-01
9-02
82
121
6-02
9-03
83
122
6-03
9-04
84
123
6-04
9-06
85
124
6-05
9-07
86
125
6-06
9-08
87
126
6-06
9-09
88
127
6-07
9-11
89
128
6-08
10-00
90
129
6-09
10-01
91
130
6-10
10-03
92
131
6-11
10-04
93
132
7-00
10-05
94
133
7-01
10-06
95
134
7-02
10-08
96
135
7-02
10-09
97
136
7-03
10-11
98
137
7-04
11-00
99
138
7-05
11-02
Pontos Idade Média
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
11-04
11-05
11-07
11-09
11-11
12-00
12-02
12-04
12-06
12-08
12-11
13-01
13-03
13-05
13-08
13-10
14-01
14-03
14-06
14-09
15-00
15-03
15-06
15-09
16-01
16-04
16-08
17-00
17-05
17-09
18-02
18-07
19-01
19-09
20-04
20-11
21-10
22+
22+