distorção de forma no teste de bender

Transcrição

distorção de forma no teste de bender
DISTORÇÃO DE FORMA NO TESTE DE BENDER: QUESTIONANDO SEU
CRITÉRIO DE VALIDADE
Fermino Fernandes Sisto+, Ana Paula Porto Noronha++ e Acácia Aparecida Angeli dos Santos+++
RESUMO
Para se obter informações sobre a qualidade dos testes psicológicos utilizados no Brasil, este trabalho
analisou os critérios relativos à distorção de formas nas figuras do Bender, relativas ao seu caráter
evolutivo. Participaram 314 crianças de ambos os sexos das séries iniciais do ensino fundamental. Os dados
foram coletados por uma equipe que dava instruções e auxiliava os alunos na utilização dos cartões. Os
resultados indicaram correlação negativa entre idade e deformação em algumas figuras. Também, apesar de
haver diferenças estaticamente significativas na pontuação em relação às idades, sugerindo que conforme
aumentou a idade, diminuiu a intensidade da deformação. O agrupamento resultante da prova de Tukey não
foi coerente com o esperado para uma medida sensível ao caráter maturacional do desenvolvimento infantil.
Além disso, os valores de alfa indicaram consistência frágil. Esses resultados apontam para a necessidade de
revisão dos critérios de Koppitz.
Palavras-chave: Avaliação psicológica; parâmetros psicométricos; sistema de avaliação de Koppitz
FORM DISTORTION OF BENDER TEST: QUESTIONING ITS VALIDITY
CRITERION
ABSTRACT
In order to gather information about the quality of psychological tests that are used in Brazil this study
analyzed the criteria related to the Bender figures form distortions in relation to its evolutional aspects. 314
children were studied, both male and female, attending the initial grades of elementary school. The data was
collected by a team, responsible to instruct and help the children to use the cards. The results suggested a
negative correlation between age and some of the figure distortions. Besides, the groups formed by Tukey’s
tests did not show coherency to an expected measure sensitive to the characteristics of the child’s
maturational development, in spite of the statistically significant differences among the scores related to the
ages, which showed that the age increased as the distortion intensity decreased. Moreover, the alpha values
indicated low consistency. These results suggest the need to review Koppitz’s criteria.
Key words: Psychological assessment; psychometric properties; Koppitz’s evaluation system.
+
Doutor em Educação pela Universidad Complutense de Madrid; livre docente em Psicologia do Desenvolvimento pela UNICAMP;
docente da graduação e do Programa de Estudos Pós-graduados em Psicologia da Universidade São Francisco – Itatiba-SP. E-mail:
[email protected].
++
Doutora em Psicologia: Ciência e Profissão pela PUC-Campinas; bolsista de produtividade do CNPq; docente da graduação e do
Programa de Estudos Pós-graduados em Psicologia da Universidade São Francisco – Itatiba-SP.
+++
Doutora em Psicologia Escolar e do Desenvolvimento Humano pela USP; docente da graduação e do Programa de Estudos Pósgraduados em Psicologia da Universidade São Francisco – Itatiba-SP.
INTRODUÇÃO
Há indicações de que está havendo um crescimento do interesse pela testagem
psicológica. A partir de 1990, aproximadamente, novos testes e a revisão dos antigos
tornou-se um fato nos Estados Unidos (Anastasi & Urbina, 2000). O aumento da produção
científica e da prática psicométrica na Europa é apontado por Muniz (1996) e comprovável
pelas publicações e freqüentes participações em congressos internacionais.
Os trabalhos do International Test Comission (2001) também influenciaram fortemente na
psicometria européia e na elaboração das recentes resoluções do Conselho Federal de
Psicologia no Brasil. De forma geral, contribuíram para a sistematização de testes, uma vez
que têm a função de supervisionar a organização, a construção e o uso de instrumentos
psicológicos, favorecendo e pautando o crescimento da área com parâmetros claramente
definidos.
Outro trabalho de natureza semelhante foi desenvolvido por associações, tais como,
a American Educational Research Association, a American Psychological Association e a
National Council on Measurement in Education (AERA, APA & NCME, 1999), cujo
objetivo foi criar critérios para a avaliação, para a prática e para o efeito resultante da
utilização de medidas psicológicas. Os Standards, que definem normas internacionais para
construção e utilização de testes, não pretendem responder a todas as questões de ordem
psicométrica, contudo seria desejável que autores, editores e usuários as conhecessem com
o objetivo de aperfeiçoar os instrumentos nacionais.
Pelo menos duas publicações revelam a organização e a qualidade dos instrumentos nos
Estados Unidos. Exemplo disso é o Mental Measurements Yeabooks da Universidade de
Nebraska que traz informações precisas acerca da construção, aplicação e dos parâmetros
psicométricos dos testes (Salvia & Ysseldyke, 1991). Com o mesmo propósito, a
Psychological Assessment Resources (2003), criada há 25 anos, editou um catálogo de
testes no qual constam mais de 400 trabalhos para utilização em áreas diversas, tais como
avaliação da personalidade e aconselhamento, avaliação neuropsicológica, forense,
intelectual, desenvolvimento, negócios, dentre outras.
Em contrapartida, no cenário nacional, atualmente estão sendo dados passos importantes
para a estruturação da área depois de um período de estagnação. Assim, o Conselho Federal
de Psicologia (CFP, 2001, 2003) por meio de suas resoluções nos 025/2001 e 002/2003
regulamentou o uso, a elaboração e a comercialização de testes psicológicos. No que se
refere especialmente à elaboração de testes, a última resolução considerou que há
necessidade de aprimoramento dos instrumentos e procedimentos técnicos de trabalho dos
psicólogos, a fim de promover serviços com qualidade técnica e ética à sociedade.
É nesse contexto que se insere o presente estudo, cujo objeto de investigação é o Teste
Gestáltico Viso-Motor, criado por Lauretta Bender em 1938, e com trabalhos iniciais
datando de 1930. O instrumento baseia-se nos estudos de Max Wertheimer (1930) sobre as
leis de organização perceptual. Da série de 30 desenhos usados por Wertheimer, Bender
selecionou nove deles, considerados os mais representativos para ilustrar a função pela qual
o indivíduo responde gestalticamente a uma série de estímulos.
A premissa do teste é de que o comportamento viso-motor preciso é uma habilidade,
sendo que a mensuração da maturidade percepto-motora poderia ser obtida pelo uso de
padrões com diferentes graus de complexidade e princípios de organização. Para Bender a
função gestáltica é associada a diversas funções intelectuais, tais como percepção visual,
habilidade motora manual, conceitos temporais e espaciais e organização ou representação
(Koppitz, 1989).
O método de avaliação do Bender Gestáltico denominado Developmental Bender
Test Scoring System foi criado por Koppitz em 1963, destina-se a avaliar a maturidade
neurológica da criança para o diagnóstico de lesão cerebral. Fizeram parte da amostra 1104
crianças, sendo 637 do sexo masculino e 467 do sexo feminino, pertencentes a 46 classes
de 12 escolas públicas dos Estados Unidos. A idade das crianças variou entre 5 e 10 anos e
11 meses. Quanto às qualidades psicométricas, os estudos de precisão entre os
examinadores geraram coeficientes de correlação entre 0,88 a 0,96. Além disso, cada
sujeito foi retestado 4 meses depois da primeira avaliação. Empregou-se o coeficiente de
correlação de Kendall e as correlações mostraram-se significativas. Por fim, verificou-se a
sensibilidade do instrumento e os resultados indicaram que ele é sensível de idade em
idade, dos 6 aos 10 anos.
De acordo com Koppitz (1989), a avaliação da habilidade percepto-motora se
justifica uma vez que o desenvolvimento intelectual se dá a partir de experiências sensóriomotoras nos primeiros anos de vida. Além disso, o desenvolvimento perceptivo-motor
adequado pode ser entendido como um requisito para o desenvolvimento de habilidades
acadêmicas, de forma que um baixo desempenho perceptivo-motor tende a contribuir para
problemas de aprendizagem.
Várias pesquisas utilizaram o Bender em grupos com dificuldades específicas. Entre
elas estão estudos com pacientes epilépticos e esquizofrênicos (Maciel Jr. & Puente, 1983;
Lee & Oh, 1998; Aucone & colaboradores, 2002; entre outros), em crianças com
deficiência auditiva (Cariola, Piva, Yamada & Bevilacqua, 2000; Gemignani, & Chiari,
2000) ou em pacientes portadores da síndrome de imunodeficiência adquirida (Mattos,
1991). Embora os estudos se diferenciem quanto à amostra ou à metodologia empregada,
em comum, eles usaram o Teste de Bender a fim de verificar características neurológicas
dos sujeitos avaliados. Os resultados, em geral, têm apontado para a sensibilidade do
instrumento para captar as diferenças existentes entre os portadores de distúrbios e pessoas
sem distúrbios aparentes.
Ainda nesse sentido, o estudo realizado por Blanchard (1998) com 387 pacientes de
diferentes grupos clínicos (adolescentes institucionalizados, dementes senis e pacientes
psiquiátricos, entre outros) teve o propósito de identificar qual a figura ou combinação de
figuras mais útil para um diagnóstico rápido de disfunções neurológicas. Diferentes
métodos de correção foram utilizados e os resultados apontaram a figura 7 como a que
apresentou correlações mais altas e consistentes em todos os métodos e para todos os
grupos de pacientes.
A utilidade do Bender para o diagnóstico diferencial de crianças com problemas de
aprendizagem também tem sido apontada. Nesse sentido, Arrillaga, Eschebarria e Goya
(1981) realizaram uma investigação do nível intelectual de um grupo de 6 a 13 anos com
suspeita de deficiência mental ou dificuldade de aprendizagem. Utilizando o WISC, o teste
de Matrizes Progressivas Coloridas do Raven e o Bender os autores encontraram
correlações entre as três medidas. Similarmente, Jing, Deqing e Longhui (2001)
compararam crianças portadoras de diversos tipos de dificuldades (verbais e não verbais)
com crianças normais. Os resultados apontaram a existência de diferenças significativas
entre os vários grupos, sendo que os sujeitos com dificuldades verbais apresentaram
pontuação mais elevada em apenas uma figura e os com dificuldades não-verbais tiveram
escores mais elevados em cinco figuras.
Outros estudos têm procurado verificar a validade do Bender como preditivo do
desenvolvimento. Com esse intuito, Brannigan, Aabye, Baker e Ryan (1995) compararam o
sistema de classificação com o sistema qualitativo em 409 crianças dos primeiros quatro
anos de escolaridade. Os resultados obtidos demonstraram que o sistema qualitativo era
mais adequado para a identificação de crianças com problemas de aprendizagem. Em
trabalho recente, Chan (2001) apontou para dificuldades de comparação dos resultados do
Bender com crianças chinesas de 4,5 a 8,5 anos, quando pontuadas segundo a classificação
norte-americana. Como conclusão o autor enfatiza a necessidade de padrões apropriados às
crianças avaliadas.
Em função desses aspectos, há autores que questionam o valor dos critérios de correção
utilizados, afirmando que há limitações na interpretação da pontuação obtida, com
conseqüentes problemas para sua utilização no diagnóstico neuropsicológico, bem como na
identificação de aspectos desenvolvimentais (Taylor, Kauffman & Partenio, 1984; Shapiro
& Simpson, 1995; Lacks, 2000).
Entre os estudos mais recentes que se destinam a encontrar formas alternativas de correção,
encontra-se o de Posada (2002) que desenvolveu um sistema de classificação das respostas
fundamentado nos princípios piagetianos de construção e representação espacial. Sua
amostra englobou 851 crianças de escolas públicas argentinas entre 5 e 14 anos. As análises
estatísticas preliminares resultantes de sua classificação indicaram bons parâmetros
psicométricos e vantagens em relação aos métodos clássicos de correção como os de
Santucci e Koppitz.
No Brasil, o Teste de Bender tem sido muito usado (Noronha & colaboradores,
2002; Pinelli Jr. & Pasquali, 1990) e tem feito parte do programa de disciplinas de várias
universidades brasileiras (Alves, 2002; Alves, Alchieri & Marques, 2002). Ao lado disso,
tem sido objeto de pesquisas, das quais serão ressaltadas as que estudaram evidências de
validade.
Assim, as relações entre traços de personalidade e percepção visomotora foram estudadas
por Sisto, Bueno e Rueda (2003). Os resultados indicaram que a menor integração
associou-se às maiores pontuações em neuroticismo, enquanto que maiores pontuações em
distorção associaram-se a maiores pontuações de psicoticismo. Por sua vez, Bandeira e
Hutz (1994) investigaram o grau de predição do rendimento escolar na primeira série por
meio da aplicação dos testes Desenho da Figura Humana, Bender e Raven. Os resultados
mostraram que os três testes apresentam correlações significativas com o rendimento
escolar, embora apenas Bender e itens evolutivos do Desenho da Figura Humana tenham
contribuído para explicar a variância do rendimento escolar.
Com relação às pesquisas que levaram em conta o aspecto maturacional do teste, há o
trabalho realizado por Moura (1982) com 160 sujeitos de 3 a 6 anos. Foram avaliadas as
diferenças da performance dos diferentes grupos etários, tendo ficado evidente o caráter
evolutivo na reprodução de figuras geométricas. No entanto, não foram essas as idades
inicialmente estudadas por Koppitz. Há também os estudos de validação de Kroeff (1988,
1992), valendo-se do método de correção proposto por Koppitz. O autor apresentou normas
específicas para escolas públicas e privadas e analisou a diferença de resultados de acordo
com a série.
Uma pesquisa de particular interesse é a de Pinelli Jr. e Pasquali (1990) na qual
buscou-se fazer uma avaliação dos parâmetros psicométricos, por meio de uma análise
fatorial. Os resultados indicaram que o Bender possui uma estrutura multifatorial,
contrapondo-se a unifatorial do sistema proposto por Koppitz e uma baixa consistência
interna.
Da literatura sobre o Bender, pelo menos duas informações são constantes e bastante
relevantes. Se por um lado, é um instrumento bastante usado, e o Brasil segue essa mesma
tendência; por outro lado, apesar dos estudos feitos, há críticas em relação a evidências de
sua validade, que são poucas e controversas (Moura, 1982; Kroeff, 1988, 1992; Pinelli Jr.
& Pasquali, 1990; Bandeira & Hutz, 1994).
Considerando o estudo de Pinelli Jr. e Pasquali (1990) questionando a
unidimensionalidade do teste, o presente estudo teve como objetivo analisar os critérios
relativos à deformação ou distorção de formas, nas figuras A, 1, 3, 5 e 7 em relação ao seu
caráter evolutivo. De certa forma, busca averiguar a validade desse critério para diferenciar
as idades cronológicas, já que a idade cronológica foi o critério usado por Koppitz para
diferenciar níveis maturacionais.
MÉTODO
PARTICIPANTES
Foram sujeitos da pesquisa 314 crianças, ambos os sexos, de primeira à quarta série
de uma escola pública, com idades variando entre 7 e 10 anos (média 8,62 anos e desvio
padrão de 1,12). Do total, foram 48,4% do gênero feminino e 51,6% do gênero masculino.
Havia 24 meninas (36,4%) e 42 meninos (63,6%) totalizando 66 alunos de 7 anos; 35
meninas (42,7%) e 47 meninos (57,3%) totalizando 82 alunos de 8 anos; 44 meninas
(61,1%) e 28 meninos (38,9%) totalizando 72 alunos de 9 anos; 49 meninas (52,2%) e 45
meninos (47,9%) totalizando 66 alunos de 10 anos.
INSTRUMENTO
O Teste Gestáltico Visomotor de Bender foi construído para fornecer um índice de
maturação percepto-motora. Consiste de nove figuras (A, 1, 2, 3, 4, 5, 6, 7 e 8) que são
apresentadas uma a uma, para serem copiadas pelo sujeito em uma folha em branco, sem
auxílio mecânico. Neste estudo, optou-se pelo critério de Koppitz (1989) e interessaram
apenas os itens referentes à distorção da forma nas figuras A, 1, 3, 5 e 7. Conforme os
critérios propostos por Koppitz, para cada erro cometido pela criança foi atribuído um
ponto. Assim, cada figura foi considerada uma medida e a soma delas, outra, denominada
distorção geral.
PROCEDIMENTO
Os instrumentos foram aplicados coletivamente, em sala de aula, por uma equipe de
cinco estudantes de graduação e um mestrando de psicologia. Ficaram dois aplicadores por
sala de aula para dar as instruções e auxiliar os sujeitos individualmente, caso fosse
necessário. A avaliação foi realizada por um grupo de seis pessoas que concordaram entre
si na atribuição de cada ponto aos erros cometidos pelos sujeitos.
RESULTADOS
Considerando os resultados encontrados, no que se refere ao gênero, vale destacar
que apenas na figura 1 houve significância estatística (t=-2,466 e p=0,014), sendo que os
meninos tenderam a apresentar uma média de 0,06 e as meninas de 0,15, ou seja, um
número maior de meninas apresentou distorções na figura 1 do teste. Quanto às outras
figuras e na pontuação geral de distorção, as diferenças foram atribuídas ao acaso.
Com referência à relação entre idade e deformação, esperava-se que houvesse uma
correlação negativa e significativa entre idade e pontuação em distorção, ou seja, que
conforme as crianças fossem ficando mais velhas, as distorções fossem diminuindo. Os
resultados encontram-se na Tabela 1.
_________________________________
inserir Tabela 1 aproximadamente aqui
__________________________________
Por estes resultados pode-se observar que em três das seis medidas a expectativa foi
confirmada, ainda que os coeficientes possam ser considerados baixos. Nos outros casos, o
aumento da idade não está relacionado com o aumento ou diminuição de presença de
distorção nas figuras.
No entanto, é possível que, apesar de não haver correlação entre idade e as
deformações nas figuras, as idades poderiam se diferenciar quanto à presença ou ausência
de deformação. Para isso, os dados foram estudados por meio de análise de variância a
nova e seus resultados encontram-se na Tabela 2.
_________________________________
inserir Tabela 2 aproximadamente aqui
__________________________________
Com base nesta análise, apenas as pontuações da figura 3 não diferenciaram
significativamente as idades. O teste de Tukey, no entanto, indicou que a figura 5 formava
apenas um conjunto, indicando que a diferenciação encontrada era muito tênue. Além
disso, nem todas as idades se diferenciaram, como mostra a Tabela 3.
_________________________________
inserir Tabela 3 aproximadamente aqui
__________________________________
Os resultados obtidos permitiram observar que as pontuações das figuras A e 1, bem como
a pontuação geral, formaram dois subconjuntos e não quatro como seria o esperado para
cada uma. Também, as idades agrupadas em cada subconjunto são diferentes, sendo que
apenas na pontuação geral a seqüência das idades foi a esperada. Finalmente, a figura 7 foi
a que mais se adequou à expectativa maturacional do teste, apesar da idade de 8 anos não
ser discriminada.
No entanto, menção deve ser feita ao fato de que a pontuação geral (soma de todas as
figuras) formou dois subconjuntos, de forma que a idade de 10 anos foi considerada
diferente das outras três, que formaram um outro conjunto. Essa informação demonstra que
esse indicador só diferencia a idade de 10 anos das outras. Nessa mesma direção, a figura A
facilita a interpretação da possibilidade de discriminar as crianças de 7 anos, mas é
ambivalente com relação às crianças de 9 anos.
Na Tabela 4 são apresentados, por idade e no geral, as médias, desvios padrões e o
coeficiente de consistência interna de Cronbach 1996 (alfa) em relação a todas as figuras
analisadas.
_________________________________
inserir Tabela 4 aproximadamente aqui
__________________________________
As médias por idade diminuíram conforme a idade dos sujeitos aumentava, porém
como já se afirmou anteriormente, as diferenças entre elas não são estatisticamente
significativas. Vale destacar que o índice de alfa obtido para cada agrupamento não é alto,
indicando baixa consistência interna do item para explicar o conjunto de dados aí obtidos.
Analisou-se, também, a correlação item-total, cujos dados encontram-se na Tabela 5. O
critério usado foi o de correlações inferiores a 0,30 (Guilford & Fruchter, 1978) para
indicar problemas de adequação.
_________________________________
inserir Tabela 5 aproximadamente aqui
__________________________________
Pelos resultados obtidos apenas as informações da figura 3 indicam um ajustamento à
medida geral, ou seja, à soma de todas as figuras, em todas as idades e no geral. Também, a
figura 5 ofereceu um bom ajustamento, já que em três das cinco análises as correlações
atenderam ao critério. Por sua vez, as figuras 1 e 7 mostraram ajustamento apenas aos 8
anos e, finalmente, a figura A não atingiu o critério em nenhuma das análises. Dessa forma,
das cinco figuras estudadas, três delas não apresentaram comunalidade com a medida geral
de distorção.
DISCUSSÃO E CONCLUSÕES
Para Koppitz (1989) a avaliação da habilidade percepto-motora está relacionada
com as experiências sensório-motoras nos primeiros anos de vida. Ao lado disso, defendeu
que o teste de Bender seria apropriado para captar os aspectos evolutivos decorrentes da
maturidade neurológica das crianças.
Originalmente o instrumento foi desenvolvido com base em resultados de mais de 1000
crianças de ambos os sexos entre 5 e 10 anos. Na ocasião, Koppitz (1963) afirmou que o
teste, composto por 30 itens, era capaz de avaliar a maturidade neurológica de crianças e
oferecer sinais indicativos de lesões cerebrais. Os resultados indicaram que o instrumento
era apropriado para ser utilizado com crianças de 6 a 10 anos.
Pela correção proposta por Koppitz (1963) o número de sinais apresentados tenderia
a diminuir, acompanhando o desenvolvimento infantil, visto que essa medida tem como
pressuposto que o comportamento motor é resultante de uma habilidade que denota a
maturidade percepto-motora. Por essa característica, e dentro dessa concepção, o Bender
tem sido um dos testes muito utilizados no Brasil (Alves, 2002; Alves, Alchieri & Marques,
2002; Noronha & colaboradores, 2002). Ao mesmo tempo, alguns estudos têm apontado
problemas em relação à unidimensionalidade da medida (Pinelli Jr. & Pasquali, 1990),
como também em relação ao caráter evolutivo (Taylor, Kauffman & Partenio, 1985;
Brannigan & colaboradores, 1995) ainda que outros corroboraram os resultados de Koppitz
(Arrillaga, Eschebarria & Goya, 1981; Moura, 1982; Kroeff, 1988, 1992; Jing, Deqing &
Longhui, 2001).
Nesse contexto, justifica-se a busca de evidências de validação. A averiguação do
caráter evolutivo da medida foi realizada por meio da análise de variância. Seu resultado
apresentou um valor estatisticamente significativo para a diferença entre as médias de sinais
na distorção de forma das figuras em relação às idades, exceção feita à figura 3. Entretanto,
o teste post-hoc aplicado para verificar os agrupamentos apontou que as idades não foram
diferenciadas em todas as figuras, que no geral distinguiram apenas dois grupos etários. A
exceção ficou por conta da figura 7 que agrupou as idades em 3 grupos. Essa informação
sugere que o caráter evolutivo defendido por algumas pesquisas (Arrillaga, Eschebarria &
Goya, 1981; Moura, 1982; Kroeff, 1988, 1992; Jing, Deqing & Longhui, 2001) não foi
detectado nem em cada figura de per si, nem na soma de todas elas.
Realce deve ser dado ao fato de que a soma da pontuação de cada figura diferenciou
apenas a idade de 10 anos das outras. Além disso, deve-se mencionar o fato de que a figura
7 foi a que mais se mostrou sensível para captar as diferenças maturacionais previstas. A
sensibilidade da figura 7 já havia sido apontada por Blanchard (1998) como sendo a figura
mais adequada para diferenciar características neurológicas dos grupos clínicos com os
quais trabalhou, independentemente do método de correção utilizado.
Observou-se, ainda, ao se analisar os coeficientes de consistência interna de todas as figuras
que os valores de alfa indicaram também fragilidades, não apenas por idade, mas também
no geral. Esses dados encontram suporte no estudo realizado por Pinelli Jr. e Pasquali
(1990).
Pelos resultados obtidos na análise das correlações item-total outros problemas
foram encontrados. De fato, apenas a figura 3 forneceu indicativos de ajustamento em todas
as idades e no geral, embora em três das cinco análises da figura 5 as correlações atenderam
ao critério. No entanto, as figuras 1 e 7 mostraram ajustamento em apenas uma das idades
e a figura A em nenhuma. Assim, essas figuras parecem indicar a necessidade de uma
revisão em seu sistema de correção.
De todas essas análises dois fatos devem ser destacados. Apesar de não se ajustar ao
conjunto de medidas, a figura 7 foi a mais sensível para detectar as diferenças entre as
idades, ou seja, apresentou alguma evidência de validade discriminante. Ao lado disso,
outra figura que apresenta resultados que merecem a atenção é a figura 3 que aparece como
a que melhor se ajusta ao critério deformação (possível evidência de unidimensionalidade),
como detectado pela correlação item-total, mas com baixa correlação para diferenciar as
idades. Ambas as figuras careceriam de outros estudos que as focalizassem.
Esses resultados foram obtidos com base em uma análise de um critério específico (a
deformação ou distorção de forma) que não é o único usado no sistema Koppitz de
correção. Nesse sentido, as críticas feitas não se referem ao sistema como um todo, pois se
desconhece dados analisando cada critério separadamente. No entanto, não deixam de
lançar dúvidas sobre o sistema, sugerindo novas pesquisas, como também a análise dos
outros critérios do sistema.
Essa delimitação do estudo trouxe consigo a dificuldade de comparar os dados com
a literatura, já que as pesquisas estudadas sempre consideraram o sistema como um todo.
No entanto, algumas compatibilidades e incompatibilidades puderam ser inferidas.
Assim, os dados aqui obtidos não são congruentes com os encontrados anteriormente nas
pesquisas estrangeiras (Arrillaga, Eschebarria & Goya, 1981; Jing, Deqing & Longhui,
2001) e nacionais (Moura, 1982; Kroeff, 1988, 1992) que apontaram o teste como sensível
para diferenciação das idades. Quando se analisou a relação da idade e a pontuação em
deformação, era esperado que as crianças mais velhas apresentassem pontuações menores
nos sinais indicativos de deformações. No entanto, os índices esperados de correlação
negativa não foram aqui constatados na maioria das figuras avaliadas.
Outros estudos relataram dificuldades na utilização do sistema de classificação de Koppitz
para captação de diferenças entre crianças da faixa etária para a qual o teste foi destinado
(Taylor, Kauffman & Partenio, 1985; Brannigan & colaboradores, 1995). Nesse sentido,
pode-se levantar a hipótese de que o critério evolutivo não está presente em todas as
figuras, corrigidas pelo critério adotado. Em outros termos, não se pode somar os pontos
obtidos nas diferentes figuras, pois eles estão medindo coisas distintas, ou seja, não estão
avaliando a mesma dimensão, o que se contrapõe ao sistema unidimensional proposto por
Koppitz e já questionado em outros trabalhos como o de Pinelli e Pasquali (1990).
Tal como apontado no presente estudo, outros pesquisadores também levantaram
questionamentos a respeito da adequação dos critérios de pontuação propostos por Koppitz.
Há esforços no sentido de se buscar sistemas alternativos de correção que sejam mais
sensíveis para captar os aspectos maturacionais no desenvolvimento infantil (Lacks &
Newport, 1980; Shapiro & Simpson, 1995; Lacks, 2000; Posada, 2002). Aliás, no que se
refere aos sistemas de pontuação do teste, há que se ressaltar que, embora Bender não tenha
criado um procedimento de correção de seus cartões, diferentes autores em todo o mundo
apresentaram tentativas de atribuir pontos a determinadas indicativos de sinais
neurológicos, de características afetivo-emocionais e de organização grafo-perceptual.
Finalmente, os questionamentos aqui realizados podem contribuir para com a área de
psicometria no que se refere à determinação de evidências de validade e precisão e,
principalmente, realçar a necessidade de deixar mais claros os limites dos testes usados e
suas possibilidades de interpretação. Dessa forma, pesquisadores e profissionais de
psicologia poderão contar com instrumentos mais adequados que possam ser mais
conscientemente utilizados o que produziria diagnósticos mais confiáveis.
REFERÊNCIAS BIBLIOGRÁFICAS
ALVES, I. C. B. (2002) O ensino das técnicas de exame psicológico no Brasil: visão geral. Anais do IX
Simpósio de Pesquisa e Intercâmbio Científico,p.86, Águas de Lindóia-SP.
ALVES, I. C. B., Alchieri, J. C., & MARQUES, K. C. (2002) As técnicas de exame psicológico ensinadas
nos cursos de graduação de acordo com os professores. Psico-USF ( 7)1: 77-88.
AMERICAN
EDUCATIONAL
RESEARCH
ASSOCIATION,
AMERICAN
PSYCHOLOGICAL
ASSOCIATION E NATIONAL COUNCIL ON MEASUREMENT IN EDUCATION (1999) Standards for
Educational and Psychological Testing, Washington: American Educational Research Association.
ANASTASI, A. & URBINA, S. (2000) Testagem Psicológica. Porto Alegre: Artes Médicas.
ARRILLAGA, S. G. P., ESCHEBARRIA, C. C. & GOYA, I. O. (1981) Una investigación sobre aspectos
intelectuales en una población de deficientes de un grupo marginal. Psiquis: Revista de Psiquiatria,
Psicologia y Psicosomatica (2) 1: 12-22.
AUCONE, E. J. et al. (2002) Test-retest reliability of the Advanced Psychodiagnostic Interpretation (API)
scoring system for the Bender Gestalt in chronic schizophrenics. Assessment (8) 3: 351-353.
BANDEIRA, D. R. & HUTZ, C. S. (1994) A contribuição dos testes DFH, Bender e Raven na predição de
rendimento escolar na primeira série. Psicologia: Teoria e Pesquisa (10) 1: 59-72.
BLANCHARD, T. F. (1998) An abbreviated Bender Gestalt test for detection of neurological dysfunction.
Dissertation Abstracts International (58) 8: 44-37.
BRANNIGAN, G. G. et al. (1995) Further validation of the qualitative scoring system for the modified
Bender-Gestalt Test. Psychology in the Schools (32) 1: 24-26.
CARIOLA, T. C. et al. (2000) A prova gráfica de organização perceptiva para crianças de quatro a seis anos
deficientes auditivas. Pediatria Moderna (36) 9: 588-594.
CHAN, P. W. (2001) Comparison of visual motor development in Hong Kong and the USA assessed on the
Qualitative Scoring System for the Modified Bender-Gestalt Test. Psychological Reports (88) 1: 236-240
CONSELHO FEDERAL DE PSICOLOGIA (CFP), Resolução no 025/2001. Disponível em _
http://www.pol.org.br __www.pol.org.br_. Consulta efetuada em 2001.
CONSELHO FEDERAL DE PSICOLOGIA (CFP), Resolução no 02/2003. Disponível em _
http://www.pol.org.br __www.pol.org.br_. Consulta efetuada em 2002.
CRONBACH, J. E. (1996) Fundamentos da Testagem Psicológica. Porto Alegre: Artes Médicas.
GEMIGNANi, E. Y. M. C. & CHIARI, B. M. (2000) Escala de Maturação do Teste de Bender em um grupo
de crianças deficientes auditivas. Pró-fono (12) 2: 49-53.
GUILFORD, J. P. & FRUCHTER, B. (1978) Fundamental statistic in psychology and Education. New York:
McGraw-Hill, th Edition.
INTERNATIONAL TEST COMISSION (ITC) Diretrices internacionales para el uso de los tests. Disponível
em _ HYPERLINK http://www.cop.es/tests/Diretrices.htm __www.cop.es/tests/Diretrices.htm_. Consulta
efetuada em 2001.
JING, G.; DEQING, T. & LONGHUI, L. (2001) Visual-motor deficit in children with learning disabilities.
Chinese-Mental-Health-Journal (15 ) 6: 388-390.
KOPPITZ, E. M. (1963) The Bender Gestalt Test for young children. New York: Grums Stratton.
KOPPITZ, E. M. (1989) O Teste Gestáltico Bender para Crianças. Porto Alegre: Artes Médicas.
KROEFF, P. (1988) Normas brasileiras para o Teste de Bender. Psicologia: Reflexão e Crítica 1/2 (3): 12-19.
KROEFF, P. (1992) Desempenho de crianças no Teste de Bender e nível sócio-econômico-cultutal.
Psicologia: Reflexão e Crítica (5) 2: 119-126.
LACKS, P. (2000) Visuoconstructive abilities, In G. Groth-Marnat, (org.) Neuropsychological assessment in
clinical practice: A guide to test interpretation and integration. New York: John Wiley & Sons.
LEE, S. Y., & OH, S. W. (1998) Visuoperceptual and constructive ability disturbances of patients with
traumatic brain injury in Hutt Adaptation of the Bender Gestalt Test.. Korean-Journal-of-Clinical-Psychology
(17) 1: 311-317.
MACIEL, JR. J. A. & PUENTE, M. (1983) Avaliação Multimodal do Teste de Bender no Psicodiagnóstico da
Epilepsia. Revista Brasileira de Neurologia (2 ) 19: 55-58.
MATTOS, P. (1991) Os distúrbios mentais orgânicos e a síndrome de imunodeficiência adquirida – parte II.
Jornal Brasileiro de Psiquiatria (40) 7: 375-381.
MOURA, M. L. S. (1982) Reconhecimento e reprodução de figuras do Teste Gestaltico Viso-Motor-Bender:
um estudo evolutivo. Arquivos Brasileiros de Psicologia (34) 4: 50-61.
MUÑIZ, J. (1996) Psicometria. Madrid/España: Editoria Universitas.
NORONHA, A. P. P.et al. (2002) Instrumentos psicológicos mais conhecidos por estudantes do sul de Minas
gerais. Avaliação Psicológica (1) 2: 151-158.
PINELLI JR., B. & PASQUALI, L. (1990) Parâmetros Psicométricos do Teste Gestaltico Viso-Motor de
Bender: um estudo empírico. Revista de Psicologia 1/2 (7/8) 51-74.
POSADA, M. C. (2002) Un sistema alternativo para la evaluacion del Test Gestaltico Viso-motor de Bender.
Revista-Iberoamericana-de-Diagnostico-y-Evaluacion-Psicologica (14) 2: 9-31.
Psychological Assessment Resources (2003) CATALOG OF PROFESSIONAL TESTING RESOURCES.
Lutz-FL: PAR.
SALVIA, J. & YSSELDYKE, J. (1991) Avaliação em Educação Especial e Corretiva. São Paulo: Ed.
Manole.
SHAPIRO, S. K., & Simpson, R. G. (1995) Koppitz scoring system as a measure of Bender-Gestalt
performance in behaviorally and emotionally disturbed adolescents.. Journal of Clinical Psychology (51) 1:
108-112.
SISTO, F. F., BUENO, J. M. H., & RUEDA, F. J. M. (2003) Traços de personalidade na infância e distorção
e integração de formas: um estudo de validade. Psicologia em Estudo ( 8) 1: 77-84.
TAYLOR, R. L.; KAUFFMAN, D., & PARTENIO, I. (1984) The Koppitz Developmental Scoring System
for the Bender-Gestalt: Is it developmental? Psychology in the-Schools (21) 4: 425-428.
Primeira decisão editorial em: maio /2004
Versão final em: agosto /2004
Aceito em: novembro /2004

Documentos relacionados