dificuldades inerentes à compilação de um corpus oral de

Transcrição

dificuldades inerentes à compilação de um corpus oral de
DIFICULDADES INERENTES À COMPILAÇÃO DE UM CORPUS ORAL DE
INFORMANTES BRASILEIROS APRENDIZES DE INGLÊS PARA O
PROJETO LINDSEI-BR
1. Introdução
Predomina, atualmente, a utilização de corpora de falantes nativos de inglês na
pesquisa linguística e na elaboração de materiais didáticos, conforme observa Gilquin
(2007, p. 320):
A utilização de corpus tem-se espalhado no campo do inglês para propósitos acadêmicos, todavia, uma
busca na literatura e em materiais pedagógicos mostra que pesquisadores da área e escritores de materiais
usam principalmente corpora de nativos.
Além disso, “profissionais da linguagem tomam como verdadeiro que os modelos
apropriados para o uso de uma língua venham de seus falantes nativos” (Cook 1999, p.
185). Há, contudo, que se considerar as particularidades do aprendiz de inglês e
enxergá-lo como portador de uma identidade própria. Observações acerca da expressão
falada e escrita da Língua Inglesa por aprendizes revelam peculiaridades relacionadas à
língua materna (L1) dos mesmos e podem orientar o ensino e aprendizado de inglês a
públicos específicos.
2. Objetivos
Este trabalho tem por objetivo apresentar e discutir as principais dificuldades
encontradas pelos anotadores durante a etapa de transcrição de entrevistas gravadas de
brasileiros aprendizes de inglês para o projeto LINDSEI-BR e, ainda, mostrar
perspectivas quanto à utilização de tais dados para eventuais pesquisas relacionadas à
influência da língua materna no aprendizado de Língua Inglesa.
3. O projeto LINDSEI-BR: apresentação e composição
O projeto LINDSEI – Louvain International Databaseof Spoken English
Interlanguage- foi lançado em 1995 pela Université Catholique de Louvain, na Bélgica,
e visa à formação de um corpus oral internacional de aprendizes de Língua Inglesa de
diferentes línguas maternas. O LINDSEI-BR representa, portanto, a coletânea brasileira
destes dados. Para esta coletânea foram gravadas 50 entrevistas informais com
estudantes universitários brasileiros aprendizes de inglês com nível intermediário ou
avançado de proficiência no idioma, com representantes de ambos os sexos. Cada
entrevista consiste de três etapas: tópico de ajuste, discussão livre e descrição de
imagem (contar uma história).
4. O processo de transcrição das entrevistas: metodologia empregada e
dificuldades relacionadas
As entrevistas gravadas para o projeto LINDSEI-BR se encontram em fase de
transcrição e, ao longo desta etapa, se tornaram evidentes algumas dificuldades
relacionadas à adequação às convenções exigidas e estabelecidas pelo guia LINDSEI
para transcrição, disponível em formato eletrônico no sítio da Universidade de Louvain.
É relevante pontuar que, em um corpus dedicado à linguagem oral
espontânea,
a
transcrição
de
características
pertinentes
exclusivamente à fala deve ser feita segundo critérios que, além de
considerarem elementos da oralidade, devem ser capazes de registrá-los
com a maior precisão possível.
As transcrições são feitas manualmente e são, portanto, susceptíveis a erros. Dois
anotadores se ocupam da tarefa. Em relação à anotação manual, Ide (2012) apresenta
como “ideal a utilização de vários anotadores, sob circunstâncias controladas, de modo
a proporcionar medidas de concordância entre eles, especialmente para anotações
semânticas e de discurso”. Cada anotador se ocupa de metade das transcrições e
posteriormente revisam e analisam a metade feita pelo outro para gerar a versão final.
As principais dificuldades encontradas durante o trabalho foram aquelas
relacionadas à transcrição das pausas preenchidas e dos retornos dados pelo interlocutor,
das palavras truncadas e da sobreposição de turnos. Houve frequente utilização do som
[Λ] como preenchimento para pausas. Supunha-se tratar do artigo indefinido a quando a
palavra seguinte era um substantivo iniciado por consoante ou mesmo iniciado por
vogal, seguido ou não de auto-correção de a para an. Supunha-se ser a letra a quando a
próxima palavra começava por esta vogal. Gabrielatos et al (2010) também observaram
o emprego do artigo indefinido a e da vogal a em situações idênticas às acima descritas
ao analisar transcrições de entrevistas de um subcorpus extraído do Corpus de
Linguagem Adolescente de Londres (COLT) e do Corpus dos Inovadores Linguísticos
(LIC) para estudo da utilização das formas do artigo indefinido no inglês londrino.
Embora tais suposições fossem pertinentes, neste estudo, elas são discutíveis. Em
algumas ocorrências do som [a] como preenchimento para pausa, não ficou
absolutamente claro se se tratava do artigo indefinido a, da letra a ou da expressão para
preenchimento eh. A escolha da representação escrita para a transcrição coube a cada
anotador, de acordo com critérios particulares de análise: (Ex. 1)
(1) and he: had a a . a: love: . a a girl he= he loved but . they . couldn’t
Critérios particulares também se fizeram necessários na transcrição de outros
preenchimentos de pausas e de retornos dados pelo receptor quando estes não eram
razoavelmente audíveis ou quando eram falados e ouvidos de uma maneira que não
fosse possível encontrar um correspondente adequado no guia LINDSEI para
transcrevê-los. Ainda, como falantes de inglês não nativos, é difícil para
anotadores
identificar
correspondem
se
precisamente
os
às
sons
produzidos
formas
(eh),
pelos
(er)
informantes
ou
(erm).
Os
informantes, por sua vez, apresentam componentes em sua fala que não
se enquadram nos padrões fonéticos da Língua Inglesa, como, por
exemplo,
a
mencionados,
própria
elementos
utilização
cuja
dos
pronúncia
preenchimentos
pelos
para
aprendizes
pausa
apresenta
nítidas influências de sua L1. Sendo assim, ocasionalmente foi utilizado para
cobrir pausas um preenchimento característico do português brasileiro [ε], que encontra
no guia LINDSEI um correspondente semelhante para a escrita [eh], todavia, tal grafia
não representa foneticamente o preenchimento efetivamente utilizado pelo informante.
A dificuldade relacionada à transcrição das palavras truncadas era mais relevante
quanto maior a ocorrência de sons truncados em sequência, tornando uma difícil tarefa a
precisa identificação auditiva de cada som truncado e sua respectiva transcrição de
maneira a representar exatamente o que foi dito. (Ex. 2)
(2) the teacher in this movie is= s= so ex= ins= inspiring . (er)
Os entraves inerentes à sobreposição dos turnos de fala devem-se especialmente
às entrevistas nas quais ocorrem muitas sobreposições em um único turno, inclusive
devido aos retornos dados pelo interlocutor, fazendo com que, por diversas vezes, fosse
difícil a identificação de cada palavra e de seu respectivo falante e, ainda, o exato
momento em que as sobreposições ocorriam.
5. Conclusões, considerações e expectativas
As dificuldades descritas foram bastante significativas no início do trabalho de
transcrição, tornando-o moroso. Após algum tempo, embora ainda presentes, tais
dificuldades tornaram-se menos expressivas.
As ponderações apresentadas acerca das dificuldades ao transcrever são
preliminares e partem de observações que tiveram sua origem no decorrer do trabalho.
Estudos individuais de cada aspecto mencionado devem ser feitos.
Espera-se que, em curto prazo, a etapa de transcrição seja finalizada e se possa ter
acesso aos dados orais de informantes de outras nacionalidades para que, então, por
meio de comparações, estudos lingüísticos sejam feitos numa tentativa de caracterizar o
inglês falado por brasileiros. Tal esforço neste sentido poderá servir como fonte de
dados para a elaboração de materiais didáticos específicos para aprendizes de inglês que
tenham o português do Brasil como L1, para pesquisas relacionadas à interlíngua e
demais estudos comparativos.
6. Referências bibliográficas
COOK, V. (1999). “Going beyond the native speaker in language teaching.” Tesol
Quarterly, vol.33, nº 2, pp. 185-209.
GABRIELATOS, C.; et al. (2010). “A corpus-based sociolinguistic study of indefinite
article forms in London English.” Journal of English Linguistics, vol.38, nº 4, pp. 297334.
GILQUIN, G.; et al. (2007). “Learner corpora: the missing link in EAP pedagogy.”
Journal of English for Academic Purposes, vol.6, pp. 319-335.
IDE, N. (2012). The manually annoted sub-corpus. In: Encontro de Linguística de
Corpus,
5.,
São
Carlos.
Disponível
em
<http://143.107.232.109/elcebralc2012/slides/plenarias/nancy_ide_plenary.pdf.> Acesso em: 31 out. 2012
UNIVERSITÉ CATHOLIQUE DE LOUVAIN. Centre for English Corpus Linguistics.
Disponível em: <http://www.uclouvain.be/en-cecl-lindsei.html>. Acesso em: 12 mar.
2012.