Self-, peer- and professor assessment from a Bloom`s perspective
Transcrição
Self-, peer- and professor assessment from a Bloom`s perspective
12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI Self-, peer- and professor assessment from a Bloom’s perspective Luiz Antonio Titton (Universidade de São Paulo, São Paulo, Brazil) – [email protected] Jose Dutra Oliveira Neto (Universidade de São Paulo, São Paulo, Brazil) – [email protected] Helder Jose de Araujo (Universidade de São Paulo, São Paulo, Brazil) [email protected] Abstract: Among the existing assessment alternatives offered by virtual learning environments, self and peer assessments are implementable options with low human and materials cost. The existence of numerous studies on these forms of assessment without a proper framework can lead to different results. Some lack of theoretical basis may cause their reliability to be questionable. The objective of this study is to investigate, from the point of view of the cognitive domain skills proposed by Bloom, three assessments: peer-, self- and professor assessment. Through a sample of about 100 undergraduate accounting students, we will investigate the use of a system of evaluation by self-, peerand professor assessment anonymously and with the use of rubrics. The findings show evidence of alignment among the three forms as well as the impacts of the technique in the learning process of accounting students. Furthermore, the evidence shows that the type of activity promotes different convergence grading in the assessments. These findings can help in new strategies for assessment and teaching and learning especially in courses with high numbers of students. Keywords: Assessment, rubrics, Bloom taxonomy 0120 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI Introdução A simples investigação dos resultados obtidos de auto avaliações e as realizadas por pares comparativamente àquelas produzidas pelo professor produziu resultados relevantes demonstrando haver coerência em graus variados (Chang, Liang, & Chen, 2013a; Chang, Tseng, & Lou, 2012a; Chen, 2010a; Napoles, 2008) Entretanto, constatam-se disparidades em graus variados nas análises dos resultados. Esse fator pode induzir o pesquisador a obter conclusões inexatas. Um dos aspectos que se observa é que o agrupamento das questões utilizadas para as avaliações é feito de acordo com o significado das tarefas (Chang, Liang, & Chen, 2013b). O questionamento que se faz é que nesse caso as conclusões não dispõem de um arcabouço teórico conceitual para basear a forma como foram realizados os agrupamentos. Portanto, as análises sobre o processo ficam prejudicados porque qualquer comparação entre os grupos tem um sentido explicativo restrito a atividades e não de forma mais ampla e generalizável como seria se os agrupamentos tivessem sido realizados com base em um framework reconhecido pela ciência. A adoção da taxonomia de habilidades cognitivas proposto por Bloom não é nova para análises de avaliações. Um estudo realizou uma comparação entre os tipos de questões em uma faculdade de química e concluiu que no exame admissional há predominância de questões de níveis superiores de habilidades mas que, no decorrer do curso, são utilizados essencialmente, acima de 99%, questões do primeiro nível de habilidades da taxonomia. (Karamustafaoğlu, SEVİM, Karamustafaoğlu, & ÇEPNİ, 2003a) Ainda com foco em estrutura curricular, foi sugerida como que fosse adotada uma variante da taxonomia de Bloom, proposta por Krathwohl (2000) para determinar o nível de habilidades de alto nível envolvido nas questões formuladas para realizar a avaliação de tarefas. Essa variante foi utilizada para avaliar a presença de questões de níveis mais avançados nos três primeiros anos de um curso. (Collier-Reed, 2011) Foi observado, também, que o envolvimento proporcionado pela avaliação por pares desenvolve mais as habilidades meta cognitivas, que são mais difíceis em uma auto avaliação. (Chang, Tseng, & Lou, 2012b) Esse trabalho buscou investigou, do ponto de vista das habilidades do domínio cognitivo proposto Bloom, as avaliações: por pares, auto avaliação e avaliação do professor. Dessa maneira, foi utilizado um arcabouço teórico conceitual para as avaliações classificando as atividades de acordo com as habilidades representadas na taxonomia de Bloom. Para isso, as rubricas utilizadas para a avaliação foram produzidas utilizando o arcabouço teórico e esse mesmo framework foi utilizado para a análise. Assim, os agrupamentos não utilizaram o sentido do conteúdo das questões do ponto de vista do caso em si, mas as habilidades do domínio cognitivo. 2 – Modelos de avaliação O processo de avaliação demanda o uso intensivo de recursos humanos que torna o processo de avaliação muito caro e longo. A medida que crescem o número de alunos, o processo de avaliação torna-se um elemento crítico no processo de viabilidade financeira. Uma das iniciativas educacionais com grande volume de alunos são os 0121 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI Massive Open Course Online (MOOC) onde observa-se uma grande expectativa de crescimento no mercado educacional (Gray, 2013) A avaliação do professor torna-se inviável em cursos com grande número de alunos e, portanto, surge a necessidade de identificar novas formas de avaliação viáveis com a mesma qualidade. Dentre as possibilidades pode-se destacar a avaliação auto avaliação e a feita por pares. Sitzmann, Brown, & Bauer (2010) explicam o construto de auto avaliação por meio da distinção entre três abordagens: conhecimento, aprendizado cognitivo e resultados emocionais. A primeira refere-se a avaliação que os alunos fazem de seu nível de conhecimento ou incrementos nos seus conhecimentos em um determinado domínio. A segunda - auto avaliação na dimensão de aprendizado cognitivo - refere-se a compreensão de informações que incluem conhecimento baseado em fatos e conhecimentos. A distinção crítica entre essas duas dimensões é a origem de onde vem a compreensão dos alunos. A primeira refere-se a depoimentos de seus níveis de conhecimento enquanto que a segunda refere-se a auto graduações em exames e tarefas assim como as atribuídas pelo professor. A terceira abordagem – resultados emocionais – engloba três possíveis aspectos: reações, motivação e eficácia. As reações refletem a satisfação do aluno com a sua experiência educacional (Sitzmann, Brown, Casper, Ely, & Zimmerman, 2008). A motivação refere-se ao grau em que os alunos se esforçaram para aplicar o conhecimento adquirido (Sitzmann et al., 2008). E, a eficácia diz respeito a confiança dos alunos na sua habilidade de realizar tarefas associadas ao treinamento dado (Bandura, 1977) Nesse trabalho, ao referir-se a auto avaliação está sendo feira a referência a segunda abordagem, aprendizado cognitivo, em que o objeto sendo medido é o conhecimento baseado em fatos e conhecimentos em tarefas. Essa delimitação exclui a auto percepção de conhecimento e resultados emocionais. Nessa abordagem específica, o aluno avalia a sua atividade comparando com um critério entendido como correto e que é o mesmo utilizado pelo professor para a avaliação da tarefa. A avaliação por pares tem se tornado comum em muitos cursos no contexto da tecnologia de telecomunicações. Esse modo de avaliação pode ser combinado com a auto avaliação e a do instrutor. No entanto, uma pesquisa foi realizada com os alunos que trabalham no mesmo assunto presencialmente e foram encontrados indícios de diferenças nos resultados dos três métodos de avaliação citados. Verificou-se que a auto avaliação e a do instrutor são consistentes entre si, mas a avaliação por pares mostrou diferenças significativas com relação aos outros dois métodos.(Chang, Liang, & Chen, 2013c; Chang, Tseng, & Lou, 2012c) Uma nova pesquisa posterior testou a mesma configuração usando suporte baseado na web e descobriu-se que neste novo ambiente os três métodos convergiram para os mesmos resultados (Chang et al., 2012c). Nessas duas pesquisas todos os alunos sabiam que estava avaliando um ao outro. Isso é um indício de que o meio pode influenciar a convergência de resultados obtidos. A avaliação por pares melhora as habilidades do aluno para relacionar objetivos instrucionais com atividades de avaliação, para entender os critérios e processos, para identificar os pontos fortes e fraquezas do próprio desempenho dos alunos, para melhorar a sua compreensão e sua confiança no assunto em mãos e para melhorar 0122 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI desempenho futuro (Ballantine, 2002 apud Chen, 2010). A avaliação pelos pares pode expor o cenário de aprendizagem colaborativa, oferecendo uma maneira de incluir sugestões para outro aluno fazer um trabalho melhor. Em outras palavras, os alunos não precisam apenas do conteúdo do curso para produzir o trabalho, mas precisam, também, conhecer os critérios de avaliação. Esse conhecimento é necessário para reunir esses elementos para propor uma sugestão sobre o trabalho que está sendo avaliado de forma independente sendo seu próprio ou de terceiros. Neste sentido, uma pressão social para colaborar pode resultar numa melhor aprendizagem. Quando a responsabilidade de fazer a avaliação é passada para os alunos, a sua capacidade de atender a esses requisitos deve ser suficiente para corresponder à importância da avaliação. (O’Toole, 2013) Embora na maioria dos alunos percebe-se que a avaliação por pares "impacta positivamente a autoconfiança, melhora comportamentos de aprendizagem, e ajuda na identificação de pontos fortes e limitações pessoais" a maioria dos alunos concordou que o recebimento de feedback de um instrutor é mais significativo do que a partir de um outro aluno. Além disso, os alunos demonstraram-se divididos em relação ao impacto do anonimato e amizade.(Theising, Wu, & Heck Sheehan, 2014) De fato, os alunos tendem dar mais valor a especialistas e ao instrutor mais do que a si mesmos " e podem se sentir desconfortáveis quanto a criticar o desempenho do outro.(Chen, 2010b) Ver o trabalho do aluno a partir da perspectiva do avaliador pode ser uma experiência poderosa instrutiva para os alunos, uma vez que não são avaliadores experientes. Em outros casos, eles podem construir sobre essa experiência, tornando-se melhores avaliadores da qualidade do trabalho de alunos (e, por decorrência, do seu próprio trabalho). Dessa forma, sua responsabilidade pode crescer ao longo do tempo. (O’Toole, 2013) Observa-se que pela novidade deste método, isso pode ser um possível problema porque os alunos duvidam de suas próprias capacidades para produzir um feedback construtivo e sugestões apropriadas. (Bannister & Thorne, 1997 apud Chen, 2010) Esta progressão na responsabilidade e capacidade de avaliação por pares pode ser deliberadamente estruturada com um projeto de aprendizagem, que inclui as fases da atividade, avaliação por pares, revisão e reflexão sobre a avaliação do par, aprendendo a ser um assessor melhor, mais ativo e com uma avaliação mais aprofundada. As atividades de avaliação podem ser incluídas no projeto do curso especialmente para oferecer mais oportunidades para desenvolver habilidades de avaliação. Esta é uma forma de pedagogia da aprendizagem-ação. O processo pode ser gerido de forma mais eficaz onde a tecnologia pode ser usada para a acrescentar sugestões sobre o material avaliado na área de avaliação, com comentários dos pontos de avaliação adicionadas por outros, e, em seguida, reflexões sobre os comentários a ser acrescentados na mesma área. (O’Toole, 2013) Independentemente das crenças epistemológicas, a argumentação colaborativa promoveu ambiente mais construtivo e interativo entre colegas questionando atividades e ajudou a construir argumentos mais elevados em qualidade nos estudos de caso do que em resumos colaborativos. Isso aponta indícios de que pode ser consistente uma hipótese de que o tipo de atividade pode interferir na qualidade do ambiente colaborativo no decorrer da avaliação por pares. Portanto, os efeitos de tarefas correspondentes e crenças epistemológicas variou dependendo dos tipos de resultados de aprendizagem (compreensão vs. argumentação) em questionamento por pares 0123 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI online.(Cho, Lee, & Jonassen, 2011). O ambiente colaborativo pode levantar questionamentos acerca da avaliação de colegas, mais especificamente no anonimato. 3 Dominío Cognitivo de Bloom Segundo Bloom (Ferraz, Belhot, 2010), as habilidades no domínio cognitivo tratam de conhecimento, compreensão e o pensar sobre um problema ou fato. • • • Conhecimento: memorização de fatos específicos, de padrões de procedimento e de conceitos. Compreensão: imprime significado, traduz, interpreta problemas, instruções, e os extrapola. Aplicação: utiliza o aprendizado em novas situações. Estudos anteriores demonstraram que podem ocorrer predominâncias extremas do uso de questões centradas em habilidades cognitivas de baixo nível mesmo quando existem recomendações institucionais para o uso de avaliações em habilidades cognitivas de alto nível (Karamustafaoğlu, SEVİM, Karamustafaoğlu, & ÇEPNİ, 2003b). Essa distinção entre graduação entre itens de alto ou baixo nível de habilidades cognitivas também foi observada em estudo que apontou que os alunos tiveram facilidade e demonstraram melhor acurácia na auto avaliação de itens de baixo nível e demonstraram dificuldade em questões de alto nível. (Sadler & Good, 2006) Em cursos na modalidade online, a condição de anonimato pode definir uma situação que afeta positiva ou negativamente a confiança na avaliação. Sob esta condição especial, verificou-se que a revisão por pares cegos apresentou um melhor desempenho na avaliação de tarefas por escrito e forneceram feedback mais crítico para os seus pares do que os estudantes que participam na revisão por pares com avaliadores identificados.(Lu & Bol, 2007) Observou-se que até mesmo entre grupos distintos, avaliando membros do seu grupo e de outro, e em que se sabia qual era o outro grupo sendo avaliado, a tendência de alterar a avaliação positivamente para o seu próprio grupo em detrimento a outro é um fato (Sadler & Good, 2006). Além do aspecto do anonimato, deve existir um critério claro no processo de avaliação para uniformizar o processo de correção. Por isso, existe a necessidade de que os critérios sejam transparentes, previsíveis e relevantes para o currículo e para as necessidades dos alunos de forma a projetar um sistema confiável. (O’Toole, 2013) Para manter a boa qualidade, a necessidade de esforços de avaliação tornou-se altamente consumidora de tempo e recursos. Por esta razão, o uso de instrumentos de avaliação que podem promover o pensamento e aprendizagem ao mesmo tempo em que os alunos são avaliados estão ganhando interesse de ser utilizados em Ambiente Virtual de Aprendizagem (AVA). Entre os instrumentos disponíveis, a adoção de rubricas demonstra ser a forma mais rápida e eficiente para avaliar o trabalho do aluno. Quando rubricas são produzidas de acordo com as recomendações encontradas na literatura, 0124 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI podem ser também ensinar ferramentas que suportam a aprendizagem do aluno e o desenvolvimento de habilidades de pensamento sofisticados. O uso de rubricas previamente definidas para avaliar o conhecimento sobre um assunto é uma boa maneira de manter a transparência e a previsibilidade claras para alunos e instrutores. O principal aspecto das rubricas que contribui levar o sistema à transparência, confiabilidade e acurácia é que elas suportem a aprendizagem e o desenvolvimento de habilidades e de compreensão. Elas, também, devem ser fáceis de usar e explicar, mostrar claramente a expectativa do professor e proporcionar aos alunos um feedback mais informativo sobre os seus pontos fortes. O número adequado de gradações para rubricas é quatro opções.(Andrade, 2000) Não há indicações sobre como produzir as rubricas de tal modo a atender a todas estas necessidades. As recomendações são de que para fazer uma rubrica instrucional o professor deve olhar para modelos, listas de critérios, construir e desconstruir critérios e níveis articulados de qualidade, criar e rever o projeto de rubricas antes de usá-lo. (Andrade, 2000). Além disso, a necessidade de avaliar se torna menos importante do que o desejo de aumentar o processo de aprendizagem e desenvolver novas capacidades. O projeto de rubricas depende de quanto os fins - formativo ou somativo - são os objetivos da avaliação. O sucesso do sistema depende dos alunos: o engajamento em sua aprendizagem, capacidade de agir no contexto, capacidade de aplicar seus recursos em um contexto diferente do seu aprendizado um, capacidade de aplicar suas habilidades em um contexto desconhecido no futuro, meta–capacitação para desenvolver as suas capacidades ainda mais, meta-capacidade de ajudar os outros a desenvolver as suas capacidades. Práticas de avaliação bem desenhados podem incluir vários ou todos estes aspectos para promover a boa aprendizagem e avaliação confiável. (O’Toole, 2013) Por outro lado, a experiência anterior com a utilização de rubricas é extremamente importante pois se os alunos são simplesmente apresentados as rubricas e pede-se que usem voluntariamente, eles acabam por ignorar as rubricas. (Sadler & Good, 2006) Por isso, existe a necessidade de previamente ensinar aos alunos sobre como utilizar as rubricas por meio de um treino nessa ferramenta de avaliação. Entretanto, pode-se afirmar que as rubricas devem medir as habilidades de acordo com a dimensão que se deseja mensurar podendo ser conhecimento, compreensão ou capacidades de nível superior. Utilizaremos nesta proposta as 3 dimensões iniciais da taxonomia de Bloom. Esse trabalho tem como objetivo a investigação sobre alguns modelos de avaliação no ensino de graduação usando uma ferramenta online. Existem diversas formas de avaliação no ensino presencial, porém poucos estudos empíricos estão disponíveis na literatura acerca do uso de ferramentas no processo avaliativo. Os modelos utilizados são: auto avaliação, avaliação por pares e avaliação pelo professor. A etapa empírica ocorreu em um curso de graduação em contabilidade em uma instituição pública. A mensuração dos modelos baseou-se nas dimensões cognitivas de Bloom Metodologia Este é um estudo de caso que vai permitir identificar o alinhamento entre os diversos tipos de avaliação em uma unidade de pesquisa que é um curso de graduação de contabilidade. 0125 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI Os participantes foram alunos de graduação em contabilidade em uma universidade pública. A disciplina utilizada para a pesquisa foi a de métodos científicos da pesquisa onde os alunos aprendem a escrever artigos científicos e relatório de pesquisa, como parte do curso. A amostra teve 101 alunos. Dessa amostra, três alunos foram excluídos por não terem submetido seu trabalho para avaliação uma vez que essa condição os impediu de avaliar os trabalhos de dois pares, além do seu próprio trabalho. Essa opção foi tomada do ponto de vista didático com a justificativa de que a capacidade de avaliar é posterior ao aprendizado decorrente de produzir o mesmo material na tarefa proposta para a atividade. Na atividade, o aluno deveria atingir os dois primeiros níveis cognitivos de Bloom quando teve a oportunidade de mostrar a capacidade em conhecer e compreender os conceitos básicos referentes as seções obrigatórias e opcionais de um resumo científico. Neste caso, o aluno recebeu um resumo de um artigo publicado em uma revista científica nacional e, também, uma cópia do artigo completo. Suas tarefas foram a de identificar as seis seções do resumo que estão presentes e/ou faltantes. Essas seções foram delimitadas como contexto, lacuna, objetivo, materiais e métodos, resultados e conclusão. A tarefa seguinte consistiu em colocar o resumo nessa ordem uma vez que o resumo fornecido estava em outra ordem. A terceira tarefa é identificar a seção ou as seções faltantes e produzir uma frase para completar o resumo com as seis seções. No caso do resumo fornecido, estavam faltando as duas primeiras seções. Do ponto de vista da taxonomia de Bloom, as tarefas que compõem a atividade foram associadas com as habilidades no domínio cognitivo como se apresenta no Quadro 1: Quadro 1 - Relacionamento entre as tarefas e a taxonomia de Bloom Tarefa Habilidade no domínio cognitivo T1 - Identificar as seções do resumo Conhecimento T2 - Reordenar o resumo segundo o gabarito proposto Conhecimento T3 - Demonstrar que identificou as partes faltantes Conhecimento T4 - Produzir a primeira parte faltante (contexto) Compreensão T5 - Produzir a segunda parte faltante (lacuna) Compreensão Após a submissão de sua atividade pelo AVA, o aluno terá que avaliar anonimamente outros dois colegas anônimos, além de fazer a avaliação do seu próprio trabalho. O professor efetua esta avaliação para todos os alunos. Todos usaram a mesma rubrica no sistema de AVA. Devido às necessidades institucionais e alinhamento para as questões éticas sobre as pesquisas que utilizam seres humanos, foi exposto aos alunos que a nota final do curso usou suas medidas de desempenho e que o material produzido foi parte de uma pesquisa em que não haveria nenhuma identificação individual. O uso efetivo de suas avaliações 0126 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI como parte da nota final do curso foi o argumento apresentado estimular a avaliação sincera e responsável. Um questionário foi administrado a todos os alunos após a conclusão da tarefa para verificar o grau de proteção do anonimato. É previsível que exista algum tipo de influência da avaliação por quebra de anonimato. Isso é considerado como uma ameaça a validade e foi mensurada resultando em 2 % de alunos que identificaram o trabalho de terceiros sendo avaliado. Esse valor foi considerado aceitável e sem implicações para essa pesquisa. Em que pese a recomendação para que as rubricas sejam em número de quatro, foi necessário incluir uma opção anterior para indicar que no trabalho sendo avaliado não tinha sido realizada a tarefa correspondente à rubrica. Dessa forma, em todas rubricas obteve-se 5 opções para as primeiras três tarefas. A graduação total mínima possível é 5 e a maior é 25. Quadro 2 - Rubricas utilizadas Enunciado da rubrica Colocar marcação correta no word usando o gabarito de seções do resumo Montar o resumo na ordem correta de acordo com o gabarito de seções do resumo Demonstrar o que está faltando (deixou alguma indicação ou produziu Rubricas Valor Não fez 1 Errou mais de 3 marcações 2 Errou duas marcações 3 Errou uma das marcações 4 Marcou corretamente as partes 5 Não fez 1 Errou 3 ou mais partes 2 Errou duas partes 3 Errou uma das partes 4 Reordenou corretamente as partes 5 Nao fez 1 0127 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI Enunciado da rubrica Rubricas a parte que falta). As partes faltantes são contexto e gap Identificou mais de duas partes faltantes (incorreto) 2 Identificou (incorreto) faltante 3 Identificou duas partes faltantes (correto) 3 Não produziu um texto para o CONTEXTO 1 Produziu o texto, mas não está correto 2 Produziu corretamente, mas o texto não está claro 3 Produziu corretamente e o texto está claro 4 Não produziu um texto para o GAP 1 Produziu o texto, mas não está correto 2 Produziu corretamente, mas o texto não está claro 3 Produziu corretamente e o texto está claro 4 Qualidade do texto produzido sobre o CONTEXTO Qualidade do texto produzido sobre o GAP uma parte Valor Resultados Os dados foram processados utilizando os valores atribuídos para cada opção em cada rubrica e não representam as notas atribuídas aos alunos. Esses valores tem o objetivo exclusivo de análise dos dados obtidos. Esses dados foram consolidados na Tabela 1: 0128 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI Tabela 1 - Dados primários das rubricas aplicadas Rubric Professo a r Pares Auto 1 3,05 3,43 3,53 2 1,78 3,60 3,71 3 3,01 2,96 3,23 4 2,11 2,75 2,91 5 2,44 2,43 2,59 Pares/Prof 12,45% 101,94% -1,72% 30,16% -0,47% Auto/Prof 15,85% 108,39% 7,25% 37,50% 6,13% Auto/Pare Convergênci s a 3,02% 0,25 3,19% 1,08 9,13% 0,14 5,64% 0,42 6,64% 0,09 O objetivo dessa tabela é apresentar os resultados de cada um dos níveis de avaliação – professor, pares e auto avaliação. Sendo assim, na primeira coluna é indicada a rubrica e nas três colunas seguintes apresentam-se as médias da amostra. Na quarta coluna observa-se quanto, em percentual, as notas das avaliações dos pares foi superior a nota atribuída pelo professor. Na coluna seguinte é apresentado o quanto a nota de auto avaliação foi superior àquela dada pelo professor. A última coluna é o desvio padrão dos três grupos de avaliações apresentadas – professor, pares e auto avaliação. Entendeu-se que o desvio padrão entre todas as notas corresponde a uma medida de convergência entre os grupos de avaliação. As avaliações realizadas por pares foram tratadas conjuntamente e é necessário ressaltar que ocorreram duas avaliações para cada trabalho submetido. Outra tabela analítica foi produzida comparando o quanto as avaliações feitas pelo próprio aluno e por pares estavam superiores a avaliação feita pelo professor. Nesse caso, a tabela é extensa comparando cada nota e a consolidação das informações pode ser visualizada na : Tabela 2 - Variação percentual das auto avaliações e avaliações dos pares sobre as do professor Descrição Auto avaliações / Avaliação do Professor Avaliações dos pares / Avaliação do Professor Média Desvio Padrão Média Desvio Padrão Rubrica 1 24% 50% 19% 44% Rubrica 2 Rubrica 3 Rubrica 4 Rubrica 5 182% 13% 78% 25% 155% 43% 123% 82% 167% 7% 72% 29% 143% 61% 120% 99% Nessa tabela, são apresentados os percentuais em que as auto avaliações e avaliações por pares são superiores àquelas atribuídas pelo professor. Assim, a média representa o percentual médio dos favorecimentos dados em auto avaliações e avaliações dos pares. São acompanhadas do desvio padrão desses percentuais. Tabela 3 - Variações das auto avaliações e por pares sobre as do professor agrupadas Descrição Auto avaliações / 0129 Avaliações dos pares / 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI Avaliação do Professor Total Conhecimento Compreensão Média 65% 73% 52% Desvio Padrão 71% 95% 38% Avaliação do Professor Média 59% 64% 50% Desvio Padrão 65% 89% 31% Nessa tabela, os mesmos dados da tabela anterior foram totalizados na linha ´total’. A seguir, na linha de conhecimento foram totalizadas as rubricas 1 a 3 que foram classificadas como sendo do primeiro nível de Bloom. Na linha de compreensão estão totalizadas as rubricas 4 e 5 consideradas como pertencentes ao nível 2 de Bloom. Análise Do ponto de vista de existir algum favorecimento dos alunos ao conceder avaliações superiores aos dados pelo professor, pode-se notar na Tabela 1 que há indícios de que trata-se de um fato. Entretanto, não há um padrão para esse pretenso favorecimento. Observe-se que há uma sensível diferença entre o grau de favorecimento entre as cinco rubricas. Isso leva a considerar a suposição de que o favorecimento é afetado pelo tipo de tarefa, corroborando o que afirmaram Cho, Lee & Jonassen (2011). Por outro lado, isso não assegura que a causa dessa discrepância também não possa ter sido a rubrica utilizada. Mas essa suposição não encontra fundamento no próprio conjunto de rubricas utilizadas, uma vez que as duas últimas são idênticas e também apresentam diferenças de favorecimento entre si. Dessa forma, é possível descartar o efeito da rubrica como um fator que pudesse interferir na afirmação realizada por Cho, Lee & Jonassen (2011) e que dessa forma confirmam o indício de que o resultado das rubricas é afetado apenas pelo tipo de tarefa. Ainda, na Tabela 1, na última coluna, pode-se observar que há pouca regularidade na convergência entre as rubricas. Mesmo considerando que as três primeiras rubricas referem-se a um tipo de habilidade de domínio cognitivo diferente das duas últimas, essa tendência de divergência se mantém. E, isso faz merecer uma avaliação mais detalhada para compreender se pode existir alguma coerência entre os dois grupos de rubricas no sentido do favorecimento dado pelos alunos comparativamente com as avaliações do professor. Na Tabela 2 observa-se os percentuais de favorecimento das avaliações comparadas com aquela produzida pelo professor. Observe-se que quando o favorecimento é alto – rubricas 2 e 4 – o desvio padrão também é elevado. Isso acontece tanto nas avaliações por pares como nas auto avaliações. Isso pode significar o indício de que em algumas atividades há mais propensão ao favorecimento do que outras e que o consenso geral da turma tende a ser menor. Veja, na Tabela 3, na linha de total, que os favorecimentos gerais da turma, tanto quando nas avaliações por pares quanto nas auto avaliações são próximas, tanto no percentual quanto no desvio padrão. Essa convergência é muito importante por dar indícios de que existe coerência da turma nas duas modalidades de avaliação, mostrando que existiu um favorecimento maior, mas pequeno, nas auto avaliações. 0130 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI Mas, o dado relevante observável na Tabela 3 é que o nível de favorecimento nas rubricas 1 a 3, totalizadas sob a dimensão de conhecimento de Bloom apresenta maior nível de favorecimento do que os dados mostrados na dimensão da compreensão. E, observa-se, da mesma forma convergência entre as auto avaliações e as avaliações por pares. Essa pode ser uma indicação de que nas tarefas da segunda dimensão de Bloom, a propensão ao favorecimento é menor. Considerações Finais Pode-se afirmar que há indícios de convergência entre auto avaliações e por pares comparadas com as feitas pelo professor. Entretanto, deve-se observar que a quarta e quinta rubricas são idênticas variando apenas a tarefa proposta que foi produzir um texto referente ao contexto e lacuna (gap), respectivamente. Por isso, atribui-se a falta de homogeneidade para a atividade que foi aplicada aos alunos, ou seja, a atividade pode alterar a convergência, e portanto a acurácia, das avaliações feitas pelos alunos. Por outro lado, há uma convergência relativamente uniforme entre a auto avaliações e por pares, com superioridade da primeira. Isso demonstra a tendência para o maior favorecimento em que o aluno avalia a si mesmo, mas que o comportamento geral é coerente entre os dois tipos de avaliação. O resultado apresentado corrobora as pesquisas anteriores mas a taxonomia de Bloom apresenta uma dimensão nova para interpretar os dados. Foi constatado que ao se oferecer atividades que envolvem o conhecimento – primeiro nível da taxonomia de Bloom -, as discrepâncias entre as avaliações feitas pelos alunos e a do professor podem ser muito maiores do que aquelas que envolvem a compreensão, que é o segundo nível de Bloom. É interessante que a variação das diferenças entre avaliações de alunos e do professor apresentaram desvio padrão menor também nessa comparação. Isso sugere que o tipo de atividade influencia a avaliação pelos indícios de que nas atividades de mais alto nível de habilidades a auto avaliação e por pares apresentem maior acurácia. Essa pesquisa foi aplicada em uma situação presencial utilizando um Ambiente Virtual de Aprendizagem e, por isso, é facilmente replicável em um curso online utilizando os recursos já disponíveis nessa ferramenta e independendo do número de alunos desde que atendidas a algumas condições: avaliações por pares duplamente cegos, que seja conhecido o percentual de favorecimento dos pares sobre as do professor, que seja conhecido o percentual de favorecimento das auto avaliações sobre as dos pares, produção de rubricas adequadas e, não menos importante, o percentual de convergência de cada tipo de atividade. Entre esses requisitos, o que demonstra maior dificuldade aparente é determinar quais atividades induzem aos percentuais variados de falta de convergência. Entretanto, ficou clara a existência de indícios de que nas atividades de maior nível na taxonomia de Bloom, esses percentuais são menores. Esse achado de que a acurácia em avaliações feitas pelos alunos em atividades de maior nível de Bloom pode ser relevante para cursos em MOOC porque as avaliações poderiam centrar em níveis mais elevados de habilidades. Esse pode ser um fator de melhoria de qualidade desses cursos. 0131 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI A inserção da taxonomia de Bloom para análise da acurácia das avaliações feitas pelos alunos avançou no conhecimento em relação a resultados anteriores pelo fato de demonstrar que existem indícios de uma maior acurácia nas avaliações em atividades que demandam maior nível de habilidades cognitivas. Foram encontrados indícios de que quanto mais avançado a atividade no sentido das habilidades de domínio cognitivo de Bloom menor será o desvio de avaliação dos alunos com relação às tarefas avaliadas. Esses indícios têm suporte, também, na coerência entre auto avaliações e avaliações por terceiros que, no caso estudado, apresentaram forte convergência. Referências Andrade, H. G. (2000). Using Rubrics to Promote Thinking and Learning. Educational Leadership, 57(5), 13–18. Bandura, A. (1977). Self-efficacy: Toward a unifying theory of behavioral change. Psychological Review, 84(2), 191–215. doi:10.1037//0033-295X.84.2.191 Chang, C.-C., Liang, C., & Chen, Y.-H. (2013a). Is learner self-assessment reliable and valid in a Web-based portfolio environment for high school students? Computers & Education, 60(1), 325–334. doi:10.1016/j.compedu.2012.05.012 Chang, C.-C., Liang, C., & Chen, Y.-H. (2013b). Is learner self-assessment reliable and valid in a Web-based portfolio environment for high school students? Computers & Education, 60(1), 325–334. doi:10.1016/j.compedu.2012.05.012 Chang, C.-C., Liang, C., & Chen, Y.-H. (2013c). Is learner self-assessment reliable and valid in a Web-based portfolio environment for high school students? Computers & Education, 60(1), 325–334. doi:10.1016/j.compedu.2012.05.012 Chang, C.-C., Tseng, K.-H., & Lou, S.-J. (2012a). A comparative analysis of the consistency and difference among teacher-assessment, student self-assessment and peer-assessment in a Web-based portfolio assessment environment for high school students. Computers & Education, 58(1), 303–320. doi:10.1016/j.compedu.2011.08.005 Chang, C.-C., Tseng, K.-H., & Lou, S.-J. (2012b). A comparative analysis of the consistency and difference among teacher-assessment, student self-assessment and peer-assessment in a Web-based portfolio assessment environment for high school students. Computers & Education, 58(1), 303–320. doi:10.1016/j.compedu.2011.08.005 Chang, C.-C., Tseng, K.-H., & Lou, S.-J. (2012c). A comparative analysis of the consistency and difference among teacher-assessment, student self-assessment and 0132 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI peer-assessment in a Web-based portfolio assessment environment for high school students. Computers & Education, 58(1), 303–320. doi:10.1016/j.compedu.2011.08.005 Chen, C. (2010a). The implementation and evaluation of a mobile self- and peerassessment system. Computers & Education, 55(1), 229–236. doi:10.1016/j.compedu.2010.01.008 Chen, C. (2010b). The implementation and evaluation of a mobile self- and peerassessment system. Computers & Education, 55(1), 229–236. doi:10.1016/j.compedu.2010.01.008 Cho, Y. H., Lee, J., & Jonassen, D. H. (2011). The role of tasks and epistemological beliefs in online peer questioning. Computers & Education, 56(1), 112–126. doi:10.1016/j.compedu.2010.08.014 Collier-Reed, B. (Ed. . (2011). Proceedings of the First Biennial Conference of the South African Society for Engineering Education Proceedings of the First Biennial Conference of the South African Society for Engineering Education. Ferraz, A.P.C.M., Belhot, R.V., Taxonomia de Bloom: revisão teórica e apresentação das adequações do instrumento para definição de objetivos instrucionais, Gestão Produção, São Carlos, v. 17, n. 2, p. 421-431, 2010 Gray, D. (2013). Barriers To Online Postsecondary Education Crumble: Enrollment In Traditional Face-To-Face Course Declines As Enrollment In Online Courses Increases. Contemporary Issues In Education Research, 6(3), 345–348. Karamustafaoğlu, S., SEVİM, S., Karamustafaoğlu, O., & ÇEPNİ, S. (2003a). Analysis of Turkish High-School Chemistry-Examination Questions According To Bloom’ S Taxonomy. Chemistry Education Research and Practice, 4(1), 25. doi:10.1039/b2rp90034c Karamustafaoğlu, S., SEVİM, S., Karamustafaoğlu, O., & ÇEPNİ, S. (2003b). Analysis of Turkish High-School Chemistry-Examination Questions According To Bloom’ S Taxonomy. Chemistry Education Research and Practice, 4(1), 25. doi:10.1039/b2rp90034c Lu, R., & Bol, L. (2007). A Comparison of Anonymous Versus Identifiable e-Peer Review on College Student Writing Performance and the Extent of Critical Feedback. Journal of Interactive Online Learning, 6(2), 100–115. Napoles, J. (2008). Relationships Among Instructor, Peer, and Self-Evaluations of Undergraduate Music Education Majors’Micro-Teaching Experiences. Journal of Research in Music Education, 56(1), 82–91. O’Toole, R. (2013). Pedagogical strategies and technologies for peer assessment in Massively Open Online Courses ( MOOCs ). 0133 12th INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS & TECHNOLOGY MANAGEMENT - CONTECSI Sadler, P., & Good, E. (2006). The Impact of Self- and Peer-Grading on Student Learning. Educational Assessment, 11(1), 1–31. doi:10.1207/s15326977ea1101_1 Sitzmann, T., Brown, K. G., & Bauer, K. N. (2010). Self-Assessment of Knowledge : A Cognitive Learning or Affective Measure ?, 9(2), 169–191. Sitzmann, T., Brown, K. G., Casper, W. J., Ely, K., & Zimmerman, R. D. (2008). A review and meta-analysis of the nomological network of trainee reactions. The Journal of Applied Psychology, 93(2), 280–95. doi:10.1037/0021-9010.93.2.280 Theising, K., Wu, K., & Heck Sheehan, A. (2014). Impact of peer assessment on student pharmacists’ behaviors and self-confidence. Currents in Pharmacy Teaching and Learning, 6(1), 10–14. doi:10.1016/j.cptl.2013.09.020 0134