Friday, September 11, 2009

2

Sobre as notas dos exames (após um primeiro relance às pautas; mas, agora, já com um acrescento no final, com análise mais fina)
Como se vê das informações do Gave, a nível nacional houve uma descida (em média de um valor: de 11,1 para 10,1). No entanto, como, e sempre a nível nacional, as médias de frequência eram este ano melhores (14, em vez de 13), podemos considerar que a disforia (relativamente a 2009) ainda será maior. Se bem entendo os números do Gave, a nível nacional, a diferença entre entre média de frequência e nota no exame é de 4 valores.
Olhando as pautas da ESJGF, vê-se que há muitos casos de diferença desse teor, mas sobretudo com os alunos que vinham com boas ou muito boas notas de frequência. Raramente, os dezanoves, dezoitos, dezassetes de CIF não baixaram três, quatro, cinco valores. Apercebi-me de que a descida já é menos marcada nos alunos médios e fracotes. Há uma aparente concentração na faixa entre 10,5 e 14,5-15 (e aí ficaram quase todos: os fracotes, os médios, os bons e até alguns muito bons). São raríssimas as negativas no exame; e devo dizer que esses poucos casos de negativas correspondem a alunos que temi que em exame pudessem ter nota até bastante mais fraca — em geral, ortografias problemáticas.
Houve, portanto, um afunilamento das notas: poucas notas más (menos do que eu acharia justo, para ser franco, como acabei de dizer), demasiadas notas de suficiente ou de bom pequeno.
Esta quase indiferenciação era já induzida pelo tipo de prova e, sobretudo, pelos critérios de correcção e pela aferição estabelecida nas equipas de correcção. Passo a explicar.
A prova pouco pedia que implicasse informação resultante de conhecimento anterior, o que permitia evitar que se criasse uma primeira seriação através da própria capacidade de responder em termos minimamente aceitáveis. Obrigou isto a que tudo se transferisse para a aplicação dos critérios de correcção. Dito de outro modo: como os itens eram relativamente acessíveis, haveria depois que remeter a decisão de pontuação para a opinião do corrector, apoiada nos habituais descritores por níveis de desempenho. Essas descrições eram campo aberto para a subjectividade. Exemplifico a seguir, um pouco caricaturalmente.
Níveis de desempenho definidos segundo o tipo «1: ‘com pertinência e rigor’; 2: ‘com alguma pertinência e com rigor’; 3: com alguma pertinência e com algum rigor’; etc.» são modos de esconder que tudo fica ao critério do corrector. É tão contingente a escolha entre descritores deste género como decidir que aquela resposta é muito boa, boa, suficiente, etc., sem mais (aliás acho até mais objectiva a segunda estratégia, porque, ao menos, não distrairia o corrector e aproveitaria uma bitola que este já tem interiorizada).
Perante descritores assim, a tendência do corrector é fugir às margens dessa escala que exibe os níveis de desempenho. Tenderá a não atribuir o primeiro escalão (ou até talvez o segundo) nem os últimos, preferindo concentrar as notas na descrição menos maximalista. (E, realmente, é difícil, perante uma resposta do grupo I ou a redacção III, não achar o corrector que o texto do aluno podia estar ainda melhor, mesmo se estiver quase perfeito.) Ora, na preferência mecânica pelo segundo ou terceiro nível de desempenho já o bom aluno vai perdendo pontos. (No grupo II, a indiferenciação era assumida no item 8, em cuja correcção se pontuavam identicamente dois e três erros, e um ou zero. Apesar de tudo, mais leal.)
Chego a um ponto melindroso, porque implica aludir à experiência havida na aferição a que procedem os correctores. Como corrector, também me coube integrar um desses grupos de dez colegas que, supervisionados por um outro professor já instruído pelo Gave, se tiveram de conformar a indicações de correcção com que nem sempre a maioria concordava. Pareceu-me que este ano as indicações do Gave eram especialmente exigentes no que se considerou ser a «propriedade lexical» (descontando pontuação, por exemplo, em casos de usos que muitos considerávamos serem metáforas inteligentes ou expressões reveladoras de sofisticação da escrita). É provável que esta falta de maleabilidade relativamente a abordagens não-literais e a tentativas criativas — assim disseminada por instrução oral aos correctores — tenha prejudicado sobretudo os melhores alunos.
Outro aspecto que venho criticando: as provas são dadas a cada corrector em blocos de cinquenta, onde está, em geral, uma única escola. Como se calcula, numa correcção de prova como esta, bastante aberta, os correctores acabam por se adaptar ao nível das provas que vão corrigindo e o seu grau de exigência é influenciado pela percepção que têm desse conjunto de provas que lhes calhou. Estão criadas condições para que um bom conjunto de provas seja visto por uma bitola menos condescendente do que o envelope que contenha cinquenta provas de uma escola fracota (inconfidência: não sabem os correctores a que escola pertencem as suas provas; mas conseguem aperceber-se do estilo de escola; e todos confessam que vão conformando o seu grau de exigência ao panorama que encontram).
A distribuição de séries de provas de números seguidos a cada corrector tem ainda outro efeito pernicioso: pode uma dada escola ficar dependente das idiossincrasias de apenas dois ou três correctores. E — confrontando resultados, bons e maus, de alunos que conheço bem — não fiquei nada convencido com a competência dos correctores que terão cabido à ESJGF.
Acrescento. Entretanto, estudei as pautas e também pude ver algumas provas de alunos que me vieram perguntar se valia a pena recorrer. Confirmei que são notáveis as diferenças de corrector.
As primeiras cinquenta provas (de Ademar a Catarina B.) tiveram notas de exame ora até melhores do que as notas internas ora ligeiramente mais fracas. Nessas cinquenta provas, as subidas relativamente à nota interna perfazem 473 pontos; as descidas, 466. Ou seja, a média da diferença entre exame e CIF é praticamente neutra (até há ligeiríssima subida relativamente à nota interna: + 0,14). Quem se chame Aníbal, Berengária ou Cacilda teve sorte, calhou-lhe o corrector, apesar de tudo, mais generoso.
Já das Catarinas aos Hélderes, os examinandos tiveram azar. Essas são as cinquenta provas vistas com mais ódio. Não há neste conjunto nenhuma subida relativamente à nota interna e as descidas são frequentes e fortíssimas. A diferença de pontuação é de -1510 (média neste conjunto: 30 pontos de descida relativamente à nota interna). À partida, um aluno deste grupo tinha menos três valores do que as Alices ou os Carlos Albertos.
O terceiro grupo (de Henrique a Júlia) também não teve grande sorte. Nestas cinquenta provas só há um caso de subida no exame relativamente à CIF (um valor vírgula nove) e os pontos de descida somam 1342 (subtraindo: 1323 negativos; média de 2,646 valores de descida).
Entre Karina e Paulo G., o corrector foi mais razoável. A pontuação «negativa» (entre CIF e nota de exame) é 939 (resultantes de +30; e -968). Em média, os alunos desta cinquentena baixam 1,876 valores.
O corrector seguinte (de Paulo R. a Tiago G.) foi de novo para o maldoso. +8, -1189 = 1181; média – 2,3 valores. Neste conjunto há uma única subida, a da excelente Sílvia (de 18 para 18,8), aliás a melhor nota da escola.
Sobra um conjunto pequeno de provas (Tiago J. a Xavier), que há-de ter sido incorporado a outras, de outra escola. De qualquer modo, o contraste entre os padrões da primeira cinquentena e da segunda é tal (sobretudo se virmos a lista dos cinquenta resultados de cada, em papel mesmo, o que aqui não posso fazer), que não há dúvida que os sobrescritos iniciais tinham cinquentas provas segundo a exacta ordem de pauta.
Não sou prendado em métodos quantitativos, mas parece óbvio que os dados são significativos, mostrando suficientemente a subjectividade da correcção destes exames. Faço notar que, como há sempre bastante afunilamento dos resultados (independentemente dos correctores), aquelas diferenças entre CIF e exame ampliam-se (potenciam-se) no caso dos bons e muito bons alunos. As tais diferenças médias de três valores num dado corrector significam que os alunos de dezanove, dezoito ou dezassete tiveram no exame talvez menos cinco ou quatro valores.