O USO DE VERBOS MODAIS DE ABSTRACTS EM DA ÁREA DE LINGUÍSTICA SARMENTO, S. SCORTEGAGNA, B. INTRODUÇÃO O estudo do uso dos verbos modais em textos acadêmicos mostra-se relevante, pois expressa a crença dos falantes e seus diferentes graus de convicção a respeito do estado das coisas, permitindo também que os falantes expressem seus julgamentos sobre as possibilidades (SARMENTO, 2008). O uso de tais estruturas tem demonstrado características peculiares em relação a textos acadêmicos como um todo. Neste estudo são investigados os verbos modais em abstracts em língua inglesa da área de linguística de forma a descrever textos com diferentes níveis de proficiência na língua. O trabalho propõe a continuidade de pesquisa previamente apresentada por Sarmento et al. (2011) que compilou um corpus de gêneros acadêmicos da área de Linguística e Literatura, nas línguas inglesa e portuguesa, de forma a possibilitar a análise linguística e propôs projetos e tarefas pedagógicas para serem utilizadas com os alunos do Instituto de Letras da Universidade Federal do Rio Grande do Sul. Após a conclusão desse estágio da pesquisa, será elaborada mais uma Unidade Didática que integrará o que já foi previamente feito. O objetivo geral deste projeto é gerar subsídios para que haja material (para uso imediato ou para servir como base) relacionado ao gênero abstracts e que o ensino desse seja mais direcionado e profundo. METODOLOGIA Para a realização desta pesquisa foram utilizados dois corpora: os abstracts em inglês da área de linguística do Corpus LILE (este corpus também possui abstracts da área da literatura e em língua portuguesa), que é composto por 1254 textos distribuídos em diferentes níveis proficiência (para mais detalhes ver Sarmento et al., 2011) e a parte acadêmica do COCA, corpus já amplamente difundido no meio acadêmico. A porção do Corpus LILE analisada é composta por 351 textos (abstracts) e 65.468 tokens. Os abstracts são provenientes de escritores com diferentes níveis de proficiência acadêmica assim distribuídos: 44 textos de trabalhos de conclusão de curso de graduação (da base de dados LUME-UFRGS); 71 de teses e dissertações (LUME-UFRGS); 120 de periódicos nacionais de linguística; e 116 de periódicos internacionais de linguística, ambos QUALIS A. A realização da análise é feita, primeiramente através de um contraste entre o grupo geral dos VMs no Corpus LILE e a seção acadêmica do COCA com o intuito de verificar se a presença dos VMs caracteriza o gênero Abstract. Para tal, os valores totais são normalizados e o teste estatístico Log Likelihood (LL) é aplicado para verificarmos a significância das diferenças. Será utilizado o ponto de corte de 6,6, como proposto por Rayson (2002). Em um segundo momento investiga-se a distribuição dos VMs entre os nove padrões sintáticos propostos por Kennedy (2002) nos quatro subcorpora do Corpus LILE (TCCs, Teses e Dissertações, etc): • • • • • • • • • 1) Modal Sozinho 2) Modal + infinitivo (modal + voz ativa) 3) Modal + be + passado particípio (modal + voz passiva) 4) Modal + be+ presente particípio (modal + progressivo) 5) Modal + have + passado particípio (ou adjetivo) (modal + perfeito) 6) Modal + be + being + passado particípio (ou adjetivo) (modal + be + progressivo + passado particípio/adjetivo) 7) Modal + have + been + passado particípio (modal + voz passiva + perfeito) 8) Modal + have + been + presente particípio (modal + voz passiva + progressivo) 9) Modal + have+ been + being + passado particípio (ou adjetivo) (modal + voz passiva + perfeito + progressivo) (KENNEDY, 2002, p. 82) OS VERBOS MODAIS NOS CORPORA E RESULTADOS PRELIMINARES A tabela a seguir mostra a distribuição dos verbos modais nos dois corpora analisados. O valor normalizado refere-se à ocorrência de cada modal por cada mil tokens. CAN COULD MAY MIGHT MUST SHALL SHOULD WILL WOULD TOT. LILE 127 27 65 19 13 0 33 58 28 370 Norm. 1,934560078 0,411284426 0,990129174 0,289422374 0,198025835 0 0,502680965 0,883499878 0,426517183 COCA (acadêmico) 194250 83632 132824 45095 57253 5382 77011 138413 146054 879914 TOKENS 65648 85791918 NORMALIZADO 5,71 10,25 Norm. 2,264199292 0,974823759 1,548211103 0,525632263 0,667347244 0,062733182 0,897648657 1,6133571 1,702421433 LL COCA x LILE -3,32 -27,38 -12,6 -8,34 -30,01 -8,23 -12,47 -24,77 -89,97 -157,62 LL - LOG LIKELIHOOD Como é possível perceber, a relação (log likelihood) entre o COCA e o LILE mostra-se estatisticamente significativa. Com exceção do verbo modal CAN, todos os outros estão acima do ponto de corte estabelecido de 6,6. A frequência dos modais normalizada é de 5,71 no LILE e 10,25 no COCA com um LL -157,62. Observando os verbos separadamente, todos são significativamente menos frequentes no LILE em comparação ao COCA, sendo would o verbo que apresenta maior diferença: 0,42 no LILE e 1,7 no COCA e um LL de -89,97. Dessa forma, verifica-se que os verbos modais não são frequentes nos abstracts da área de linguística quando comparado aos outros gêneros acadêmicos presentes no COCA, indicando uma especificidade quantitativa com relação à incidência dos verbos modais no LILE. A DISTRIBUIÇÃO DOS VERBOS MODAIS NO LILE Esta tabela mostra a distribuição dos verbos modais no corpus LILE. Na primeira coluna há uma numeração – de um até nove – que corresponde aos padrões sintáticos propostos por Kennedy (2002): Nota-se uma predominância do uso do modal Can, correspondendo a 34% (127 ocorrências) do total de ocorrências modais, seguido de May com 17% (65 ocorrências) e Will com 15% (58 ocorrências). O modal Shall não apresenta nenhuma ocorrência e Must apenas 3,5% (13 ocorrências). Dessa forma, deduz-se que há uma predominância do uso epistêmico em contraposição ao deôntico, como pode ser verificado no exemplo abaixo retirado do subcorpus de Revistas Internacionais: “These analytic demonstrations are used to argue that researchers in the field of applied linguistics might use this approach to examine interview interaction in order to develop[…]” Conforme a primeira e última coluna da tabela anterior observa-se que a distribuição dos modais nos nove padrões sintáticos concentra-se nos padrões 2 e 3: “Modal + infinitivo” e “modal + be + passado particípio”, respectivamente (exemplos a seguir do subcorpora de Revistas Internacionais): “We briefly review what conversation and discourse analysis can explain about these exchanges[…]”. “[…]and the article makes recommendations for ways in which attention can be drawn to the discoursal dimension in interviewing practice”. A DISTRIBUIÇÃO DOS VERBOS MODAIS NOS SUBCORPORA DO LILE A tabela a seguir mostra a distribuição dos verbos modais nos subcorpora analisados. O valor normalizado refere-se à ocorrência de cada modal por cada mil tokens. CAN COULD MAY MIGHT MUST SHALL SHOULD WILL WOULD TOT. TCC¹ 18 12 10 3 4 0 3 10 4 64 NORM 1,98 1,32 1,1 0,33 0,44 0 0,33 1,1 0,44 7,05 T&D² 45 8 18 3 2 0 6 17 11 110 NORM 2,13 0,37 0,85 0,14 0,09 0 0,28 0,8 0,52 5,22 RN³ 32 5 15 2 4 0 11 16 7 92 NORM 1,99 0,31 0,93 0,12 0,24 0 0,68 0,99 0,43 5,8 RI4 32 2 22 11 3 0 13 15 6 104 NORM 1,64 0,1 1,12 0,56 0,15 0 0,66 0,76 0,3 6,3 1) Trabalhos de Conclusão de Curso 2) Teses e Dissertações 3) Revistas Nacionais 4) Revistas Internacionais Como podemos perceber, parece haver um uso mais frequente de modais por alunos de graduação do que por outros escritores mais experientes, com um valor normalizado de 7,05. Entretanto, observa-se que a preferência pelo modal Can em todos os quatro subcorpora. Os modais Could e Might apresentam uma diferença significativa na comparação entre o subcorpus de TCC e o de Revistas Internacionais. CONCLUSÃO O uso dos verbos modais, de uma forma quantitativa, mostra-se bastante diferente ao compararmos um corpus composto somente de abstracts (LILE) com um corpus composto de diversos gêneros acadêmicos (COCA). Da mesma forma, os quatro subcorpora apresentam algumas diferenças entre si. Essas diferenças apontam para uma necessidade de desenvolvermos materiais didáticos de forma a habilitarmos estudantes de Letras a escreverem de uma forma mais semelhante aos padrões internacionais. REFERÊNCIAS KENNEDY, G. D. (2002). Variation in the distribution of modal verbs in the British National Corpus In: REPPEN, R.; FITZMAURICE, S. M., BIBER, D.; Using Corpora to Explore Linguistic Variation. Amsterdan: John Benjamins: 73-91. RAYSON, P. (2002). Matrix: A statistical method and software tool for linguistic analysis through corpus comparison. Tese de doutorado. Universidade de Lancaster. SARMENTO, S. (2008). O uso dos verbos modais em manuais de aviação em inglês: um estudo baseado em corpus. Tese (Doutorado em Letras) – Instituto de Letras, Universidade Federal do Rio Grande do Sul. Porto Alegre. SARMENTO, S.; SCORTEGAGNA, B. E GOULART, L. (2011). Corpus de Gêneros Acadêmicos de Linguística d Literatura: Compilação, Análise e Aplicações Didáticas. ELC 2011 – X Encontro de Linguística de Corpus, UFMG, Belo Horizonte..