CORPOS E CORES: COLORINDO A DESCRIÇÃO DA LÍNGUA PORTUGUESA Cláudia Freitas1 Diana Santos2 Rosário Silva3 RESUMO Na senda de nossos estudos anteriores, apresentamos aqui um quadro das diferenças de uso entre as cores nas variantes brasileira e portuguesa do português, com ênfase nos verbos. Após uma panorâmica dos recursos utilizados e da filosofia e prática de anotação subjacente, apresentamos as pesquisas sobre palavras de cor e seus argumentos, de uma forma didática e convidando os leitores a repetir as buscas ou a efetuarem outras no nosso material. No artigo apresentamos também o corte-e-costura, a ferramenta de apoio à anotação do projeto AC/DC, e o tipo de regras utilizadas. Focando a nossa atenção na classe gramatical dos verbos, concluímos que estes tendem a perder o seu significado originalmente colorido e a especializarem-se em sentidos muitas vezes metafóricos ou restritos a conotações ou mesmo expressões idiomáticas. É além disso nesse sentido, principalmente, que observamos diferentes usos nas duas variantes. PALAVRAS-CHAVE: Linguística com corpos, cores, português, variantes do português, verbos ABSTRACT Following up previous studies on the subject of colours in Portuguese and possible differences between the two variants, we consider in detail the verbs conveying colour in this paper. After presenting the resources and the underlying annotation philosophy and practice, we submit to the reader a set of searches on colour verbs and their arguments, showing how they can be replicated or modified for further study. We also briefly present corte-e-costura, the annotation tool in the AC/DC project and the corresponding rules. Our focus here being the verbs, we concluded that they tend to lose their originally visual import and specialize in metaphorical meanings, connotatively laden expressions, or even idioms, and that this trend is the main reason for differences among the two varieties investigated. KEYWORDS: Corpus linguistics, colours, Portuguese, Portuguese varieties, verbs 1. Introdução A questão das palavras de cor, além do seu interesse intrínseco, linguístico e filosófico (repare-se que além de ilustrarem a atribuição de propriedades (e não apenas ações ou objetos), são prototipicamente aplicadas a referentes concretos), tem uma particularidade que a torna especialmente interessante para estudos com corpos: são suficientemente comuns para serem estudadas quantitativamente. E além de comuns, ou talvez por isso, são encontradas em muitíssimas expressões mais ou menos convencionais, em que perdem o seu significado básico e exprimem outros valores bem afastados do campo visual, tal como atitude, conotações, assim como refletem (ou podem refletir) usos e artefatos antigos (passadeira vermelha/tapete vermelho, papel pardo, páginas amarelas). Com efeito, do ponto de vista de frequência, alguns adjetivos de cor são dos adjetivos mais frequentes, mas interessa saber até que ponto o são porque a cor é 1 Doutora, professora do Departamento de Letras da PUC-Rio e colaboradora da Linguateca. Email: [email protected] 2 Doutora, professora associada do departamento de línguas, literaturas, e culturas europeias da Faculdade de Letras da Universidade de Oslo, líder da Linguateca. [email protected] 3 Mestre, colaboradora da Linguateca. Email: [email protected] fundamental na língua portuguesa, ou o são porque tomaram muitos mais objetivos e sentidos além do prototípico (como é o caso de palavras como gente ou coisa, que se tornaram genéricos, ou pé ou mão que estão no caminho da gramaticalização em locuções como ao pé de (variante de Portugal) ou à mão). Por outro lado, é possível que o número distinto de expressões convencionais com uma dada palavra de cor ateste a idade dessa cor na língua, e/ou a produtividade do uso dessa forma, assim como é possível que ateste diferenças ou aumento de sentidos. Gill Philip (2011) ilustra de forma muito clara todo o espetro de questões semânticas na língua, desde colocação, expressões idiomáticas e metaforização até ao uso criativo da língua, usando a cor nos corpos. Como será referido na nossa resenha sobre trabalhos anteriores, na secção 1.1, a cor tem também já uma longa história de tratamento linguístico e estudo, mesmo baseado em corpos. Neste trabalho, damos continuidade à exploração das cores em corpos da língua portuguesa, ao mesmo tempo que, aproveitando as possibilidades de pesquisa em corpos das variantes do Brasil e de Portugal, contrastamos também o uso nas duas variantes. De maneira geral, este trabalho pode ser entendido como uma continuação de Santos et al. (2011), que, ao apresentar dados que sugerem um maior uso das cores na variante portuguesa, levanta questões sobre o uso das cores no Brasil e em Portugal. Partindo de uma investigação sobre a distribuição das categorias gramaticais nas duas variantes, comparamos, em um primeiro momento, a distribuição das cores por categoria gramatical. Além disso, tirando proveito de corpos ricamente anotados com informação linguística, exploramos a distribuição das cores por categoria sintática (e por variante). O objetivo do presente trabalho é duplo: por um lado, buscamos perceber como se relacionam cor e categoria gramatical nas variantes PT e PB; por outro, tentamos prover uma descrição detalhada do comportamento dos verbos de cor. 1.1 A cor nos estudos linguísticos O estudo das cores ocupa um papel importante no debate sobre universalismo e relativismo, interessando a diferentes áreas do conhecimento. Como possui aspectos biológicos e linguísticos, é natural que o campo das cores seja de especial relevância nos estudos da/sobre a linguagem (Deutscher, 2010). No entanto, como notam Santos et al. (2011), boa parte dos estudos sobre a cor, defendendo a universalidade da conceptualização da cor (Berlin & Kay, 1969; Rosch, 1975) ou, pelo contrário, refutando-a (Wierzbicka, 1990), tomam como base experiências com informantes. Como também aponta Lucy (1997), as pesquisas sobre as cores têm se concentrado na comparação entre as línguas, em um refinamento da tipologia e no reforço de argumentos de base biológica, enquanto relativamente pouco tem sido feito para melhorar a qualidade da descrição linguística. Saunders (2005), numa perspetiva filosófica, denuncia a base biológica implícita de Berlin & Kay (1969). Nesse contexto, trabalhos com base em corpos podem oferecer um bom complemento no que se refere ao comportamento das cores nas línguas. Com relação ao português, além da exploração que vimos desenvolvendo no âmbito do AC/DC (Santos et al., 2011), do CorTrad (Teixeira et al., 2012) e do COMPARA (Frankenberg-Garcia & Santos, 2002) relativa à cor (Inácio et al., 2008, Silva et al., 2008, Santos et al., 2008, Santos et al., 2011), referimos também Biderman et al. (2007), que parte igualmente de corpos para explorar e descrever as diferenças na expressão da cor no Brasil e em Portugal. Ainda para o português, remetemos o leitor para os trabalhos de Bacelar do Nascimento et al. (1996), Correia (2006) e Farias & Marcuschi (2006), que se debruçam sobre diferentes questões relacionadas com a cor, e Jorge et al. (2003) e Zavaglia (2006, 2007), que tratam o fenômeno de uma perspectiva contrastiva e/ou lexicográfica – veja-se também Philip (2003) para o contraste entre o inglês e o italiano. Finalmente, numa ótica diacrônica, Sletsjøe (1962) e Swearingen (1990) dissertam sobre, respetivamente, o conceito de verde aplicado a olhos e o da diferenciação dos termos vermelho e roxo em português. 2. Contexto Nossa exploração de corpos toma por base o projeto AC/DC (Acesso a Corpos / Disponibilização de Corpos), que disponibiliza corpos do português, nas variantes do Brasil e de Portugal, na Internet, e contém atualmente cerca de 374 milhões de palavras (Costa et al, 2009, Santos, no prelo). Todo o material foi anotado automaticamente pelo analisador sintático PALAVRAS (Bick, 2000), tendo algumas partes passado por revisão humana. Além da anotação do PALAVRAS, os corpos do AC/DC também vêm recebendo anotação relativa à informação semântica no campo das cores (Mota & Santos, 2009) como mencionado na secção anterior. A seção seguinte apresenta brevemente as opções linguísticas subjacentes à anotação das cores, bem como problematiza os casos mais difíceis. Para a documentação detalhada do trabalho de anotação linguística das cores, consulte-se o Arco-Íris (Silva e Santos, 2012). 2.1. A anotação semântica Como mencionado, todos os corpos do AC/DC possuem informação semântica relativa à cor, presente no atributo “sema”. Atualmente, são 7 as classes de cor (veja seção 2.2 sobre o processo de anotação): SEMA [sema="cor"] [sema="cor:humana"] [sema="cor:vinho"] [sema="cor:raça"] [sema="cor:política"] [sema="cor:equipa"] [sema="cor:original"] Explicação Exemplo Cor pura, representação de atributos visuais cores que correspondem a atributos naturais humanos Cores associadas aos tipos de vinho Cores usadas para representar raça Cores associadas a partidos ou ideias políticas por metonímia Cores associadas a equipas (geralmente de futebol) por metonímia Usos não convencionais; não representativos de atributos visuais (e que não se enquadram nos anteriores) sapatos vermelhos; nuvens cinzentas cabelos ruivos, ou louros; corar de vergonha vinho branco, tinto do Douro; espumante rosé os pele-vermelha; brancos, negros e pardos deputados verdes; socialismo vermelho torcida alvinegra; defesa encarnada período negro; concordata branca; vida cor de rosa Quadro 1: Classes de cores no AC/DC A classe original é atribuída quando estamos diante de usos não relacionados a propriedades visuais – quando o vínculo com a propriedade colorida se perdeu, total ou parcialmente. Naturalmente se pode argumentar que nos usos de [sema="cor:política"] e [sema="cor:equipa"] o vínculo com a cor também pode estar distante, mas o uso da cor nesses domínios é sistemático o suficiente para nos permitir agrupá-los sob um rótulo. No caso de [sema="cor:original"] (que admitimos talvez não ser o melhor nome, mas que provém do seguinte raciocínio “teve origem em cor”), agrupamos tanto (i) usos metafóricos de uma cor, separados ou englobados em expressões fixas (ficar no vermelho; dar branco); (ii) termos que originalmente contêm uma palavra de cor, mas que são considerados unidades, e que não se referem sobretudo a cor (buraco negro; elefante branco); (iii) termos que, sendo ainda possivelmente descritivos, são usados metaforicamente (sinal verde; levou um cartão vermelho ( ≠ encontrei um cartão vermelho na mesa com um poema (que é considerado [sema="cor"]). Além disso, (iv) usamos [sema="cor:original"] quando estamos diante de usos não previstos, que podemos apelidar de criativos, das palavras de cor, como ilustram os trechos (1-4) a seguir: (1) Se definem como socialistas (ou «socialismo moreno», como diz Brizola) , mas tem forte apelo populista . (2) Ainda que tingido do ` socialismo moreno» do autor de "O Povo Brasileiro" , o livro ... (3) Impressionado com o bronzeado dos colegas, o baiano Jaques Wagner (PT-BA) , desbotado pelas viagens à Alemanha, Coréia do Sul e Inglaterra, disse: ` O socialismo moreno do Brizola não deu certo, mas pelo visto o neoliberalismo mulatinho do Fernando Henrique vai bem» . (4) Sem a ajuda soviética e vítima do bloqueio americano, o sonho do socialismo moreno, que tanto encantou a esquerda brasileira, parecia estar fadado a um final infeliz. Se moreno nos exemplos (1-4) é cor tanto quanto o seriam "socialismo vermelho" ou "socialismo verde", por exemplo, então poderíamos atribuir-lhe a etiqueta [sema="cor:política"]. No entanto, não temos a cor morena sistematicamente associada a nenhum campo da política em português, e portanto anotamos como [sema="cor:original"], o mesmo se aplicando a "mulatinho" na frase (3). (E notamos que a etiqueta [sema="cor:humana"] jamais seria atribuída nesses casos.) Além das classes semânticas, as cores (quando sema=”cor”) também são classificadas quanto ao grupo: Grupos de cor: BRANCO, PRETO, AZUL, AMARELO, VERMELHO, LARANJA, VERDE, ROXO, CASTANHO, CREME, CINZENTO, ROSA, PRATEADO, DOURADO e também OUTRAS.*, MÚLTIPLA.*, AUSÊNCIA, NÃOESPECIFICADA e DESCONHECIDA. O grupo Outras engloba expressões cuja cor pareceu impossível identificar ou definir, tais como cor de apoplexia; cor de crime e traição; cor de ferro velho, cor de morte etc. Além disso, usamos também o grupo Outras quando não é possível decidir sobre (e portanto anotar) a inclusão de uma cor em um determinado grupo. Pardo, por exemplo, é castanho/marrom ou cinzento? E cor de telha? É importante esclarecer que a relação entre os grupos e as classes de cor não é de complementação, e não há dupla categorização. A classificação de grupo de cor só existe se a ocorrência de cor for do tipo [sema= "cor"], isto é, se estivermos diante de usos descritivos, coloridos. Dessa forma, em sorriso amarelo, o amarelo não pertence ao grupo Amarelo, visto ser [sema="cor:original"], e o mesmo para vinho verde, classificado como [sema="cor:vinho"]. Estamos conscientes, no entanto, de que algumas das classes também são descritivas, como [sema="cor:humana"] (em olhos verdes, não há como negar a propriedade colorida de “verde”), e uma possibilidade para o futuro é adicionar grupos de cores específicas para a classe humana, por exemplo. As motivações para a existência do grupo atual de cores (com 19 elementos) são, sobretudo, empíricas. Tomamos como critério o uso variado e frequente de um termo para uma cor/grupo de cor, pois isto significa que, de alguma maneira, esse grupo/cor é relevante na língua. No grupo Creme, por exemplo, são 18 as instâncias de cores, como bege; bege-areia; creme; marfim; perolado; pérola etc., o que o torna merecedor de um grupo próprio. Além disso, a busca por um “grupo” é mais prática que uma busca por lema (vide os 18 lemas de Creme). Vale lembrar, no entanto, que o grupo não foi fixo a priori, e que a exploração das cores nos corpos pode levar à criação de novas categorias/grupos de cores. 2.2 A ferramenta de anotação (corte-e-costura) O corte-e-costura (Mota & Santos, 2011, Santos & Mota, 2012) é uma ferramenta desenhada para ajudar a anotação dos corpos, a partir do desenvolvimento de regras sucessivamente mais específicas, para obter cobertura total, pondo o anotador no ciclo: ou seja, desenvolvendo um conjunto inicial de regras, aplicando-as, revendo o resultado, e continuando num processo iterativo até considerar toda a anotação correta, e abrangendo todos os casos. É baseado num léxico, quer de palavras simples quer de expressões com várias palavras, e na aplicação de cinco tipos de regras, que em seguida exemplificamos para a cor: 1) regras positivas adicionando casos de cor que não estão no léxico, 2) regras negativas removendo casos que não deviam ser considerados cor; 3) regras de especialização que transformam casos de cor noutros mais específicos; 4) regras que retiram a marcação de casos específicos; e 5) regras recursivas (cuja aplicação só pára se não puderem continuar a ser aplicadas). Além disso, para cada tipo de regras existe a distinção entre regras gerais e regras específicas associadas a cada corpo, que fica ao critério do anotador, conhecendo o conjunto dos corpos do AC/DC, decidir. Abaixo temos um exemplo de uma regra de cada tipo: 1) a palavra celeste é considerada cor se antecedida pelas palavras bicicleta, divã ou vestimenta; 2) a palavra louro não é palavra de cor quando na expressão louros da vitória; 3) a palavra branco refere-se a vinho se estiver seguida por , tinto, e passa pois de simples cor a cor:vinho; 4) a palavra tricolor que tinha sido atribuída à classe equipa volta a ser apenas “cor” (no caso específico de um dado corpo); e 5) se as palavras aço, banana, borgonha e café no singular estiverem seguidas da conjunção e e de uma palavra de cor, são consideradas cor. a:[lema="bicicleta|divã|vestimenta"] b:[lema="celeste"] >> b:[sema="cor"] a:[word="louros"] b:[word="da|do"] c:[word="triunfo|vitoria"] >> a:[sema="0"] a:[lema="branco"] b:[word=","] c:[lema="tinto"] >> a:[sema="cor:vinho"] [sema="cor:equipa" & lema="tricolor"] >> [sema="cor"] a:[lema="aço|banana|borgonha|café" & pessnum="S"] b:[lema=",|e|ou"] c:[sema="cor"] >> a:[sema="cor"] 4. Exploração das cores nos corpos No presente trabalho, tomamos por base principalmente os corpos CONDIVport (Silva, 2008) e CHAVE (Rocha & Santos, 2007). O CONDIVport, criado com o objetivo de permitir o estudo da convergência e divergência do português entre as variantes do Brasil e de Portugal, contém cerca de 5 milhões de palavras distribuídas em jornais desportivos e revistas de saúde e de moda – áreas que tendem a empregar cores de maneira recorrente. Além disso, é importante mencionar que toda a anotação das cores no CONDIV passou por revisão humana. O CHAVE contém cerca de 99 milhões de palavras distribuídas em textos jornalísticos da Folha de São Paulo (Brasil) e do jornal Público (Portugal). Por ser um corpo maior, e de conteúdo mais geral, oferece dados complementares aos obtidos no CONDIVport, mas ainda não foi objeto de revisão humana. 4.1 Categorias gramaticais A tabela 1 apresenta a distribuição das cores – sem distinção de tipo – por categoria gramatical nos corpos CHAVE e CONDIV. Como é possível observar, no CHAVE, não há qualquer diferença na distribuição das cores por categoria gramatical entre as variantes BR e PT, com uma ocorrência maior de adjetivos coloridos se comparados com os verbos. No CONDIV, os dados relacionados aos verbos coloridos também são idênticos entre as variantes, e por sua vez são menos frequentes que os verbos no CHAVE. Com relação aos adjetivos de cor, a situação no CONDIV é um pouco diferente, havendo mais adjetivos coloridos na variante PT do que na variante BR. Tal fato, no entanto, conforme explicado em Santos et al., (2011), pouco tem a ver com a distribuição de adjetivos, ou com o uso das cores, mas antes se deve à composição do corpo CONDIV: a porção BR do corpo contém muitos moldes de cor – e menos texto, em um sentido estrito – o que explica a diferença nos números. CHAVE CONDIV ADJ cor Verbos cor ADJ cor Verbos cor BR 0,6% 0,2% 2,2% 0,06% PT 0,6% 0,2% 3,4% 0,06% Tabela 1: Distribuição das cores por categoria gramatical e variante 4.2 Exploração dos verbos coloridos Com relação aos verbos coloridos, nosso principal interesse nesse trabalho, constatamos que a imensa maioria está na forma de particípio, o que não surpreende, dado que o particípio frequentemente assume o papel de modificador. No entanto, como as formas participiais ainda não foram totalmente revistas no CHAVE (Douro (rio e região), e dourado (peixe), por exemplo, ainda estão como particípios passados do verbo dourar) optamos por não considerá-las neste trabalho. A tabela 2 contém todos os verbos coloridos, excluindo o particípio, contidos no AC/DC4, em ambas as variantes. Os lemas marcados com ** ocorrem no CHAVE e no CONDIV, e portanto serão considerados no presente estudo. Também na tabela 2 indicamos a distribuição dos lemas por variante, independente de corpo, e notamos que, em termos gerais, há um uso mais frequente de verbos de cor na variante de Portugal. Embora não esteja na tabela, mas seja de fácil aferição na página do AC/DC, percebemos que os verbos presentes apenas na variante PT vêm, em grande À data do presente trabalho. Como a anotação e sua revisão ainda estão em progresso, poderemos ainda encontrar mais casos no futuro, assim como modificar os dados quantitativos. 4 parte, do corpo Vercial, que contém obras literárias de autores portugueses, cujas datas de publicação variam desde 1500 a 19335. Grupo de cor Lema e distribuição dos verbos por corpo e variante BR 4 PT 4 BR 2 PT 10 TOTAL por variante (de todos os corpos) PT BR 50 14 1 7 2 6 1 14 --1 --- --1 1 17 14 67 2 16 3 1 2 1 13 ----- --4 2 120 --6 --1 --- 8 1 1 --1 --- 1 ----- 25 69 86 3 6 2 4 6 ---- --- 22 5 --51 2 50 --4 --3 --857 2 64 4 7 99 2 5 2 9 5 431 46 12 24 --- --- --- CHAVE Grupo Vermelho Grupo Laranja Grupo Amarelo Grupo Roxo Grupo Preto Grupo Verde Grupo Cinzento Grupo Rosa Grupo Dourado Grupo Branco Grupos Castanho, Creme, Prateado Azul avermelhar**; vermelhejar; vermelhar, purpurar, revermelhar, purpurejar, enrubescer alaranjar** amarelar**, amarelecer**, amarelejar arroxear**, roxear enegrecer**, negrejar esverdear**; reverdecer**; verdejar**, esverdear; esverdinhar; verdecer acinzentar** rosar**, rosear dourar**/doirar**, sobredourar, sobredourar; sobredoirar branquear**; embranquecer**; branquejar; esbranquiçar; alvidecer sem verbos nas --formas finitas no CHAVE e CONDIV; e pratear; azular; acastanhar, amarronzar CONDIV Tabela 2: Distribuição dos verbos coloridos nos corpos CHAVE e CONDIV, sem particípio 6. O corpo Vercial contém obras digitalizadas pelo projeto Vercial, http://alfarrabio.di.uminho.pt/vercial/, e de fato podemos considerar que, exceto nos séculos XIX e XX, não faz sentido distinguir os autores “portugueses” dos “brasileiros”. Um estudo mais fino deverá ser feito, reduzindo os escritores portugueses ao período moderno, e não entrando em conta com os outros, ou considerando alguns autores antigos como pertencendo às duas ou mesmo à variante brasileira, como poderia ser o caso do Padre António Vieira ou do Judeu. 6 Para realizar a busca por lema no AC/DC, após a escolha do corpo desejado para a pesquisa, a expressão de busca é (o exemplo refere-se à busca pelos verbos em forma finita pertencentes ao grupo Vermelho): [sema="cor.*" & grupo="Vermelho" & temcagr!="PCP" & pos="V.*"]. Para a distribuição por corpo, uma vez selecionado o corpo TODOS, a expressão de busca é (o exemplo refere-se à busca da distribuição, pelos corpos, do lema “branquear”, na variante PT): 5 Uma conclusão possível, e que pode ser explorada futuramente com a análise detalhada dos verbos de cores no Vercial, é a perda gradual da propriedade descritiva dos verbos de cores – como se fossem tomando a forma de adjetivos/particípios e convencionalizando-a em direções mais concretas. 4.3 Os usos das cores Nesta seção relatamos os dados obtidos na exploração dos usos dos verbos de cor. Especificamente, buscamos os argumentos associados aos verbos coloridos, nas posições de sujeito e de objeto. Com relação ao grupo Dourado, o primeiro dado a chamar a atenção é que quase metade das ocorrências de dourar/doirar, em ambas as variantes, não é colorida, mas se refere à expressão “dourar/doirar a pílula”, em um uso claramente original. A tabela 3 apresenta detalhadamente os usos de dourar/doirar. Como se pode perceber, são (quase) todos não descritivos: doura-se a imagem, a perspectiva, o perdão, o brasão. A única ocorrência que talvez possa ser considerada descritiva, isto é, colorida, diz respeito a “dourar a sala”, em “.. o sol doira a sala...”. No entanto, consideramos esse (mais) um exemplo de difícil decisão, que pode ser visto tanto do ponto de vista da cor (o sol deixar a sala da cor dourada) como um uso não colorido, (o sol ilumina a sala). Não há como ter certeza da leitura, e consideramos, portanto, a vagueza uma propriedade inerente e importante da linguagem, que não deve ser eliminada ou vista como imperfeição. Como a língua não nos obriga a escolher uma única interpretação, não o faremos. Especificamente com relação à anotação, estamos diante de um exemplo em que o verbo recebe as duas informações semânticas, simultaneamente: será considerado tanto [sema="cor"] (para a interpretação colorida), quanto [sema="cor:original"] (para a interpretação não colorida). Na variante BR, a situação é idêntica, em que se doura, além da pílula, a imagem, a ignorância e a personalidade, entre outros. Assim como na variante PT, o sol doura coisas como paisagem, cidade e gente. E, diferente da variante PT, no Brasil também se doura alho, bacon, cebola, etc, isto é, temos o uso associado ao domínio culinário, e, portanto, um uso original – o que não acontece na variante PT, em que o verbo associado a tais ações é alourar7. Com relação aos sujeitos de dourar, são pouco frequentes, dada a alta ocorrência da forma infinitiva “dourar a pílula”. Ainda assim, na parte portuguesa do CHAVE apenas nomes próprios (de pessoas e instituições) exercem a função de sujeito, o que reforça a ideia de um uso original. Na variante BR, além de nome próprio, são mestres, estatutos, virtudes, retórica e jornal aqueles que douram, mais uma vez em um uso original. Ainda na variante BR, discos de massa, carne e grill douram, repetindo-se o uso original vinculado à culinária, e encontramos apenas uma ocorrência de um uso possivelmente colorido, em que a ação de dourar é feita pelo sol, como já mencionado8. [sema="cor.*" & lema="branquear" & temcagr!="PCP" & pos="V.*" & variante="PT"], e nos resultados deve-se pedir “Distribuição de corpo”. 7 Por outro lado, não podemos desconsiderar o fato de haver muito mais notícias sobre comida/culinária no jornal Folha de S. Paulo que no Público – o que não invalida nossa explicação. São apenas 6 os casos de “alourar” na parte PT do CHAVE, e 1 na parte BR (ou 2, se considerarmos também “aloirar”). 8 Para realizar a busca por lema dos sujeitos de dourar ou doirar no AC/DC, após a escolha do corpo desejado para a pesquisa, a expressão de busca é (o exemplo refere-se à busca apenas na Lema dos objetos de dourar|doirar Distribuição por variante e corpo BR* PT** Campo semântico CHAVE CONDIV CHAVE CONDIV pílula* ** imagem* ** ; perspectiva**; brasão**; asa**; sala **; chamado**; perdão**; ignorância*; fisiologia*; imagem*; década*; personalidade*; jogada*; triunfo* alho*; bacon*; assado*; cebola*; manteiga*; frango* paisagem*; cidade*; luz*; gente* 12 5 2 9 9 1 -- original original 7 -- --- -- 3 2 --- -- original (culinária) original|colori do TOTAL 27 4 18 1 Tabela 3: Objetos de dourar/doirar nos corpos CHAVE e CONDIV9 A análise dos verbos branquear e embranquecer, pertencentes ao grupo Branco, também revela fatos curiosos. Se voltarmos à tabela 2, vemos que, no CHAVE, tomando-se o lema branquear, é enorme a diferença entre a variante BR (4) e a variante PT (99). Quando exploramos essa forma verbal, percebemos que, das 99 ocorrências, 68 referem-se a um uso original da cor, em que o principal objeto de branquear é dinheiro, e os demais lemas são variados (tabela 4). O segundo uso mais comum de branquear, e que também comparece de maneira mais frequente na variante PT, diz respeito ao campo da cor humana. Branqueiam-se dente, perna, pele mão. Ainda na tabela 4, vemos que, na variante BR, não há uso original de branquear: o uso colorido é o mais comum, mas ainda assim são poucas as ocorrências no corpos (apenas 3). Com relação ao uso associado ao ser humano, a variante BR conta com apenas uma ocorrência (branquear o pescoço). Não encontramos nem uma ocorrência de branquear usado de maneira original. Com relação à expressão branquear dinheiro, muito frequente em PT, o seu equivalente em BR é lavar dinheiro (22 ocorrências no CHAVE), ou, mais especificamente, a expressão lavagem de dinheiro (96 ocorrências no CHAVE). Lema dos objetos de branquear Distribuição por variante e corpo BR* PT** Campo semântico CHAVE CONDIV CHAVE CONDIV dinheiro** imagem**; PIDE**; comportamento**; situação**; fascismo**; derrota**; tortura** etc. ----- ---- 14 68 1 -- original original roupa* **; rolha*; celulose*; marfim** dente**; pescoço*; perna**, pele**, mão** 3 --- --1 1 1 1 6 colorido cor:humana TOTAL 3 1 84 8 Tabela 4: Objetos de branquear nos corpos CHAVE e CONDIV10 variante BR) [func="SUBJ>.*"] [pos!="V.*"]* [pos="V.*" & lema="do[ui]rar" & sema="cor.*" & temcagr!="PCP" & variante="BR"] within s 9 Para realizar a busca por lema dos objetos de dourar|doirar no AC/DC, após a escolha do corpo desejado para a pesquisa, a expressão de busca é (o exemplo refere-se à busca apenas na variante PT) [sema="cor.*" & grupo="Dourado" & temcagr!="PCP" & pos="V.*" & variante="PT"] [pos!="V.*"]* @[func="<ACC"] within s Já a exploração de embranquecer aponta para um quadro diferente. Voltando à tabela 2, não apenas a frequência de uso é menor do que em branquear, como também os dados são mais equilibrados entre as variantes. A análise qualitativa de embranquecer revela um uso associado à cor humana, independente da variante, como pode ser observado na tabela 5. Lema dos objetos de embranquecer Distribuição por variante e corpo BR* PT** CHAVE CONDIV CHAVE CONDIV tudo e todos 1 --- --- --- Pele* **; mão**; cabelo* ** 2 3 ----- 1 1 2 2 TOTAL Campo semântico cor:raça|origin al cor:humana Tabela 5: Objetos de embranquecer nos corpos CHAVE e CONDIV A exceção é para uma ocorrência de embranquecer, na variante BR, que pode ser associada a um uso original ou, simultaneamente, ao uso associado à utilização da cor como raça, como pode ser percebido na frase: FSP951120-009: É que foram antes massacrados por uma mídia que busca embranquecer tudo e todos. Por fim, se desconsideramos, na busca, a presença de objeto, e analisamos formas intransitivas de embranquecer, aparecem mais duas ocorrências, ambas na variante BR, nenhuma colorida, e ambas associadas ao campo semântico da raça: FSP950319-128: Ao adotar como visão de si mesmo a ideologia de seus dominadores, o mestiço opta pelo recalque e pela traição de tudo que nele não for espelho da Europa: o filho de índia e europeu, identificando-se com o pai, tornou-se perseguidor do gentio materno; o mulato, buscando ascender socialmente, trata desesperadamente de embranquecer, reforçando e legitimando o preconceito com o negro. FSP950623-092: Suassuna acredita que os espetáculos, se bem produzidos, seriam capazes de atrair ` 300 vezes mais gente do que o Michael Jackson» (que ele define como ` traidor da raça negra», por sua suposta vontade de ` embranquecer») . Com relação ao grupo Preto, nossa análise considerou apenas o verbo enegrecer. Pela tabela 2, constatamos que enegrecer é muito mais frequente na variante PT (e com um uso muitíssimo mais alto no corpo Vercial (63), que não exploramos aqui), e é usado principalmente de maneira original. A tabela 6 oferece uma visão qualitativa de enegrecer, em ambas as variantes. Lema dos objetos de enegrecer costa**, céu**, prata** Abril**; coração**; imagem**; verso**; cenário* **; desporto** dente** TOTAL Distribuição por variante e corpo BR* PT** Campo semântico CHAVE CONDIV CHAVE CONDIV --1 ----- 2 6 1 1 cor cor:original --1 ----- 1 9 --2 cor:humana Tabela 6: Objetos de enegrecer nos corpos CHAVE e CONDIV Expressão de busca utilizada, considerando a variante PT: [sema="cor.*" & lema="branquear" & temcagr!="PCP" & pos="V.*" & variante="PT"] [pos!="V.*"]* @[func="<ACC"] within s Distribuição de lema 10 Quando buscamos pelos responsáveis pelo enegrecimento, encontramos, nos usos coloridos, petróleo (enegrece a costa), fumo (enegrece o céu) e enxofre (enegrece a prata) e, nos usos originais, ódio (enegrece o coração), ou incertezas (enegrecem o cenário), sendo apenas o último exemplo relativo à variante BR. Se eliminamos a restrição referente à presença de objeto, temos mais uma ocorrência de enegrecer, na variante BR do CHAVE, vaga entre [sema="cor:raça"] ou [sema="cor:humana"]: FSP951016-045: No começo do século, sociólogos acreditavam fortemente nas variáveis raciais e, otimistas, diziam que o Brasil não tinha um problema com os negros, pois iríamos branqueando gradativamente com os casamentos inter-raciais, enquanto os americanos se preocupavam, pois acreditavam que iriam enegrecendo por meio dos mesmos cruzamentos entre negros e brancos. Os verbos do grupo Amarelo – amarelar e amarelecer – também apresentam comportamentos distintos conforme a variante. Com relação a amarelar, em termos quantitativos, quase não há diferença entre as variantes PT e BR (tabela 2). No entanto, a análise qualitativa a partir dos corpos (tabela7) revela que, considerando apenas o corpo CHAVE-BR encontramos (poucas) ocorrências transitivas11 de amarelar, que é usado sobretudo relacionado a atributos humanos, mas encontramos também um uso original (o remorso amarelando os olhos) e um uso colorido. Lema dos objetos de amarelar Pratos* Pessoas*; unhas* olhos* TOTAL Distribuição por variante e corpo BR* PT** CHAVE CONDIV CHAVE CONDIV 1 2 1 4 ----- ----- ----- --- --- --- Campo semântico cor cor:humana cor: original Tabela 7: Objetos de amarelar nos corpos CHAVE e CONDIV No entanto, se consideramos os usos intransitivos ou transitivos indiretos de amarelar, o quadro se altera ligeiramente. Encontramos mais três ocorrências (duas no CHAVE BR, uma no CONDIV PT), todas em um uso claramente original, mas com diferenças de sentido conforme a variante. Na variante BR, amarelar equivale a ter medo de; se acovardar (sentido inexistente na variante PT). Na variante PT (cf. o terceiro exemplo), amarelar equivale a distribuir cartões amarelos. FSP951030-086: Folha -- Você já «amarelou» para ondas grandes em alguma competição? (CHAVE-BR) par=fut48437: Mas não é menos que, depois que descobriram que a capital boliviana era nos Andes, os jogadores brasileiros literalmente amarelaram .(CONDIV- BR) par=fut18426: O jogo foi muito árduo e houve necessidade de «amarelar». (CONDIV- PT) Com relação a amarelecer, a tabela 2 já indica o uso mais frequente na variante PT, com apenas 3 ocorrências na variante BR. A tabela 8 contém a descrição qualitativa do comportamento de amarelecer. [sema="cor.*" & lema="amarelar" & temcagr!="PCP" & pos="V.*" & variante="PT"] [pos!="V.*"]* @[func="<ACC"] within s 11 Lema dos objetos de amarelecer espetáculo*; mármore** pele* TOTAL Distribuição por variante e corpo BR* PT** CHAVE CONDIV CHAVE CONDIV 1 1 2 ------- 2 -- ---- Campo semântico cor cor:humana Tabela 8: Objetos de amarelecer nos corpos CHAVE e CONDIV No entanto, como amarelecer é usado principalmente de maneira intransitiva, apresentamos os sujeitos de amarelecer, na variante PT: página, tinta, relva, colectâneas, relvado [sema="cor"]; fruta, sorriso [sema="cor:original"]. Notamos ainda uma ocorrência de amarelecer de inveja, referente a [sema="cor:original"]. Por fim, detalhamos os usos dos verbos do grupo Verde – esverdear, reverdecer e verdejar. A tabela 2 mostra que, para os três lemas, há muito mais ocorrências na variante PT. No entanto, se restringimos a análise aos corpos CHAVE e BR, as diferenças somem, com no máximo duas ocorrências por variante. A única diferença está no lema esverdear, na variante PT do CHAVE, com 8 ocorrências, que detalhamos a seguir. Todas as ocorrências de esverdear são originais, como vemos na tabela 9: Lema dos objetos de esverdear indústria**; pílula**; sistema**; projetos**; atividade econômica** Distribuição por variante e corpo BR* PT** CHAVE CONDIV CHAVE CONDIV --- --- 7 1 Campo semântico Cor:original Tabela 9: Objetos de esverdear nos corpos CHAVE e CONDIV Com relação aos demais verbos de cor – rosar, acinzentar, arroxear; avermelhar; alaranjar – a baixa frequência de ocorrência nos corpos CHAVE e CONDIV e o limite de páginas nos obrigam a postergar a descrição para outra ocasião. Lembramos, no entanto, que todo o material encontra-se publicamente disponível na página do projeto AC/DC para aqueles que se interessarem pelo campo das cores. Considerações finais Neste trabalho, exploramos dois corpos jornalísticos, com textos das variantes de Portugal e do Brasil, quanto a classes gramaticais que se referem às cores, com especial atenção aos verbos. De maneira sumarizada, os resultados encontrados indicam que: - A distribuição das categorias gramaticais é a mesma entre as variantes portuguesa e brasileira; - A distribuição dos verbos de cor e dos adjetivos de cor também é a mesma entre as variantes portuguesa e brasileira; - Como esperado, verbos se prestam pouco a representar o processo de “colorização” das coisas. Assim, não é surpresa que a grande maioria dos verbos de cores esteja no particípio. E, quando desconsideramos essa forma, independente de variante ou gênero, certos grupos de cores, como Castanho e Creme desaparecem. Por outro lado, grupos, como Verde, Branco, Preto, Amarelo e Dourado, são mais produtivos na formação de verbos, dando origem a dois ou mais lemas distintos. Especificamente quanto às formas verbais que se referem às cores, acreditamos ter descoberto pontos que merecem análise mais detalhada. De uma perspectiva do uso, é interessante perceber o que fazem os verbos de cor. Branquear e embranquecer, por exemplo, têm comportamentos diferentes não apenas quanto à frequência. Branquear, mais comum, é usado principalmente na variante de Portugal, e de maneira metafórica: muito mais que os dentes, branqueiam-se dinheiro e imagem. Embranquecer tem um uso mais literal – embranquecemos os cabelos, a pele. No entanto, o que mais nos chama a atenção é a frequência dos usos originais associados aos verbos de cor – excluída a forma participial –, o que parece sugerir uma perda gradativa da propriedade descritiva desses verbos. A alta ocorrência, em muitos casos, dos verbos de cor apenas no corpo VERCIAL, composto por textos literários antigos, reforça essa hipótese. Alguns pontos permanecem para análise futura: nossa busca excluiu locuções verbais. Usamos mais “ficar vermelho” do que “avermelhar”? E o que nos diria a análise das cores no particípio? Por fim, reforçamos a ideia de que para comparar termos de cor entre duas ou mais línguas é importante uma caracterização detalhada das cores em cada uma das línguas contrastadas. Em nosso estudo, buscamos conjugar as dimensões de uso e de forma, oferecendo um quadro das cores em português, considerando também distinções entre as variantes do Brasil e de Portugal. Agradecimentos O presente trabalho foi desenvolvido no âmbito da Linguateca, financiada pelo governo português, UMIC, FCCN e União Europeia (FEDER e FSE), por meio de POSC/339/1.3/C/NAC, e pela FCT. REFERÊNCIAS BIBLIOGRÁFICAS BACELAR DO NASCIMENTO, Maria Fernanda & Anabela Carvalho. "Preto e branco ou branco e preto? (Como se combinam os nomes de cores)". In Actas do XI Encontro Nacional da Associação Portuguesa de Linguística (Lisboa, 2-4 de Outubro de 1995), 1996, Lisboa: APL/Colibri, pp. 367-380. BERLIN, Brent & Paul Kay. Basic Colour Terms: their Universality and Evolution. Stanford: CSLI, 1991 [1.a edição: 1969] BIDERMAN, Maria Tereza Camargo, Maria Fernanda Bacelar do Nascimento & Luisa Alice Santos Pereira. “Uso das cores no português brasileiro e no português europeu.” In: Aparecida Negri Isquierdo & Ieda Maria Alves (eds.), As ciências do léxico: Lexicologia, lexicografia, terminologia, vol. III, Editora UFMS, Associação editorial Humanitas, 2007, 105-124. CORREIA, Margarita."Towards a General Description of the Semantic Field of 'Colour' in European Portuguese". In C.P. Biggam & Christian J. Kay (eds.), Progress in Colour Studies, 1: Language and Culture. Amsterdam/Filadélfia: John Benjamins, 2006, pp. 111-25. COSTA, Luís, Diana Santos & Paulo Alexandre Rocha. "Estudando o português tal como é usado: o serviço AC/DC". In The 7th Brazilian Symposium in Information and Human Language Technology (STIL 2009), 2009, São Carlos, Brasil. DEUTSCHER, Guy. Through the language glass: Why the World Looks Different in Other Languages. Metropolitan: Henry Holt, 2010. FARIAS, Emília Maria Peixoto & Luís Antônio Marcuschi. "A metáfora das cores na linguagem e no pensamento". In Abuêndia Padilha Pinto (org.), Tópicos em cognição e linguagem. 1ed. Recife: Ed. Universitária da UFPE, 2006, v. 1, p. 19-55. FRANKENBERG-GARCIA, Ana & Diana Santos. "COMPARA, um corpus paralelo de português e de inglês na Web". Cadernos de Tradução IX.1, 2002, pp. 61-79. Universidade de Santa Catarina. ISSN: 1676-7047. INÁCIO, Susana, Diana Santos & Rosário Silva. "COMPARAndo cores em português e inglês". In Sónia Frota & Ana Lúcia Santos (orgs.), Artigos selecionados do XXIII Encontro da Associação Portuguesa de Linguística, APL, 2008, pp. 271-86. JORGE, Guilhermina (coord.) et al. "As cores preto no branco: uma análise comparativa", Polifonia 6, Revista do Grupo Universitário de Investigação em Línguas Vivas da Universidade de Lisboa, Edições Colibri, Lisboa, 2003, pp. 119133. LUCY, John A. "Linguistic relativity". Annual Review of Anthropology 26. Palo Alto, CA: Annual Reviews Inc, 1997, pp 291-312. MOTA, Cristina & Diana Santos. "Corte e costura no AC/DC: auxiliando a melhoria da anotação nos corpos". Setembro de 2009. http://www.linguateca.pt/acesso/corte-ecostura.pdf PHILIP, Gillian Susan. "Collocation and connotation: A Corpus-Based Investigation Of Colour Words In English And Italian", PhD thesis, University of Birmingham, Março de 2003. PHILIP, Gill. Colouring Meaning: Collocation and connotation in figurative language. John Benjamins Publishing Company, 2011. ROCHA, Paulo & Diana Santos. "CLEF: Abrindo a porta à participação internacional em avaliação de RI do português". In Diana Santos (ed.), Avaliação conjunta: um novo paradigma no processamento computacional da língua portuguesa. Lisboa, Portugal : IST Press, 2007, pp. 143-158. ROSCH, Eleanor. "Universals and cultural specifics in human categorization". In Brislin, Richard, Stephen Bochner & Walter Lonner (eds.), Cross-cultural perspectives on learning. Wiley, 1975, pp. 177-206. SANTOS, Diana. "Corpora at Linguateca: vision and roads taken". In Tony Berber Sardinha & Telma São Bento Ferreira (eds.), Working with Portuguese corpora. No prelo. SANTOS, Diana & Cristina Mota. "Experiments in human-computer cooperation for the semantic annotation of Portuguese corpora". In Nicoletta Calzolari, Khalid Choukri, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis, Mike Rosner & Daniel Tapias (eds.), Proceedings of the International Conference on Language Resources and Evaluation (LREC 2010) (Valletta, Malta, 17-23 de Maio de 2010), European Language Resources Association, pp. 1437-1444. SANTOS, Diana, Rosário Silva & Susana Inácio."What's in a colour? Studying and contrasting colours with COMPARA". Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC 2008) (Marraqueche, 26 de Maio -1 de Junho de 2008), ELDA. SANTOS, Diana, Rosário Silva & Cláudia Freitas. "Pluralidades na cor: contrastando a língua do Brasil e de Portugal". In Augusto Soares da Silva, Amadeu Torres & Miguel Gonçalves (orgs.), Línguas Pluricêntricas: Variação Linguística e Dimensões Sociocognitivas. Pluricentric Languages: Linguistic Variation and Sociocognitive Dimensions. Braga: Aletheia, Publicações da Faculdade de Filosofia da Universidade Católica Portuguesa, 2011, pp. 555-572. SANTOS, Diana, Stella E.O. Tagnin & Elisa Duarte Teixeira. "Colours, clothing and food in CorTrad: why corpus-based translation studies are revealing". Apresentação no ICAME 2011 (Oslo, 1-5 de junho de 2011). SAUNDERS, Barbara. "Revisiting basic colour terms", Science as Culture, The Human Nature Review, 2005, http://human-nature.com/science-asculture/saunders.html. SILVA, Augusto Soares da. "O corpus CONDIV e o estudo da convergência e divergência entre variedades do português". In Luís Costa, Diana Santos & Nuno Cardoso (eds.), Perspectivas sobre a Linguateca / Actas do encontro Linguateca : 10 anos. Linguateca, 2008, pp. 25-28. SILVA, Rosário & Diana Santos. "Arco-íris: notas sobre a anotação do campo semântico da cor em português". Primeira edição: 25 de junho de 2009. Versão atual: 24 de janeiro de 2012. http://www.linguateca.pt/acesso/ArcoIris.pdf SILVA, Rosário, Susana Inácio & Diana Santos. "Documentação da anotação relativa à cor no COMPARA". Última versão: 31 de Dezembro de 2008. http://www.linguateca.pt/COMPARA/DocAnotacaoCorCOMPARA.pdf SLETSJØE, Leif. “Sobre el topico de los ojos verdes”, Strenae: Estudios de filologia e historia dedicados al profesor Manuel Garcia Blanco, Salamanca, 1962, pp. 445459. SWEARINGEN, Andrew. “Seeing red in Roxo: The Evolution of Portuguese colour terms”, MA thesis, Univ. of Copenhagen, 2000. TEIXEIRA, Elisa D., Diana Santos & Stella E. O. Tagnin. "CorTrad: um novo corpus paralelo multiversão para o par de línguas português-inglês". Em Tania M.G. Shepherd, Tony Berber Sardinha & Marcia Veirano Pinto (eds.), Caminhos na Linguística de Corpus, Mercado de Letras, 2012, pp. 151-176. WIERZBICKA, Anna. The meaning of color terms: semantics, culture, and cognition. Cognitive Linguistics, 1-1, 1990, 99-150. ZAVAGLIA, Cláudia. "Dicionário e cores”. Alfa 50, 2, São Paulo, 2006, pp. 25-41. ZAVAGLIA, Claudia. “A prática lexicográfica multilingue: Questões concernentes ao campo das cores”. In Aparecida Negri Isquierdo & Ieda Maria Alves (eds.), As ciências do léxico: Lexicologia, lexicografia, terminologia, vol. III, Editora UFMS, Associação editorial Humanitas, 2007, pp. 209-222.