Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. Projeto de Pós Doutorado Cristiane NAMIUTI Temponi (IEL/UNICAMP) Supervisora: Charlotte Marie Chambelland GALVES (IEL/UNICAMP) Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. RESUMO Este projeto de pesquisa insere-se no âmbito do projeto temático Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística – Fase II (FAPESP: 04/03643-0) e tem como objetivo mapear a sintaxe de textos históricos a fim de trazer mais subsídios para descrever e entender a gramática média do português e as mudanças que pontuaram na história da língua. As reflexões, bem como a metodologia de classificação e a análise de dados terão como pano de fundo o quadro teórico de Princípios e Parâmetros da Gramática Gerativa (cf. Chomsky, 1995). Já avançamos na questão gramatical trazendo fatos importantes que corroboram a hipótese de Galves (1996, 1998, 2001, 2004) de ter havido um estágio gramatical intermediário entre o Português Arcaico (PA) e o Português Europeu Contemporâneo (PE). De posse dos resultados sobre a interpolação obtidos na minha tese de doutoramento (Namiuti, 2008) somados aos resultados de Galves, Britto & Paixão de Sousa (2005) sobre a ênclise e a próclise e os de Paixão de Sousa (2004) sobre a posição do sujeito, sustenta-se a hipótese de uma gramática intermediária PA - PE. Atestamos (Cf. Namiuti, 2008) que a interpolação dos constituintes do VP, bastante produtiva nas orações dependentes do português arcaico, desaparece da produção literária no século 16, e a não adjacência entre o complementador e o clítico se torna mais comum: a ordem ‘complementador-clítico-XP-(neg)1-verbo’ abre espaço para a ordem ‘complementador-XP-clítico-(neg)-verbo’. Neste mesmo século encontramos um padrão proclítico nas orações não dependentes afirmativas, e ainda, a interpolação da negação ganha novos contextos (‘não’ passa a ser interpolado em ambientes tradicionalmente considerados de variação ‘clV’ / ‘Vcl’). Interpretamos estes fatos como o reflexo da mudança no domínio de hospedagem do clítico, que deixa de poder subir até o núcleo mais alto da estrutura da frase (C°) e passa a se relacionar exclusivamente com o complexo verbal (em ∑°, nas orações raízes e em I°, nas orações dependentes). Alguns trabalhos importantes, como o de Martins (1997, 2005), também Parcero (1999), propõem que a estabilização da ordem em Português resulta de uma mudança que relaciona a perda do fenômeno da interpolação com a perda do fronteamento dos constituintes do Sintagma Verbal para a esquerda do verbo. No entanto, os resultados obtidos na tese de doutorado (Namiuti, 2008) nos levam a propor o contrário: a perda da possibilidade do fronteamento não é a razão para o desaparecimento do fenômeno da interpolação, uma vez que constatamos que este último já é obsoleto no século 16, enquanto o primeiro parece ser ainda bastante produtivo até o século 18 (cf. Paixão de Sousa 2004). Este projeto de pesquisa almeja comprovar empiricamente que a permanência da possibilidade do fronteamento, somada à mudança no domínio do clítico é que faz prevalecer a próclise sobre a ênclise nas orações raízes ‘XV’ nos textos dos séculos 16 e 17, e ainda, surgir novas possibilidades para a interpolação da negação. O nosso objetivo será, portanto, fazer uma nova investigação sobre o fronteamento dos constituintes no período gramatical chamado por Galves (2004) de Português Médio e comprovar a hipótese deste fenômeno estar diretamente ligado a sintaxe dos clíticos nesta época. Para tanto contraporemos as orações com fronteamento às orações em que os sintagmas permanecem em posição 1 Parênteses indicam opcionalidade 1 Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. pós-verbal (com e sem clíticos) presentes nos textos de autores nascidos entre o século 15 e o 18. Para que esse estudo possa ser realizado numa base empírica suficiente e confiável, trabalharemos com textos do Corpus Tycho Brahe sintaticamente anotados, e participaremos dessa anotação, corrigindo o output do anotador automático (parser). I. INTRODUÇÃO Na perspectiva gerativista, o conceito de Gramática remete à possibilidade de se gerarem as estruturas, e não ao inventário de estruturas. Essas possibilidades são limitadas pela “Gramática Universal”, que faz parte das faculdades inatas do ser humano. A Gramática Universal oferece “princípios” imutáveis e “parâmetros” que podem ser especificados (ou “fixados”) diferentemente em gramáticas particulares – determinando, assim, os limites de variação entre as gramáticas (Chomsky e Lasnik 1993). Cada gramática, neste sentido, representa uma determinada parametrização dos princípios da Gramática Universal. Portanto, a gramática na teoria gerativa, será uma entidade individual. As gramáticas individuais emergem nos falantes a partir da interação entre os princípios da Gramática Universal (ou seja, inatos) e a experiência lingüística de cada falante (ou seja, os dados a que está exposto na fase de aquisição, produzidos pela geração anterior). Desse ponto de vista, a mudança gramatical é uma função da relação entre a capacidade inata e a experiência lingüística vivenciada pelas sucessivas gerações de falantes. Neste quadro, a gramática é um objeto teórico, enquanto os dados de língua são um objeto empírico a ser interpretado. Portanto, ao levantar hipóteses sobre gramáticas, os estudos gerativistas buscam interpretar teoricamente os dados da língua. Os dados documentados relativos a mudanças apresentam-se, tipicamente, como dados de variação entre formas antigas e formas novas nos textos. Note-se, entretanto, que quando se admite que a mudança de uma gramática para outra envolve a fixação (ou “marcação”) diferente dos parâmetros via aquisição da linguagem pela criança, esta mudança deverá ser conceituada, por necessidade teórica, como um evento abrupto. Temos então um aparente paradoxo: a mudança gramatical, em tese um evento abrupto, manifestase nos dados como um evento de variação gradual. Assim, a interpretação dos dados históricos num estudo de mudança gramatical precisa contar com um quadro metodológico que permita abordar o problema da variação diacrônica. Em nosso estudo, partimos do quadro delineado a partir de Kroch (1989), que salienta que a variação nos textos não se deve confundir com variação nas gramáticas. Ou seja: as mudanças nas línguas, instanciadas nos documentos históricos como variação gradual, são reflexos de mudanças gramaticais que devem ocorrer de modo abrupto. Nos casos de mudança gramatical, a variação entre formas antigas e novas na linha do tempo não pode ser conceituada como uma “oscilação” produzida por uma única gramática particular. Ao contrário, cada forma parece corresponder a diferentes fixações de um parâmetro. Nestes casos, a variação nos textos pode ser compreendida como fruto da convivência, no 2 Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 3 plano do uso, de formas geradas por diferentes gramáticas. É o que Kroch (1994) chama de “Competição de Gramáticas”, processo no qual as formas antigas são gradualmente expulsas do uso pelas formas inovadoras. No que concerne especificamente o problema da identificação de etapas gramaticais, ou a periodização, a contribuição central do conceito de Competição de Gramáticas é a idéia de que a emergência de uma nova gramática será identificada pelo surgimento de formas novas nos dados. (Cf. Galves, Paixão de Sousa e Namiuti, 2006). Os estudos pioneiros sobre a diacronia do português no quadro gerativista (cf. Martins 1994; Torres Morais, 1995; Ribeiro, 1996 entre outros) levaram em conta a periodização delineada pela tradição, que, de forma geral, divide a história da língua em três grandes ciclos – o Português Arcaico, o Português Clássico, e o Português Europeu Moderno. Entretanto costumam considerar apenas dois períodos gramaticais – a gramática antiga e a gramática moderna. Esta hipótese de duas fases gramaticais é em parte o resultado do fato de que a história do português carecia de estudos aprofundados que focalizassem os períodos posteriores ao século 16, uma vez que esse século é considerado como o marco inicial das línguas modernas (cf. Mattos e Silva 1992 para uma síntese dos estudos sobre periodização do português). No caso da língua portuguesa, essa concepção mostrou-se particularmente inadequada, porque, como argumenta Galves (2004), além do surgimento posterior do português brasileiro, o próprio português europeu sofre mudanças notáveis depois do séc. 16. Com os estudos baseados no Corpus Tycho Brahe2, que reúne textos de autores portugueses nascidos entre 1380 e 1845, é possível defender a existência de três Gramáticas, ou seja, dois estágios gramaticais anteriores ao Português Europeu Moderno. Nossa presente proposta consiste em mapear a sintaxe dos textos históricos, focalizando o fronteamento de constituintes nas sentenças, a fim de descrever a sintaxe do Português Médio e (re)afirmar as hipóteses lançadas no âmbito do projeto temático. Para isto trabalharemos para a disponibilização da versão sintaticamente anotada dos textos do Corpus do Português Histórico Tycho Brahe. Nesta empreita, corrigiremos os textos anotados automaticamente pelo parser, desenvolvido por Daniel Bikel na Universidade da Pensilvânia, com o auxílio da ferramenta de correção das etiquetas sintáticas - Corpus Draw3. Nas seções seguintes apresentaremos o estado da arte com relação aos avanços nas pesquisas sobre as gramáticas do Português, sobretudo no que diz respeito à questão do fenômeno da interpolação e o 2 No âmbito do Projeto Temático Padrões Rítmicos Fixação de Parâmetros e Mudança Lingüística. Projeto financiado pela FAPESP (98/3382-0 e 04/03643-0) e desenvolvido no Instituto de Estudos da Linguagem (IELUNICAMP), sob a coordenação da Professora Doutora Charlotte Marie Chambelland Galves. O projeto tem como quadro teórico o modelo de Princípios e Parâmetros e utiliza, para modelar o estudo da mudança lingüística, o ferramental teórico que vem sendo desenvolvido por A. Kroch e colaboradores. Trata-se de um projeto eminentemente pluridisciplinar, exigindo competências variadas. Assim a equipe executora é formada por sintaticistas, fonólogos, foneticistas, especialistas em história do português, físicos-estatísticos, probabilistas, estatísticos e cientistas da computação. 3 Corpus Draw é uma ferramenta de edição/correção de textos anotados sintaticamente desenvolvida na Universidade da Pensilvânia. Tal ferramenta faz parte do pacote Corpus Search. http://corpussearch.sourceforge.net/ Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. Português Médio. Também falaremos do corpus Tycho Brahe e do empreendimento tecnológico ligado à sua construção. E, finalmente, apresentaremos nosso plano de trabalho. II. O FENÔMENO DA INTERPOLAÇÃO E A QUESTÃO GRAMATICAL. Dois aspectos da sintaxe dos clíticos pronominais se destacam pelas alterações de padrão na diacronia do português: as ordens relativas clítico-verbo ~ verbo-clítico e a interpolação. Em orações subordinadas, finitas, e em orações principais introduzidas por operadores, os clíticos são sempre pré-verbais no português. No entanto, nestas configurações há variação entre a adjacência clítico-verbo e a interpolação nos textos dos séculos 13 a 16. Idênticos constituintes frásicos podem ocorrer ora à esquerda da seqüência clítico-verbo, ora interpolados entre o clítico e o verbo. (01) como se nesta carta contem (NO, 1538. Martins 1994) (02) como nesta carta se contem (Lx, 1532. Martins 1994) A interpolação é, portanto, a construção na qual o clítico pronominal não se apresenta contíguo ao verbo – ou noutros termos, na qual um outro constituinte sintático se interpola entre o pronome e o verbo. Tratase de uma construção característica dos textos mais antigos do português (bem como do romance ibérico em geral, cf. Rivero, 1994, 1997, Martins 1994, 1997, 2002, entre outros) e que se torna obsoleta nos autores nascidos no século 16 (cf. Namiuti, 2008). A interpolação da negação, porém, continuou a ser registrada e é ainda atestada no português europeu moderno (cf., entre outros, Martins, 1994, Mira Mateus et alli, 2003, Magro 2007, Namiuti, 2008). Os estudos sobre a colocação pronominal na diacronia do português (cf. entre outros, Martins 1994, Parcero 1999 e Fiéis 2001) demonstraram que a interpolação dos diversos elementos do sintagma verbal era freqüente até o século 16 e restrita aos contextos de próclise obrigatória. Considero (cf. Namiuti, 2008) que os fatos relativos à interpolação são importantes para compreendermos a mudança que remonta ao séc. 14, se considerarmos a afirmação de Cardeira (2005) sobre as formas clássicas já anunciadas na segunda metade desse século, somada à questão teórica da aquisição e mudança delineada a partir de Kroch (1989). Antes disso, a interpolação de constituintes generalizados do sintagma verbal é própria das orações dependentes com contigüidade ‘complementadorclítico’. Este fenômeno reflete a preferência do clítico por uma posição adjacente ao complementador ou à conjunção subordinativa e é característico da gramática arcaica (cf. Matos e Silva 1998, entre outros). Na fronteira entre os séculos 15 e 16, quando a próclise passa a ser predominante também nas orações não dependentes, constatei (Namiuti, 2008) o surgimento de novos contextos de interpolação da negação que passa a ocorrer interpolada também nos domínios tradicionalmente considerados de variação 4 Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 5 entre ênclise e próclise - ‘clV’/’Vcl’4 (orações raízes - introduzidas por sujeito, um sintagma preposicional, um sintagma adverbial, uma oração anteposta, ou ainda por conjunção copulativa; e infinitivas introduzidas por preposições que não condicionavam a próclise categórica, como a preposição ‘em’). (03) “E, pelo ElRei Dom João o III querer casar, e êle não querer, lhe não deram satisfação de seus serviços ...” (Couto-1548) (cf. (04) Namiuti, 2008) “E sintido do mal, que o fizera com ele a infirmidade em o não enterrar,” (Sousa – 1556). (cf. Namiuti, 2008) As primeiras ocorrências de interpolação da negação encontradas em contextos de variação clV/Vcl foram atestadas por Martins (1994) no final do século 15. Esta diferente possibilidade de interpolar a negação mostrou-se freqüente nos textos do corpus Tycho Brahe e identificou-se como um grupo coeso (cf. Namiuti, 2008). Nas orações dependentes, identifiquei, no século 16, que a queda na freqüência da interpolação generalizada (de elementos diferentes da negação) segue o aumento da não-contigüidade ‘complementador-clítico’ nas sentenças negativas com clítico-neg-verbo. (05) “e certo que se lhe ElRei não mandára sucessor” (CTB: Couto-1548)5 (Cf. Namiuti, 2008) (06) “que até o Prior dos Agostinhos, seu Confessor, o não pôde sofrer” (CTB: Couto-1548) (Cf. Namiuti, 2008) Logo em seguida na linha do tempo vemos o completo desaparecimento do fenômeno da interpolação generalizada nos textos. (Remeto a Namiuti, 2008). O gráfico abaixo, retirado da tese (Namiuti, 2008: 52, gráfico I.8)6, reúne algumas opções de ordenação relevantes para entendermos e localizarmos as gramáticas e sua evolução no tempo: 1) a 4 No português e espanhol dos séculos 13 a 16, em orações principais afirmativas não introduzidas por operadores os clíticos podem ocorrer quer em posição pré-verbal, quer em posição pós-verbal. Esta variação acontece quando o verbo não está em posição inicial e é precedido ou do sujeito, ou, de um sintagma preposicional, um sintagma adverbial, uma oração anteposta, ou ainda da conjunção copulativa e. Em todos os casos o clítico apresenta-se necessariamente adjacente ao verbo. (1) E a donzela foi-se e deo agoa à rainha (Pr. Livro de Linhagens. Piel & Mattoso 1980:23. Apud Martins 2002:263) (2) E a donzela lhe disse entom que achara um mouro doente (Pr. Livro de Linhagens. Piel & Mattoso 1980:28. Apud Martins 2002: 263) Os fatos relativos à variação ênclises versus próclises também são importantes para compreendermos a gramática média. Paixão de Sousa (2004), bem como Galves e Paixão de Sousa (2005) consideram que a alternância Vcl vs. clV nos textos representativos dos anos 1500 e 1600, corresponde a uma alternância possibilitada por uma mesma gramática (a gramática do PM). Nos textos representativos dos anos 1700 e 1800, a variação é o efeito de uma competição de gramáticas (no sentido de Kroch 1994, 2001), que por sua vez evidencia a emergência da gramática do PE. 5 Apesar de Diogo do Couto ter nascido em 1548 atestamos algumas interpolações do tipo Arcaico (C-cl-X-negV) no seu texto, porém são marginais em relação à estrutura sem a interpolação de elementos diferentes de ‘não’ (C-X-clnegV). 6 A tese ‘Aspectos da história gramatical do português. Interpolação, negação e mudança.’ (Namiuti, 2008) encontra-se em : http://www.ime.usp.br/~tycho/participants/namiuti/index.html Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 6 interpolação generalizada vs adjacência ‘clV’ (exemplos 01 e 02); 2) a adjacência entre o ‘complementizador’ e o ‘clítico’ nas sentenças com interpolação da negação (C-cl-X-negV vs. C-XclnegV: exemplos 05 e 06); e ainda, 3) a freqüência de ênclise sobre próclise nas orações matrizes XVerbo. A ênclise dá lugar à próclise nas orações raízes e a seqüência ‘C-cl-X-negV’ dá lugar à ‘C-X-clnegV’ nas orações encaixadas exatamente na mesma época (queda da ênclise e de ‘C-cl-X-neg-V’ nos textos produzidos no século 15). E ainda, atesta-se a emergência de um novo padrão, nos textos editados no final do século 18, com uma progressiva subida de freqüência da ênclise nas orações matrizes, porém sem correlação com o fenômeno da interpolação de elementos diferentes da negação, pois este desaparece por completo muito antes. Interpretei estes fatos como evidência da emergência de uma nova gramática em textos anteriores ao século 16, em conformidade ao que Galves (2004) afirma sobre o português médio (PM). Gráfico I: Três conjuntos de dados e três padrões diferentes. (Namiuti, 2008:52) 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 1275 1325 1375 1425 1475 1525 1575 1625 1675 1725 1775 1825 1875 1925 Interpolação de elementos diferentes da negação/adjacência 'cl-V' (Martins 1994, Parcero 1999 e CTB) C-cl-X-negV vs.C-X-cl-negV (Martins 1994 e CTB) Ênclise vs Próclise em orações raízes XV (Martins 1994, Ribeiro 1995 e CTB) Seguindo a proposta delineada por Kroch (1994, 2003), a interpolação de elementos diferentes da negação ainda atestada nos textos quinhentistas deve ser interpretada como variação no uso de formas em competição, uma vez que novos padrões de ordenação já foram indiciados nesta época. Propomos na tese de doutorado, dentro do quadro teórico da Morfologia Distribuída (MD) (cf. Embick e Noyer 2001, entre outros) que os pronomes clíticos no PA podem se mover na sintaxe para esquerda do núcleo mais alto da oração, C°7, e que seguem deslocamento local sofrendo assim a inversão prosódica com seu hospedeiro. Desse ponto de vista, a interpolação de constituintes na gramática arcaica (GA) deriva da inversão prosódica mantendo a adjacência C-cl. E é também por este motivo que temos a 7 A teoria da gramática gerativa, adotando a representação X', além das projeções lexicais propõe que o ‘dicionário mental’ contém também projeções funcionais. Os núcleos funcionais têm função eminentemente gramatical. A flexão verbal constitui uma categoria funcional que a teoria convencionou chamar de IP (sigla vinda do inglês para ‘sintagma flexional’ - inflection phrase). INFLº ou I° é o núcleo do sintagma da flexão verbal, IP. Além da flexão verbal, outra projeção funcional essencial na teoria é a projeção que traduz a subordinação – CP (complementizer phrase). C° é o núcleo desta projeção funcional. Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 7 predominância da ênclise em orações XV no PA. Para corroborar esta proposta, lembramos que o PA permitia a assimilação entre consoantes finais de complementadores e quantificadores e a líquida que constitui o primeiro segmento do pronome (por as > polas, pulas, poila ...), apontados por Barbosa (1996) Quanto à gramática média, esta terá resultado da mudança que veda a possibilidade da interpolação e dá lugar à próclise nas orações matrizes XV, sendo X interno à estrutura oracional (cf. Galves e Paixão de Sousa 2005). Tal mudança estará estreitamente relacionada com o domínio de hospedagem do clítico8 que deixa de ser independente do verbo e passa a ser dependente dele. Nesta gramática clítico e verbo estão incorporados em Σ°9. Assim, de acordo com a análise que propus em Namiuti (2008), a gramática do português antigo teria um pronome clítico capaz de se hospedar no núcleo mais alto da estrutura frasal (C°). A estrutura com interpolação, mantendo o complementizador e o clítico adjacentes, nas orações encaixadas, e a ênclise, nas orações raízes, (respectivamente exemplos 7 e 8), estariam relacionadas com a obrigatoriedade da inversão prosódica do clítico a este núcleo. (07) asy como ho ele na dita procuração há (Lx, 1306; Martins, 1994) (08) E eu outrossi semelhauilmente obligome ... (Lx: 1291; Martins, 1994) Entretanto, a subida do clítico para C° nas orações dependentes e do verbo para este núcleo nas orações raízes não parece ser obrigatória, podendo o clítico e/ou o verbo manterem-se num núcleo mais baixo derivando a próclise com adjacência ao verbo, e ainda, prevendo casos com interpolação e não adjacência ao complementizador (respectivamente exemplos 9 e 10). (09) e outrossj lhj fica h~uu herdam~eto (Lx, 1311; Martins 1994); (010) e que sempre a os mosteyros de Anssedj e de Arnoya usarõ e possoyrã (NO, 1285; Martins 1884) Interpretamos que a não obrigatoriedade do fenômeno sugere seu caráter prosódico. 8 Não podemos propor que a diferença PA-PM em relação aos clíticos está na tipologia periférico/nuclear, pois assumimos a hipótese de Martins (2003) de que os pronomes clíticos em português sempre foram nucleares. Daí a possibilidade de intervirem entre a negação e o verbo, e de ocorrerem em mesóclises. 9 Martins (1994) traz as observações de Laka (1990) para o inglês e para o basco, e de Chomsky (1957) para o inglês, de que existe um paralelismo entre construções negativas e construções afirmativas enfáticas. Em inglês tanto a negação quanto a afirmação enfática implicam a presença de ‘do’. (01) Mary didn’t leave (02) Mary did leave [enfático, acento de intensidade sobre did] Dada a similaridade de processos sintáticos envolvidos na negação e na afirmação enfática, Laka (1990) propõe que ambas são instanciações de uma categoria funcional Σ (“Speech Act”). Martins (1994) propõe que ΣP faz parte da estrutura da frase e está presente não só nas orações enfáticas, mas em todas as frases, e que a colocação dos clíticos nas línguas românicas depende da natureza desta categoria funcional Σ, situada na estrutura frásica entre CP e IP: morfologicamente “forte” ou “fraca”; e com ou não conteúdo lexical. E argumenta em favor desta hipótese mostrando que a ênclise em orações não dependentes, a existência de construções de VP nulo e a opção por certo padrão de resposta afirmativa (mínima) a interrogativas totais (“tens visto o João? Tenho/#Sim”) são fenômenos associados entre si, manifestados apenas nas línguas em que Σ tem traços-V fortes. Σ° é, portanto, o núcleo de polaridade situado acima dos nódulos INFL e presente em todas as orações, ora instanciado como afirmação, ora como negação, ora como foco. Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 8 Já a gramática do português médio se caracteriza pela perda da propriedade de subida do clítico e do verbo a C° (o pronome clítico não sobe além de ∑° nesta fase), perdendo assim a possibilidade de interpolar elementos diferentes da negação. Assumimos que o preenchimento do Spec de ∑P é incompatível com a ênclise sendo a próclise a ordem das orações raízes XV, abrindo espaço para a possibilidade da interpolação da negação neste contexto. A ênclise só será licenciada em sentenças estruturalmente V1, como propõem Galves Britto e Paixão de Sousa (2005). A mudança para o português europeu moderno terá lugar na reanálise da posição do verbo e dos constituintes pré-verbais. O verbo em PE não se moverá além de I°, também o clítico ficará neste domínio junto com o verbo. Spec de ∑P se restringirá aos constituintes afetivos e o sujeito pré-verbal ocupará Spec de IP. Consideramos que a questão central para se entender a gramática média é o fato dos constituintes fronteados estarem deixando de aparecer linearmente entre o clítico e o verbo para aparecer entre o conectivo e a seqüência linear clítico-verbo entre os séculos 15 e 16. Uma vez que a ordem ‘conectivoXP-cl-V’ parece estabilizar-se no século 16, os dados atestados por Namiuti (2008) devem refletir não uma mudança de posição dos constituintes fronteados, já que o fronteamento, inclusive de complementos verbais, continua a ser produtivo até o início do século 1810, mas uma mudança na posição do pronome clítico. Tal mudança está relacionada ao domínio de hospedagem do clítico (mas não no seu estatuto de clítico) (cf. Namiuti, 2008). III. INTERPOLAÇÃO E FRONTEAMENTO. Com relação ao fronteamento de constituintes no português antigo e clássico, encontramos na literatura a associação da perda do fronteamento com a perda da interpolação generalizada, tendo a segunda mudança conseqüência na primeira. Martins (1997, 2005) mostra que a ordem ‘Objeto-Verbo’ é bastante freqüente no PA, podendo ser o reflexo do deslocamento à esquerda (left deslocation), do foco identificacional, ou ainda, do scrambling dentro do domínio de IP. Este terceiro tipo de movimento não é permitido em PE moderno11, e é opcional no PA, como nos mostram os exemplos abaixo atestados por Martins (2005:182). (011) Sse pela u~etura uos algu~e a dita v~ya enbargar (Documento notarial, século 13) (012) Sse pela u~etura uos algu~e enbargar a dita v~ya (Documento notarial, século 13) A autora propõe que o scrambling de objeto no PA é o movimento para Spec AgrS, e afeta DPs, PPs, AdvPs (respectivamente: sintagmas determinantes, sintagmas preposicionais, e adverbiais) e orações reduzidas de infinitivo ou particípio. E ainda ressalta que tal fenômeno não é restrito a apenas um 10 Cf. Paixão de Sousa (2004) e Gibrail (em andamento) No Português Europeu contemporâneo, a ordenação de constituintes é, normalmente, estruturada obedecendo a um padrão SVO, em que o verbo é seguido de seus complementos. Algumas exceções a esse padrão são encontradas no PE, mas, como aponta Martins (2005), os deslocamentos atuais estão mais diretamente relacionados a questões de focalização ou topicalização dos elementos fronteados, refletindo apenas recursos de ordem discursiva. 11 Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 9 constituinte por oração, mas vários constituintes podem ser movidos, e que também é encontrado tanto em orações com sujeito nulo, quanto com sujeito lexical (como nos exemplos acima). Segundo Martins (2005), no PA, AgrS teria uma seleção de traços ininterpretáveis (um traço EPP) com uma propriedade de atrair todo – F (atract-all-F), ou seja todo sintagma com um traço forte. Em sua análise AgrS permitiria múltiplos Specs e os constituintes movidos por scrambling ocupariam os Specs de AgrS. A ordem OV deverá, portanto, ser própria das orações encaixadas, já que, de acordo com a proposta de Martins (2005), nas orações não dependentes do PA, o verbo se move para um núcleo mais alto que AgrS°. Assim, uma vez que os constituintes movidos por scrambling são os mesmos que podiam ser interpolados entre o clítico e o verbo, e ainda nos mesmos contextos (orações dependentes), Martins (2005) correlaciona o desaparecimento da interpolação com à perda desta propriedade de AgrS selecionar múltiplos Specs. A anteposição de constituintes do VP ao verbo nos séculos 15, 16 e 17 é também o objeto de investigação de Parcero (1999). A autora convencionou chamar de fronteamento qualquer deslocamento de constituintes do VP para uma posição pré-verbal, como nos exemplos abaixo, tirados de sua dissertação – página 2: (013) mostrava que muy espantada viera a sua alma das penas (VDS 24-38) 12 (014) dinheiros aos que carregar quiriam (DFR 85-6) (015) Rogue a Deos por my que apostolo he de Deos (VDS 338-28) No que diz respeito às estruturas com interpolação, Parcero (1999) entende este fenômeno como um tipo específico de fronteamento. O trabalho de Parcero foi pioneiro em investigar o fronteamento e a interpolação de constituintes concomitantemente e ainda tratar a interpolação como um tipo específico de fronteamento. Esses fenômenos envolvem, principalmente os constituintes complementos e adjuntos. A princípio, Parcero verifica que parece não haver restrições sintáticas sobre o tipo de constituinte que pode ser fronteado: (Parcero 1999:17). (016) e pode enquerer ... que honrra e estado tinha (DFR 11-279). (017) Porque por todos daras conta e rrazom a Deos (VDS 21-16). (018) Sabede que natural cousa he de cada hua cousa demendar (VDS 9-30). (019) Parecia que em seu coraçam nam jazia o contrário (GRS 1817) (020) Tudo o que agora tomasse (PRG 30-214). (021) depois que adubado fosse (DFR 60-321). 12 Parcero (1999) utiliza as iniciais dos textos que constituem o corpus seguidas do número da página ou da carta (quando se tratar de cartas) e/ou do número da linha em que se encontra o dado diante de cada dado para os identificar. DFR –Crônica de D. Fernando VDS – Vida de Santos GRS –Livro das Obras de Garcia Resende DCP – Ásia Década Primeira PRG – Peregrinação CTS – Cartas Espirituais/Cartas Familiares Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. (022) Nos bees d’aquelles que paguar nom quisessem (DFR 49-321) Um objeto direto, como em (16); um complemento oblíquo, em (17); um predicativo, em (18); um adjunto adverbial de lugar, em (19); um adjunto adverbial de tempo, em (20); o particípio passado em (21) e o infinitivo em (22). A autora constatou que não há uma diminuição na percentagem de elementos fronteados do século 15 ao 17. Porém, nota que os constituintes complementos deixam de ser fronteados no século 17 enquanto os adjuntos permanecem sendo fronteados. Quanto às construções com clíticos, fundamentais para uma análise completa, Parcero (1999) atestou o fenômeno da interpolação nos mesmos contextos atestados por Martins (1994), contextos de próclise categórica, preferencialmente em orações encaixadas. Então computou todas as ocorrências de clíticos em sentenças encaixadas, encontrando três tipos principais de construções: cl-X-V, que corresponde ao contexto de interpolação, cl-V-X e X-cl-V, que se referem às estruturas de clíticos adjacentes ao verbo. Estas ordens alternam livremente nos textos. Parcero (1999) argumenta que as estruturas com o clítico adjacente ao verbo são, no geral, mais comuns que a interpolação dos constituintes e ainda aumentam sua freqüência no século 16 e 17. A autora também aponta que as construções ‘cl-X-V’ e ‘cl-suj-V’ desaparecem no século 17, enquanto as construções ‘X-cl-V’ e ‘suj-cl-V’ aumentam e as construções ‘cl-V-(X)’ e ‘cl-neg-V’ permanecem estáveis. Entretanto faltam estruturas que deviam ser consideradas para uma interpretação mais exata da situação. Uma vez que Parcero (1999) considera ‘clítico-negação-verbo’ e as construções ‘Sujeito-verbo’, deveria também considerar ‘negação-clítico-vervo’ e ‘verbo-Sujeito’. Sem isso, teremos um leque de variação incompleto para a extração de freqüências, o que pode comprometer a interpretação dos resultados obtidos. Os dados de Parcero (1999) sugerem uma instabilidade no uso da interpolação com relação ao fronteamento com próclise e adjacência ‘clV’ (‘C-X-cl-V’) no século 16, revelada pela grande diferença encontrada nos textos representativos deste século (enquanto a interpolação generalizada é marginal em PRG – 7%, em DCP é bastante freqüente – 50%). Note que esta relação nada nos diz sobre a preferência do fronteamento nos textos, uma vez que não se mede ‘clítico-verbo-XP’. Para se chegar a frequência do fenômeno do fronteamento, é necessário somar as estruturas ‘XPclítico-verbo’ e ‘clítico-XP-verbo’, por hipótese estruturas de fronteamento, e contrapor com a estrutura ‘clítico-verbo-XP’, sem o fronteamento. Os dados de Parcero (1999) revelam que o fronteamento nas construções com clítico se mantém até o século 17. Todavia, a construção de fronteamento mais freqüente no primeiro texto do século 15 é ‘clítico-XP-verbo’, enquanto que no século 17 é ‘XP-clítico-verbo’. Este fato vai ao encontro de nossa proposta de que a perda do fenômeno da interpolação não está relacionada com a perda do fronteamento. Perde-se a interpolação, mas o fronteamento ainda existe na língua Clássica. Concordamos com Parcero (1999) de que o fronteamento de constituintes e a interpolação são fenômenos relacionados, uma vez que a interpolação é opcional e o clítico pode se colocar ora antes dos constituintes movidos (fronteados) ora depois (clítico-XP-verbo / XP-clítico-verbo). Mas não parece ter 10 Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 11 sido a perda da possibilidade do fronteamento a causa do desaparecimento da interpolação. Como vimos, a perda do fenômeno da interpolação é anterior ao século 17. A possibilidade do fronteamento teria persistido durante a época clássica, o que explicaria uma série de propriedades da língua nesta época. Paixão de Sousa (2004) traz evidências, baseadas em 20 textos do corpus anotado do Português Histórico Tycho Brahe, de que o fronteamento é ainda uma construção importante no português clássico, e que a possibilidade de tal construção ajuda a explicar os padrões da colocação de clíticos nesta fase. Corroborando a hipótese de Galves (1996, 1998), Paixão de Sousa (2004:163) argumenta que a passagem do sistema médio (PC) para o moderno (PE) seria a passagem de um sistema de XP-VerboSujeito para um sistema de Sujeito-Verbo-XP, onde há uma dissociação entre a posição pré-verbal do sujeito, e a posição dos elementos fronteados, agora restritos aos sintagmas focalizados. A autora constatou que de fato em todos os períodos há construções Sujeito-Verbo-Objeto, assim como há construções Verbo-Sujeito com ênclises e próclises, porém observou diferenças importantes para a passagem do português clássico para o português europeu moderno no século 18: “as ordens com XV e com próclises tornam-se menos freqüentes; a ordem X-XclVS desaparece dos textos já na primeira metade do século 18; e as ordens VSX caem de 0,07 para 0,01 nos textos entre a segunda metade do século 17 e o texto do século 19. Isto permite afirmar que a queda do patamar de cerca de 20% para o patamar de cerca de 10% de ordens VS é explicável fundamentalmente como uma queda na freqüência de construções que instanciam o fronteamento de constituintes para uma posição acima da posição de sujeitos. Tomo assim os fatos referentes à inversão como relevantes para compreender o sistema dos textos médios, e sua diferença com os modernos. A despeito de não se ter disponível uma análise mais sistemática da natureza da posição de fronteamento em termos discursivos, estes fatos todos tomados em conjunto indicam ser razoável propor que nos textos clássicos, está ativa uma posição pré-verbal para fronteamento de constituintes regida por propriedades do tipo “V2” (Paixão de Sousa, 2004:162) Para corroborar a hipótese, Paixão de Sousa (2004:157) mostra que as ordens VS (verbo-sujeito) com ênclises no português clássico são, em sua maioria, casos de V1 absolutos – ou seja, ‘#Verbo-clíticoSujeito’. Apenas no texto de Ortigão (1836) a proporção de ‘#Verbo-clítico-Sujeito’ será superada pela proporção de ‘XP-Verbo-clítico-Sujeito’. Além disso, não se registra, em nenhum período, casos de inversão com ênclises em ordens V3 (X-X-V-cl-S).13 A autora também chama a atenção para o fato da ordem X-cl-V-S, que seria a configuração mais característica do fronteamento, ser o tipo de inversão mais freqüentemente atestada nos textos dos séculos 13 Cabe salientar que existe na história do português dois tipos de inversão ‘verbo-sujeito’: as inversões românicas e as germânicas. As inversões românicas se instanciam preferencialmente como #VS, ou mais caracteristicamente, #VXS, e correspondem a uma focalização do sujeito, que ocupa uma posição pós-verbal mais baixa, ou seja, pode estar depois dos complementos do verbo. Nestes casos, a inversão é de fato uma propriedade dos sujeitos, que permanecem em VP – ou são extrapostos à direita, a depender da análise; de qualquer modo, o que está em jogo neste caso é a natureza do sujeito. Este tipo de construção pode ser identificada nas ordens VXS, ou seja, em que entre o verbo e o sujeito há um outro constituinte de VP (...) Já a inversão germânica – #XVS, ou mais caracteristicamente #XVSX – não é, a rigor, uma inversão. Pois o que está em jogo nestes casos não é o sujeito, que está em sua posição “regular” – mas sim o movimento de um outro constituinte de VP para uma posição mais elevada que a posição regular do sujeito. Este movimento envolve a subida do constituinte em questão para ocupar o especificador de determinada categoria funcional para cujo núcleo o verbo por sua vez se move – explicando a ordem linear XVS. O sujeito, assim, é “deixado para trás” – e isto pode acontecer mesmo com sujeitos que não são focos. Na verdade, nestas configurações o constituinte X pré-verbal será o elemento mais saliente da sentença. As ordens VS deste tipo se configuram tipicamente como XVSX (...) Para poder verificar a freqüência de cada tipo de inversão, é preciso separar do total de ordens VS o sub-conjunto dos dados em que a posição do sujeito em relação aos demais constituintes pós-verbais possa ser bem documentada (ou seja, separar apenas (X)VXS e (X)VSX). (Paixão de Sousa 2004: 160, 161) Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 12 16 e 17. (Cf. Paixão de Sousa, 2004:161). Sendo assim, para Paixão de Sousa 2004, no português clássico, a ordem S-V é fruto ora do fronteamento do sujeito, ora de sua topicalização. Segundo a autora: “... observando as tendências de freqüência de diferentes classes de construções XV com próclises, veremos que o comportamento dos sujeitos pré-verbais referenciais com próclises é comparável ao de elementos necessariamente fronteados.” (Paixão de Sousa 2004: 85) “.... constituintes que não podem participar da operação de adjunção nunca aparecem com ênclises. Podemos portanto considerar que no sistema médio, a ênclise é uma característica indicadora de adjunção. Em vista disso defenderei que os sujeitos em SVcl podem ser classificados como adjuntos nos textos até o século 18, período em que apresentam um comportamento comparável aos demais adjuntos (mas como veremos, isso diferencia os textos mais modernos dos textos médios, uma vez que a freqüência de ocorrência de SVcl neles é mais elevada que a freqüência de outros XVcl).” (Paixão de Sousa 2004: 85) Os resultados apresentados por Gibrail14 (2007, tese em andamento) corroboram fortemente a hipótese de Paixão de Sousa (2004) e nossa análise para as três gramáticas que pontuaram na história da língua portuguesa (Namiuti, 2008). A autora mostra que nos autores nascidos nos séculos 16 e 17 há a atuação de uma gramática V2 no licenciamento das várias formas de manifestação de estruturas de tópico. Os dados de Gibrail, também extraídos do Corpus Tycho Brahe, mostram uma grande tendência de licenciamento de objetos em posição de tópico em estruturas V2, ou seja, X-V, com e/ou sem clítico (96,5% de ordem X-V, contra 2,5% de X-X-V e 1% de X-X-X-V, no século 16; e 94,7% de ordem X-V, contra 5,1% de X-X-V e 0,2% de X-X-X-V). Gibrail atesta a diminuição da freqüência de uso de estruturas de topicalização, paralelamente à evolução da freqüência de uso de estruturas de CLLD (clitic left deslocation) em função da restrição de licenciamento de sintagmas topicalizados na categoria de elementos fronteados. IV. OBJETIVO DO PROJETO Nosso objetivo será estender a descrição feita dos domínios não dependentes por Paixão de Sousa (2004) (orações com clíticos) e Gibrail (em andamento) (orações com clítico e sem clítico) para os domínios dependentes finitos, uma vez que o fenômeno do fronteamento e da interpolação é característico deste ambiente (cf. Martins 2005). As construções sob análise nas orações dependentes com e sem pronomes clíticos estão exemplificadas a seguir. Nas orações com sujeito nulo localizaremos as ordens: 14 GIBRAIL, Alba Verôna Brito. (tese em andamento). Formas de Manifestações de Estruturas de Tópico do Português Clássico: Mudança de Comportamento Sintático na Diacronia. Apresentação no workshop do projeto temático Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística - IEL/UNICAMP. Agosto, 2007. O levantamento de dados de Gibrail considera as construções com topicalização nas orações não-dependentes e marca o estatuto do sujeito (lexical ou nulo) e, quando lexical, sua posição (SV, VS) em textos do corpus Tycho Brahe. Entretanto, falta no trabalho a automação e a versatilidade que serão conquistadas com a disponibilização do corpus Tycho Brahe anotado sintaticamente. Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. (i) (X)-X-Verbo vs Verbo-X-(X) (23) Ho Ifante foy ho derradeyro que ſe delle deſpedio beyjan-dolhe has mãos. (Duarte Galvão, 1435) (24) .... em ſuas excellentes cavallarias, como por ellas ſe moſtra, ho animoſo fervor, e ardente esforço de Julio Ceſar, e ha ſegurança muy confiada de Publio Cipiaõ Afriquano, em tanto grão , que todo ho que eſtava por fazer, cometia como ſe ho tiveſe jàa feyto, e ho que muy deficil ſe acha ſendo tam activo. (Galvão, 1435) (25) De nhuma lhe acodiam tantos, como de Beja, ho que cauſou fiquar ha a Villa muito minguoada de gente, que para ſua defenſaõ lhe fazia miſter. (Galvão, 1435) (26) os quaes dotou de muitas poſeſsões ,e guarneceo de grandes ornamentos, no que he bem de notar , e ſeguir ha muita devoçaõ dos Cavalleyros daquelle tempo , que com todas ſuas preſas, e trabalhos, e grandes, e continuas deſpezas, em guerra taõ ſanta , e quaſi do Reyno ha dentro ſendo entam ho Reyno mais pequeno, e menos rico, nom ſe deſcuydàraõ por eſo de todo ho ſerviço de Deos, ... (Galvão, 1435) (27) Finalmente que desta e de toda a mais caça de que acima tratei, participam (como digo) todos os moradores, e mata-se muita dela à custa de pouco trabalho em toda a parte que querem: porque não há lá impedimento de coutadas como nestes Reinos, e um só Índio basta ( se é bom caçador) a sustentar uma casa de carne do mato: ao qual não escapa um dia por outro, que não mate porco ou veado, ou qualquer outro animal destes de que fiz menção . (Gândavo, 1502) (28) Acautela ele os maridos, a que façam ter as suas mulheres as receitas de cozinha escritas por outros e por Ramalho Ortigão não se importando que elas conheçam pessoalmente este último sujeito, mas somente o "Cozinheiro dos Cozinheiros" que ele redigia. (Ortigão, 1836) Considero que não é possível propor uma análise baseada apenas nas ordens X-Verbo vs Verbo-X, pois nas sentenças sem clítico, ou com clítico adjacente ao verbo nem sempre é claro diferenciar as construções de deslocamento à esquerda e foco identificacional, também permitidas no PE moderno (cf. Martins, 2002, 2005), do fronteamento permitido apenas nas fases antigas. Para refinar a análise, buscarei as construções com o sujeito expresso, também considerando a posição do clítico nas sentenças que contiverem o pronome. (ii) Sujeito-X-Verbo-(X) e (X)-Verbo-Sujeito-X (029) e jàa nom tinham modo de defençaõ, ſe nom deſemparar ho palanque, e acolherſe àcerqua; mas ho Senhor Deos, que he poderoſo em todalas couſas, quando ſe hos homens em ellas nom ſabem, nem podem valer ... (Galvão, 1435) (030) nom peleyjando, que peleyjando receaes ſe fogiſemos as batalhas ha que nos Deos, e noſas vontades taõ acerqua trouxeraõ ... (Galvão, 1435) (031) ... à honra da morte , e payxaõ que N.Senhor recebeo na Cruz,pelo qual hee de crer , ~q lhe quiz Deos aſi apparecer ... (Galvão, 1435) (032) As quais capitanias el-Rei Dom João o terceiro , desejoso de plantar nestas partes a Religião Cristã , ordenou em seu tempo, escolhendo para o governo de cada uma delas vassalos seus de sangue e merecimento , em que cabia esta confiança. (Gândavo, 1502) 13 Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. (033) Finalmente que desta e de toda a mais caça de que acima tratei , participam (como digo) todos os moradores , e mata-se muita dela à custa de pouco trabalho em toda a parte que querem: porque não há lá impedimento de coutadas como nestes Reinos, e um só Índio basta ( se é bom caçador) a sustentar uma casa de carne do mato: ao qual não escapa um dia por outro, que não mate porco ou veado, ou qualquer outro animal destes de que fiz menção. (Gândavo, 1502) (034) Durou ho cerquo perto de ſinquo mezes, por ha Cidade ſer muy for- te , de ſitio, e cerqua, e eſtarem dentro muitos Mouros,'q ha muy bem defendião , fizeraõ-ſe neſte cerquo grandes eſcaramuças , e fortes combates, em que ſe matavam muitos Cavalleyros de huma parte , e da outra. (Galvão, 1435) (iii) X-Sujeito-Verbo e Verbo-X-Sujeito (035) nem manteuda cõ ElRey de por meyo em ſua terra , que abaſtava para elles leyxarem-na em poder de Chriſtãos como fora ſeu dezejo , e aſi ſe foraõ ha ElRey , e lho dice- raõ muy francamente, ho que lhes elle muito agradeceo , offerecen-do-ſe, que ſe alguns delles, e de ſuas gentes quizeſem fiquar em ſua terra, elle lhe daria luguares para povoarem (Galvão 1435) (036) que ſegundo cuydo, e eſpero prazerà ha Deos, que voſos deſejos, e meus, eu volos darey compridos com muito prazer , e honra (Galvão 1435) (037) QUE viaje à roda do seu quarto quem está à beira dos Alpes, de Inverno, em Turim, que é quase tão frio como São Petersburgo - entende-se. Mas com este clima, com este ar que Deus nos deu, onde a laranjeira cresce na horta, e o mato é de murta, o próprio Xavier de Maistre, que aqui escrevesse, ao menos ia até o quintal. (Garrett 1799) As construções em (ii) são mais características das gramáticas V2 (cf. Paixão de Sousa 2004) e por isso o diagnóstico do fronteamento traz menos ambigüidade nestes casos. De acordo com Martins (2002: 285) o processo sintático de deslocação do objeto para uma posição pré-verbal interna à frase, designado scrambling pela autora, resulta na ordem ‘Sujeito-Objeto-Verbo’ (SOV). Segundo Martins (2002), este processo de anteposição verbal do objeto não perdura em nenhuma das línguas românicas, mas mantem-se representado em outras línguas da família germânica, como no alemão e no neerlandês. Já as ordens Objeto-Sujeito-Verbo e Objeto-Verbo-Sujeito resultariam do deslocamento a esquerda clítica ou da focalização enfática, estruturas que persistem no português contemporâneo. Por outro lado, ponderando a posição pós-verbal do sujeito, a ordem ‘X-Verbo-Sujeito-X’ não seria uma inversão da posição do sujeito, como no PE, mas o movimento de um outro constituinte de VP para uma posição mais elevada que a posição regular do sujeito (cf. Paixão de Sousa (2004), também cf. nota 11). Este movimento envolve a subida do constituinte em questão para ocupar o especificador de determinada categoria funcional para cujo núcleo o verbo por sua vez se move – explicando a ordem linear XVS. O sujeito, assim, é “deixado para trás” – e isto pode acontecer mesmo com sujeitos que não são focos. (Paixão de Sousa 2004: 160, 161). Já a inversão VXS corresponderia mais caracteristicamente a uma focalização do sujeito (cf nota 13). Portanto, as ordenações em (ii) são as principais construções sob análise e as em (iii) são freqüentes no PE moderno e por isso é crucial medi-las nos textos para se descobrir quando exatamente vão superar as construções apresentadas em (ii). 14 Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 15 Desta forma, para verificar a freqüência de cada tipo de inversão, é preciso separar do total de ordens Verbo-Sujeito o subconjunto dos dados em que a posição do sujeito em relação aos demais constituintes pós-verbais possa ser bem definida, ou seja, separar ‘(X)-Verbo-X-Sujeito’ e ‘(X)-VerboSujeito-X’. Também vamos ponderar a natureza de X refinando os tipos de X que aparecerão nos textos. Investigaremos separadamente os complementos e adjuntos. Na categoria complemento, separaremos os sintagmas dativos dos acusativos. Na categoria adjunto, refinaremos o tipo (adverbiais, preposicionais, nominais, ...). Desta forma pretendemos trazer subsídios para comprovar nossa proposta, delineada a partir da argumentação trazida na tese de doutorado (Namiuti, 2008), de que a perda da possibilidade da interpolação é anterior ao desaparecimento do fronteamento na língua portuguesa. Ou seja, a possibilidade do processo sintático do fronteamento mantem-se após a re-análise dos núcleos hospedeiros do pronome clítico15. E ainda, corroborar a hipótese de Galves (1996, entre outros trabalhos) e Paixão de Sousa (2004). V – O CORPUS TYCHO BRAHE Como lembra Paixão de Sousa (2006), os estudos históricos realizados com base em textos antigos dependem, antes de tudo, da garantia da fidelidade às formas originais dos textos – sendo este o pilar de sustentação que qualquer estudo lingüístico, em qualquer quadro teórico, deve pressupor. No caso dos corpora eletrônicos, esse pressuposto fundamental pode ser integrado a outros requisitos, como a necessidade de quantidade, agilidade e automação no trabalho estatístico de seleção de dados. Paixão de Sousa (2006) defende que a conjunção dessas vertentes configura o principal desafio do trabalho de edição especializada e análise lingüística de textos antigos no meio eletrônico. Foi com este espírito que foi desenvolvido o Corpus Tycho Brahe. O corpus Tycho Brahe é um corpus anotado do português histórico que disponibiliza seus textos em formato ortograficamente transcrito e morfologicamente etiquetado, e está investindo em um analisador sintático para os textos Medievais e Clássicos. Os textos analisados morfo-sintaticamente permitem uma pesquisa lingüística mais precisa e rápida com recuperação instantânea de informações nos textos analisados. Elaborado nos moldes do corpus parseado do Inglês Médio PPCME (Penn-Helsinki Parsed Corpus of Middle English), o Corpus Anotado do Português Histórico Tycho Brahe consiste em um corpus eletrônico composto por textos em prosa, escritos em português por falantes nativos do português, nascidos entre 1380 e 1845 (cf. http://www.ime.usp.br/~tycho/corpus). O objetivo do Corpus Tycho Brahe é disponibilizar publicamente dados históricos do português europeu anotados de tal maneira que os estudiosos de sua história possam recuperar rapidamente informações categoriais e estruturais 15 De acordo com Namiuti (2008), o pronome clítico deixa de poder se hospedar em C° no PM, passando a ter como possibilidades apenas ∑° e I°. Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. pertinentes à análise morfo-sintática da língua. No final do processo de construção do Corpus, cada um dos textos, representados por aproximadamente cinqüenta mil (50.000) palavras cada, deverá estar disponível em três formatos: 1 - ortograficamente transcritos: Senhor: Ofereço a Vossa Majestade as Reflexões sobre a vaidade dos homens 2 - morfologicamente etiquetados: Senhor/NPR :/. Ofereço/VB-P a/P Vossa/PRO$-F Majestade/NPR as/D-F-Reflexões/NPR-P sobre/P a/D-F vaidade/N dos/P+D-P homens/N-P 3 - sintaticamente anotados: (IP-MAT (NP-SBJ *pro*) (NP-VOC (NPR Senhor)) (. :) (VB-P Ofereço) (PP (P a) (NP (PRO$-F Vossa) (NPR Majestade))) (NP-ACC (D-F-P as) (NPR-P Reflexões) (PP (P sobre) (NP (D-F a) (N vaidade) (PP (P+D-P dos) (NP (N-P homens)))))) O sistema de anotação sintática é uma árvore que pode ser visualizada sob a forma de parênteses etiquetados, como no exemplo acima, ou no formato arbóreo quando visualizada no Corpus Draw. 4 – Figura do corpus draw abaixo. Sentença: Isto é o mesmo que oferecer em um pequeno livro aquilo de que o mundo todo se compõe, e que só Vossa Majestade não tem: feliz indigência, e que só em Vossa Majestade se acha. (AIRES-A_001,03.8)16 16 As sentenças são identificada com: o nome do arquivo – Aires-A_001, o número da página – 03, o número da sentença - 08. 16 Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 17 Uma sentença declarativa é codificada como um IP-MAT (um “IP matriz”) ao passo que uma subordinada é codificada como um CP, que seleciona um IP-SUB (um “IP-subordinado”). Todos os sintagmas são diretamente ligados ao nó raiz: o sujeito (NP-SBJ), o verbo (SR-P), e o objeto direto (NPACC) no caso representado na figura do Corpus Draw17. http://www.ime.usp.br/~tycho/corpus/manual/index.html As relações entre os nós da árvore são de dois tipos: dominância e precedência. Na figura acima, o IP-MAT domina imediatamente os nós NP-SBJ, SR-P e NP-ACC. O nó NP-SBJ precede imediatamente TR-P, e precede não imediatamente o NP-ACC . As buscas são feitas com base nestas relações. Para estudar, por exemplo, o fronteamento dos NPs acusativos em sentenças subordinadas deve-se escrever um comando de busca do tipo: define: port.def print_indices: t node: IP* query: (IP-SUB iDoms NP-ACC) AND (IP-SUB iDoms tns_vb) AND (NP-ACC iPrecedes tns_vb) AND (NP-ACC iDoms !\**|SE|CL) Que se traduz: IP-SUB domina imediatamente NP-AC, e também o verbo finito (VB|TR|ET|HV|SR-*). NPACC precede imediatamente verbo finito, e não domina imediatamente categoria vazia ou clítico. 17 Simplificação em relação à teoria X’, ramificações não binárias, ausência de projeção de VP e outros módulos da teoria. A anotação sintática não deve, nem pretende, seguir as tendências de análise mais recentes dentro de determinada Teoria lingüística. A intenção em apresentar um corpus anotado sintaticamente é disponibilizar um maior número possível de estruturas a serem recuperadas automaticamente, e não apresentar uma análise de dados. Por isso, se fez necessário estabelecer critérios sistemáticos de anotação sintática, disponíveis no manual em: http://www.ime.usp.br/~tycho/corpus/manual/syntax.html. Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 18 Tal comando permite que se encontrem todas as sentenças com a ordem ‘Objeto Direto-Verbo’ em sentenças encaixadas. Os dados são salvos automaticamente em um arquivo de saída. O arquivo contém um cabeçalho com informações sobre a data e o texto em que foi feita a busca; bem como sobre a ferramenta utilizada – o CorpusSearch e a formulação da busca. Os dados são impressos logo após o cabeçalho da seguinte forma: 1) a sentença sem anotação; 2) informação sobre o(s) dado(s) considerado(s) naquela sentença, no exemplo apresentado no quadro abaixo: na sentença que possui um IP-SUB de número 41, o NP acusativo considerado é o de número 42 e o verbo - 45 (os números são atribuídos automaticamente pela ferramenta para a identificação do dado). 3) a sentença anotada. porque os erros facilmente se desculpam em favor de um morto; se bem que pouco vale um livro, quando para merecer algum sufrágio, necessita que primeiro morra o seu Autor; (AIRES-A_001,09.101) *~/ /* 41 IP-SUB: 41 IP-SUB, 42 NP-ACC, 45 VB-P, 43 Q */ ( (41 IP-SUB (42 NP-ACC (43 Q pouco)) (45 VB-P vale) (47 NP-SBJ (48 D-UM um) (50 N livro)) (52 , ,) (54 CP-ADV (55 WADV quando) (57 IP-SUB (58 NP-SBJ *pro*) (60 PP (61 P para) (63 IP-INF (64 VB merecer) (66 NP-ACC (67 Q algum) (69 N sufrágio)))) (71 , ,) (73 VB-P necessita) (75 CP-THT (76 C que) (78 IP-SUB (79 ADVP (80 ADJ primeiro)) (82 VB-SP morra) (84 NP-SBJ (85 D o) (87 PRO$ seu) (89 NPR Autor))))))) (93 ID AIRES-A_001,09.101)) /~* No final do arquivo de saída a busca trás automaticamente a quantificação hits/tokens/total – onde hits é o número de dados / tokens é o número de sentenças que contém dados / e total é o total de sentenças do(s) texto(s). SUMMARY: source files, hits/tokens/total ..\port\aires.psd 12/12/4498 whole search, hits/tokens/total 12/12/4498 Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 19 Esta busca pode ser ampliada, por exemplo, com buscas que prevêem todo o tipo de oração, ou qualquer constituinte fronteado. Ou ainda pode ser sofisticada, por exemplo, considerando a posição do sujeito ou seu estatuto nulo, ou ainda a posição do verbo, se segue ou precede imediatamente o elemento em foco. Para que esta metodologia de busca automática atinja uma grande quantidade de textos, ampliando assim as possibilidades de investigações, e trazendo um produto de grande interesse para a comunidade científica, pretendemos contribuir para a disponibilização dos textos do corpus Tycho Brahe anotados sintaticamente. E, desta forma tornando possível a investigação que propomos neste projeto de pesquisa, com a busca das sentenças depensentes finitas (com e sem clíticos) que contenham elementos fronteáveis, e o mapeamento das freqüências do fronteamento nos treze textos do Corpus Tycho Brahe, ponderando a posição do sujeito e do verbo, e as sentenças com sujeito nulo. Nosso trabalho consistirá, portanto, em duas tarefas centrais: 1) A correção da anotação sintática de dois terços dos vinte textos previstos pelo projeto temático para serem disponibilizados para pesquisa nos dois próximos anos (o que equivale a treze textos), usando a ferramenta Corpus Draw. 2) A análise dos dados de variação X-V/V-X levantados http://corpussearch.sourceforge.net/CS-manual/QueryLanguage.html) com Corpus para fundamentar Search a hipótese apresentada na seção II. IV. PLANO DE TRABALHO E CRONOGRAMA DE SUA EXECUÇÃO Ano 1: 01 de junho de 2008 a 30 de maio de 2009 Correção da anotação de cinco textos e início da criação das buscas e do levantamento de dados. Nesta primeira etapa focalizaremos os textos dos séculos 16 e 17 por serem bastante representativos da gramática média refletindo uma fase de estabilidade desta gramática nos textos. 1) Luís de Sousa (1556) 2) Francisco Rodrigues Lobo (1579) 3) Antônio Vieira (1608) cartas 4) Antonio Vieira (1608) Sermões 5) Antônio das Chagas (1631) A divisão quantitativa dos textos parte do pressuposto de que o analisador automático ainda não foi suficientemente treinado para produzir uma anotação satisfatória e com isso a correção levará mais tempo neste primeiro ano. Depois da correção de cada texto será feito o levantamento dos dados. Desta forma investiremos em uma dinâmica que enriquece as tarefas de correção e busca. Pois as experiências com a Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. implementação das buscas podem contribuir na estabilização da anotação, bem como trazer saídas para eventuais lacunas no sistema de anotação proposto. Também a experiência da correção da anotação promove uma intimidade com o sistema que potencializa o poder da busca e a análise dos dados. Cabe a esta etapa a análise do fenômeno do fronteamento em associação com a sintaxe da colocação pronominal átona e o fenômeno da interpolação nos cinco textos anotados. Também faremos a redação do relatório parcial. Ano 2: 01 junho de 2009 a 30 de maio de 2010 Correção e análise dos dados dos oito textos restantes. 1) Cavaleiro de Oliveira (1702) cartas 2) Antonio da Costa (1714) 3) Ramalho Ortigão (1836) 4) Diogo do Couto (1542) 5) Francisco de Holanda (1517) 6) Pedro de Magalhães Gandavo (150? -1579) 7) Duarte Galvão (1435 – 1517) 8) Fernão Lopes (1380 – 1460) Nesta fase focalizaremos a análise do fenômeno do fronteamento em associação com a sintaxe da colocação pronominal átona e o fenômeno da interpolação investigado na tese de doutorado. Redação do relatório final, com a apresentação e interpretação de todos os dados. REFERÊNCIAS BARBOSA, P. (1996). Clitic placement in European Portuguese and the position of subjects. In Aaron Halpern & Arnold Zwicky (eds). Approachingh Second: Second position clitics and related phenoena. Stanford, California: CSLI Publications. 1-40. CARDEIRA, Esperança. (2005). Entre o Português Antigo e o Português Clássico. Imprensa Nacional Casa da Moeda. Lisboa. CHOMSKY, Noam. (1979). Principles and parameters in linguistic theory. MIT. CHOMSKY, Noam. (1993). “Minimalist program for linguistic inquiry”. In HALLE, K. & CHOMSKY, Noam. (1995). The Minimalist Program. Cambridge (MA). MIT Press. COSTA, João & DUARTE, Inês (2002): “Preverbal subjects in null subjects languages are not necessarily dislocated”. Em: Journal of Portuguese Linguistic, 1, 159-175. COSTA, João, e MARTINS, Ana Maria (2004). “What is strong functional head?”. Lisbon: Whorkshop on Alternative Views on the Functional Domain. 20 Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. 21 COSTA, João. & Charlotte. GALVES (2002). “External subjects in two varieties of Portuguese. Evidence for a nonunifiede analysis”. Em: Claire Beyssade, Reineke Bok-Bennema, Frank Drijkoningen, Paola Monachesi (eds). Proceedings of going Romance 2000, Amsterdam/Philadelphia: Jhon Beijamins. EIDE, Kristine (2002): “A noção de tópico e a ordem de palavras no português do século XVI”, Em: Romansk Fórum Nr. 16 – 2002/2. XV Skandinaviske romanistkongress. Oslo 12.-17. August 2002. EMBICK, D. E Noyer, R. (2001). "Movement operations after syntax". Em: Linguistic Inquiry. 32: 4, 555-595 FIÉIS, Maria. Alexandra Jesus. (2001) “Interpolação em Português Medieval como adjunção a XP”. Em: Actas do XVI - Encontro Nacional da Associação Portuguesa de Linguística, Lisboa, APL, 197-211. GALVES, Charlotte (1996). “Colocação de clíticos e mudança gramatical no português europeu”. Comunicação no 12° Encontro da Associação Portuguesa de Linguística, Braga, Portugal. GALVES, Charlotte. (1998) Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística. UNICAMP CAMPINAS. (Projeto de pesquisa FAPESP) GALVES, Charlotte (2001). Ensaios sobre as gramáticas do português. Editora da Unicamp. Campinas-SP GALVES, Charlotte. (2004) Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística – Fase II. UNICAMP CAMPINAS. (Projeto de pesquisa FAPESP) GALVES, Charlotte, BRITTO, Helena e PAIXÃO DE SOUSA, Maria Clara (2005) – “Clitic Placement in Europena Portuguese: Results from the Tycho Brahe Corpus”. Em: Journal of Portuguese Linguistics, Vol 4 , n.1, Special Issue on variation and change in the Iberian languages: the Peninsula and beyond. GALVES, Charlotte, Cristiane NAMIUTI e Maria Clara PAIXÃO DE SOUSA, (2006) – “Novas perspectivas para antigas questões: revisitando a periodização da língua portuguesa”. Em: Grammatische Structuren des Europäischen Portugiesisch. Annette Endruschat / Rolf Kemmler / Bárbara Schäfer-PrieB (Hrsg). Turbigen: Calapinus Verlag, págs 45-75. GIBRAIL, Alba Verôna Brito. (em andamento). “Formas de Manifestações de Estruturas de Tópico do Português Clássico: Mudança de Comportamento Sintático na Diacronia”. Apresentação no workshop do projeto temáticoI Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística - IEL/UNICAMP. Agosto, 2007. HALLE, M. E MARANTZ, M. (1993): “Distributed Morphologie and the pieces of inflection”. Em: Halle, K. e Keyser. J. (eds.) View from the Building 20: Essays in Linguistics in honor of Sylvain Bromberger. Cambridge, MA, MIT Press. KROCH, Anthony. (1989). "Reflexes of grammar in patterns of language change". Em: Language Variation and Change. p. 199-244. Cambridge University Press. KROCH, Anthony. (1994). "Morphosyntactic Variation." In: Beals et al., (eds.), Proceedings of the Thirtieth Annual Meeting of the Chicago Linguistic Society, vol. 2, pp. 180—201. KROCH, Anthony. (2003). "Mudança sintática". http://www.ling.upenn.edu/ kroch. Traduzido por Silvia Cavalcante. LAKA, I. (1990). Negation in Syntax: On the Nature of Functional Categories and Projections. Ph. D. Dissertation. Cambredge, Massachussets: MIT. MAGRO, Catarina (2007). Clíticos: Variações sobre o tema. Tese de Doutoramento, Universidade de Lisboa. MARTINS, Ana Maria (1994) – Clíticos na história do português. Tese de Doutoramento, Universidade de Lisboa. Mimeo. MARTINS, Ana Maria (1997) – “Mudança Sintática. Clíticos, negação e um pouquinho de Scrambling”. Em: Estudos Lingüísticos e Literários,. nº 19, Salvador: Programa de Pós Graduação da Universidade Federal da Bahia. MARTINS, Ana Maria (2000): “Polarity Items in Romance: Underspecification and Lexical Change.” Em: Diachronic Syntax: Models and Mechanisms. Orgs. Pintzuk, Susan, George Tsoulas e Anthony Warnes. Oxford University Press. MARTINS, Ana Maria. (2002). "Mudança Sintática e História da Língua Portuguesa". Em: História da Língua e História da Gramática. Actas do Encontro. Colecção Poliedro 11. Universidade do Minho. Centro de Estudos Humanísticos. Braga 2002. MARTINS, Ana Maria. (2005). “Clitic Placement, VP-Ellipsis and Scrambling in Romance”. Em: Batilbori, Montse, Maria Lhuïsa Hermanz, Carme Picallo, e F. Roca (eds.) Gramaticalization and Parametric Variation. Oxford University Press. MATTOS E SILVA, Rosa Virginia (1989). Estruturas trecentistas: Elementos para uma gramática do português arcaico. Lisboa: Imprensa Nacional Casa da Moeda. Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados. MATTOS E SILVA, Rosa Virginia (1992). Para uma caracterização do período arcaico do português. Mimeo. NAMIUTI, Cristiane (2008). "Aspectos da história gramatical do português. Interpolação, negação e mudança". Tese de Doutorado. IEL/UNICAMP. Campinas, SP. NOYER, R (2004): “Distributed Morphology”. http://www.ling.upenn.edu/~rnoyer/dm/ PAIXÃO DE SOUSA, Maria Clara (2004) – Língua Barroca: sintaxe e história do português nos 1600. Tese de Doutoramento. Instituto de Estudos da Linguagem. Universidade Estadual de Campinas. Campinas-SP PAIXÃO DE SOUSA, Maria Clara (2005). Memórias do Texto. Revista Texto Digital, ISSN 1807-9288, ano 2 n.1 2006.<http://www.textodigital.ufsc.br/num02/paixao.htm> PARCERO, Lúcia. (1999). Fronteamentos de constituintes no português dos séculos XV, XVI e XVII. Dissertação de Mestrado, UFBa, Salvador-Ba. RAPOSO, Eduardo Paiva (1994): Afectives operators and clausal structure in European Portuguese and European Spenish. Versão inédita. RAPOSO, Eduardo Paiva. (2000). "Clitic positions and Verb movement". Portuguese Syntax: New RIBEIRO, Ilza (1995) A sintaxe da ordem do português arcaico: o efeito V2. Tese de Doutoramento, Instituto de Estudos da Linguagem, Universidade Estadual de Campinas. RIBEIRO, Ilza. (1996). "Questões sobre a ordem dos constituintes no português arcaico e no português clássico". Em: Boletim ABRALIN Nº 17. RIVERO, María Luisa. (1994). “Negation, imperatives and Wackernagel effects”. In: Revista di Linguistica. RIVERO, María Luisa. (1997). “On two locations for complement clitic pronouns: Serbo-Croatian, Bulgarian and Old Spanish”. In: Parameters of morphosyntatic change. Ans Van Kemenade and Migel Vicenti (eds.). Cambridge University Press. Págs. 170-206. TORRES MORAES, Maria Aparecida, (1995) – Do português clássico ao português moderno: um estudo da cliticização e do movimento do verbo. Tese de Doutoramento, Instituto de Estudos da Linguagem, Universidade Estadual de Campinas. 22