abrir PDF - IME-USP

Propaganda
Textos e Gramáticas.
O fronteamento de constituintes no corpus Tycho Brahe:
à procura do Português Médio em textos sintaticamente
anotados.
Projeto de Pós Doutorado
Cristiane NAMIUTI Temponi (IEL/UNICAMP)
Supervisora: Charlotte Marie Chambelland GALVES (IEL/UNICAMP)
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
RESUMO
Este projeto de pesquisa insere-se no âmbito do projeto temático Padrões Rítmicos, Fixação de
Parâmetros e Mudança Lingüística – Fase II (FAPESP: 04/03643-0) e tem como objetivo mapear a
sintaxe de textos históricos a fim de trazer mais subsídios para descrever e entender a gramática média do
português e as mudanças que pontuaram na história da língua. As reflexões, bem como a metodologia de
classificação e a análise de dados terão como pano de fundo o quadro teórico de Princípios e Parâmetros
da Gramática Gerativa (cf. Chomsky, 1995).
Já avançamos na questão gramatical trazendo fatos importantes que corroboram a hipótese de
Galves (1996, 1998, 2001, 2004) de ter havido um estágio gramatical intermediário entre o Português
Arcaico (PA) e o Português Europeu Contemporâneo (PE). De posse dos resultados sobre a interpolação
obtidos na minha tese de doutoramento (Namiuti, 2008) somados aos resultados de Galves, Britto &
Paixão de Sousa (2005) sobre a ênclise e a próclise e os de Paixão de Sousa (2004) sobre a posição do
sujeito, sustenta-se a hipótese de uma gramática intermediária PA - PE. Atestamos (Cf. Namiuti, 2008)
que a interpolação dos constituintes do VP, bastante produtiva nas orações dependentes do português
arcaico, desaparece da produção literária no século 16, e a não adjacência entre o complementador e o
clítico se torna mais comum: a ordem ‘complementador-clítico-XP-(neg)1-verbo’ abre espaço para a
ordem ‘complementador-XP-clítico-(neg)-verbo’. Neste mesmo século encontramos um padrão proclítico
nas orações não dependentes afirmativas, e ainda, a interpolação da negação ganha novos contextos
(‘não’ passa a ser interpolado em ambientes tradicionalmente considerados de variação ‘clV’ / ‘Vcl’).
Interpretamos estes fatos como o reflexo da mudança no domínio de hospedagem do clítico, que deixa de
poder subir até o núcleo mais alto da estrutura da frase (C°) e passa a se relacionar exclusivamente com o
complexo verbal (em ∑°, nas orações raízes e em I°, nas orações dependentes).
Alguns trabalhos importantes, como o de Martins (1997, 2005), também Parcero (1999), propõem
que a estabilização da ordem em Português resulta de uma mudança que relaciona a perda do fenômeno
da interpolação com a perda do fronteamento dos constituintes do Sintagma Verbal para a esquerda do
verbo. No entanto, os resultados obtidos na tese de doutorado (Namiuti, 2008) nos levam a propor o
contrário: a perda da possibilidade do fronteamento não é a razão para o desaparecimento do fenômeno
da interpolação, uma vez que constatamos que este último já é obsoleto no século 16, enquanto o
primeiro parece ser ainda bastante produtivo até o século 18 (cf. Paixão de Sousa 2004). Este projeto de
pesquisa almeja comprovar empiricamente que a permanência da possibilidade do fronteamento, somada
à mudança no domínio do clítico é que faz prevalecer a próclise sobre a ênclise nas orações raízes ‘XV’
nos textos dos séculos 16 e 17, e ainda, surgir novas possibilidades para a interpolação da negação.
O nosso objetivo será, portanto, fazer uma nova investigação sobre o fronteamento dos
constituintes no período gramatical chamado por Galves (2004) de Português Médio e comprovar a
hipótese deste fenômeno estar diretamente ligado a sintaxe dos clíticos nesta época. Para tanto
contraporemos as orações com fronteamento às orações em que os sintagmas permanecem em posição
1
Parênteses indicam opcionalidade
1
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
pós-verbal (com e sem clíticos) presentes nos textos de autores nascidos entre o século 15 e o 18. Para
que esse estudo possa ser realizado numa base empírica suficiente e confiável, trabalharemos com textos
do Corpus Tycho Brahe sintaticamente anotados, e participaremos dessa anotação, corrigindo o output
do anotador automático (parser).
I. INTRODUÇÃO
Na perspectiva gerativista, o conceito de Gramática remete à possibilidade de se gerarem as estruturas, e
não ao inventário de estruturas. Essas possibilidades são limitadas pela “Gramática Universal”, que faz
parte das faculdades inatas do ser humano. A Gramática Universal oferece “princípios” imutáveis e
“parâmetros” que podem ser especificados (ou “fixados”) diferentemente em gramáticas particulares –
determinando, assim, os limites de variação entre as gramáticas (Chomsky e Lasnik 1993). Cada
gramática, neste sentido, representa uma determinada parametrização dos princípios da Gramática
Universal. Portanto, a gramática na teoria gerativa, será uma entidade individual. As gramáticas
individuais emergem nos falantes a partir da interação entre os princípios da Gramática Universal (ou
seja, inatos) e a experiência lingüística de cada falante (ou seja, os dados a que está exposto na fase de
aquisição, produzidos pela geração anterior).
Desse ponto de vista, a mudança gramatical é uma função da relação entre a capacidade inata e a
experiência lingüística vivenciada pelas sucessivas gerações de falantes. Neste quadro, a gramática é um
objeto teórico, enquanto os dados de língua são um objeto empírico a ser interpretado. Portanto, ao
levantar hipóteses sobre gramáticas, os estudos gerativistas buscam interpretar teoricamente os dados da
língua.
Os dados documentados relativos a mudanças apresentam-se, tipicamente, como dados de variação
entre formas antigas e formas novas nos textos. Note-se, entretanto, que quando se admite que a mudança
de uma gramática para outra envolve a fixação (ou “marcação”) diferente dos parâmetros via aquisição da
linguagem pela criança, esta mudança deverá ser conceituada, por necessidade teórica, como um evento
abrupto.
Temos então um aparente paradoxo: a mudança gramatical, em tese um evento abrupto, manifestase nos dados como um evento de variação gradual. Assim, a interpretação dos dados históricos num
estudo de mudança gramatical precisa contar com um quadro metodológico que permita abordar o
problema da variação diacrônica.
Em nosso estudo, partimos do quadro delineado a partir de Kroch (1989), que salienta que a
variação nos textos não se deve confundir com variação nas gramáticas. Ou seja: as mudanças nas
línguas, instanciadas nos documentos históricos como variação gradual, são reflexos de mudanças
gramaticais que devem ocorrer de modo abrupto. Nos casos de mudança gramatical, a variação entre
formas antigas e novas na linha do tempo não pode ser conceituada como uma “oscilação” produzida por
uma única gramática particular. Ao contrário, cada forma parece corresponder a diferentes fixações de um
parâmetro. Nestes casos, a variação nos textos pode ser compreendida como fruto da convivência, no
2
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
3
plano do uso, de formas geradas por diferentes gramáticas. É o que Kroch (1994) chama de “Competição
de Gramáticas”, processo no qual as formas antigas são gradualmente expulsas do uso pelas formas
inovadoras.
No que concerne especificamente o problema da identificação de etapas gramaticais, ou a
periodização, a contribuição central do conceito de Competição de Gramáticas é a idéia de que a
emergência de uma nova gramática será identificada pelo surgimento de formas novas nos dados. (Cf.
Galves, Paixão de Sousa e Namiuti, 2006).
Os estudos pioneiros sobre a diacronia do português no quadro gerativista (cf. Martins 1994; Torres
Morais, 1995; Ribeiro, 1996 entre outros) levaram em conta a periodização delineada pela tradição, que,
de forma geral, divide a história da língua em três grandes ciclos – o Português Arcaico, o Português
Clássico, e o Português Europeu Moderno. Entretanto costumam considerar apenas dois períodos
gramaticais – a gramática antiga e a gramática moderna. Esta hipótese de duas fases gramaticais é em
parte o resultado do fato de que a história do português carecia de estudos aprofundados que focalizassem
os períodos posteriores ao século 16, uma vez que esse século é considerado como o marco inicial das
línguas modernas (cf. Mattos e Silva 1992 para uma síntese dos estudos sobre periodização do português).
No caso da língua portuguesa, essa concepção mostrou-se particularmente inadequada, porque,
como argumenta Galves (2004), além do surgimento posterior do português brasileiro, o próprio
português europeu sofre mudanças notáveis depois do séc. 16.
Com os estudos baseados no Corpus Tycho Brahe2, que reúne textos de autores portugueses
nascidos entre 1380 e 1845, é possível defender a existência de três Gramáticas, ou seja, dois estágios
gramaticais anteriores ao Português Europeu Moderno.
Nossa presente proposta consiste em mapear a sintaxe dos textos históricos, focalizando o
fronteamento de constituintes nas sentenças, a fim de descrever a sintaxe do Português Médio e
(re)afirmar as hipóteses lançadas no âmbito do projeto temático. Para isto trabalharemos para a
disponibilização da versão sintaticamente anotada dos textos do Corpus do Português Histórico Tycho
Brahe. Nesta empreita, corrigiremos os textos anotados automaticamente pelo parser, desenvolvido por
Daniel Bikel na Universidade da Pensilvânia, com o auxílio da ferramenta de correção das etiquetas
sintáticas - Corpus Draw3.
Nas seções seguintes apresentaremos o estado da arte com relação aos avanços nas pesquisas sobre
as gramáticas do Português, sobretudo no que diz respeito à questão do fenômeno da interpolação e o
2
No âmbito do Projeto Temático Padrões Rítmicos Fixação de Parâmetros e Mudança Lingüística. Projeto
financiado pela FAPESP (98/3382-0 e 04/03643-0) e desenvolvido no Instituto de Estudos da Linguagem (IELUNICAMP), sob a coordenação da Professora Doutora Charlotte Marie Chambelland Galves. O projeto tem como
quadro teórico o modelo de Princípios e Parâmetros e utiliza, para modelar o estudo da mudança lingüística, o
ferramental teórico que vem sendo desenvolvido por A. Kroch e colaboradores. Trata-se de um projeto eminentemente
pluridisciplinar, exigindo competências variadas. Assim a equipe executora é formada por sintaticistas, fonólogos,
foneticistas, especialistas em história do português, físicos-estatísticos, probabilistas, estatísticos e cientistas da
computação.
3
Corpus Draw é uma ferramenta de edição/correção de textos anotados sintaticamente desenvolvida na Universidade
da Pensilvânia. Tal ferramenta faz parte do pacote Corpus Search. http://corpussearch.sourceforge.net/
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
Português Médio. Também falaremos do corpus Tycho Brahe e do empreendimento tecnológico ligado à
sua construção. E, finalmente, apresentaremos nosso plano de trabalho.
II. O FENÔMENO DA INTERPOLAÇÃO E A QUESTÃO GRAMATICAL.
Dois aspectos da sintaxe dos clíticos pronominais se destacam pelas alterações de padrão na diacronia do
português: as ordens relativas clítico-verbo ~ verbo-clítico e a interpolação.
Em orações subordinadas, finitas, e em orações principais introduzidas por operadores, os clíticos
são sempre pré-verbais no português. No entanto, nestas configurações há variação entre a adjacência
clítico-verbo e a interpolação nos textos dos séculos 13 a 16. Idênticos constituintes frásicos podem
ocorrer ora à esquerda da seqüência clítico-verbo, ora interpolados entre o clítico e o verbo.
(01) como se nesta carta contem (NO, 1538. Martins 1994)
(02) como nesta carta se contem (Lx, 1532. Martins 1994)
A interpolação é, portanto, a construção na qual o clítico pronominal não se apresenta contíguo ao verbo –
ou noutros termos, na qual um outro constituinte sintático se interpola entre o pronome e o verbo. Tratase de uma construção característica dos textos mais antigos do português (bem como do romance ibérico
em geral, cf. Rivero, 1994, 1997, Martins 1994, 1997, 2002, entre outros) e que se torna obsoleta nos
autores nascidos no século 16 (cf. Namiuti, 2008).
A interpolação da negação, porém, continuou a ser registrada e é ainda atestada no português
europeu moderno (cf., entre outros, Martins, 1994, Mira Mateus et alli, 2003, Magro 2007, Namiuti,
2008).
Os estudos sobre a colocação pronominal na diacronia do português (cf. entre outros, Martins 1994,
Parcero 1999 e Fiéis 2001) demonstraram que a interpolação dos diversos elementos do sintagma verbal
era freqüente até o século 16 e restrita aos contextos de próclise obrigatória.
Considero (cf. Namiuti, 2008) que os fatos relativos à interpolação são importantes para
compreendermos a mudança que remonta ao séc. 14, se considerarmos a afirmação de Cardeira (2005)
sobre as formas clássicas já anunciadas na segunda metade desse século, somada à questão teórica da
aquisição e mudança delineada a partir de Kroch (1989). Antes disso, a interpolação de constituintes
generalizados do sintagma verbal é própria das orações dependentes com contigüidade ‘complementadorclítico’. Este fenômeno reflete a preferência do clítico por uma posição adjacente ao complementador ou
à conjunção subordinativa e é característico da gramática arcaica (cf. Matos e Silva 1998, entre outros).
Na fronteira entre os séculos 15 e 16, quando a próclise passa a ser predominante também nas
orações não dependentes, constatei (Namiuti, 2008) o surgimento de novos contextos de interpolação da
negação que passa a ocorrer interpolada também nos domínios tradicionalmente considerados de variação
4
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
5
entre ênclise e próclise - ‘clV’/’Vcl’4 (orações raízes - introduzidas por sujeito, um sintagma
preposicional, um sintagma adverbial, uma oração anteposta, ou ainda por conjunção copulativa; e
infinitivas introduzidas por preposições que não condicionavam a próclise categórica, como a preposição
‘em’).
(03)
“E, pelo ElRei Dom João o III querer casar, e êle não querer, lhe não deram satisfação de seus serviços ...”
(Couto-1548) (cf.
(04)
Namiuti, 2008)
“E sintido do mal, que o fizera com ele a infirmidade em o não enterrar,” (Sousa – 1556). (cf.
Namiuti,
2008)
As primeiras ocorrências de interpolação da negação encontradas em contextos de variação clV/Vcl
foram atestadas por Martins (1994) no final do século 15. Esta diferente possibilidade de interpolar a
negação mostrou-se freqüente nos textos do corpus Tycho Brahe e identificou-se como um grupo coeso
(cf. Namiuti, 2008).
Nas orações dependentes, identifiquei, no século 16, que a queda na freqüência da interpolação
generalizada (de elementos diferentes da negação) segue o aumento da não-contigüidade
‘complementador-clítico’ nas sentenças negativas com clítico-neg-verbo.
(05) “e certo que se lhe ElRei não mandára sucessor” (CTB: Couto-1548)5 (Cf. Namiuti, 2008)
(06) “que até o Prior dos Agostinhos, seu Confessor, o não pôde sofrer” (CTB: Couto-1548) (Cf. Namiuti, 2008)
Logo em seguida na linha do tempo vemos o completo desaparecimento do fenômeno da interpolação
generalizada nos textos. (Remeto a Namiuti, 2008).
O gráfico abaixo, retirado da tese (Namiuti, 2008: 52, gráfico I.8)6, reúne algumas opções de
ordenação relevantes para entendermos e localizarmos as gramáticas e sua evolução no tempo: 1) a
4
No português e espanhol dos séculos 13 a 16, em orações principais afirmativas não introduzidas por operadores os
clíticos podem ocorrer quer em posição pré-verbal, quer em posição pós-verbal. Esta variação acontece quando o verbo
não está em posição inicial e é precedido ou do sujeito, ou, de um sintagma preposicional, um sintagma adverbial, uma
oração anteposta, ou ainda da conjunção copulativa e. Em todos os casos o clítico apresenta-se necessariamente
adjacente ao verbo.
(1) E a donzela foi-se e deo agoa à rainha (Pr. Livro de Linhagens. Piel & Mattoso 1980:23. Apud Martins 2002:263)
(2) E a donzela lhe disse entom que achara um mouro doente (Pr. Livro de Linhagens. Piel & Mattoso 1980:28. Apud Martins 2002: 263)
Os fatos relativos à variação ênclises versus próclises também são importantes para compreendermos a gramática
média. Paixão de Sousa (2004), bem como Galves e Paixão de Sousa (2005) consideram que a alternância Vcl vs. clV
nos textos representativos dos anos 1500 e 1600, corresponde a uma alternância possibilitada por uma mesma gramática
(a gramática do PM). Nos textos representativos dos anos 1700 e 1800, a variação é o efeito de uma competição de
gramáticas (no sentido de Kroch 1994, 2001), que por sua vez evidencia a emergência da gramática do PE.
5
Apesar de Diogo do Couto ter nascido em 1548 atestamos algumas interpolações do tipo Arcaico (C-cl-X-negV) no
seu texto, porém são marginais em relação à estrutura sem a interpolação de elementos diferentes de ‘não’ (C-X-clnegV).
6
A tese ‘Aspectos da história gramatical do português. Interpolação, negação e mudança.’ (Namiuti, 2008) encontra-se em :
http://www.ime.usp.br/~tycho/participants/namiuti/index.html
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
6
interpolação generalizada vs adjacência ‘clV’ (exemplos 01 e 02); 2) a adjacência entre o
‘complementizador’ e o ‘clítico’ nas sentenças com interpolação da negação (C-cl-X-negV vs. C-XclnegV: exemplos 05 e 06); e ainda, 3) a freqüência de ênclise sobre próclise nas orações matrizes XVerbo. A ênclise dá lugar à próclise nas orações raízes e a seqüência ‘C-cl-X-negV’ dá lugar à ‘C-X-clnegV’ nas orações encaixadas exatamente na mesma época (queda da ênclise e de ‘C-cl-X-neg-V’ nos
textos produzidos no século 15). E ainda, atesta-se a emergência de um novo padrão, nos textos editados
no final do século 18, com uma progressiva subida de freqüência da ênclise nas orações matrizes, porém
sem correlação com o fenômeno da interpolação de elementos diferentes da negação, pois este desaparece
por completo muito antes.
Interpretei estes fatos como evidência da emergência de uma nova gramática em textos anteriores
ao século 16, em conformidade ao que Galves (2004) afirma sobre o português médio (PM).
Gráfico I: Três conjuntos de dados e três padrões diferentes. (Namiuti, 2008:52)
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
1275 1325 1375 1425 1475 1525 1575 1625 1675 1725 1775 1825 1875 1925
Interpolação de elementos diferentes da negação/adjacência 'cl-V' (Martins 1994, Parcero 1999 e CTB)
C-cl-X-negV vs.C-X-cl-negV (Martins 1994 e CTB)
Ênclise vs Próclise em orações raízes XV (Martins 1994, Ribeiro 1995 e CTB)
Seguindo a proposta delineada por Kroch (1994, 2003), a interpolação de elementos diferentes da
negação ainda atestada nos textos quinhentistas deve ser interpretada como variação no uso de formas em
competição, uma vez que novos padrões de ordenação já foram indiciados nesta época.
Propomos na tese de doutorado, dentro do quadro teórico da Morfologia Distribuída (MD) (cf.
Embick e Noyer 2001, entre outros) que os pronomes clíticos no PA podem se mover na sintaxe para
esquerda do núcleo mais alto da oração, C°7, e que seguem deslocamento local sofrendo assim a inversão
prosódica com seu hospedeiro. Desse ponto de vista, a interpolação de constituintes na gramática arcaica
(GA) deriva da inversão prosódica mantendo a adjacência C-cl. E é também por este motivo que temos a
7
A teoria da gramática gerativa, adotando a representação X', além das projeções lexicais propõe que o ‘dicionário
mental’ contém também projeções funcionais. Os núcleos funcionais têm função eminentemente gramatical. A flexão
verbal constitui uma categoria funcional que a teoria convencionou chamar de IP (sigla vinda do inglês para ‘sintagma
flexional’ - inflection phrase). INFLº ou I° é o núcleo do sintagma da flexão verbal, IP. Além da flexão verbal, outra
projeção funcional essencial na teoria é a projeção que traduz a subordinação – CP (complementizer phrase). C° é o
núcleo desta projeção funcional.
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
7
predominância da ênclise em orações XV no PA. Para corroborar esta proposta, lembramos que o PA
permitia a assimilação entre consoantes finais de complementadores e quantificadores e a líquida que
constitui o primeiro segmento do pronome (por as > polas, pulas, poila ...), apontados por Barbosa
(1996)
Quanto à gramática média, esta terá resultado da mudança que veda a possibilidade da interpolação
e dá lugar à próclise nas orações matrizes XV, sendo X interno à estrutura oracional (cf. Galves e Paixão
de Sousa 2005). Tal mudança estará estreitamente relacionada com o domínio de hospedagem do clítico8
que deixa de ser independente do verbo e passa a ser dependente dele. Nesta gramática clítico e verbo
estão incorporados em Σ°9.
Assim, de acordo com a análise que propus em Namiuti (2008), a gramática do português antigo
teria um pronome clítico capaz de se hospedar no núcleo mais alto da estrutura frasal (C°). A estrutura
com interpolação, mantendo o complementizador e o clítico adjacentes, nas orações encaixadas, e a
ênclise, nas orações raízes, (respectivamente exemplos 7 e 8), estariam relacionadas com a
obrigatoriedade da inversão prosódica do clítico a este núcleo.
(07) asy como ho ele na dita procuração há (Lx, 1306; Martins, 1994)
(08) E eu outrossi semelhauilmente obligome ... (Lx: 1291; Martins, 1994)
Entretanto, a subida do clítico para C° nas orações dependentes e do verbo para este núcleo nas orações
raízes não parece ser obrigatória, podendo o clítico e/ou o verbo manterem-se num núcleo mais baixo
derivando a próclise com adjacência ao verbo, e ainda, prevendo casos com interpolação e não adjacência
ao complementizador (respectivamente exemplos 9 e 10).
(09)
e outrossj lhj fica h~uu herdam~eto (Lx, 1311; Martins 1994);
(010) e que sempre a os mosteyros de Anssedj e de Arnoya usarõ e possoyrã (NO, 1285; Martins 1884)
Interpretamos que a não obrigatoriedade do fenômeno sugere seu caráter prosódico.
8
Não podemos propor que a diferença PA-PM em relação aos clíticos está na tipologia periférico/nuclear, pois
assumimos a hipótese de Martins (2003) de que os pronomes clíticos em português sempre foram nucleares. Daí a
possibilidade de intervirem entre a negação e o verbo, e de ocorrerem em mesóclises.
9
Martins (1994) traz as observações de Laka (1990) para o inglês e para o basco, e de Chomsky (1957) para o inglês,
de que existe um paralelismo entre construções negativas e construções afirmativas enfáticas. Em inglês tanto a negação
quanto a afirmação enfática implicam a presença de ‘do’.
(01) Mary didn’t leave
(02) Mary did leave [enfático, acento de intensidade sobre did]
Dada a similaridade de processos sintáticos envolvidos na negação e na afirmação enfática, Laka (1990)
propõe que ambas são instanciações de uma categoria funcional Σ (“Speech Act”).
Martins (1994) propõe que ΣP faz parte da estrutura da frase e está presente não só nas orações enfáticas, mas
em todas as frases, e que a colocação dos clíticos nas línguas românicas depende da natureza desta categoria funcional
Σ, situada na estrutura frásica entre CP e IP: morfologicamente “forte” ou “fraca”; e com ou não conteúdo lexical. E
argumenta em favor desta hipótese mostrando que a ênclise em orações não dependentes, a existência de construções de
VP nulo e a opção por certo padrão de resposta afirmativa (mínima) a interrogativas totais (“tens visto o João?
Tenho/#Sim”) são fenômenos associados entre si, manifestados apenas nas línguas em que Σ tem traços-V fortes.
Σ° é, portanto, o núcleo de polaridade situado acima dos nódulos INFL e presente em todas as orações, ora
instanciado como afirmação, ora como negação, ora como foco.
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
8
Já a gramática do português médio se caracteriza pela perda da propriedade de subida do clítico
e do verbo a C° (o pronome clítico não sobe além de ∑° nesta fase), perdendo assim a possibilidade de
interpolar elementos diferentes da negação. Assumimos que o preenchimento do Spec de ∑P é
incompatível com a ênclise sendo a próclise a ordem das orações raízes XV, abrindo espaço para a
possibilidade da interpolação da negação neste contexto. A ênclise só será licenciada em sentenças
estruturalmente V1, como propõem Galves Britto e Paixão de Sousa (2005).
A mudança para o português europeu moderno terá lugar na reanálise da posição do verbo e dos
constituintes pré-verbais. O verbo em PE não se moverá além de I°, também o clítico ficará neste domínio
junto com o verbo. Spec de ∑P se restringirá aos constituintes afetivos e o sujeito pré-verbal ocupará
Spec de IP.
Consideramos que a questão central para se entender a gramática média é o fato dos constituintes
fronteados estarem deixando de aparecer linearmente entre o clítico e o verbo para aparecer entre o
conectivo e a seqüência linear clítico-verbo entre os séculos 15 e 16. Uma vez que a ordem ‘conectivoXP-cl-V’ parece estabilizar-se no século 16, os dados atestados por Namiuti (2008) devem refletir não
uma mudança de posição dos constituintes fronteados, já que o fronteamento, inclusive de complementos
verbais, continua a ser produtivo até o início do século 1810, mas uma mudança na posição do pronome
clítico. Tal mudança está relacionada ao domínio de hospedagem do clítico (mas não no seu estatuto de
clítico) (cf. Namiuti, 2008).
III. INTERPOLAÇÃO E FRONTEAMENTO.
Com relação ao fronteamento de constituintes no português antigo e clássico, encontramos na literatura a
associação da perda do fronteamento com a perda da interpolação generalizada, tendo a segunda mudança
conseqüência na primeira.
Martins (1997, 2005) mostra que a ordem ‘Objeto-Verbo’ é bastante freqüente no PA, podendo ser o
reflexo do deslocamento à esquerda (left deslocation), do foco identificacional, ou ainda, do scrambling
dentro do domínio de IP. Este terceiro tipo de movimento não é permitido em PE moderno11, e é opcional
no PA, como nos mostram os exemplos abaixo atestados por Martins (2005:182).
(011) Sse pela u~etura uos algu~e a dita v~ya enbargar (Documento notarial, século 13)
(012) Sse pela u~etura uos algu~e enbargar a dita v~ya (Documento notarial, século 13)
A autora propõe que o scrambling de objeto no PA é o movimento para Spec AgrS, e afeta DPs, PPs,
AdvPs (respectivamente: sintagmas determinantes, sintagmas preposicionais, e adverbiais) e orações
reduzidas de infinitivo ou particípio. E ainda ressalta que tal fenômeno não é restrito a apenas um
10
Cf. Paixão de Sousa (2004) e Gibrail (em andamento)
No Português Europeu contemporâneo, a ordenação de constituintes é, normalmente, estruturada obedecendo a um
padrão SVO, em que o verbo é seguido de seus complementos. Algumas exceções a esse padrão são encontradas no PE,
mas, como aponta Martins (2005), os deslocamentos atuais estão mais diretamente relacionados a questões de
focalização ou topicalização dos elementos fronteados, refletindo apenas recursos de ordem discursiva.
11
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
9
constituinte por oração, mas vários constituintes podem ser movidos, e que também é encontrado tanto
em orações com sujeito nulo, quanto com sujeito lexical (como nos exemplos acima).
Segundo Martins (2005), no PA, AgrS teria uma seleção de traços ininterpretáveis (um traço EPP)
com uma propriedade de atrair todo – F (atract-all-F), ou seja todo sintagma com um traço forte. Em sua
análise AgrS permitiria múltiplos Specs e os constituintes movidos por scrambling ocupariam os Specs de
AgrS. A ordem OV deverá, portanto, ser própria das orações encaixadas, já que, de acordo com a
proposta de Martins (2005), nas orações não dependentes do PA, o verbo se move para um núcleo mais
alto que AgrS°. Assim, uma vez que os constituintes movidos por scrambling são os mesmos que podiam
ser interpolados entre o clítico e o verbo, e ainda nos mesmos contextos (orações dependentes), Martins
(2005) correlaciona o desaparecimento da interpolação com à perda desta propriedade de AgrS selecionar
múltiplos Specs.
A anteposição de constituintes do VP ao verbo nos séculos 15, 16 e 17 é também o objeto de
investigação de Parcero (1999). A autora convencionou chamar de fronteamento qualquer deslocamento
de constituintes do VP para uma posição pré-verbal, como nos exemplos abaixo, tirados de sua
dissertação – página 2:
(013) mostrava que muy espantada viera a sua alma das penas (VDS 24-38) 12
(014) dinheiros aos que carregar quiriam (DFR 85-6)
(015) Rogue a Deos por my que apostolo he de Deos (VDS 338-28)
No que diz respeito às estruturas com interpolação, Parcero (1999) entende este fenômeno como um tipo
específico de fronteamento.
O trabalho de Parcero foi pioneiro em investigar o fronteamento e a interpolação de constituintes
concomitantemente e ainda tratar a interpolação como um tipo específico de fronteamento. Esses
fenômenos envolvem, principalmente os constituintes complementos e adjuntos. A princípio, Parcero
verifica que parece não haver restrições sintáticas sobre o tipo de constituinte que pode ser fronteado:
(Parcero 1999:17).
(016) e pode enquerer ... que honrra e estado tinha (DFR 11-279).
(017) Porque por todos daras conta e rrazom a Deos (VDS 21-16).
(018) Sabede que natural cousa he de cada hua cousa demendar (VDS 9-30).
(019) Parecia que em seu coraçam nam jazia o contrário (GRS 1817)
(020) Tudo o que agora tomasse (PRG 30-214).
(021) depois que adubado fosse (DFR 60-321).
12
Parcero (1999) utiliza as iniciais dos textos que constituem o corpus seguidas do número da página ou da carta
(quando se tratar de cartas) e/ou do número da linha em que se encontra o dado diante de cada dado para os identificar.
DFR –Crônica de D. Fernando
VDS – Vida de Santos
GRS –Livro das Obras de Garcia Resende
DCP – Ásia Década Primeira
PRG – Peregrinação
CTS – Cartas Espirituais/Cartas Familiares
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
(022) Nos bees d’aquelles que paguar nom quisessem (DFR 49-321)
Um objeto direto, como em (16); um complemento oblíquo, em (17); um predicativo, em (18); um
adjunto adverbial de lugar, em (19); um adjunto adverbial de tempo, em (20); o particípio passado em
(21) e o infinitivo em (22).
A autora constatou que não há uma diminuição na percentagem de elementos fronteados do século
15 ao 17. Porém, nota que os constituintes complementos deixam de ser fronteados no século 17 enquanto
os adjuntos permanecem sendo fronteados.
Quanto às construções com clíticos, fundamentais para uma análise completa, Parcero (1999) atestou
o fenômeno da interpolação nos mesmos contextos atestados por Martins (1994), contextos de próclise
categórica, preferencialmente em orações encaixadas. Então computou todas as ocorrências de clíticos em
sentenças encaixadas, encontrando três tipos principais de construções: cl-X-V, que corresponde ao
contexto de interpolação, cl-V-X e X-cl-V, que se referem às estruturas de clíticos adjacentes ao verbo.
Estas ordens alternam livremente nos textos.
Parcero (1999) argumenta que as estruturas com o clítico adjacente ao verbo são, no geral, mais
comuns que a interpolação dos constituintes e ainda aumentam sua freqüência no século 16 e 17. A autora
também aponta que as construções ‘cl-X-V’ e ‘cl-suj-V’ desaparecem no século 17, enquanto as
construções ‘X-cl-V’ e ‘suj-cl-V’ aumentam e as construções ‘cl-V-(X)’ e ‘cl-neg-V’ permanecem
estáveis. Entretanto faltam estruturas que deviam ser consideradas para uma interpretação mais exata da
situação. Uma vez que Parcero (1999) considera ‘clítico-negação-verbo’ e as construções ‘Sujeito-verbo’,
deveria também considerar ‘negação-clítico-vervo’ e ‘verbo-Sujeito’. Sem isso, teremos um leque de
variação incompleto para a extração de freqüências, o que pode comprometer a interpretação dos
resultados obtidos.
Os dados de Parcero (1999) sugerem uma instabilidade no uso da interpolação com relação ao
fronteamento com próclise e adjacência ‘clV’ (‘C-X-cl-V’) no século 16, revelada pela grande diferença
encontrada nos textos representativos deste século (enquanto a interpolação generalizada é marginal em
PRG – 7%, em DCP é bastante freqüente – 50%). Note que esta relação nada nos diz sobre a preferência
do fronteamento nos textos, uma vez que não se mede ‘clítico-verbo-XP’.
Para se chegar a frequência do fenômeno do fronteamento, é necessário somar as estruturas ‘XPclítico-verbo’ e ‘clítico-XP-verbo’, por hipótese estruturas de fronteamento, e contrapor com a estrutura
‘clítico-verbo-XP’, sem o fronteamento.
Os dados de Parcero (1999) revelam que o fronteamento nas construções com clítico se mantém até
o século 17. Todavia, a construção de fronteamento mais freqüente no primeiro texto do século 15 é
‘clítico-XP-verbo’, enquanto que no século 17 é ‘XP-clítico-verbo’. Este fato vai ao encontro de nossa
proposta de que a perda do fenômeno da interpolação não está relacionada com a perda do fronteamento.
Perde-se a interpolação, mas o fronteamento ainda existe na língua Clássica.
Concordamos com Parcero (1999) de que o fronteamento de constituintes e a interpolação são
fenômenos relacionados, uma vez que a interpolação é opcional e o clítico pode se colocar ora antes dos
constituintes movidos (fronteados) ora depois (clítico-XP-verbo / XP-clítico-verbo). Mas não parece ter
10
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
11
sido a perda da possibilidade do fronteamento a causa do desaparecimento da interpolação. Como vimos,
a perda do fenômeno da interpolação é anterior ao século 17. A possibilidade do fronteamento teria
persistido durante a época clássica, o que explicaria uma série de propriedades da língua nesta época.
Paixão de Sousa (2004) traz evidências, baseadas em 20 textos do corpus anotado do Português
Histórico Tycho Brahe, de que o fronteamento é ainda uma construção importante no português clássico,
e que a possibilidade de tal construção ajuda a explicar os padrões da colocação de clíticos nesta fase.
Corroborando a hipótese de Galves (1996, 1998), Paixão de Sousa (2004:163) argumenta que a
passagem do sistema médio (PC) para o moderno (PE) seria a passagem de um sistema de XP-VerboSujeito para um sistema de Sujeito-Verbo-XP, onde há uma dissociação entre a posição pré-verbal do
sujeito, e a posição dos elementos fronteados, agora restritos aos sintagmas focalizados.
A autora constatou que de fato em todos os períodos há construções Sujeito-Verbo-Objeto, assim
como há construções Verbo-Sujeito com ênclises e próclises, porém observou diferenças importantes para
a passagem do português clássico para o português europeu moderno no século 18:
“as ordens com XV e com próclises tornam-se menos freqüentes; a ordem X-XclVS desaparece dos textos já na
primeira metade do século 18; e as ordens VSX caem de 0,07 para 0,01 nos textos entre a segunda metade do
século 17 e o texto do século 19.
Isto permite afirmar que a queda do patamar de cerca de 20% para o patamar de cerca de 10% de ordens VS é
explicável fundamentalmente como uma queda na freqüência de construções que instanciam o fronteamento de
constituintes para uma posição acima da posição de sujeitos.
Tomo assim os fatos referentes à inversão como relevantes para compreender o sistema dos textos médios, e sua
diferença com os modernos. A despeito de não se ter disponível uma análise mais sistemática da natureza da
posição de fronteamento em termos discursivos, estes fatos todos tomados em conjunto indicam ser razoável propor
que nos textos clássicos, está ativa uma posição pré-verbal para fronteamento de constituintes regida por
propriedades do tipo “V2” (Paixão de Sousa, 2004:162)
Para corroborar a hipótese, Paixão de Sousa (2004:157) mostra que as ordens VS (verbo-sujeito) com
ênclises no português clássico são, em sua maioria, casos de V1 absolutos – ou seja, ‘#Verbo-clíticoSujeito’. Apenas no texto de Ortigão (1836) a proporção de ‘#Verbo-clítico-Sujeito’ será superada pela
proporção de ‘XP-Verbo-clítico-Sujeito’. Além disso, não se registra, em nenhum período, casos de
inversão com ênclises em ordens V3 (X-X-V-cl-S).13
A autora também chama a atenção para o fato da ordem X-cl-V-S, que seria a configuração mais
característica do fronteamento, ser o tipo de inversão mais freqüentemente atestada nos textos dos séculos
13
Cabe salientar que existe na história do português dois tipos de inversão ‘verbo-sujeito’: as inversões
românicas e as germânicas.
As inversões românicas se instanciam preferencialmente como #VS, ou mais caracteristicamente, #VXS, e correspondem a uma
focalização do sujeito, que ocupa uma posição pós-verbal mais baixa, ou seja, pode estar depois dos complementos do verbo. Nestes casos, a
inversão é de fato uma propriedade dos sujeitos, que permanecem em VP – ou são extrapostos à direita, a depender da análise; de qualquer modo, o
que está em jogo neste caso é a natureza do sujeito. Este tipo de construção pode ser identificada nas ordens VXS, ou seja, em que entre o verbo e o
sujeito há um outro constituinte de VP (...)
Já a inversão germânica – #XVS, ou mais caracteristicamente #XVSX – não é, a rigor, uma inversão. Pois o que está em jogo nestes
casos não é o sujeito, que está em sua posição “regular” – mas sim o movimento de um outro constituinte de VP para uma posição mais elevada que
a posição regular do sujeito. Este movimento envolve a subida do constituinte em questão para ocupar o especificador de determinada categoria
funcional para cujo núcleo o verbo por sua vez se move – explicando a ordem linear XVS. O sujeito, assim, é “deixado para trás” – e isto pode
acontecer mesmo com sujeitos que não são focos. Na verdade, nestas configurações o constituinte X pré-verbal será o elemento mais saliente da
sentença. As ordens VS deste tipo se configuram tipicamente como XVSX (...)
Para poder verificar a freqüência de cada tipo de inversão, é preciso separar do total de ordens VS o sub-conjunto dos dados em que a posição
do sujeito em relação aos demais constituintes pós-verbais possa ser bem documentada (ou seja, separar apenas (X)VXS e (X)VSX). (Paixão de Sousa
2004: 160, 161)
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
12
16 e 17. (Cf. Paixão de Sousa, 2004:161).
Sendo assim, para Paixão de Sousa 2004, no português clássico, a ordem S-V é fruto ora do
fronteamento do sujeito, ora de sua topicalização. Segundo a autora:
“... observando as tendências de freqüência de diferentes classes de construções XV com próclises, veremos que o
comportamento dos sujeitos pré-verbais referenciais com próclises é comparável ao de elementos necessariamente
fronteados.” (Paixão de Sousa 2004: 85)
“.... constituintes que não podem participar da operação de adjunção nunca aparecem com ênclises. Podemos
portanto considerar que no sistema médio, a ênclise é uma característica indicadora de adjunção. Em vista disso
defenderei que os sujeitos em SVcl podem ser classificados como adjuntos nos textos até o século 18, período em
que apresentam um comportamento comparável aos demais adjuntos (mas como veremos, isso diferencia os textos
mais modernos dos textos médios, uma vez que a freqüência de ocorrência de SVcl neles é mais elevada que a
freqüência de outros XVcl).” (Paixão de Sousa 2004: 85)
Os resultados apresentados por Gibrail14 (2007, tese em andamento) corroboram fortemente a hipótese de
Paixão de Sousa (2004) e nossa análise para as três gramáticas que pontuaram na história da língua
portuguesa (Namiuti, 2008). A autora mostra que nos autores nascidos nos séculos 16 e 17 há a atuação
de uma gramática V2 no licenciamento das várias formas de manifestação de estruturas de tópico.
Os dados de Gibrail, também extraídos do Corpus Tycho Brahe, mostram uma grande tendência de
licenciamento de objetos em posição de tópico em estruturas V2, ou seja, X-V, com e/ou sem clítico
(96,5% de ordem X-V, contra 2,5% de X-X-V e 1% de X-X-X-V, no século 16; e 94,7% de ordem X-V,
contra 5,1% de X-X-V e 0,2% de X-X-X-V). Gibrail atesta a diminuição da freqüência de uso de
estruturas de topicalização, paralelamente à evolução da freqüência de uso de estruturas de CLLD (clitic
left deslocation) em função da restrição de licenciamento de sintagmas topicalizados na categoria de
elementos fronteados.
IV. OBJETIVO DO PROJETO
Nosso objetivo será estender a descrição feita dos domínios não dependentes por Paixão de Sousa (2004)
(orações com clíticos) e Gibrail (em andamento) (orações com clítico e sem clítico) para os domínios
dependentes finitos, uma vez que o fenômeno do fronteamento e da interpolação é característico deste
ambiente (cf. Martins 2005). As construções sob análise nas orações dependentes com e sem pronomes
clíticos estão exemplificadas a seguir.
Nas orações com sujeito nulo localizaremos as ordens:
14
GIBRAIL, Alba Verôna Brito. (tese em andamento). Formas de Manifestações de Estruturas de Tópico do
Português Clássico: Mudança de Comportamento Sintático na Diacronia. Apresentação no workshop do projeto
temático Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística - IEL/UNICAMP. Agosto, 2007. O
levantamento de dados de Gibrail considera as construções com topicalização nas orações não-dependentes e marca o
estatuto do sujeito (lexical ou nulo) e, quando lexical, sua posição (SV, VS) em textos do corpus Tycho Brahe.
Entretanto, falta no trabalho a automação e a versatilidade que serão conquistadas com a disponibilização do corpus
Tycho Brahe anotado sintaticamente.
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
(i) (X)-X-Verbo vs Verbo-X-(X)
(23) Ho Ifante foy ho derradeyro que ſe delle deſpedio beyjan-dolhe has mãos. (Duarte Galvão, 1435)
(24) .... em ſuas excellentes cavallarias, como por ellas ſe moſtra, ho animoſo fervor, e ardente esforço de Julio
Ceſar, e ha ſegurança muy confiada de Publio Cipiaõ Afriquano, em tanto grão , que todo ho que eſtava por fazer,
cometia como ſe ho tiveſe jàa feyto, e ho que muy deficil ſe acha ſendo tam activo. (Galvão, 1435)
(25) De nhuma lhe acodiam tantos, como de Beja, ho que cauſou fiquar ha a Villa muito minguoada de gente,
que para ſua defenſaõ lhe fazia miſter. (Galvão, 1435)
(26) os quaes dotou de muitas poſeſsões ,e guarneceo de grandes ornamentos, no que he bem de notar , e ſeguir ha
muita devoçaõ dos Cavalleyros daquelle tempo , que com todas ſuas preſas, e trabalhos, e grandes, e continuas
deſpezas, em guerra taõ ſanta , e quaſi do Reyno ha dentro ſendo entam ho Reyno mais pequeno, e menos rico, nom
ſe deſcuydàraõ por eſo de todo ho ſerviço de Deos, ... (Galvão, 1435)
(27) Finalmente que desta e de toda a mais caça de que acima tratei, participam (como digo) todos os moradores, e
mata-se muita dela à custa de pouco trabalho em toda a parte que querem: porque não há lá impedimento de
coutadas como nestes Reinos, e um só Índio basta ( se é bom caçador) a sustentar uma casa de carne do mato: ao
qual não escapa um dia por outro, que não mate porco ou veado, ou qualquer outro animal destes de que fiz menção
. (Gândavo, 1502)
(28) Acautela ele os maridos, a que façam ter as suas mulheres as receitas de cozinha escritas por outros e por
Ramalho Ortigão não se importando que elas conheçam pessoalmente este último sujeito, mas somente
o "Cozinheiro dos Cozinheiros" que ele redigia. (Ortigão, 1836)
Considero que não é possível propor uma análise baseada apenas nas ordens X-Verbo vs Verbo-X, pois
nas sentenças sem clítico, ou com clítico adjacente ao verbo nem sempre é claro diferenciar as
construções de deslocamento à esquerda e foco identificacional, também permitidas no PE moderno (cf.
Martins, 2002, 2005), do fronteamento permitido apenas nas fases antigas.
Para refinar a análise, buscarei as construções com o sujeito expresso, também considerando a
posição do clítico nas sentenças que contiverem o pronome.
(ii) Sujeito-X-Verbo-(X) e (X)-Verbo-Sujeito-X
(029) e jàa nom tinham modo de defençaõ, ſe nom deſemparar ho palanque, e acolherſe àcerqua; mas ho Senhor
Deos, que he poderoſo em todalas couſas, quando ſe hos homens em ellas nom ſabem, nem podem valer ...
(Galvão, 1435)
(030) nom peleyjando, que peleyjando receaes ſe fogiſemos as batalhas ha que nos Deos, e noſas vontades taõ
acerqua trouxeraõ ... (Galvão, 1435)
(031) ... à honra da morte , e payxaõ que N.Senhor recebeo na Cruz,pelo qual hee de crer , ~q lhe quiz Deos aſi
apparecer ... (Galvão, 1435)
(032) As quais capitanias el-Rei Dom João o terceiro , desejoso de plantar nestas partes a Religião Cristã , ordenou
em seu tempo, escolhendo para o governo de cada uma delas vassalos seus de sangue e merecimento , em que cabia
esta confiança. (Gândavo, 1502)
13
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
(033) Finalmente que desta e de toda a mais caça de que acima tratei , participam (como digo) todos os moradores ,
e mata-se muita dela à custa de pouco trabalho em toda a parte que querem: porque não há lá impedimento de
coutadas como nestes Reinos, e um só Índio basta ( se é bom caçador) a sustentar uma casa de carne do mato: ao
qual não escapa um dia por outro, que não mate porco ou veado, ou qualquer outro animal destes de que fiz menção.
(Gândavo, 1502)
(034) Durou ho cerquo perto de ſinquo mezes, por ha Cidade ſer muy for- te , de ſitio, e cerqua, e eſtarem dentro
muitos Mouros,'q ha muy bem defendião , fizeraõ-ſe neſte cerquo grandes eſcaramuças , e fortes combates, em que
ſe matavam muitos Cavalleyros de huma parte , e da outra. (Galvão, 1435)
(iii) X-Sujeito-Verbo e Verbo-X-Sujeito
(035) nem manteuda cõ ElRey de por meyo em ſua terra , que abaſtava para elles leyxarem-na em poder de
Chriſtãos como fora ſeu dezejo , e aſi ſe foraõ ha ElRey , e lho dice- raõ muy francamente, ho que lhes elle muito
agradeceo , offerecen-do-ſe, que ſe alguns delles, e de ſuas gentes quizeſem fiquar em ſua terra, elle lhe daria
luguares para povoarem (Galvão 1435)
(036) que ſegundo cuydo, e eſpero prazerà ha Deos, que voſos deſejos, e meus, eu volos darey compridos com
muito prazer , e honra (Galvão 1435)
(037) QUE viaje à roda do seu quarto quem está à beira dos Alpes, de Inverno, em Turim, que é quase tão frio como
São Petersburgo - entende-se. Mas com este clima, com este ar que Deus nos deu, onde a laranjeira cresce na horta,
e o mato é de murta, o próprio Xavier de Maistre, que aqui escrevesse, ao menos ia até o quintal. (Garrett 1799)
As construções em (ii) são mais características das gramáticas V2 (cf. Paixão de Sousa 2004) e por isso o
diagnóstico do fronteamento traz menos ambigüidade nestes casos.
De acordo com Martins (2002: 285) o processo sintático de deslocação do objeto para uma posição
pré-verbal interna à frase, designado scrambling pela autora, resulta na ordem ‘Sujeito-Objeto-Verbo’
(SOV). Segundo Martins (2002), este processo de anteposição verbal do objeto não perdura em nenhuma
das línguas românicas, mas mantem-se representado em outras línguas da família germânica, como no
alemão e no neerlandês. Já as ordens Objeto-Sujeito-Verbo e Objeto-Verbo-Sujeito resultariam do
deslocamento a esquerda clítica ou da focalização enfática, estruturas que persistem no português
contemporâneo.
Por outro lado, ponderando a posição pós-verbal do sujeito, a ordem ‘X-Verbo-Sujeito-X’ não seria
uma inversão da posição do sujeito, como no PE, mas o movimento de um outro constituinte de VP para
uma posição mais elevada que a posição regular do sujeito (cf. Paixão de Sousa (2004), também cf. nota
11). Este movimento envolve a subida do constituinte em questão para ocupar o especificador de
determinada categoria funcional para cujo núcleo o verbo por sua vez se move – explicando a ordem
linear XVS. O sujeito, assim, é “deixado para trás” – e isto pode acontecer mesmo com sujeitos que não
são focos. (Paixão de Sousa 2004: 160, 161). Já a inversão VXS corresponderia mais caracteristicamente a
uma focalização do sujeito (cf nota 13). Portanto, as ordenações em (ii) são as principais construções sob
análise e as em (iii) são freqüentes no PE moderno e por isso é crucial medi-las nos textos para se
descobrir quando exatamente vão superar as construções apresentadas em (ii).
14
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
15
Desta forma, para verificar a freqüência de cada tipo de inversão, é preciso separar do total de
ordens Verbo-Sujeito o subconjunto dos dados em que a posição do sujeito em relação aos demais
constituintes pós-verbais possa ser bem definida, ou seja, separar ‘(X)-Verbo-X-Sujeito’ e ‘(X)-VerboSujeito-X’.
Também vamos ponderar a natureza de X refinando os tipos de X que aparecerão nos textos.
Investigaremos separadamente os complementos e adjuntos. Na categoria complemento, separaremos os
sintagmas dativos dos acusativos. Na categoria adjunto, refinaremos o tipo (adverbiais, preposicionais,
nominais, ...).
Desta forma pretendemos trazer subsídios para comprovar nossa proposta, delineada a partir da
argumentação trazida na tese de doutorado (Namiuti, 2008), de que a perda da possibilidade da
interpolação é anterior ao desaparecimento do fronteamento na língua portuguesa. Ou seja, a
possibilidade do processo sintático do fronteamento mantem-se após a re-análise dos núcleos hospedeiros
do pronome clítico15. E ainda, corroborar a hipótese de Galves (1996, entre outros trabalhos) e Paixão de
Sousa (2004).
V – O CORPUS TYCHO BRAHE
Como lembra Paixão de Sousa (2006), os estudos históricos realizados com base em textos antigos
dependem, antes de tudo, da garantia da fidelidade às formas originais dos textos – sendo este o pilar de
sustentação que qualquer estudo lingüístico, em qualquer quadro teórico, deve pressupor. No caso dos
corpora eletrônicos, esse pressuposto fundamental pode ser integrado a outros requisitos, como a
necessidade de quantidade, agilidade e automação no trabalho estatístico de seleção de dados. Paixão de
Sousa (2006) defende que a conjunção dessas vertentes configura o principal desafio do trabalho de
edição especializada e análise lingüística de textos antigos no meio eletrônico. Foi com este espírito que
foi desenvolvido o Corpus Tycho Brahe.
O corpus Tycho Brahe é um corpus anotado do português histórico que disponibiliza seus textos
em formato ortograficamente transcrito e morfologicamente etiquetado, e está investindo em um
analisador sintático para os textos Medievais e Clássicos. Os textos analisados morfo-sintaticamente
permitem uma pesquisa lingüística mais precisa e rápida com recuperação instantânea de informações nos
textos analisados.
Elaborado nos moldes do corpus parseado do Inglês Médio PPCME (Penn-Helsinki Parsed Corpus
of Middle English), o Corpus Anotado do Português Histórico Tycho Brahe consiste em um corpus
eletrônico composto por textos em prosa, escritos em português por falantes nativos do português,
nascidos entre 1380 e 1845 (cf. http://www.ime.usp.br/~tycho/corpus). O objetivo do Corpus Tycho
Brahe é disponibilizar publicamente dados históricos do português europeu anotados de tal maneira que
os estudiosos de sua história possam recuperar rapidamente informações categoriais e estruturais
15
De acordo com Namiuti (2008), o pronome clítico deixa de poder se hospedar em C° no PM, passando a ter
como possibilidades apenas ∑° e I°.
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
pertinentes à análise morfo-sintática da língua.
No final do processo de construção do Corpus, cada um dos textos, representados por
aproximadamente cinqüenta mil (50.000) palavras cada, deverá estar disponível em três formatos:
1 - ortograficamente transcritos: Senhor: Ofereço a Vossa Majestade as Reflexões sobre a vaidade dos
homens
2 - morfologicamente etiquetados: Senhor/NPR :/. Ofereço/VB-P a/P Vossa/PRO$-F Majestade/NPR
as/D-F-Reflexões/NPR-P sobre/P a/D-F vaidade/N dos/P+D-P homens/N-P
3 - sintaticamente anotados: (IP-MAT (NP-SBJ *pro*)
(NP-VOC (NPR Senhor))
(. :)
(VB-P Ofereço)
(PP (P a)
(NP (PRO$-F Vossa)
(NPR Majestade)))
(NP-ACC (D-F-P as)
(NPR-P Reflexões)
(PP (P sobre)
(NP (D-F a)
(N vaidade)
(PP (P+D-P dos)
(NP (N-P homens))))))
O sistema de anotação sintática é uma árvore que pode ser visualizada sob a forma de parênteses
etiquetados, como no exemplo acima, ou no formato arbóreo quando visualizada no Corpus Draw.
4 – Figura do corpus draw abaixo. Sentença: Isto é o mesmo que oferecer em um pequeno livro aquilo de
que o mundo todo se compõe, e que só Vossa Majestade não tem: feliz indigência, e que só em Vossa
Majestade se acha. (AIRES-A_001,03.8)16
16
As sentenças são identificada com: o nome do arquivo – Aires-A_001, o número da página – 03, o número da
sentença - 08.
16
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
17
Uma sentença declarativa é codificada como um IP-MAT (um “IP matriz”) ao passo que uma
subordinada é codificada como um CP, que seleciona um IP-SUB (um “IP-subordinado”). Todos os
sintagmas são diretamente ligados ao nó raiz: o sujeito (NP-SBJ), o verbo (SR-P), e o objeto direto (NPACC) no caso representado na figura do Corpus Draw17.
http://www.ime.usp.br/~tycho/corpus/manual/index.html
As relações entre os nós da árvore são de dois tipos: dominância e precedência. Na figura acima, o
IP-MAT domina imediatamente os nós NP-SBJ, SR-P e NP-ACC. O nó NP-SBJ precede imediatamente
TR-P, e precede não imediatamente o NP-ACC . As buscas são feitas com base nestas relações.
Para estudar, por exemplo, o fronteamento dos NPs acusativos em sentenças subordinadas deve-se escrever
um comando de busca do tipo:
define: port.def
print_indices: t
node: IP*
query: (IP-SUB iDoms NP-ACC)
AND (IP-SUB iDoms tns_vb)
AND (NP-ACC iPrecedes tns_vb)
AND (NP-ACC iDoms !\**|SE|CL)
Que se traduz: IP-SUB domina imediatamente NP-AC, e também o verbo finito (VB|TR|ET|HV|SR-*). NPACC precede imediatamente verbo finito, e não domina imediatamente categoria vazia ou clítico.
17
Simplificação em relação à teoria X’, ramificações não binárias, ausência de projeção de VP e outros
módulos da teoria. A anotação sintática não deve, nem pretende, seguir as tendências de análise mais recentes dentro de
determinada Teoria lingüística. A intenção em apresentar um corpus anotado sintaticamente é disponibilizar um maior
número possível de estruturas a serem recuperadas automaticamente, e não apresentar uma análise de dados. Por isso, se
fez necessário estabelecer critérios sistemáticos de anotação sintática, disponíveis no manual em:
http://www.ime.usp.br/~tycho/corpus/manual/syntax.html.
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
18
Tal comando permite que se encontrem todas as sentenças com a ordem ‘Objeto Direto-Verbo’ em sentenças
encaixadas. Os dados são salvos automaticamente em um arquivo de saída. O arquivo contém um cabeçalho
com informações sobre a data e o texto em que foi feita a busca; bem como sobre a ferramenta utilizada – o
CorpusSearch e a formulação da busca.
Os dados são impressos logo após o cabeçalho da seguinte forma:
1) a sentença sem anotação;
2) informação sobre o(s) dado(s) considerado(s) naquela sentença, no exemplo apresentado no quadro abaixo: na
sentença que possui um IP-SUB de número 41, o NP acusativo considerado é o de número 42 e o verbo - 45 (os
números são atribuídos automaticamente pela ferramenta para a identificação do dado).
3) a sentença anotada.
porque os erros facilmente se desculpam em favor de um morto; se bem que pouco vale um livro, quando para merecer algum sufrágio, necessita
que primeiro morra o seu Autor;
(AIRES-A_001,09.101)
*~/
/*
41 IP-SUB: 41 IP-SUB, 42 NP-ACC, 45 VB-P, 43 Q
*/
( (41 IP-SUB (42 NP-ACC (43 Q pouco))
(45 VB-P vale)
(47 NP-SBJ (48 D-UM um) (50 N livro))
(52 , ,)
(54 CP-ADV (55 WADV quando)
(57 IP-SUB (58 NP-SBJ *pro*)
(60 PP (61 P para)
(63 IP-INF (64 VB merecer)
(66 NP-ACC (67 Q algum) (69 N sufrágio))))
(71 , ,)
(73 VB-P necessita)
(75 CP-THT (76 C que)
(78 IP-SUB (79 ADVP (80 ADJ primeiro))
(82 VB-SP morra)
(84 NP-SBJ (85 D o) (87 PRO$ seu) (89 NPR Autor)))))))
(93 ID AIRES-A_001,09.101))
/~*
No final do arquivo de saída a busca trás automaticamente a quantificação hits/tokens/total – onde hits é o número de
dados / tokens é o número de sentenças que contém dados / e total é o total de sentenças do(s) texto(s).
SUMMARY:
source files, hits/tokens/total
..\port\aires.psd 12/12/4498
whole search, hits/tokens/total
12/12/4498
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
19
Esta busca pode ser ampliada, por exemplo, com buscas que prevêem todo o tipo de oração, ou qualquer
constituinte fronteado. Ou ainda pode ser sofisticada, por exemplo, considerando a posição do sujeito ou seu
estatuto nulo, ou ainda a posição do verbo, se segue ou precede imediatamente o elemento em foco.
Para que esta metodologia de busca automática atinja uma grande quantidade de textos, ampliando
assim as possibilidades de investigações, e trazendo um produto de grande interesse para a comunidade
científica, pretendemos contribuir para a disponibilização dos textos do corpus Tycho Brahe anotados
sintaticamente. E, desta forma tornando possível a investigação que propomos neste projeto de pesquisa,
com a busca das sentenças depensentes finitas (com e sem clíticos) que contenham elementos fronteáveis,
e o mapeamento das freqüências do fronteamento nos treze textos do Corpus Tycho Brahe, ponderando a
posição do sujeito e do verbo, e as sentenças com sujeito nulo.
Nosso trabalho consistirá, portanto, em duas tarefas centrais:
1) A correção da anotação sintática de dois terços dos vinte textos previstos pelo projeto temático para
serem disponibilizados para pesquisa nos dois próximos anos (o que equivale a treze textos), usando a
ferramenta Corpus Draw.
2)
A
análise
dos
dados
de
variação
X-V/V-X
levantados
http://corpussearch.sourceforge.net/CS-manual/QueryLanguage.html)
com
Corpus
para fundamentar
Search
a hipótese
apresentada na seção II.
IV. PLANO DE TRABALHO E CRONOGRAMA DE SUA EXECUÇÃO
Ano 1: 01 de junho de 2008 a 30 de maio de 2009
Correção da anotação de cinco textos e início da criação das buscas e do levantamento de dados.
Nesta primeira etapa focalizaremos os textos dos séculos 16 e 17 por serem bastante representativos da
gramática média refletindo uma fase de estabilidade desta gramática nos textos.
1) Luís de Sousa (1556)
2) Francisco Rodrigues Lobo (1579)
3) Antônio Vieira (1608) cartas
4) Antonio Vieira (1608) Sermões
5) Antônio das Chagas (1631)
A divisão quantitativa dos textos parte do pressuposto de que o analisador automático ainda não foi
suficientemente treinado para produzir uma anotação satisfatória e com isso a correção levará mais tempo
neste primeiro ano.
Depois da correção de cada texto será feito o levantamento dos dados. Desta forma investiremos
em uma dinâmica que enriquece as tarefas de correção e busca. Pois as experiências com a
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
implementação das buscas podem contribuir na estabilização da anotação, bem como trazer saídas para
eventuais lacunas no sistema de anotação proposto. Também a experiência da correção da anotação
promove uma intimidade com o sistema que potencializa o poder da busca e a análise dos dados.
Cabe a esta etapa a análise do fenômeno do fronteamento em associação com a sintaxe da colocação
pronominal átona e o fenômeno da interpolação nos cinco textos anotados.
Também faremos a redação do relatório parcial.
Ano 2: 01 junho de 2009 a 30 de maio de 2010
Correção e análise dos dados dos oito textos restantes.
1) Cavaleiro de Oliveira (1702) cartas
2) Antonio da Costa (1714)
3) Ramalho Ortigão (1836)
4) Diogo do Couto (1542)
5) Francisco de Holanda (1517)
6) Pedro de Magalhães Gandavo (150? -1579)
7) Duarte Galvão (1435 – 1517)
8) Fernão Lopes (1380 – 1460)
Nesta fase focalizaremos a análise do fenômeno do fronteamento em associação com a sintaxe da
colocação pronominal átona e o fenômeno da interpolação investigado na tese de doutorado. Redação do
relatório final, com a apresentação e interpretação de todos os dados.
REFERÊNCIAS
BARBOSA, P. (1996). Clitic placement in European Portuguese and the position of subjects. In Aaron Halpern &
Arnold Zwicky (eds). Approachingh Second: Second position clitics and related phenoena. Stanford, California:
CSLI Publications. 1-40.
CARDEIRA, Esperança. (2005). Entre o Português Antigo e o Português Clássico. Imprensa Nacional Casa da
Moeda. Lisboa.
CHOMSKY, Noam. (1979). Principles and parameters in linguistic theory. MIT.
CHOMSKY, Noam. (1993). “Minimalist program for linguistic inquiry”. In HALLE, K. & CHOMSKY, Noam.
(1995). The Minimalist Program. Cambridge (MA). MIT Press.
COSTA, João & DUARTE, Inês (2002): “Preverbal subjects in null subjects languages are not necessarily
dislocated”. Em: Journal of Portuguese Linguistic, 1, 159-175.
COSTA, João, e MARTINS, Ana Maria (2004). “What is strong functional head?”. Lisbon: Whorkshop on
Alternative Views on the Functional Domain.
20
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
21
COSTA, João. & Charlotte. GALVES (2002). “External subjects in two varieties of Portuguese. Evidence for a nonunifiede analysis”. Em: Claire Beyssade, Reineke Bok-Bennema, Frank Drijkoningen, Paola Monachesi (eds).
Proceedings of going Romance 2000, Amsterdam/Philadelphia: Jhon Beijamins.
EIDE, Kristine (2002): “A noção de tópico e a ordem de palavras no português do século XVI”, Em: Romansk
Fórum Nr. 16 – 2002/2. XV Skandinaviske romanistkongress. Oslo 12.-17. August 2002.
EMBICK, D. E Noyer, R. (2001). "Movement operations after syntax". Em: Linguistic Inquiry. 32: 4, 555-595
FIÉIS, Maria. Alexandra Jesus. (2001) “Interpolação em Português Medieval como adjunção a XP”. Em: Actas do
XVI - Encontro Nacional da Associação Portuguesa de Linguística, Lisboa, APL, 197-211.
GALVES, Charlotte (1996). “Colocação de clíticos e mudança gramatical no português europeu”. Comunicação no
12° Encontro da Associação Portuguesa de Linguística, Braga, Portugal.
GALVES, Charlotte. (1998) Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística. UNICAMP
CAMPINAS. (Projeto de pesquisa FAPESP)
GALVES, Charlotte (2001). Ensaios sobre as gramáticas do português. Editora da Unicamp. Campinas-SP
GALVES, Charlotte. (2004) Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística – Fase II.
UNICAMP CAMPINAS. (Projeto de pesquisa FAPESP)
GALVES, Charlotte, BRITTO, Helena e PAIXÃO DE SOUSA, Maria Clara (2005) – “Clitic Placement in
Europena Portuguese: Results from the Tycho Brahe Corpus”. Em: Journal of Portuguese Linguistics, Vol 4 , n.1,
Special Issue on variation and change in the Iberian languages: the Peninsula and beyond.
GALVES, Charlotte, Cristiane NAMIUTI e Maria Clara PAIXÃO DE SOUSA, (2006) – “Novas perspectivas para
antigas questões: revisitando a periodização da língua portuguesa”. Em: Grammatische Structuren des Europäischen
Portugiesisch. Annette Endruschat / Rolf Kemmler / Bárbara Schäfer-PrieB (Hrsg). Turbigen: Calapinus Verlag,
págs 45-75.
GIBRAIL, Alba Verôna Brito. (em andamento). “Formas de Manifestações de Estruturas de Tópico do Português
Clássico: Mudança de Comportamento Sintático na Diacronia”. Apresentação no workshop do projeto temáticoI
Padrões Rítmicos, Fixação de Parâmetros e Mudança Lingüística - IEL/UNICAMP. Agosto, 2007.
HALLE, M. E MARANTZ, M. (1993): “Distributed Morphologie and the pieces of inflection”. Em: Halle, K. e
Keyser. J. (eds.) View from the Building 20: Essays in Linguistics in honor of Sylvain Bromberger. Cambridge, MA,
MIT Press.
KROCH, Anthony. (1989). "Reflexes of grammar in patterns of language change". Em: Language Variation and
Change. p. 199-244. Cambridge University Press.
KROCH, Anthony. (1994). "Morphosyntactic Variation." In: Beals et al., (eds.), Proceedings of the Thirtieth Annual
Meeting of the Chicago Linguistic Society, vol. 2, pp. 180—201.
KROCH, Anthony. (2003). "Mudança sintática". http://www.ling.upenn.edu/ kroch. Traduzido por Silvia
Cavalcante.
LAKA, I. (1990). Negation in Syntax: On the Nature of Functional Categories and Projections. Ph. D. Dissertation.
Cambredge, Massachussets: MIT.
MAGRO, Catarina (2007). Clíticos: Variações sobre o tema. Tese de Doutoramento, Universidade de Lisboa.
MARTINS, Ana Maria (1994) – Clíticos na história do português. Tese de Doutoramento, Universidade de Lisboa.
Mimeo.
MARTINS, Ana Maria (1997) – “Mudança Sintática. Clíticos, negação e um pouquinho de Scrambling”. Em:
Estudos Lingüísticos e Literários,. nº 19, Salvador: Programa de Pós Graduação da Universidade Federal da Bahia.
MARTINS, Ana Maria (2000): “Polarity Items in Romance: Underspecification and Lexical Change.” Em:
Diachronic Syntax: Models and Mechanisms. Orgs. Pintzuk, Susan, George Tsoulas e Anthony Warnes. Oxford
University Press.
MARTINS, Ana Maria. (2002). "Mudança Sintática e História da Língua Portuguesa". Em: História da Língua e
História da Gramática. Actas do Encontro. Colecção Poliedro 11. Universidade do Minho. Centro de Estudos
Humanísticos. Braga 2002.
MARTINS, Ana Maria. (2005). “Clitic Placement, VP-Ellipsis and Scrambling in Romance”. Em: Batilbori,
Montse, Maria Lhuïsa Hermanz, Carme Picallo, e F. Roca (eds.) Gramaticalization and Parametric Variation.
Oxford University Press.
MATTOS E SILVA, Rosa Virginia (1989). Estruturas trecentistas: Elementos para uma gramática do português
arcaico. Lisboa: Imprensa Nacional Casa da Moeda.
Textos e Gramáticas. O fronteamento de constituintes no corpus Tycho Brahe: à procura do Português Médio em textos sintaticamente anotados.
MATTOS E SILVA, Rosa Virginia (1992). Para uma caracterização do período arcaico do português. Mimeo.
NAMIUTI, Cristiane (2008). "Aspectos da história gramatical do português. Interpolação, negação e mudança".
Tese de Doutorado. IEL/UNICAMP. Campinas, SP.
NOYER, R (2004): “Distributed Morphology”. http://www.ling.upenn.edu/~rnoyer/dm/
PAIXÃO DE SOUSA, Maria Clara (2004) – Língua Barroca: sintaxe e história do português nos 1600. Tese de
Doutoramento. Instituto de Estudos da Linguagem. Universidade Estadual de Campinas. Campinas-SP
PAIXÃO DE SOUSA, Maria Clara (2005). Memórias do Texto. Revista Texto Digital, ISSN 1807-9288, ano 2 n.1
2006.<http://www.textodigital.ufsc.br/num02/paixao.htm>
PARCERO, Lúcia. (1999). Fronteamentos de constituintes no português dos séculos XV, XVI e XVII. Dissertação de
Mestrado, UFBa, Salvador-Ba.
RAPOSO, Eduardo Paiva (1994): Afectives operators and clausal structure in European Portuguese and European
Spenish. Versão inédita.
RAPOSO, Eduardo Paiva. (2000). "Clitic positions and Verb movement". Portuguese Syntax: New
RIBEIRO, Ilza (1995) A sintaxe da ordem do português arcaico: o efeito V2. Tese de Doutoramento, Instituto de
Estudos da Linguagem, Universidade Estadual de Campinas.
RIBEIRO, Ilza. (1996). "Questões sobre a ordem dos constituintes no português arcaico e no português clássico".
Em: Boletim ABRALIN Nº 17.
RIVERO, María Luisa. (1994). “Negation, imperatives and Wackernagel effects”. In: Revista di Linguistica.
RIVERO, María Luisa. (1997). “On two locations for complement clitic pronouns: Serbo-Croatian, Bulgarian and
Old Spanish”. In: Parameters of morphosyntatic change. Ans Van Kemenade and Migel Vicenti (eds.). Cambridge
University Press. Págs. 170-206.
TORRES MORAES, Maria Aparecida, (1995) – Do português clássico ao português moderno: um estudo da
cliticização e do movimento do verbo. Tese de Doutoramento, Instituto de Estudos da Linguagem, Universidade
Estadual de Campinas.
22
Download