Primeira parte do curso – Estrutura sintáticas (Chomsky, 1957) 1) Sobre a independência da gramática O que é língua para Chomsky nesta obra? “[É] um conjunto (finito ou infinito) de sentenças, cada sentença sendo finita em extensão e construída a partir de um conjunto finito de elementos” (p. 17) Qual é o objetivo fundamental da análise linguística de uma língua L? É distinguir as sequências gramaticais de L das agramaticais, que não pertencem a L. De fato, encontrar a gramática da língua L, que é o mecanismo que gera todas as sequências gramaticais de L e nenhuma sequência agramatical. Como testar se uma gramática é adequada ou não? Consultando as intuições de um falante nativo a respeito se sentenças geráveis pelo mecanismo postulado. Mas o que é ser de fato gramatical na língua L? A primeira coisa que Chomsky ressalta é que o conjunto de frases ou sequências gramaticais não pode ser o conjunto de enunciados de um determinado corpus, por maior que ele seja. Isso porque qualquer falante nativo tem condições de julgar se uma sequência é aceitável ou não (pertencente ou não à língua L) mesmo que nunca a tenha ouvido – ou seja, mesmo que a sentença não pertença ao corpus em questão, que será necessariamente finito e acidental. Um outro ponto importante é que a noção de gramatical “não pode ser confundida com as noções ‘dotado de sentido’ ou ‘significativo’ em qualquer sentido semântico”. Aqui aparece o famoso exemplo de Chomsky: colorless green ideas sleep furiously – que é uma frase gramatical para qualquer falante de inglês, ainda que aparentemente desprovida de sentido. Compare-se com furiously sleep ideas green colorless – que é agramatical, mas usa os mesmos itens. Tampouco se pode dizer que uma sequência é gramatical na língua L por conta de algum alto nível de aproximação estatística de L. Veja-se que as duas sequências acima jamais ocorreram em inglês, e, ainda assim, uma é gramatical e a outra não para os falantes nativos. Chomsky comenta que, na frase colorless green ideas sleep furiously, o falante nativo imporá uma entoação normal, enquanto a sequência agramatical terá entoação descendente em cada palavra, mostrando que o falante não integra as palavras numa frase. Ele também conseguirá se lembrar da frase gramatical muito mais facilmente do que da sequência agramatical. Conclusão: “a gramática é autônoma e independente do significado e (...) modelos probabilísticos não fornecem nenhum esclarecimento sobre alguns dos problemas básicos da estrutura sintática” (p. 23). 2) Uma teoria linguística elementar Que tipo de mecanismo pode produzir as sentenças gramaticais do inglês? – Essa é a pergunta que Chomsky coloca no início do terceiro capítulo de seu livro. “Uma língua é um sistema extremamente intrincado, e parece óbvio que qualquer tentativa de apresentar diretamente esse conjunto (de sentenças gramaticais) em termos de sequências gramaticais de fonemas nos levaria a uma gramática tão complexa que seria praticamente inútil. Por esse motivo (entre outros), a descrição linguística procede em termos de um sistema de ‘níveis de representação’. Assim, em vez de descrever diretamente a estrutura fonêmica das sentenças, o linguista estabelece elementos de ‘nível superior’ tais como os morfemas, e descreve, de um lado, a estrutura morfêmica das sentenças, e, de outro, a estrutura fonêmica dos morfemas” (p. 25). Vamos então considerar a estrutura morfêmica das sentenças. Que tipo de gramática geraria as sequências gramaticais de morfemas (considerando-se como morfema também as palavras no sentido tradicional pré-teórico) do inglês (e só elas)? Condição 1 – a gramática tem que ser finita – não pode, portanto, ser uma lista de todas as sequências de morfemas. Chomsky aqui faz uma crítica à gramática de estados finitos. O que é uma gramática de estados finitos? Imaginemos uma máquina que passa por um número finito de estados e, a cada transição de estado, ela produz um símbolo (uma palavra, por exemplo). A ideia é que, a partir da primeira palavra (do primeiro estado da máquina), os estados seguintes são limitados a cada transição, por conta do estado imediatamente anterior. Assim, a cada palavra escolhida em cada transição (estado), as possibilidades de palavras seguintes são limitadas por esta palavra. As gramáticas de estados finitos podem produzir infinitas sentenças se houver, por exemplo, loopings no sistema. Chomsky afirmará que o inglês não é uma língua de estados finitos. Por que Chomsky afirma isso? Veja-se que há relações entre itens que se mantêm a longa distância, com uma sequência arbitrariamente grande entre eles. Isso é muito problemático para as gramáticas de estados finitos. Por exemplo: (1) Se S1, então S2 (compare-se com *se S1, ou S2) (2) O homem que disse que S está chegando hoje (compare-se com *o homem disse que S estão chegando hoje). (3) Se ou S1 ou S2, então S3. Chomsky conclui: “Vimos que uma teoria tão limitada linguisticamente (gramática de estados finitos) não é adequada; somos forçados a procurar algum outro tipo mais poderoso de gramática e uma forma mais ‘abstrata’ de teoria linguística. A noção de ‘nível linguístico de representação’ apresentado no começo desta seção deve ser modificada e elaborada. Deve haver pelo menos um nível linguístico que não tenha uma estrutura tão simples. Quer dizer, em algum nível, não será o caso que toda sentença seja representada simplesmente como uma sequência finita de elementos de algum tipo, gerada da esquerda para a direita por algum mecanismo elementar” (p. 34). 3) A estrutura sintagmática Aqui, Chomsky propõe um novo tipo de regra, totalmente fora do modelo de estados finitos, em que uma regra do tipo X → Y significa “reescreva X como Y”. As regras a seguir são exemplos desse tipo de regra de reescritura: (4) (5) (6) (7) (8) (9) S → SN + SV SN → Art + N SV → Verbo +SN Art → o, a N → homem, bola, etc. Verbo → chutou, pegou, etc. Assim, para a sentença “o homem chutou a bola”, temos a seguinte derivação: (10) Sentença SN + SV Art + N + SV Art +N + Verbo + SN O + N + Verbo + SN O + homem + Verbo + SN O + homem + chutou + SN O + homem + chutou + Art + N O + homem + chutou + a + N O + homem + chutou + a + bola A inserção correta do artigo depende de propriedades do N combinado a ele (por exemplo, se é plural ou singular, se é masculino ou feminino, etc.). O mesmo vale para o verbo em relação ao SN que o antecede. Assim, as regras que inserem esses itens, deve ter uma forma tal que incluam o contexto de inserção, como (11) a seguir para “chutou”: (11) SNsing + Verbo → SNsing + chutou Importante: na regra de reescritura, somente um símbolo pode ser substituído por outro, como ocorre em todas as regras apresentadas até o momento, incluindo (11). Uma gramática, assim, é um conjunto finito de sequências iniciais (como o símbolo S em (4)), representado por Σ, e um conjunto finito de fórmulas F do tipo das regras de reescritura. Acima, vemos um exemplo de gramática na sequência (4)-(9), com a álgebra [Σ, F], onde a única sequência inicial é S. Uma derivação nessa gramática está desenvolvida em (10). Diagramas arbóreos podem descrever as relações de constituência entre os componentes da sentença, mas são menos informativos do que a sequência em (10) – pois essa inclui a ordem das aplicações das regras de reescritura. Um mesmo diagrama arbóreo pode ser construído por ordens diferentes de aplicação das regras. O que Chomsky deseja mostrar nessa parte do capítulo é que as descrições em termos de estruturas sintagmáticas, como o que vimos em (9) e (10), são mais poderosas do que as descrições baseadas em estados finitos. “No nível da estrutura sintagmática (...) cada sentença da língua é representada por um conjunto de sequências [por exemplo, (10) acima], e não por uma única sequência, como acontece no nível dos fonemas, dos morfemas ou das palavras” (p. 43). Apesar de incluir um conjunto de sequências para cada sentença, Chomsky defende que a estrutura sintagmática seja considerada como um único nível (como são os níveis morfêmico ou fonêmico, ainda que com as diferenças apontadas acima). Chomsky apresenta então uma extensão do uso das regras de reescritura para a descrição morfofonêmica da língua. Assim, alguns exemplos de aplicação dessa ideia podem ser encontrados em: (12) (i) walk → /wɔk/ (ii) take + passado → /tuk/ (iii) /...D/ + passado → /...D/ + /ɪd/ (em que D = /t/ ou /d/) (iv) passado → /d/ (v) take → /teyk/ etc. Importante: será preciso haver uma ordem entre as regras. Assim, por exemplo, (ii) tem que se aplicar antes de (iii) e (v), para que o resultado gerado não seja /teykt/. Pode-se pensar uma aplicação das regras de reescritura all the way down, do nível mais abstrato das estruturas sintagmáticas ao nível morfofonêmico. Isso pode causar a sensação de que a própria ideia de se postular uma separação entre níveis – por exemplo o sintagmático e o morfofonêmico – é arbitrária, mas a questão é que os tipos de regras são de fato distintos: nas regras sintagmáticas um único símbolo é reescrito em outros, mas nas regras em (12) não é isso que acontece. Além disso, há diferença de níveis entre as regras em (12), e isso não acontece com as regras em, por exemplo, (9). 4) Limitações da descrição O que Chomsky tenta mostrar neste capítulo são as limitações de uma teoria baseada exclusivamente em estruturas sintagmáticas para descrever uma língua natural. Particularmente, a ideia é que mesmo que ela seja capaz de descrevê-la, a gramática construída será extremamente complexa, ad hoc e pouco reveladora. “A única maneira de testar a adequação de nosso aparato atual é tentar aplica-lo diretamente à descrição do inglês. Tão logo consideramos qualquer sentença que vá além do tipo mais simples e, em particular, tentamos definir algum tipo de ordem entre as regras que produzem tais sentenças, descobrimos que há inúmeras dificuldades e complicações” (p. 48). Mas a demonstração disso é extensa demais (e já fora feita em sua tese de doutorado) e Chomsky vai adotar um outro caminho, mostrando que há melhorias consideráveis da descrição do inglês se o modelo de gramática não ficar reduzido a [Σ, F]. Alguns exemplos: a) Coordenação: Z + X + W e Z + Y + W; como chegamos a Z + X e Y + W? Por exemplo: (i) a cena – do filme – foi em Chicago; (ii) a cena – da peça – foi em Chicago. E: a cena – do filme e da peça – foi em Chicago. Os X e Y devem ser constituintes sintáticos, e devem ser do mesmo tipo sintático: *a cena – do filme e que eu escrevi – foi em Chicago. - Uma regra de coordenação como a seguinte simplifica enormemente (em relação a uma gramática do tipo [Σ, F]) a descrição do processo de coordenação: “Se S1 e S2 são sentenças gramaticais, e S1 difere de S2 apenas pelo fato de S1 possuir X onde S2 possui Y, e X e Y forem constituintes do mesmo tipo em S1 e em S2, respectivamente, então S3 é uma sentença, em que S3 é o resultado da substituição de X por X + and + Y em S1” (p. 51). É importante ressaltar que esse tipo de regra não pode pertencer à gramática [Σ, F]. Qual é o problema? É que a regra não só vê a forma real de S1 e S2, mas também sua estrutura de constituintes. As regras de reescritura só veem seus constituintes imediatos, não veem a história da derivação. b) Chosmky faz um tratamento interessante dos morfemas de tempo e aspecto nos verbos do inglês usando uma combinação de regras de reescritura do tipo que vimos antes e três regras diferentes do desenho das regras sintagmáticas, como era a regra de coordenação acima. Uma dessas regras ficou conhecida como “pulo do afixo” na literatura, pois inverte a ordem de afixo e v na estrutura sintagmática da sentença e introduz uma fronteira de palavra após o afixo. A famosa regra é: “Seja Af qualquer um dos afixos: -passado, -S, -, -en, -ing. Seja v qualquer M (modal) ou V, ou have ou be. Então: Af + v → v + Af#, em que # é interpretado como fronteira de palavra” (p. 55). Para que fique mais claro, façamos uma derivação. Inicialmente, é preciso propor que nas regras de reescritura exista uma que reescreve o constituinte verbal (excluindo o complemento) como auxiliar mais verbo, conforme (13) a seguir: (13) Verbo → Aux + V Além disso, há outras regras como (14) e (15), que definem como são expressos os nós Aux e M: (14) (15) Aux → C(M) (have + -en) (be + -ing) (be + -en) M → will, can, may, shall, must A regra (16) diz como devem-se realizar os afixos: (16) C→ -S no contexto de SNsing __ - no contexto de SNpl __ -passado (Note-se que a regra (16), como o pulo do afixo, também viola a gramática com a álgebra [Σ, F], pois faz menção ao contexto, ao contrário das regras sintagmáticas de reescritura). Uma sequência para “the man has been reading the book” The + man + Verbo + the + book The + man + Aux + V + the + book The + man + Aux + read + the + book The + man + C + have + -en + be + -ing + read + the + book The + man + -S + have + -en + be + -ing + read + the + book The + man + have + -S # be + -en # read + -ing # the + book The # man # have + -S # be + -en # read + -ing # the # book – esta última linha é gerada pela seguinte regra, que estbelece as fronteiras de palavras: “[s]ubstitua + por # exceto no contexto v – Af. Insira # no início e no final” (p. 55). Aí aplicam-se regras morfofonêmicas como as que vimos em (12), gerando a sentença “the man has been reading the book”, em transcrição fonêmica. A análise de Chomsky para os auxiliares considera que há elementos descontínuos, como have + -en, e isso não pode ser descrito por uma gramática do tipo [Σ, F]. A análise teria que ser outra, muitos mais complexa, com pouca capacidade de proceder generalizações robustas. c) Relação voz ativa e voz passiva: “Se S1 é uma sentença gramatical da forma SN1 – Aux – V – SN2 então a sequência correspondente da forma SN2 – Aux + be + en – V – by + SN1 também é uma sentença gramatical” (p. 62). As regras (a), (b) e (c) que discutimos acima são diferentes das regras de reescritura que vimos anteriormente, pois têm acesso á história da derivação, não somente aos constituintes imediatos. Essas regras são chamadas de “transformações gramaticais”. De modo geral uma “transformação T opera sobre uma determinada sequência (...) com uma certa estrutura de constituintes e a converte em uma nova sequência com uma nova estrutura de constituintes derivada” (p. 63). As regras transformacionais devem ser aplicadas seguindo uma determinada ordem – veja-se que a regra da voz passiva em (c) deve aplicar-se antes das regras (14), (16) e do pulo do afixo, que de fato são alimentadas por ela. Algumas transformações são obrigatórias. Por exemplo, o grupo de regras que inclui (16), o pulo do afixo e a regra de fronteira de palavras é um conjunto de transformações obrigatórias, sem as quais não há sentença. Mas há transformações opcionais, como a da voz passiva. Núcleo da língua: conjunto das sentenças que são produzidas quando aplicamos as transformações obrigatórias às sequências terminais da gramática [Σ, F]. Sentença nuclear: “Quando aplicamos somente transformações obrigatórias na geração de uma determinada sentença, chamamos a sentença resultante de sentença nuclear (kernel)” (p. 67). Qual será a estrutura da gramática de uma língua natural? Proposta: Σ: Sentença: F: X1 → Y1 : Xn → Yn Estrutura sintagmática T1 : Tn Estrutura transformacional Z1 → W1 : Zn → Wn Morfofonêmica 5) Algumas transformações em inglês Aqui, Chomsky mostra a aplicação de algumas transformações para mostrar as virtudes do modelo na descrição do inglês. Negação: a transformação de negação Tneg introduzirá not em Aux depois do segundo morfema dado pela regra (14) acima. Importante deixar claro que a regra necessariamente se aplica antes da regra (16), da regra do salto do afixo e da regra que define as fronteiras de palavras. Mas o que acontece quando C se reescreve como –S? Tneg: John – C + n’t – come. Regra (16): John – -S + n’t – come. Não há condições para a aplicação da regra do pulo do afixo. É necessário introduzir uma transformação obrigatória em inglês, dada em (17), que se aplica depois de (16) e da regra de inserção das fronteiras de palavra #: (17) # Af → #do + Af (no exemplo: #S → #do + S) Ou seja, a regra garante que o afixo vai ser hospedado por um verbo. Uma regra morfológica vai juntar afixo e negação num só item. Segundo Chomsky, a abordagem transformacional para a negação é bem mais simples do que uma abordagem que gerasse as sentenças negativas no núcleo da língua – ou seja, por meio de regras de reescritura e transformações obrigatórias como o pulo do afixo. Mas a questão é que, se um aparato mais poderoso como as transformações permite simplificar não só uma descrição de determinada construção, mas também a de outras estruturas paralelas, podemos dizer que o aparato não está somente deslocando a complexidade de lugar. Considere-se então a classe de perguntas com resposta do tipo “sim ou não”. Como é de conhecimento, há a inversão do auxiliar com o sujeito da frase da versão declarativa para que a versão interrogativa seja gerada. Suponhamos uma transformação Tint que se aplica sobre do tipo SN – C – V. Suponhamos que essa regra intercambia o primeiro e o segundo elementos dessa sequência. É importante que essa transformação se aplique depois de (16), mas antes da regra do pulo do afixo. Por exemplo, na sentença have they arrived? Depois de aplicar-se (16), temos: (18) They – - + have – -en – arrive. Aplica-se Tint: (19) - + have – they – -en – arrive. Aplica-se o pulo do afixo: (20) Have + - – they – arrive + -en. Aplica-se a regra de fronteiras: (21) Have + - # they # arrive + -en. E as regras morfofonêmicas se aplicam para gerar a forma have they arrived em transcrição fonêmica. Note-se que para gerar do they arrive, a regra (17) é aplicada após a aplicação de Tint. (22) - – they – arrive - # they # arrive (regra de fronteira de palavras) do + - # they # arrive (regra de inserção de do) Note-se que tanto o tipo de subdivisão da sentença quanto a regra de introdução de do são adotadas pelas transformações de negação e interrogação. Se fôssemos dar conta disso que regras sintagmáticas somente o aparato seria muito mais pesado, com a postulação de inúmeras regras distintas para os dois processos, incapaz de captar os aspectos comuns dos dois. Outro exemplo interessante, a transformação Tso, que gera, a partir de pares como {John arrives, I arrive}, coordenações do tipo John arrives and so do I. Simplificando a história, a regra diz que (23) se converte em (24) e, depois, as mesmas regras que aplicamos para afixação e inserção de do se aplicam: (23) (24) John – -S – arrive, I – - – arrirve John – -S – arrive – and – so – - – I John – arrive + -S – and – so – - – I John # arrive + -S # and # so # - # I John # arrive + -S # and # so # do + - # I Agora falando um pouco de QU. Como geramos o par abaixo usando transformações? Seria vantajoso abordar esses casos por meio de regras transformacionais? Vamos assumir que existe uma transformação Tw que opera sobre qualquer sequência da forma X – SN – Y. A transformação opera é duas etapas: (i) como Tint, inverte a ordem dos dois primeiros elementos: X – SN – Y → SN – X – Y; (ii) converte SN – X – Y em who – X – Y se o SN for animado e em what – X – Y se o SN for inanimado. Agora é preciso impor a condição de que Tw se Tint já tiver se aplicado. Na verdade, Tw se aplica após Tint mas antes da regra do pulo do afixo. As passagens para who ate an apple: (i) (ii) (iii) (iv) (v) John – C – eat + an + apple = John – -passado – eat + an + apple Tint: -passado – John – eat + an + apple Tw: (a) John – -passado – eat + an + apple; (b) who – -passado – eat + an + apple Pulo do afixo: who – eat + -passado # an + apple Limite de palavra: who # eat + -passado # an # apple No final: who ate an apple? As passagens para what did John eat: (i) (ii) (iii) (iv) (v) John – C – eat + an + apple = John – -passado – eat + an + apple Tint: -passado – John – eat + an + apple Tw: (a) an + apple – -passado + John + eat; (b) what – -passado + John + eat Limite de palavras: what # -passado # John # eat Inserção de do: what # do + -passado # John # eat No final: what did John eat? O sistema também explica as entoações das sentenças: as interrogativas do tipo sim-não têm entoação ascendente, mas as com QU (ou WH) têm entoação descendente, como as declarativas. Suponhamos que a Tint também converta a entoação descendente da declarativa nuclear na entoação ascendente. Suponhamos, ainda, que Tw faça a mesma inversão de entoação a sentença à qual foi aplicada. Assim, como ela é aplicada a uma sentença de entoação ascendente, fará com que a entoação da sentença final seja descendente, como esperamos. Há transformações nominalizadoras, como a que converte por exemplo uma sentença do tipo SN – SV em to + SV ou em –ing + SV. Chomsky também fala da possibilidade de tratar transformacionalmente a estrutura Art + Adj + N, como se derivada de Art – N – is – Adj. Há outras transformações sendo discutidas no capítulo, mas basta-nos o que vimos até aqui. 6) O poder explicativo da teoria linguística Ambiguidades fonológicas como em /əneym/ (a name ou an aim) não seria tratável se a gramática só tivesse um nível, o fonológico. Com o acréscimo do nível morfológico, é possível caracterizar a ambiguidade da sequência de fonemas. Do mesmo modo, se não houvesse uma estrutura sintagmática (um nível sintagmático) da forma SN – Verbo – SN por traz de sentenças distintas como John played tennis e my friend likes music, não seria possível explicar que, apesar de muito distintas fonológica e morfologicamente, as duas sentenças são, em certo sentido, compreendidas da mesma maneira. “Para compreender uma sentença, então, é necessário, primeiramente, reconstruir sua análise em cada nível linguístico; e podemos testar a adequação de um determinado conjunto de níveis linguísticos abstratos conferindo se as gramáticas formuladas em termos desses níveis nos permitem fornecer ou não uma análise satisfatória do que chamamos de ‘compreender uma sentença’”. Não podemos dar conta de todos os casos de ambiguidade com somente os níveis fonológico, morfológico e sintagmático. É preciso, como se verá, também o nível transformacional. Vejamos o seguinte exemplo: the shooting of the hunters. Ambiguidade: os caçadores podem ser tanto sujeitos do ato de atirar, como objetos do ato. No nível sintagmático, há somente uma estrutura do tipo the – V – -ing – of – SN. A ideia para resolver o problema é que a expressão é derivada via transformações de duas estruturas nucleares distintas: the hunters shoot e they shoot the hunters. Ou seja, somente com o acréscimo do nível transformacional para além do nível sintagmático, podemos explicar as diferentes interpretações que o SN the shooting of the hunters tem. Chomsky também mostra casos em que duas sentenças distintas veiculam o mesmo significado que somente uma sentença nuclear. A maneira de lidar com isso, mais uma vez, é apelar para a existência de um nível transformacional que gera duas sequências distintas a partir de uma mesma sequência sintagmática. 7) Sintaxe e semântica Chomsky critica a ideia de que se possa construir uma gramática apelando-se para o significado. 1) Não é verdade que dois enunciados são fonemicamente distintos se e somente se eles diferem no significado: (a) sinônimos absolutos com distintas realizações fonéticas: ádult x adúlt; (b) itens fonemicamente idênticos com significados distintos: bank x bank. 2) Não é verdade que os morfemas são os menores elementos portadores de significado: qual é o significado de to em I want to go, ou de do em did he come? Do mesmo modo, trechos que não são morfemas, como a sequência gl- em gleam, glimmer, glow, devem ter algum significado constante entre os itens. 3) Não é verdade que sentenças gramaticais são aquelas que possuem significação semântica: colorless green ideas sleep furiously. 4) Não é verdade que a relação sujeito-verbo (SN – VP) corresponde ao sentido estrutural ator-ação: João recebeu uma carta. A briga parou. 5) Não é verdade que a relação verbo-objeto veicule o sentido estrutural açãoobjetivo ou ação-objeto da ação: Eu perdi o trem. 6) Não é verdade que ativa e passiva são sinônimas: Todas as mulheres amam um homem./Um homem é amado por todas as mulheres. No entanto, apesar de sua independência, Chomsky não nega que existam correspondências entre categorias gramaticais e semânticas.