Magali Sanches Duran [email protected] Sandra Maria Aluísio [email protected] NÚCLEO INTERINSTITUCIONAL DE LINGUÍSTICA COMPUTACIONAL (NILC) USP-ICMC – SÃO CARLOS A QUEM PERTENCE A PREPOSIÇÃO? Ele trabalha em publicidade. Ele trabalha em segredo. PRÓXIMAS ETAPAS: Analisar listas preposições. obtidas para as demais RESULTADO ESPERADO: DESAFIO Distinguir os sintagmas preposicionados (PP= Prepositional Phrases) que são complementos de verbos dos que são adjuntos. Ele trabalha em publicidade. Ele trabalha em segredo. PP: em publicidade Complemento do verbo Responde a pergunta: Trabalha em quê? Papel semântico: TÓPICO PP: em segredo Adjunto Adverbial de Modo Responde a pergunta: Trabalha como? Papel Semântico: ADJUNTO DE MODO FINALIDADE 1.Relação de verbos que admitem complemento preposicionado com suas respectivas preposições admitidas e papéis semânticos dos complementos. Anotação automática de papéis semânticos no Projeto PROPBANK-BR. PORQUÊ Quando o PP é complemento do verbo, é possível prédeterminar o papel semântico do PP na descrição dos frames do verbo. Se o PP é uma multipalavra, também é possível pré-determinar seu papel semântico. INSTRUMENTOS E MÉTODOS Corpus Utilizado: CetenFolha. Ferramenta de busca: AC/DC Expressões de busca: Lista das preposições que introduzem PP após verbos: 1 VERBO PREP falar falar falar falar falar dar dar decidir reclamar em de sobre com para para a entre de PAPEL SEMÂNTICO1 topic topic topic actor recipient beneficiary beneficiary theme1 theme 2 topic Papéis semânticos utilizados no projeto VerbNet. 2.Relação de preposições. multipalavras introduzidas TRABALHOS FUTUROS Subcategorização semântica das multipalavras MULTIPALAVRA PAPEL SEMÂNTICO2 Procura: [pos="V"]@ [pos="PRP"]. Distribuição de lema em sigilo modo em dobro quantidade Lista de verbos, em ordem de frequência, seguidos de PP (consulta repetida para cada preposição para analisar regência) Procura: @[pos="V"] [lema="em"] . Distribuição de lema Lista colocados, em ordem de frequência, após cada preposição que segue um verbo (consulta repetida para cada preposição para analisar multipalavras) em decorrência de X causa em conjunto com X companhia em seguida tempo Procura: [pos="V"] [lema="em" & pos="PRP"]@[pos="N.*"]. Distribuição de lema RESULTADOS PARCIAIS Preposição Ocorrências Lemas V + Prep V + Prep em de por a com para sobre até entre contra sem 77727 71957 54376 51365 50397 44876 7031 6182 6145 3747 3237 2651 2514 2426 1635 2263 1891 710 858 794 435 708 Verbos Multipalavras Regidos levantadas pela preposição 193 86 33 48 81 46 0 19 47 0 2 0 2 4 0 2 por Projeto financiado pela 2Papéis semânticos adjuntos usados no Projeto Propbank-Br REFERÊNCIAS: Acesso ao corpus http://www.linguateca.pt/cetenfolha/ Descrição do corpus: PINHEIRO, G. M. ; ALUÍSIO, S. M. (2003). Córpus Nilc: descrição e análise crítica com vistas ao projeto LacioWeb. NILC-TR-03-03. ACDC: Diana Santos & Eckhard Bick. "Providing Internet access to Portuguese corpora: the AC/DC project". In Maria Gavrilidou, George Carayannis, Stella Markantonatou, Stelios Piperidis & Gregory Stainhauer (eds.), Proceedings of the Second International Conference on Language Resources and Evaluation (LREC 2000) (Athens, 31 May-2 June 2000), pp. 205-210. http://www.linguateca.pt/documentos/SantosBickLREC2000.pdf Propbank-Br: DURAN, Magali Sanches. Propbank.Br: Regras sintáticosemânticas para mapeamento de perguntas-respostas de verbos do português e anotação de papéis semânticos em um corpus do português do Brasil. Projeto de Pós-Doutorado. Propbank: http://verbs.colorado.edu/~mpalmer/projects/ace.html PALMER, M.; GILDEA D.; KINGSBURY, P. (2005) The Proposition Bank: A Corpus Annotated with Semantic Roles, Computational Linguistics Journal, 31:1. VerbNet: http://verbs.colorado.edu/~mpalmer/projects/ace.html FAPESP