compiladores - DEEI

Propaganda
Caderno de exercícios para a disciplina de:
COMPILADORES
Janeiro de 2005
João M. P. Cardoso
Departamento de Engenharia Electrónica e Informática (DEEI)
Faculdade de Ciências e Tecnologia (FCT)
Universidade do Algarve
Campus de Gambelas
8000-117 Faro
Email: [email protected]
URL: http://w3.ualg.pt/~jmcardo
Curso de Licenciatura em Engenharia de Sistemas e Informática
Curso de Licenciatura em Ensino de Informática
Curso de Licenciatura em Informática
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
Índice
FICHA Nº 1
1.1
Optimizações de código.....................................................................5
Verificar a diferença entre o tempo de execução utilizando o interpretador e
utilizando o compilador JIT .......................................................................................5
1.2
Optimizações..................................................................................................6
1.3
Propagação de constantes (Constant Propagation) ........................................7
1.4
Constant folding (Constant-Expression Evaluation) .....................................8
1.5
Desenrolamento de ciclos (Loop Unrolling)..................................................9
1.6
Simplificação algébrica (Algebraic simplification) .......................................9
1.7
Desenrolamento de ciclos (Loop Unrolling)................................................10
1.8
Simplificações algébricas + constant folding ..............................................11
1.9
Scalar replacement .......................................................................................11
1.10
Simplificação algébrica................................................................................12
1.11
Eliminação de código ou de declarações não utilizadas ..............................13
1.12
Strength reduction........................................................................................13
1.13
Depois de simplificações algébricas e reassociação ....................................14
1.14
Depois de CSE (eliminação de sub-expressões comuns): ...........................14
1.15
Sumário ........................................................................................................15
FICHA Nº 2
Introdução aos Algoritmos Iterativos...............................................16
1.16
Algoritmo Iterativo para Determinar Funções Recursivas ..........................16
1.17
Transitive Closure........................................................................................17
1.18
Algoritmo Iterativo para Transitive Closure................................................17
©João M. P. Cardoso
2
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
1.19
Exercício 1 ...................................................................................................18
1.20
Código Java..................................................................................................18
1.21
Classe Graph.java ........................................................................................19
1.22
Classe TransitiveClosure.java......................................................................21
1.23
Trabalho para Casa ......................................................................................21
1.24
Créditos ........................................................................................................22
FICHA Nº 3
Exercícios sobre Expressões Regulares e Autómatos Finitos..........23
1.25
Exercícios com Expressões Regulares.........................................................23
1.26
Exercícios com Autómatos Finitos ..............................................................23
FICHA Nº 4
Exercícios sobre Gramáticas............................................................26
FICHA Nº 5
Implementação de Analisadores Gramaticais Utilizando o JavaCC
(1ª parte)
29
1.27
Exemplo .......................................................................................................29
1.28
Exercícios.....................................................................................................32
1.29
Referências de Apoio...................................................................................32
FICHA Nº 6
Implementação de Analisadores Gramaticais Utilizando o JavaCC
(2ª parte)
33
1.30
Exercício ......................................................................................................33
FICHA Nº 7
Implementação de Analisadores Gramaticais Utilizando o JavaCC
(3ª parte)
34
1.31
Exemplo .......................................................................................................34
1.32
Referências de Apoio...................................................................................45
©João M. P. Cardoso
3
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
FICHA Nº 8
: Exercício sobre analisadores sintácticos........................................46
FICHA Nº 9
: Exercícios de Revisão....................................................................50
Anexo B: Enunciado de um Exame .............................................................................52
©João M. P. Cardoso
4
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
FICHA Nº 1 Optimizações de código
Duração: 3 horas
Esta aula tem como objectivo a utilização de algumas das optimizações de código
realizadas pelos compiladores. Algumas dessas optimizações não dependem do
processador alvo para garantirem sempre bons resultados. As optimizações do tipo
anterior e cujo impacto será avaliado são:
•
Propagação de constantes (Constant propagation);
•
Avaliação de expressões com constantes (Constant folding ou ConstantExpression evaluation);
•
Simplificações algébricas (Algebraic Simplifications)
•
Substituição por escalares (Scalar replacement)
•
Redução do custo (Strength reduction)
•
Eliminação de sub-expressões comuns (Common-Subexpression elimination CSE)
•
Eliminação de código e de declarações não utilizadas
•
Desenrolamento de ciclos (Loop unrolling)
Após leitura desta ficha e verificação das melhorias no tempo de execução, descreva
cada uma das optimizações anteriores.
1.1 Verificar a diferença entre o tempo de execução
utilizando o interpretador e utilizando o
compilador JIT
O programa exemplo que vamos utilizar é formado pelas classes em bytecodes e por
uma classe para a qual é dada o ficheiro Java original. Para executar o programa deve
primeiro compilar o ficheiro Filter.java e depois executar um dos comandos seguintes:
Utilizando o interpretador:
Java –Xint DrawImage
Utilizando o compilador JIT (por omissão):
©João M. P. Cardoso
5
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
Java DrawImage
Verifique os tempos de execução de cada um dos algoritmos apresentados.
A Figura 1 apresenta o resultado da execução do referido programa.
Figura 1. Appet Java utilizada para que os alunos possam verificar o impacto no
desempenho da utilização de determinadas transformações (optimizações) ao
nível do código da aplicação.
1.2 Optimizações
Vamos considerar a função doFIR apresentada em baixo e que é um método da classe
Filter.java. Este método, como pôde constatar anteriormente implementa um
algoritmo de processamento de imagem que reduz o ruído de uma imagem. De
seguida vamos realizar manualmente um conjunto de optimizações, que integram ou
constam como opções de alguns compiladores e que permitem melhorar o
desempenho.
final public static short[] doFIR(short[] IN) {
short[] K = {1, 2, 1,
2, 4, 2,
1, 2, 1};
©João M. P. Cardoso
6
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
int DIM = 350;
short[] OUT = new short[DIM*DIM];
for (int row=0; row < DIM-3+1; row++) {
for (int col = 0; col< DIM-3+1; col++) {
int sumval = 0;
for (int wrow=0; wrow < 3; wrow++) {
for (int wcol = 0; wcol<3; wcol++) {
sumval += IN[(row +wrow)*DIM+(col+wcol)]*K[wrow*3+wcol];
}
}
sumval = sumval / 16;
OUT[row * DIM + col] = (short) sumval;
}
}
return OUT;
}
1.3 Propagação de constantes (Constant Propagation)
final public static short[] doFIR(short[] IN) {
short[] K = {1, 2, 1,
2, 4, 2,
1, 2, 1};
short[] OUT = new short[350*350];
for (int row=0; row < 350-3+1; row++) {
for (int col = 0; col< 350-3+1; col++) {
int sumval = 0;
for (int wrow=0; wrow < 3; wrow++) {
for (int wcol = 0; wcol<3; wcol++) {
sumval += IN[(row +wrow)*350+(col+wcol)]*K[wrow*3+wcol];
}
}
sumval = sumval / 16;
OUT[row * 350 + col] = (short) sumval;
}
}
return OUT;
}
©João M. P. Cardoso
7
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
1.4 Constant folding (Constant-Expression
Evaluation)
final public static short[] doFIR(short[] IN) {
short[] K = {1, 2, 1,
2, 4, 2,
1, 2, 1};
short[] OUT = new short[350*350];
for (int row=0; row < 350-3+1; row++) {
122500
348
for (int col = 0; col< 350-3+1; col++) {
int sumval = 0;
for (int wrow=0; wrow < 3; wrow++) {
for (int wcol = 0; wcol<3; wcol++) {
sumval+= IN[(row +wrow)*350+(col+wcol)]*K[wrow*3+wcol];
}
}
sumval = sumval / 16;
OUT[row * 350 + col] = (short) sumval;
}
}
return OUT;
}
Depois de aplicar constant folding:
final public static short[] doFIR(short[] IN) {
short[] K = {1, 2, 1,
2, 4, 2,
1, 2, 1};
short[] OUT = new short[122500];
for (int row=0; row < 348; row++) {
for (int col = 0; col< 348; col++) {
int sumval = 0;
for (int wrow=0; wrow < 3; wrow++) {
for (int wcol = 0; wcol<3; wcol++) {
sumval+= IN[(row +wrow)*350+(col+wcol)]*K[wrow*3+wcol];
}
}
sumval = sumval / 16;
OUT[row * 350 + col] = (short) sumval;
©João M. P. Cardoso
8
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
}
}
return OUT;
}
1.5 Desenrolamento de ciclos (Loop Unrolling)
for (int wcol = 0; wcol<3; wcol++) {
sumval+= IN[(row +wrow)*350+(col+wcol)]*K[wrow*3+wcol];
}
Obtém-se:
final public static short[] doFIR(short[] IN) {
short[] K = {1, 2, 1,
2, 4, 2,
1, 2, 1};
short[] OUT = new short[122500];
for (int row=0; row < 348; row++) {
for (int col = 0; col< 348; col++) {
int sumval = 0;
for (int wrow=0; wrow < 3; wrow++) {
sumval+= IN[(row +wrow)*350+(col+0)]*K[wrow*3+0];
sumval+= IN[(row +wrow)*350+(col+1)]*K[wrow*3+1];
sumval+= IN[(row +wrow)*350+(col+2)]*K[wrow*3+2];
}
sumval = sumval / 16;
OUT[row * 350 + col] = (short) sumval;
}
}
return OUT;
}
1.6 Simplificação algébrica (Algebraic simplification)
final public static short[] doFIR(short[] IN) {
short[] K = {1, 2, 1,
2, 4, 2,
1, 2, 1};
short[] OUT = new short[122500];
for (int row=0; row < 348; row++) {
©João M. P. Cardoso
9
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
for (int col = 0; col< 348; col++) {
int sumval = 0;
for (int wrow=0; wrow < 3; wrow++) {
sumval+= IN[(row +wrow)*350+col])*K[wrow*3];
sumval+= IN[(row +wrow)*350+(col+1)])*K[wrow*3+1];
sumval+= IN[(row +wrow)*350+(col+2)])*K[wrow*3+2];
}
sumval = sumval / 16;
OUT[row * 350 + col] = (short) sumval;
}
}
return OUT;
}
1.7 Desenrolamento de ciclos (Loop Unrolling)
for (int wrow=0; wrow < 3; wrow++) {
sumval+= IN[(row +wrow)*350+col]*K[wrow*3];
sumval+= IN[(row +wrow)*350+(col+1)]*K[wrow*3+1];
sumval+= IN[(row +wrow)*350+(col+2)]*K[wrow*3+2];
}
Obtém-se:
final public static short[] doFIR(short[] IN) {
short[] K = {1, 2, 1,
2, 4, 2,
1, 2, 1};
short[] OUT = new short[122500];
for (int row=0; row < 348; row++) {
for (int col = 0; col< 348; col++) {
int sumval = 0;
sumval+= IN[(row +0)*350+col]*K[0*3];
sumval+= IN[(row +0)*350+(col+1)]*K[0*3+1];
sumval+= IN[(row +0)*350+(col+2)]*K[0*3+2];
sumval+= IN[(row +1)*350+col]*K[1*3];
sumval+= IN[(row +1)*350+(col+1)]*K[1*3+1];
sumval+= IN[(row +1)*350+(col+2)]*K[1*3+2];
sumval+= IN[(row +2)*350+col]*K[2*3];
sumval+= IN[(row +2)*350+(col+1)]*K[2*3+1];
sumval+= IN[(row +2)*350+(col+2)]*K[2*3+2];
©João M. P. Cardoso
10
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
sumval = sumval / 16;
OUT[row * 350 + col] = (short) sumval;
}
}
return OUT;
}
1.8 Simplificações algébricas + constant folding
final public static short[] doFIR(short[] IN) {
short[] K = {1, 2, 1,
2, 4, 2,
1, 2, 1};
short[] OUT = new short[122500];
for (int row=0; row < 348; row++) {
for (int col = 0; col< 348; col++) {
int sumval= IN[row*350+col]*K[0];
sumval+=
IN[row*350+(col+1)]*K[1];
sumval+=
IN[row*350+(col+2)]*K[2];
sumval+=
IN[(row +1)*350+col]*K[3];
sumval+=
IN[(row +1)*350+(col+1)]*K[4];
sumval+=
IN[(row +1)*350+(col+2)]*K[5];
sumval+=
IN[(row +2)*350+col]*K[6];
sumval+=
IN[(row +2)*350+(col+1)]*K[7];
sumval+=
IN[(row +2)*350+(col+2)]*K[8];
sumval = sumval / 16;
OUT[row * 350 + col] = (short) sumval;
}
}
return OUT;
}
1.9 Scalar replacement
final public static short[] doFIR(short[] IN) {
short[] K = {1, 2, 1,
2, 4, 2,
1, 2, 1};
short[] OUT = new short[122500];
for (int row=0; row < 348; row++) {
for (int col = 0; col< 348; col++) {
©João M. P. Cardoso
11
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
int sumval= IN[row*350+col]*1;
sumval+=
IN[row*350+(col+1)]*2;
sumval+=
IN[row*350+(col+2)]*1;
sumval+=
IN[(row +1)*350+col]*2;
sumval+=
IN[(row +1)*350+(col+1)]*4;
sumval+=
IN[(row +1)*350+(col+2)]*2;
sumval+=
IN[(row +2)*350+col]*1;
sumval+=
IN[(row +2)*350+(col+1)]*2;
sumval+=
IN[(row +2)*350+(col+2)]*1;
sumval = sumval / 16;
OUT[row * 350 + col] = (short) sumval;
}
}
return OUT;
}
1.10 Simplificação algébrica
final public static short[] doFIR(short[] IN) {
short[] K = {1, 2, 1,
2, 4, 2,
1, 2, 1};
short[] OUT = new short[122500];
for (int row=0; row < 348; row++) {
for (int col = 0; col< 348; col++) {
int sumval= IN[row*350+col];
sumval+=
IN[row*350+col+1]*2;
sumval+=
IN[row*350+col+2];
sumval+=
IN[(row +1)*350+col]*2;
sumval+=
IN[(row +1)*350+col+1]*4;
sumval+=
IN[(row +1)*350+col+2]*2;
sumval+=
IN[(row +2)*350+col];
sumval+=
IN[(row +2)*350+col+1]*2;
sumval+=
IN[(row +2)*350+col+2];
sumval = sumval / 16;
OUT[row * 350 + col] = (short) sumval;
}
}
return OUT;
}
©João M. P. Cardoso
12
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
1.11 Eliminação de código ou de declarações não
utilizadas
final public static short[] doFIR(short[] IN) {
short[] OUT = new short[122500];
for (int row=0; row < 348; row++) {
for (int col = 0; col< 348; col++) {
int sumval= IN[row*350+col];
sumval+=
IN[row*350+col+1]*2;
sumval+=
IN[row*350+col+2];
sumval+=
IN[(row +1)*350+col]*2;
sumval+=
IN[(row +1)*350+col+1]*4;
sumval+=
IN[(row +1)*350+col+2]*2;
sumval+=
IN[(row +2)*350+col];
sumval+=
IN[(row +2)*350+col+1]*2;
sumval+=
IN[(row +2)*350+col+2];
sumval = sumval / 16;
OUT[row * 350 + col] = (short) sumval;
}
}
return OUT;
}
1.12 Strength reduction
final public static short[] doFIR(short[] IN) {
short[] OUT = new short[122500];
for (int row=0; row < 348; row++) {
for (int col = 0; col< 348; col++) {
int sumval= IN[row*350+col];
sumval+=
IN[row*350+col+1]<<1;
sumval+=
IN[row*350+col+2];
sumval+=
IN[(row +1)*350+col]<<1;
sumval+=
IN[(row +1)*350+col+1]<<2;
sumval+=
IN[(row +1)*350+col+2]<<1;
sumval+=
IN[(row +2)*350+col];
sumval+=
IN[(row +2)*350+col+1]<<1;
sumval+=
IN[(row +2)*350+col+2];
sumval = sumval >> 4;
OUT[row * 350 + col] = (short) sumval;
©João M. P. Cardoso
13
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
}
}
return OUT;
}
1.13 Depois de simplificações algébricas e
reassociação
final public static short[] doFIR(short[] IN) {
short[] OUT = new short[122500];
for (int row=0; row < 348; row++) {
for (int col = 0; col< 348; col++) {
int sumval=IN[row*350+col];
sumval+=IN[row*350+col+1]<<1;
sumval+=IN[row*350+col+2];
sumval+=IN[350*row +350+col]<<1;
sumval+=IN[350*row +351+col]<<2;
sumval+=IN[350*row +352+col]<<1;
sumval+=IN[350*row +700+col];
sumval+=IN[350*row +701+col]<<1;
sumval+=IN[350*row +702+col];
sumval = sumval >> 4;
OUT[row * 350 + col] = (short) sumval;
}
}
return OUT;
}
1.14 Depois de CSE (eliminação de sub-expressões
comuns):
final public static short[] doFIR(short[] IN) {
short[] OUT = new short[122500];
for (int row=0; row < 348; row++) {
for (int col = 0; col< 348; col++) {
int row_350_col = row*350 + col;
int sumval= IN[row_350_col];
sumval+=
IN[row_350_col + 1]<<1;
sumval+=
IN[row_350_col + 2];
©João M. P. Cardoso
14
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
sumval+=
IN[row_350_col + 350]<<1;
sumval+=
IN[row_350_col + 351]<<2;
sumval+=
IN[row_350_col + 352]<<1;
sumval+=
IN[row_350_col + 700];
sumval+=
IN[row_350_col + 701]<<1;
sumval+=
IN[row_350_col + 702];
sumval = sumval >> 4;
OUT[row_350_col] = (short) sumval;
}
}
return OUT;
}
1.15 Sumário
As optimizações ilustradas nesta ficha permitem, sempre que haja potencial para a sua
aplicação, melhorar o desempenho do código. No exemplo ilustrado foi necessário
aplicar algumas das optimizações mais do que uma vez, em virtude da aplicação de
certas optimizações potenciar a aplicação de outras (ver por exemplo a aplicação do
desenrolamento de ciclos).
©João M. P. Cardoso
15
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
FICHA Nº 2
Introdução aos Algoritmos
Iterativos
Duração: 3 horas
1.16 Algoritmo Iterativo para Determinar Funções
Recursivas
Esta aula pretende representar uma classe de algoritmos muito utilizada em algumas
fases de um compilador. Estes algoritmos designam-se por iterativos, pois vão
alcançando a solução final por iterações.
Pretende-se determinar se um conjunto de chamadas a funções existente num dado
programa origina recursividade. Para tal é normalmente criado um grafo chamado de
Call Graph1 (grafo de chamadas a funções) que representa a estrutura de chamadas a
funções de um programa. Considere os pedaços de código seguintes (as reticências
indicam enunciados no programa que não contêm chamadas a instruções):
Void P() {... Q(); … S(); …}
Void Q() {...R(); … T(); …}
Void R() {…P(); …}
Void S() {…}
Void T() {...}
Cada nó do Call Graph representa a chamada a uma função ou procedimento, e cada
laço entre dois nós representa que a função de onde sai a seta chama a função para
onde a seta aponta. O Call Graph que representa o programa é (poderia ser construído
com base na análise do código do programa):
1
O Call Graph é utilizado na compilação em outros contextos que não apenas o de recursividade.
©João M. P. Cardoso
16
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
P
Q
R
S
T
Vamos supor que um compilador pretendia determinar quais são as funções
recursivas.
1.17 Transitive Closure
Uma das propriedades que se pode aplicar ao grafo é a propriedade transitiva:
● Se existe uma seta do nó A para o nó B e do nó B para o nó C então vamos fazer
com que exista também uma seta entre o nó A e o nó C.
Como os enunciados ‘A chama A directa ou indirectamente e ‘A é recursiva’ são
equivalentes a aplicação da regra anterior permite determinar automaticamente as
funções recursivas num determinado programa.
Após aplicação da propriedade transitiva teríamos o grafo seguinte:
P
Q
R
S
T
Que mostra claramente que as funções P, Q, e R são funções recursivas.
1.18 Algoritmo Iterativo para Transitive Closure
O seguinte algoritmo iterativo pode ser utilizado para aplicar a propriedade transitiva
a um Call Graph:
SET flag of Something changed TO TRUE;
WHILE something changed {
SET flag of Something changed TO FALSE;
©João M. P. Cardoso
17
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
FOR EACH node A IN Graph {
FOR EACH node B IN Descendants of Node A {
FOR EACH node C IN Descendants of Node B {
IF there is no arrow from Node A to Node C {
Add an arrow from Node A to Node C;
SET flag Something changed TO TRUE;
}
}
}
}
}
1.19 Exercício 1
Com base no código Java (ver a secção seguinte) formado pelas classes Graph e
escreva
TransitiveClosure,
o
método
da
classe
Graph,
designado
por
transitiveClosure, que deve implementar o algoritmo apresentado anteriormente. De
seguida realize os passos seguintes:
a) Compile as classes java fazendo: javac *.java
b) Execute o programa fazendo: java TransitiveClosure
1.20 Código Java
No código Java, o Call Graph original é representado por um array bidimensional,
designado por Edges, de 5×5 elementos booleanos. O grafo original poderá ser
representado pela seguinte matriz, em que os nós 0, 1, 2, 3, e 4 representam as funções
P, Q, R, S, e T, respectivamente:
Edges[i][j]
I
J
0
1
2
3
4
0
False
true
false
true
false
1
False
False
true
False
true
2
true
False
False
False
False
3
False
False
False
False
False
4
False
False
False
False
False
©João M. P. Cardoso
18
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
Por exemplo, o valor true no elemento edges[0][1] indica que existe um laço entre o
nó 0 e o nó 1 com sentido de 0 para 1.
1.21 Classe Graph.java
/**
This is the class of the calling graph structure.
It includes the transitive closure algorithm.
the lines below tells the javadoc tool who is the author of this class and which is the
version (try: javadoc graph.java and then view the generated html files)
@author João M. P. Cardoso
@version v0.1
*/
// import from the API the class to use System.out.println
import java.io.*;
public class Graph {
// array which represents the edges between nodes
boolean[][] edges;
/**
add an edge between two nodes
@param source represents the source of the directed edge
@param sink represents the destination node of the directed edges
*/
public void addEdge(int source, int sink) {
edges[source][sink] = true;
}
/**
Print the edges between nodes.
*/
public void print() {
System.out.println("Graph edges: ");
int N = edges.length;
for(int i=0; i<N; i++)
for(int j=0; j<N; j++)
if(edges[i][j])
©João M. P. Cardoso
19
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
System.out.println(i+" -> "+j);
}
/**
Constructor of the graph.
The line below defines the argument numNodes to be used by the javadoc tool
@param numNodes the number of nodes in the graph
*/
public Graph(int numNodes) {
// create the array with size = numNodes x numNodes
edges = new boolean[numNodes][numNodes];
// initiate all the elements equal to false: none edges
for(int i=0; i<numNodes; i++)
for(int j=0; j<numNodes; j++)
edges[i][j] = false;
}
/**
Show the functions of the calling graph which are recursive.
*/
public void printRecursiveFunctions() {
int numNodes = this.edges.length;
System.out.print("Recursive Functions in nodes: {");
for(int k=0; k<numNodes; k++)
// if there is an edge with source=sink then
// the node represents a recursive function
if(edges[k][k])
System.out.print(" "+k);
System.out.println(" }");
}
/**
Algorithm to perform the transitive closure on the original graph.
*/
public void transitiveClosure() {
// your code must be here!!!
}
}
©João M. P. Cardoso
20
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
1.22 Classe TransitiveClosure.java
/**
Class where the calling graph is created and the transitive closure is applied.
*/
public class TransitiveClosure {
public static void main(String args[]) {
// create a calling graph with 5 nodes
Graph callGraph = new Graph(5);
// add the 5 edges
callGraph.addEdge(0, 1);
callGraph.addEdge(1, 2);
callGraph.addEdge(2, 0);
callGraph.addEdge(0, 3);
callGraph.addEdge(1, 4);
// print the original graph
callGraph.print();
// call the transitive closure algorithm over the callGraph
callGraph.transitiveClosure();
// print the graph after applying the transitive closure algorithm
callGraph.print();
// show the nodes which represent recursive functions
callGraph.printRecursiveFunctions();
}
}
1.23 Trabalho para Casa
Modifique o método main da classe TransitiveClosure de modo a determinar as
funções recursivas do seguinte Call Graph:
©João M. P. Cardoso
21
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
P
Q
R
S
T
U
1.24 Créditos
A aula é baseada no exemplo apresentado no livro:
Dick Grune, Henri E. Bal, Ceriel J. H. Jacobs, and Koen G. Langendoen, Modern
Compiler Design, John Wiley & Sons, Ltd, 2000.
©João M. P. Cardoso
22
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
FICHA Nº 3 Exercícios sobre Expressões
Regulares e Autómatos Finitos
Duração: 3 horas
1.25 Exercícios com Expressões Regulares
1.1 Escreva expressões regulares para os seguintes exemplos:
(a) números binários representando números inteiros;
(b) [TPC] URLs da forma: http://www.ualg.pt (em que o campo intermédio
“ualg” é o único campo variável).
(c) [TPC] IPs da forma: 140.192.33.37 (considere que todos os IPs têm o mesmo
número de dígitos por cada campo).
(d) Representação binária de números inteiros sem utilizarem zeros supérfluos;
(e) Strings sobre o alfabeto {a, b, c} com número ímpar de a’s;
(f) [TPC] Strings sobre o alfabeto {a, b, c} em que o primeiro “a” precede o
primeiro “b”;
(g) Números binários cuja divisão por 4 dá resto zero;
(h) [TPC] Números binários maiores do que 101001;
(i) [TPC] A linguagem das constantes em vírgula flutuante (notação utilizada em
Java).
1.2 Acha que é possível escrever expressões regulares para os seguintes exemplos?
No caso de ser possível apresente uma solução:
(j) números binários que começam e acabam com o mesmo digito;
(k) [TPC] sequências de algarismos que formam capicuas;
1.26 Exercícios com Autómatos Finitos
2.1 Considere o autómato finito seguinte:
©João M. P. Cardoso
23
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
0
1
0
1
1
2
0
3
1
0
(a) O autómato é determinista ou não determinista?
(b) Qual é o seu estado de início? Quais são os estados de aceitação (finais)?
(c) Este autómato aceita a sequência 110100? Qual a sequência de estados
visitados no reconhecimento desta String?
(d) Qual é a String mais pequena que o autómato aceita?
(e) Pode indicar a String maior que o autómato aceita?
(f) Por palavras, qual é a linguagem que o autómato aceita?
2.2 Desenhe os NFAs para as expressões regulares seguintes. Depois converta cada
um deles para DFA.
(a) [01]
(b) 1+
(c) (0 | 1) [0 | 1]+
2.3 Converta os NFAs seguintes para DFAs:
(a)
0, 1
x
0
y
1
z
(b)
(c)
©João M. P. Cardoso
24
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
2.4 Um analisador lexical baseado num interpretador de um DFA utiliza duas tabelas:
● edges: indexada pelo número do estado e símbolo de entrada, retorna o número do
estado, e
● final: indexada pelo número do estado, retorna 0 ou um número representativo da
acção a realizar.
Considerando a seguinte especificação:
(aba)+
⇒ acção número 1
(a(b*)a)
⇒ acção número 2
(a | b)
⇒ acção número 3
Apresente as tabelas edges e final para o analisador lexical.
©João M. P. Cardoso
25
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
FICHA Nº 4 Exercícios sobre Gramáticas
Duração: 3 horas
1. Especificar utilizando a representação BNF gramáticas correspondentes às
expressões regulares:
(a) [0-9]+
(b) [0-9]*
2. A gramática seguinte produz expressões constituídas de dígitos 0...9 separados
pelos sinais + ou -:
Expr →
Expr “+” Expr | Expr “-“ Expr | Digit
Digit → 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
(a) Considere as expressões 9-5+2 e 3+7-4-2. Desenhe árvores sintácticas
concretas que derivem cada uma destas expressões;
(b) Pode derivar -5+2 da gramática especificada? Se achar que sim desenhe a
árvore sintáctica, caso contrário diga porque não.
(c) É a gramática ambígua? No caso de ser, tente encontrar uma gramática que
possa produzir a mesma linguagem (i.e., o mesmo conjunto de expressões) mas
que não seja ambígua.
(d) Diga se cada uma das gramáticas seguintes é equivalente (i.e., produz a mesma
linguagem) à gramática anterior?
(i) Expr → Expr “+” Expr
Expr → Expr “-“ Expr
Expr → Digit
Digit → 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
(ii) DIGIT = [0-9]
Expr → Expr “+” Expr
Expr → Expr “-“ Expr
Expr → DIGIT
(iii) Expr → (Expr “+” Expr) | (Expr “-“ Expr) | Digit
Digit → 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
(iv) OP = “+“ | “-“
Expr → (Expr OP Expr) | Digit
Digit → 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
3. Considere as gramáticas seguintes:
©João M. P. Cardoso
26
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
DIGIT = [0-9]
(i) Aexpr → “-“ | DIGIT | Aexpr DIGIT
(ii) Bexpr → DIGIT Bexpr | Bexpr DIGIT | “.”
(a) Descreva as linguagens produzidas por cada uma das gramáticas.
(b) Ambas as gramáticas são recursivas. Apresente gramáticas equivalentes nãorecursivas utilizando a notação EBNF;
4. Considere a gramática seguinte:
NUMLIT = [0-9]+
IDENT = [a-zA-Z][a-zA-Z0-9]*
BOOLLIT = “true” | “false”
Seq → Comando { “;” Seq }
Comando →
“if” Expr “then” Comando [“else” Comando]
| IDENT “:=” Expr
| “{“ Seq “}”
Expr → NUMLINT | BOOLLIT | IDENT
(a) Desenhe a árvore sintáctica concreta para a sequência de código:
y := 0;
if x then y := 1
else {y := 0}
(b) Desenhe uma possível AST para a árvore sintáctica concreta anterior.
5. Dada a gramática:
NUM = [0-9]+
ID = [A-Za-Z][0-9A-Za-z]*
Expr → Expr “+” Term | Expr “–” Term | Term
Term → Term “*” Factor | Term “/” Factor | Factor
Factor → Primary “^” Factor | Primary
Primary → “-” Primary | Element
Element → “(“ Expr “)” | NUM | ID
Quais as árvores sintácticas para:
(a) 5-2*3
(b) y^3
6. Pretende-se especificar uma gramática que permita produzir expressões aritméticas
com inteiros atendendo a que:
©João M. P. Cardoso
27
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
(i) as operações aritméticas que podem ser utilizadas são (por ordem de
precedência):
•
^
•
/, *
•
+, -
(ii) a gramática deve ser não-ambígua e deve respeitar a prioridade das
operações aritméticas;
(iii) deve poder produzir expressões aritméticas com parêntesis;
Especifique a gramática utilizando a notação EBNF.
©João M. P. Cardoso
28
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
FICHA Nº 5 Implementação de Analisadores
Gramaticais Utilizando o JavaCC (1ª parte)
Duração: 3 horas
Utilização do JavaCC [1] para gerar parsers. Esta aula tem como objectivo o início da
aprendizagem do gerador de analisadores sintácticos JavaCC. Esta tarefa requer a
aplicação dos conhecimentos até agora adquiridos na disciplina, principalmente no
que respeita aos conceitos sobre análise sintáctica e sobre analisadores sintácticos
descendentes.
O JavaCC utiliza um ficheiro com extensão .jj onde se encontra descrita a gramática
para o parser e gera uma classe Java com o nome do parser e outras classes Java de
suporte2.
nome.jj
JavaCC
Parser.java
ParserTojenManager.java
ParserConstants.java
Token.java
ParseError.java
…
Figura 2. Entradas e saídas do JavaCC supondo que foi especificado “Parser”
como nome do parser no ficheiro nome.jj.
1.27 Exemplo
Suponhamos que desejamos implementar um analisador sintáctico que reconheça
expressões aritméticas com apenas um número inteiro positivo ou com uma adição ou
uma subtracção de dois números inteiros positivos (por exemplo: 2+3, 1-4, 5, etc.). De
seguida apresenta-se uma gramática em EBNF com a especificação do símbolo
terminal utilizando uma expressão regular:
2
À medida que forem percebendo o JavaCC vão também tomando conhecimento do significado das
classes de suporte.
©João M. P. Cardoso
29
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
INTEGER = [0-9]+
Aritm → Integer [(“+” | “-“) Integer]
Para implementar um parser que implemente esta gramática utilizando o JavaCC
temos de criar um ficheiro com extensão .jj (vamos chamar-lhe: Exemplo.jj).
O ficheiro é constituído por:
1. Lista de opções (opcional): é onde pode ser definido o nível de lookahead, por
exemplo.
2. Unidade
de
compilação
Java
(PARSER_BEGIN(nome)
...
PARSER_END(nome))
3. Lista de produções da gramática (as produções aceitam os símbolos +, *, e ?
com o mesmo significado, aquando da utilização em expressões regulares)
Por exemplo para a gramática anterior, poderemos criar o ficheiro Exemplo.jj
seguinte:
PARSER_BEGIN(Exemplo)
// código Java que invoca o parser
public class Exemplo {
public static void main(String args[]) throws ParseException {
// criação do objecto utilizando o constructor com argumento para
// ler do standard input (teclado)
Exemplo parser = new Exemplo(System.in);
Exemplo.Aritm();
}
}
PARSER_END(Exemplo)
// símbolos que não devem ser considerados na análise
SKIP :
{
“ “ | “\t” | “\r”
}
// definição dos tokens (símbolos terminais)
TOKEN :
{
< INTEGER : ([“0” – “9”])+ >
| < EOL : “\n” >
©João M. P. Cardoso
30
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
}
// definição da produção
void Aritm() : {}
{
<INTEGER> ( (“+” | “-“) <INTEGER> )? (<EOF> | <EOL>)
}
Em seguida deve fazer-se:
Javacc Exemplo.jj
Compilar o código Java gerado:
Javac *.java
Executar o analisador sintáctico:
Java Exemplo
Poderemos associar às funções referentes aos símbolos não-terminais pedaços de
código Java. Por exemplo, as modificações apresentadas em seguida permitem
escrever no ecrã mensagens a indicar os números que são lidos pelo parser:
void Aritm : {Token t1, t2;}
{
t1=<INTEGER> {
System.out.println(“Integer = “+t1.image);
}
( (“+” | “-“) t2=<INTEGER> {
System.out.println(“Integer = “+t2.image);
}
)? (<EOF> | <EOL>)
}
Por cada símbolo terminal INTEGER, foi inserida uma linha de código Java que
imprime no ecrã o valor do token lido (o método image da classe Token retorna uma
String representativa do valor do token3)
Insira estas modificações no ficheiro Exemplo.jj e volte a repetir o processo até à
execução do parser. Verifique o que acontece.
3
Outros métodos serão apresentados posteriormente.
©João M. P. Cardoso
31
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
Como poderíamos adicionar também a escrita do sinal (+ ou -) lido?
1.28 Exercícios
1. Considere a ficha Nº 5. No exercício pretendia-se implementar um programa para
reconhecer números inteiros e números reais introduzidos via teclado. As expressões
regulares que definem os números são:
Inteiro → [0-9]+
Real → [0-9]*.[0-9]+
Agora, pretende-se implementar o programa utilizando o gerador de analisadores
léxicos e sintácticos: JavaCC.
Antes de iniciar as implementações referentes aos exercícios apresentados de seguida,
deve ler com atenção o tutorial [1]. Tenha atenção aos símbolos que devem ser
utilizados nas produções da gramática no JavaCC. Note que o JavaCC requer a
definição de gramáticas não-ambíguas de modo a poder fornecer apenas uma árvore
sintáctica concreta para uma dada frase.
2. Implemente utilizando o JavaCC um analisador sintáctico que permita reconhecer
expressões aritméticas com as operações *, +, e -. O analisador deve também aceitar a
utilização de parêntesis;
3. Com base no analisador anterior, adicione o código Java necessário para
implementar uma calculadora de expressões aceites pela gramática.
1.29 Referências de Apoio
1. JavaCC: https://javacc.dev.java.net/
2. Oliver Enseling, “Build your own languages with JavaCC”, Copyright © 2003
JavaWorld.com, an IDG company, http://www.javaworld.com/javaworld/jw12-2000/jw-1229-cooltools_p.html
(cópia
local
em
pdf:
http://w3.ualg.pt/~jmcardo/ensino/PS2003/AulaTP7/jw-1229-cooltools.pdf)
©João M. P. Cardoso
32
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
FICHA Nº 6 Implementação de Analisadores
Gramaticais Utilizando o JavaCC (2ª parte)
Duração: 3 horas
Implementação de uma calculadora utilizando o JavaCC sem a criação da árvore
sintáctica.
1.30 Exercício
Considere a gramática seguinte:
EOL=”\n”
INTEGER=[0-9]+
Start → Expr EOL
Expr → Term {(“+” Expr) | (“-“ Expr)}
Expr → “(“ Expr “)”
Term → Unary {(“*” Term) | (“/” Term)}
Term → “(“ Expr “)”
Unary → “-“ INTEGER
Unary → INTEGER
a) É a gramática ambígua?
b) A gramática respeita as precedências (prioridades) das operações aritméticas?
c) Acha que a gramática tem recursividade à esquerda?
d) Para que não seja necessário backtracking qual o nível mínimo de lookahead
necessário?
e) Implemente esta gramática utilizando o JavaCC. Utilize o nível de lookahead que
achar necessário.
f) Modifique o ficheiro do JavaCC da gramática de modo a calcular o valor das
expressões (funcionamento como calculadora).
©João M. P. Cardoso
33
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
FICHA Nº 7 Implementação de Analisadores
Gramaticais Utilizando o JavaCC (3ª parte)
Duração: 3 horas
Esta ficha pretende que aprendam a utilizar o JJTree em conjunto com o JavaCC [1]
para gerar parsers e árvores sintácticas.
Após a utilização do JavaCC nas duas últimas aulas, é agora tempo de aprenderem
como se pode gerar automaticamente a árvore sintáctica. Para tal utilizaremos o
JJTree (é uma ferramenta integrada no pacote de software JavaCC). O JJTree é uma
ferramenta de pré-processamento que permite gerar um ficheiro para o JavaCC que,
para além da descrição da gramática, integra código Java para a geração da árvore
sintáctica. O ficheiro de entrada do JJTree é um ficheiro que especifica a gramática do
mesmo modo que para o JavaCC e que adicionalmente inclui directivas para a geração
dos nós da árvore (é utilizado jjt como extensão do ficheiro origem).
nome.jjt
JJTree
nome.jj
Node.java
…
Figura 3. Entradas e saídas do JJTree.
1.31 Exemplo
Vamos considerar a gramática da FICHA 8 e vamos supor que pretendemos realizar
um programa que calcule as mesmas expressões, desta vez gerando a árvore sintáctica
e efectuando os cálculos sobre a árvore.
Para gerar a árvore sintáctica vamos alterar a extensão do ficheiro da gramática
original para jjt e vamos adicionar as directivas que indicam ao JJTree para criar a
árvore. O ficheiro apresentado de seguida contém as modificações introduzidas (é
utilizado o método dump() para imprimir no ecrã a árvore gerada por cada expressão
introduzida).
©João M. P. Cardoso
34
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
Ficheiro Calculator.jjt:
options
{
LOOKAHEAD=2;
}
PARSER_BEGIN(Calculator)
public class Calculator
{
public static void main(String args[]) throws ParseException {
Calculator parser = new Calculator(System.in);
int i=0;
while (true) {
// the function will return the root node of the Syntax Tree
SimpleNode rootNode = parser.parseOneLine();
//print the Syntax Tree
rootNode.dump("Syntax Tree "+(i++)+": ");
}
}
}
PARSER_END(Calculator)
SKIP :
{
""
|
"\r"
|
"\t"
}
TOKEN:
{
< INTEGER: (["0"-"9"])+ >
|
< EOL: "\n" >
}
SimpleNode parseOneLine() #Root : {}
// diz ao JJTree para criar o nó Root
{
expr() <EOL>
{return jjtThis;}
// retorna o nó da árvore construído neste
procedimento
| <EOL>
©João M. P. Cardoso
35
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
| <EOF>
{ System.exit(-1); }
}
void expr():
{
}
{
term()
(
"+" expr() #Add(2) // diz ao JJTree para criar um nó Add que tem dois filhos
| "-" expr() #Sub(2) // diz ao JJTree para criar um nó Sub que tem dois filhos
)*
| "(" expr() ")"
}
void term(): {}
{
unary()
(
"*" term() #Mult(2) // diz ao JJTree para criar um nó Mult que tem dois filhos
|
"/" term() #Div(2)
// diz ao JJTree para criar um nó Div que tem dois filhos
)*
| "(" expr() ")"
}
void unary(): {}
{
"-" <INTEGER>
| <INTEGER>
}
Em seguida deve fazer-se:
jjtree Calculator.jjt
Gerar o código Java com o JavaCC:
javacc Calculator.jj
Compilar o código Java gerado:
Javac *.java
Executar o analisador sintáctico:
Java Calculator
©João M. P. Cardoso
36
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
Verifique de seguida as árvores geradas para um conjunto de expressões introduzidas.
Contudo, a criação da árvore sintáctica não é suficiente para nós. Primeiro, a árvore
gerada não armazena os valores dos números inteiros lidos. Segundo, é necessário
programar o procedimento que atravessa a árvore e calcula o valor da expressão
aritmética definida pela árvore.
Para resolvermos o primeiro obstáculo teremos que fazer algumas alterações. O
JJTree vai gerar uma classe Java para o SimpleNode (nome da classe definido como
retorno do procedimento: parseOneLine()). Esta classe, é utilizada para representar os
nós da árvore sintáctica, e pode ser personalizada para implementar as
funcionalidades necessárias. A classe inclui os seguintes métodos:
Alguns métodos da classe representativa
dos nós da árvore sintáctica:
public Node jjtGetParent()
public Node jjtGetChild(int i)
public int jjtGetNumChildren()
Public void dump()
Descrição:
Retorna o nó pai do nó actual
Retorna o nó filho nº i
Retorna o número de filhos do nó
Escreve no ecrã a árvore sintáctica
a partir do nó
Depois da classe SimpleNode ser gerada pela primeira vez pelo JJTree podemos
adicionar-lhe métodos ou campos. Neste momento interessa-nos acrescentar à classe
um campo que permita armazenar o valor do inteiro (no caso das folhas da árvore).
Foram ainda adicionados dois métodos que permitem aceder ao campo (atribuir e
retornar o seu valor). A classe é apresentada de seguida com as alterações efectuadas
(a negrito).
/* Generated By:JJTree: Do not edit this line. SimpleNode.java */
public class SimpleNode implements Node {
protected Node parent;
protected Node[] children;
protected int id;
protected Calculator parser;
int value;
public void setValue(int a) {
this.value = a;
}
©João M. P. Cardoso
37
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
public int getValue() {
return this.value;
}
public SimpleNode(int i) {
id = i;
}
public SimpleNode(Calculator p, int i) {
this(i);
parser = p;
}
public void jjtOpen() {
}
public void jjtClose() {
}
public void jjtSetParent(Node n) { parent = n; }
public Node jjtGetParent() { return parent; }
public void jjtAddChild(Node n, int i) {
if (children == null) {
children = new Node[i + 1];
} else if (i >= children.length) {
Node c[] = new Node[i + 1];
System.arraycopy(children, 0, c, 0, children.length);
children = c;
}
children[i] = n;
}
public Node jjtGetChild(int i) {
return children[i];
}
public int jjtGetNumChildren() {
return (children == null) ? 0 : children.length;
}
/* You can override these two methods in subclasses of SimpleNode to
customize the way the node appears when the tree is dumped. If
your output uses more than one line you should override
toString(String), otherwise overriding toString() is probably all
you need to do. */
public String toString() { return CalculatorTreeConstants.jjtNodeName[id]; }
public String toString(String prefix) { return prefix + toString(); }
©João M. P. Cardoso
38
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
/* Override this method if you want to customize how the node dumps
out its children. */
public void dump(String prefix) {
System.out.print(toString(prefix));
if (children != null) {
for (int i = 0; i < children.length; ++i) {
SimpleNode n = (SimpleNode)children[i];
if (n != null) {
System.out.println();
n.dump(prefix + " ");
if(n.id == CalculatorTreeConstants.JJTUNARY)
System.out.println(" ["+n.getValue()+"]");
}
}
}
}
}
O novo ficheiro que descreve a gramática, que indica ao JJTree para gerar a árvore
sintáctica e que calcula o valor das expressões aritméticas introduzidas é apresentado
de seguida. Durante o atravessamento da árvore é importante que se possa verificar de
que tipo é um determinado nó. Tal pode ser feito utilizando o campo id de cada nó da
árvore (ver nos exemplos node.id). Para cada tido de nó da árvore o JJTree gera um
ficheiro em que são especificados os identificadores atribuídos (ver ficheiro
CalculatorTreeConstants.java). O tipo de nós corresponde aos procedimentos da
gramática e/ou aos nós especificados nas directivas para o JJTree.
Novo ficheiro Calculator.jjt:
options
{
LOOKAHEAD=2;
}
PARSER_BEGIN(Calculator)
public class Calculator {
public static void main(String args[]) throws ParseException {
Calculator parser = new Calculator(System.in);
int i=0;
while (true) {
// the function will return the root node of the Syntax Tree
©João M. P. Cardoso
39
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
SimpleNode rootNode = parser.parseOneLine();
//print the Syntax Tree
rootNode.dump("Syntax Tree "+(i++)+": ");
// call the evaluation method with the ROOT node
System.out.println("Result: "+parser.eval(rootNode));
}
}
/*
Método recursivo que realiza o cálculo da expressão percorrendo a árvore sintáctica.
*/
int eval(SimpleNode node) {
// each node contains an id field identifying its type.
int id = node.id;
//System.out.println("VALUE "+node.getValue()+" "+id);
if(id == CalculatorTreeConstants.JJTUNARY) // node with integer value
return node.getValue();
else if(node.jjtGetNumChildren() == 1) // only one child
return this.eval((SimpleNode) node.jjtGetChild(0));
// nodes with two childs
SimpleNode lhs = (SimpleNode) node.jjtGetChild(0); //left child
SimpleNode rhs = (SimpleNode) node.jjtGetChild(1); // right child
switch(id) {
case CalculatorTreeConstants.JJTADD : return eval( lhs ) + eval( rhs );
case CalculatorTreeConstants.JJTSUB : return eval( lhs ) - eval( rhs );
case CalculatorTreeConstants.JJTMULT : return eval( lhs ) * eval( rhs );
case CalculatorTreeConstants.JJTDIV : return eval( lhs ) / eval( rhs );
default : // abort
System.out.println("Operador ilegal!");
System.exit(1);
}
return 0;
}
}
PARSER_END(Calculator)
©João M. P. Cardoso
40
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
SKIP :
{
""
|
"\r"
|
"\t"
}
TOKEN:
{
< INTEGER: (["0"-"9"])+ >
|
< EOL: "\n" >
}
SimpleNode parseOneLine() #Root : {} // diz ao JJTree para criar o nó Root
{
expr() <EOL>
{return jjtThis;} // retorna o nó da árvore construído neste
procedimento
| <EOL>
| <EOF>
{ System.exit(-1); }
}
void expr(): {}
{
term()
(
"+" expr() #Add(2)
// diz ao JJTree para criar um nó Add que tem dois filhos
| "-" expr() #Sub(2) // diz ao JJTree para criar um nó Sub que tem dois filhos
)*
| "(" expr() ")"
}
void term(): {}
{
unary()
(
|
"*" term() #Mult(2)
// diz ao JJTree para criar um nó Mult que tem dois filhos
"/" term() #Div(2)
// diz ao JJTree para criar um nó Div que tem dois filhos
)*
| "(" expr() ")"
}
void unary(): {Token t;}
©João M. P. Cardoso
41
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
{
"-" (t=<INTEGER> {
// diz ao JJTree para colocar o valor do inteiro num dos campos deste nó
// (para tal é necessário adicionar à classe Java SimpleNode o método setValue() e
// o campo que armazena o valor inteiro
jjtThis.setValue(-Integer.parseInt(t.image)4);
})
| (t=<INTEGER> {
// diz ao JJTree para colocar o valor do inteiro num dos campos deste nó
// (para tal é necessário adicionar à classe Java SimpleNode o método setValue() e
// o campo que armazena o valor inteiro
jjtThis.setValue(Integer.parseInt(t.image));
})
}
Acha que a árvore sintáctica gerada pelos ficheiros jjt apresentados é uma árvore
sintáctica concreta ou uma AST (árvore sintáctica abstracta)?
Para que não seja gerado um nó por cada procedimento na gramática utiliza-se a
directiva #void a seguir ao nome do procedimento para o qual não se quer nó na
árvore. Este método permite gerar as ASTs automaticamente sem por isso ser
necessário transformar a árvore concreta numa AST. O ficheiro seguinte apresenta
uma versão da calculadora em que são geradas ASTs. Verifique a colocação da
directiva a indicar os símbolos não-terminais para os quais não será representado
qualquer nó na árvore.
Novo ficheiro Calculator.jjt:
options
{
LOOKAHEAD=2;
}
PARSER_BEGIN(Calculator)
public class Calculator
4
Como o valor de um Token é guardado como String, é necessário converter a representação em String
para inteiro. Tal pode ser conseguido utilizando métodos existentes nos API do Java. Por exemplo,
Integer.parseInt(t.image) retorna o inteiro representado pela String t.image.
©João M. P. Cardoso
42
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
{
public static void main(String args[]) throws ParseException {
Calculator parser = new Calculator(System.in);
int i=0;
while (true) {
// the function will return the root node of the Syntax Tree
SimpleNode rootNode = parser.parseOneLine();
//print the Syntax Tree
rootNode.dump("Syntax Tree "+(i++)+": ");
// call the evaluation method with the ROOT node
System.out.println("Result: "+parser.eval(rootNode));
}
}
int eval(SimpleNode node) {
// each node contains an id field identifying its type.
// we switch on these.
// enum values such as JJTUNARY come from the interface file
// SimpleParserTreeConstants, which SimpleParser implements.
// This interface file is one of several auxilliary Java sources
// generated by JJTree. JavaCC contributes several others.
int id = node.id;
//System.out.println("VALUE "+node.getValue()+" "+id);
if(id == CalculatorTreeConstants.JJTUNARY) // node with integer value
return node.getValue();
else if(node.jjtGetNumChildren() == 1) // only one child
return this.eval((SimpleNode) node.jjtGetChild(0));
SimpleNode lhs = (SimpleNode) node.jjtGetChild(0); //left child
SimpleNode rhs = (SimpleNode) node.jjtGetChild(1); // right child
switch(id) {
case CalculatorTreeConstants.JJTADD : return eval( lhs ) + eval( rhs );
case CalculatorTreeConstants.JJTSUB : return eval( lhs ) - eval( rhs );
case CalculatorTreeConstants.JJTMULT : return eval( lhs ) * eval( rhs );
case CalculatorTreeConstants.JJTDIV : return eval( lhs ) / eval( rhs );
default : // abort
System.out.println("Operador ilegal!");
©João M. P. Cardoso
43
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
System.exit(1);
}
return 0;
}
}
PARSER_END(Calculator)
SKIP :
{
""
|
"\r"
|
"\t"
}
TOKEN:
{
< INTEGER: (["0"-"9"])+ >
|
< EOL: "\n" >
}
SimpleNode parseOneLine() #Root : {}
{
expr() <EOL>
{return jjtThis;}
| <EOL>
| <EOF>
{ System.exit(-1); }
}
void expr() #void : {}
{
term()
(
"+" expr() #Add(2)
| "-" expr() #Sub(2)
)*
| "(" expr() ")"
}
void term() #void : {}
{
unary()
(
"*" term() #Mult(2)
©João M. P. Cardoso
44
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
|
"/" term() #Div(2)
)*
| "(" expr() ")"
}
void unary() : {Token t;}
{
"-" (t=<INTEGER> {
jjtThis.setValue(-Integer.parseInt(t.image));
})
| (t=<INTEGER> {
jjtThis.setValue(Integer.parseInt(t.image));
})
}
1.32 Referências de Apoio
3. JavaCC: http://www.experimentalstuff.com/Technologies/JavaCC/index.html
•
Documento de introdução ao JJTree incluído na distribuição da ferramenta:
http://w3.ualg.pt/~jmcardo/ensino/PS2003/jjtree.intro
©João M. P. Cardoso
45
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
FICHA Nº 8 : Exercício sobre analisadores
sintácticos
Tradução da notação EBNF para BNF:
1. Para determinar os conjuntos First e Follow é necessário representar em BNF as
seguintes gramáticas apresentadas na notação EBNF. Apresente as gramáticas em
BNF.
(a)
A → “a” { “b” } (“a” | A)
(b)
A → { “(“ [B | D] “)” }
D → { “[“ [B | D] “]” }
(c)
C → { ( “a” | [ “b” ] ) (“c” | “d” )}
Conjuntos First e Follow:
2. Considere a seguinte gramática representada em BNF:
A→
“a” A | “a” B “b”
B→
“b” B | C
C→
ε|B
(a) Quais dos símbolos não-terminais podem derivar ε?
(b) Determine os conjuntos First e Follow para os símbolos não-terminais A e B.
Análise Sintáctica Descendente:
3. Considere a gramática seguinte, em que PRINT, ID e NUM representam símbolos
terminais:
Start → S
S → S “;“ S
S → ID “:=” E
S → PRINT “(“ L “)”
©João M. P. Cardoso
46
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
E → ID
E → NUM
E → E “+” E
E → “(“ S “,” E “)”
L→ E
L → L “,” E
(a) Acha que esta gramática é ambígua ou não-ambígua? Justifique a resposta.
(b) Determine os conjuntos: First(S), First(E), First(L), Follow(S), Follow(E), e
Follow(L).
(c) Pretende-se implementar um analisador sintáctico descendente LL(1). Para tal
deve-se, e apenas caso seja necessário, transformar a gramática de forma a eliminar
ambiguidades e recursividades à esquerda. Caso seja necessário, deve-se também
factorizar à esquerda. Tendo em atenção os pontos anteriores, verifique se é
necessário modificar a gramática e caso seja necessário apresente a gramática
modificada.
Análise Sintáctica Ascendente:
4. Considere a gramática seguinte em que B é o símbolo inicial (os números entre
parêntesis identificam cada termo de uma produção):
B → P “&” B | P
(1, 2)
P → “x” | “y”
(3, 4)
(c) Como pode a gramática produzir x&y&x? Pode a gramática produzir x&y&?
(d) A partir das regras da gramática construa o DFA (autómato finito determinista)
que implemente o controlo das acções num parser ascendente LR(0) ou SLR.
(e) A partir do DFA obtido na alínea anterior construa as tabelas sintácticas supondo
uma gramática LR(0) e uma gramática SLR.
(f) Considerando a tabela sintáctica seguinte mostre como o parser aceita a entrada
x&y&x completando a tabela apresentada a seguir à tabela sintáctica.
Estado
Acção
Goto
x
y
&
$
B
P
S1
Shift s5
Shift s5
erro
Erro
Goto s2
Goto s3
S2
erro
erro
erro
Aceita
S3
erro
erro
Shift s4
Reduce (2)
©João M. P. Cardoso
47
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
S4
Shift s5
Shift s6
erro
Erro
S5
Reduce (3)
Reduce (3)
Reduce (3)
Reduce (3)
S6
Reduce (4)
Reduce (4)
Reduce (4)
Reduce (4)
S7
erro
erro
erro
Reduce (1)
Pilha de
Pilha de Estados
Símbolos
Goto 7
String na
Goto 3
Acção
Entrada
S1
x&y&x$
Shift s5
x
s1 s5
&y&x$
Reduce (3)
P
S1
&y&x$
Goto s3
P
s1 s3
&y&x$
Shift s4
P&
s1 s3 s4
y&x$
(g) Repita as acções efectuadas na tabela seguinte quando a String de entrada é
x&y&:
Pilha de
Pilha de Estados
Símbolos
String na
Acção
Entrada
x&y&$
5. Considere cada uma das gramáticas seguintes. Diga se cada uma das gramáticas é
uma gramática LR(0) e/ou SLR(1). Para tal, construa as tabelas sintácticas LR(0)
e SLR(1). Nota: uma gramática designa-se, por exemplo, por gramática LR(0) se a
tabela sintáctica LR(0) não apresenta conflitos (shift/reduce ou reduce/reduce).
a)
S→ X$
(1)
©João M. P. Cardoso
48
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
X → “(“ X “)” | “(“ “)”
(2, 3)
b)
S→ X$
(1)
X → “(“ X “)” | ε
(2, 3)
S→ X$
(1)
X → “(“ | Y
(2, 3)
Y → “(“ Y “)” | ε
(4, 5)
c)
©João M. P. Cardoso
49
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
FICHA Nº 9 : Exercícios de Revisão
1. Converta o NFA (autómato finito não-determinista) seguinte num DFA (autómato
finito determinista) utilizando o algoritmo de conversão que aprendeu.
x
a
y
1
0
x
x
y
2
5
a
x
x
4
3
x
y
a
x
6
2. Um analisador lexical baseado num interpretador de um DFA utiliza duas tabelas:
● edges: indexada pelo número do estado e símbolo de entrada, retorna o
número do estado, e
● final: indexada pelo número do estado, retorna 0 ou um número representativo
da acção a realizar.
Apresente as tabelas edge e final para o analisador lexical do exercício anterior.
3. Considere a gramática seguinte (o número entre parêntesis identifica o número de
cada produção):
LIT = [0-9]+
OP = “+” | “-“ | “*” | “/”
Start → Expr $
(1)
Expr → Expr OP Term (2)
Expr → LIT
(3)
Expr → “(“ Expr “)”
(4)
Term → LIT
(5)
(a)
Desenhe as árvores sintácticas concretas que conseguir derivar para as
entradas: (3/2)+4$ e 3/2+4$;
(b)
Acha que a gramática apresentada é ambígua ou não-ambígua? Justifique a
resposta;
©João M. P. Cardoso
50
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
(c)
Caso pretendesse que a gramática aceitasse nomes de variáveis – começados
com uma letra e seguidos de sequências com zero ou mais dígitos ou letras – e não
apenas literais como símbolos terminais, quais as modificações que teria de introduzir
na gramática?
(d)
Suponha que se pretende implementar um analisador sintáctico descendente
sem retrocesso (backtracking). Diga se terá de modificar a gramática para a
implementação ser possível. No caso de ter de ser modificada, apresente a nova
gramática;
(e)
Determine os conjuntos First e Follow para cada um dos símbolos não
terminais da gramática anterior;
(f)
Considerando a gramática original desenhe o DFA para o analisador sintáctico
LR(0);
(g)
Desenhe a tabela sintáctica correspondente ao DFA da alínea anterior;
(h)
Diga se a gramática original é LR(0). Caso não seja indique se é SLR(1).
Justifique as respostas;
4. Na figura a seguir é apresentado um pedaço de código (os números entre
parêntesis identificam cada linha de código).
(1)
int SumArray(int[] A, int N) {
(2)
int i, sum;
(3)
i = 0;
(4)
sum = 0;
(5)
while(i < N) {
(6)
sum = sum + A[i];
(7)
i = i+1;
(8)
}
(9)
(10)
return sum;
}
(i)
Diga os elementos presentes no código que deverão ser armazenados na tabela
de símbolos para as variáveis locais e na tabela de símbolos para os parâmetros da
função;
(j)
Supondo que na geração de código assembly se pretendia utilizar a pilha de
chamadas para armazenar todas as variáveis na função, quais os atributos que deverá
ter o descritor associado a cada variável;
(k)
Qual a estrutura de dados que escolheria para implementar a(s) tabela(s) de
símbolos?
(l)
Considerando as linhas de código (6) e (9), diga que verificações devem ser
feitas pelo analisador semântico;
(m)
Desenhe a árvore de instruções e expressões de nível alto para a sequência de
instruções de (3) a (8), considerando as instruções: lda, sta, ldl, stl, e ldp;
©João M. P. Cardoso
51
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
Anexo B: Enunciado de um Exame
Exame de época de recurso da disciplina de Programação de
Sistemas
Ano lectivo de 2002/2003
2º Semestre
Licenciatura em Engenharia de Sistemas e Computação
Licenciatura em Ensino de Informática
Licenciatura em Informática, ramo de Gestão
Duração: 2 horas + meia hora de tolerância (total: 2H30)
1. [2 valores] Converta o NFA (autómato finito não-determinista) seguinte num
DFA (autómato finito determinista) utilizando o algoritmo de conversão que
aprendeu.
ε
a
z
2
y
1
0
a
x
x
ε
z
4
a
5
a
3
y
6
2. [1,5 valores] Escreva para cada estado de aceitação do autómato da figura anterior
a expressão regular que represente as palavras da linguagem aceites pelo mesmo.
3. [1,5 valores] Desenhe um autómato finito (determinista ou não-determinista) que
permita reconhecer palavras representadas por cada uma das expressões regulares
seguintes (o autómato deve diferenciar o reconhecimento por cada uma das
expressões):
©João M. P. Cardoso
52
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
+
d e?
+
[a-c]*[1-3]
4.
[10 valores] Considere a gramática seguinte (o número entre parêntesis identifica
o número de cada produção):
LIT = [0-9]+
OP = “+” | “-“ | “*” | “/”
Start → Expr $
(1)
Expr → Expr OP Expr
(2)
Expr → LIT
(3)
Expr → “(“ Expr “)”
(4)
(a)
Desenhe as árvores sintácticas concretas que conseguir derivar para as
entradas: (32*2)+1$ e 32*2+1$;
(b)
Acha que a gramática apresentada é ambígua ou não-ambígua? Justifique a
resposta;
(c)
Supondo que os tokens definidos pelo símbolo terminal OP correspondem a
operadores aritméticos, diga se a prioridade destes operadores é respeitada pela
gramática. Justifique a resposta com um exemplo. Caso não seja, indique as
modificações que teria de introduzir na gramática.
(d)
Suponha que se pretende implementar um analisador sintáctico descendente
sem retrocesso (backtracking). Diga se terá de modificar a gramática para a
implementação ser possível. Justifique a resposta. No caso de ter de ser modificada,
apresente a nova gramática;
[Nota: Apresente a resolução das duas alíneas seguintes na mesma página do
teste]
(e)
Considerando a gramática original desenhe o DFA para o analisador sintáctico
LR(0);
(f)
Desenhe a tabela sintáctica correspondente ao DFA da alínea anterior;
(g)
Determine os conjuntos First e Follow para cada um dos símbolos não
terminais da gramática anterior;
©João M. P. Cardoso
53
CADERNO DE EXERCÍCIOS E TRABALHOS PRÁTICOS PARA A DISCIPLINA
DE COMPILADORES
(h)
Diga se a gramática original é LR(0). Caso não seja indique se é SLR(1).
Justifique;
(i)
Desenhe uma tabela (de acordo com a tabela exemplificativa indicada em
baixo) com as etapas do analisador sintáctico shift/reduce para a entrada: 3*2+4$.
Pilha de estados
Pilha de símbolos
Entrada
Acção
3*2+4$
5. [5 valores] Na figura a seguir é apresentado um pedaço de código (os números
entre parêntesis identificam cada linha de código).
(1)
void AddToArray(int[] A, int N, int C) {
(2)
int i;
(3)
i = 1;
(4)
while(i <= N) {
(5)
A[i] = C + A[i];
(6)
i = i+1;
(7)
}
(8) }
(a)
Considerando as linhas de código (5) e (6), diga que verificações devem ser
feitas pelo analisador semântico;
(b)
No caso da variável i ter sido declarada como float que conversões teriam de
ser introduzidas durante a análise semântica da linha (6);
(c)
Desenhe a árvore de instruções e expressões de nível alto para a sequência de
instruções de (3) a (7), considerando as instruções: lda, sta, ldl, stl, ldp;
(d)
Desenhe a representação intermédia de nível baixo para a sequência de
instruções de (3) a (7), considerando que todas as variáveis escalares locais são
guardadas em posições da pilha. Considere para a representação as instruções: cbr,
lda, sta, ld, st, ldp;
[Nota: Considere uma memória de sistema endereçável ao byte.]
©João M. P. Cardoso
54
Download