Gramaticas Compiladores

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 14

DIVISÃO DE ENGENHARIAS

ENGENHARIA INFORMÁTICA

TRABALHO DE COMPILADORES

3º ANO – II SEMESTRE
TURMA: B
PERÍODO LABORAL

GRAMÁTICAS

Docente: Higino Malate

TETE, 2022
Eliote Filipe Jonasse

Rodrigues Zefanias Hama

Sérgio Titos Gimurosse

GRAMÁTICAS

• Hierarquia de Chomsky;
• Tipos de Gramática;
• Maquinhas de Turing;
• Autómato de Pilhas.

Trabalho de pesquisa apresentado a cadeira


de Compiladores como parte dos requisitos
da cadeira curricular no Instituto Superior
Politécnico de Tete.

Docente: Higino Malate

TETE, 2022

2
Índice
Introdução......................................................................................................................... 2

1. Conceitos básicos sobre linguagens formais ................................................................ 3

1.1. Conceitos matemáticos complementares................................................................... 3

Símbolo ............................................................................................................................ 3

Sentença (ou palavra) ....................................................................................................... 4

Tamanho de uma sentença ............................................................................................... 4

Alfabeto ............................................................................................................................ 4

A concatenação duas cadeias ........................................................................................... 4

2. Gramáticas .................................................................................................................... 5

2.1. Definição Formal de Gramática ................................................................................ 5

2.1. Tipos de gramáticas ................................................................................................... 6

2.2. Hierarquia de Chomsky ............................................................................................. 8

3. Maquina de Turing ....................................................................................................... 8

4. Automato de pilha ........................................................................................................ 9

Conclusão ....................................................................................................................... 11

Bibliografia..................................................................................................................... 12
Introdução

O presente trabalho, aborda principalmente no tema “Gramaticas”, no qual


daremos conceitos, Hierarquia de Chomsky, Tipos de Gramática, Maquinhas de
Turing, Autómato de Pilhas. Basicamente, uma gramática serve para descrever a
estrutura de uma linguagem formal. Gramáticas consistem de uma série de regras
que descrevem como formar palavras da linguagem. Por exemplo, uma das
gramáticas que descreve a linguagem das strings de parênteses bem balanceados é a
seguinte gramática:

2
1. Conceitos básicos sobre linguagens formais

Segundo MENEZES (1997), os estudos sobre linguagens formais iniciaram-se na


década de 50 com o objectivo de definir matematicamente as estruturas das
linguagens naturais. No entanto, verificou-se que a teoria desenvolvida se aplicava
ao estudo das linguagens de programação.

A teoria de linguagens formais engloba, basicamente, o estudo das características,

propriedades e aplicações das linguagens formais, bem com a forma de representação


da estrutura (sintaxe) e determinação do significado (semântica) das sentenças das
linguagens.

Segundo FURTADO (1992), a importância desta teoria é dupla: tanto apoia outros
aspectos teóricos da teoria da computação, tais como decibilidade, computabilidade,
complexidade, etc. como fundamenta diversas aplicações computacionais, como por
exemplo processamento de linguagens, reconhecimento de padrões, modelagem de
sistemas, etc. Mas, o que é uma linguagem?

➢ Uma linguagem é uma forma de comunicação, usada por sujeitos de uma


determinada comunidade;
➢ Uma linguagem é o conjunto de SÍMBOLOS e REGRAS para combinar
esses símbolos em sentenças sintacticamente correctas.
➢ Uma linguagem é formal quando pode ser representada através de um sistema
com sustentação matemática" (PRICE; EDELWEISS, 1989).
Assim sendo, são necessários conceitos matemáticos para o estudo das linguagens
formais.

1.1. Conceitos matemáticos complementares

Símbolo
Um símbolo é uma entidade abstracta básica sem definição formal. São exemplos de
símbolos as letras, os dígitos, etc. Símbolos são ordenáveis lexicograficamente e,
portanto, podem ser comparados quanto à igualdade ou precedência. Por exemplo,
tomando as letras dos alfabetos, tem-se a ordenação A < B < C < ... < Z. A principal
utilidade dos símbolos está na possibilidade de usá-los como elementos atómicos em
definições de linguagens.

3
Sentença (ou palavra)

Uma sentença (ou palavra) é uma sequência finita de símbolos justapostos (isto é,
sem vírgulas separando os caracteres). Sejam P, R, I, M, e A símbolos, então PRIMA
é uma sentença.

As sentenças vazias, representadas por , é uma sentença constituída por nenhum


símbolo.

Tamanho de uma sentença

O tamanho (ou comprimento) de uma sentença w, denotado por |w|, é dado pelo
número de símbolos que compõem w.

Assim, o tamanho da sentença PRIMA é 5 e o tamanho da sentença vazia é 0. assim,


|ε| = 0.

Alfabeto

Um alfabeto, denotado por V, é um conjunto finito de símbolos. Assim, considerando


os símbolos dígitos, letras, etc., tem-se os seguintes alfabetos V binário = {0, 1}; V
vogais = {a, e, i, o, u}. É importante observar que um conjunto vazio também pode
ser considerado um alfabeto.

O fechamento reflexivo de um alfabeto V, denotado por V*, é o conjunto infinito


de todas as sentenças que podem ser formadas com os símbolos de V, inclusive a
sentença vazia.

O fechamento transitivo de um alfabeto V, denotado por V+, é dado por V* - { }.

Seja V o alfabeto dos dígitos binários, V = {0, 1}. O fechamento transitivo de V é


V+ = {0, 1, 00, 01, 10, 11, 000, 001, 010, 011, ...}, enquanto que o fechamento
reflexivo de V é V* = {e, 0, 1, 00, 01, 10, 11, 000, 001, 010, 011, ...}.

A concatenação duas cadeias

A concatenação é formada pela escrita da primeira cadeia seguida da segunda, sem


nenhum espaço no meio. Por exemplo, a concatenação de compila e dores é
compiladores. O operador de concatenação é a justaposição. Isto é, se w e x são
variáveis que denotam cadeias, então wx é a cadeia formada pela concatenação de w

4
e x. No exemplo acima, se tomarmos w = compila e x = dores, então temos wx =
compiladores.

2. Gramáticas

Para definirmos a gramática, devemos primeiramente conhecer a especificação de


linguagem.
Foi dito que uma linguagem L é qualquer subconjunto de sentenças sobre um alfabeto
V. Mas, qual subconjunto é esse, como defini-lo?
Uma gramática é um dispositivo formal usado para definir qual subconjunto de V*
forma determinada linguagem. A gramática define uma estrutura sobre um alfabeto
de forma a permitir que apenas determinadas combinações de símbolos sejam
consideradas sentenças. Algumas definições de gramática:
➢ É um sistema gerador de linguagens; é um sistema de reescrita;
➢ é uma maneira finita de descrever uma linguagem;
➢ é um dispositivo formal usado para especificar de maneira finita e precisa
uma linguagem infinita.
Na construção de compiladores estamos tão interessados nas gramáticas quanto as
linguagens que elas geram.
Muitas gramáticas podem gerar a mesma linguagem, mas a gramática vai ditar a
estrutura do programa resultante, e a estrutura é a saída mais importante da fase de
análise sintáctica.
2.1. Definição Formal de Gramática

Uma gramática possui um conjunto finito de variáveis (também chamadas de não


terminais). A linguagem gerada por uma gramática é definida recursivamente em
termos das variáveis e de símbolos primitivos chamados terminais, que pertencem
ao alfabeto da linguagem.

As regras que relacionam variáveis e terminais são chamadas de produções, que


sempre iniciam num ponto, o símbolo inicial, pertencente ao conjunto de variáveis
(não-terminais). Uma regra de produção típica estabelece como uma determinada
configuração de variáveis e terminais pode ser reescrita, gerando uma nova
configuração.

5
Formalmente, uma gramática é especificada por uma quádrupla (N,T,P,S), onde:

N - é o conjunto de não-terminais, ou variáveis.

T - é o conjunto de terminais, ou alfabeto, sendo que N e T são conjuntos disjuntos.

P-é um conjunto finito de produções, ou regras, sendo que P ⊆ (N ∪ T) + (N ∪ T) *.

S - é um símbolo não-terminal inicial, sendo S ∈ N. A partir dele são geradas todas


as sentenças da linguagem.

Uma produção (n,p) pode ser escrita n ::= p, para facilitar a leitura. No caso de
existir mais de uma alternativa para uma mesma configuração e símbolos do lado
esquerdo da regra, como por exemplo:
<substantivo>:: = arroz
<substantivo>:: = caldo
<substantivo>:: = benny
Pode-se escrever as opções em uma única produção, separada por |.
• O exemplo acima ficaria:
<substantivo> ::= arroz | caldo | benny.
O símbolo ::= pode ser lido como “é definido por” e o símbolo | pode ser lido como
“ou”.
2.1. Tipos de gramáticas

Impondo restrições na forma das produções, pode-se identificar quatro tipos


diferentes de gramáticas. Esta classificação foi feita por Chomsky e é conhecida
como hierarquia de Chomsky. Os tipos de gramática definidos nesta hierarquia são:

a) Tipo 0: Não há restrição na forma das produções. Este é o tipo mais geral.
Exemplo: S ::= ABS | ab Ba ::= aB | a Aa ::= aa | a | ε

b) Tipo 1: Seja G=(N,T,P,S). Se:


➢ O símbolo inicial S não aparece no lado direito de nenhuma produção, e
➢ para cada produção σ1 ::= σ2, é verdade que
➢ | σ1 | ≤ | σ2 | (com excepção da regra S ::= ε), então se diz que G é uma
gramática do tipo 1, ou Gramática Sensível ao Contexto.

6
Exemplo:

S ::= aBC | aABC

A ::= aABC | aBC

CB ::= BC

aB ::= ab

bB ::= bb

bC ::= bc

cC ::= cc

c) Tipo 2: Uma gramática G= (N, T, P, S) é do tipo 2, ou uma Gramática Livre


de Contexto, se cada produção é livre de contexto, ou seja, cada produção é
da forma A ::= σ, com A ∈ N e σ ∈ (T ∪ N)*.
Exemplo:
S ::= aSb | A A ::= cAd | e O tipo 2 não é definido como restrição do tipo 1,
porque se permite produções da forma A ::= ε, com A ≠ S. Também se
permite que o símbolo inicial S apareça no lado direito das produções.
Entretanto, existe um teorema que prova que a partir de uma gramática de
tipo 2 se pode construir outra gramática equivalente, de tipo 2, que satisfaz
as restrições do tipo 1.

d) Tipo 3. Uma gramática G é de tipo 3, ou regular, se cada produção é da


forma

A ::= aB, A ::= a ou A ::= ε, onde A e B são não-terminais e a é um terminal.

Exemplo:

S ::= aS | bB

B ::= bB | bC

C ::= cC | ε

7
2.2. Hierarquia de Chomsky

Noam Chomsky definiu uma hierarquia de linguagens como modelos para


linguagens naturais. As classes de linguagens são: regular, livre de contexto,
sensível ao contexto e irrestrita. As inclusões dos tipos de linguagens são
apresentadas na figura abaixo.

Pode-se ver que uma linguagem do tipo 3 é também do tipo 2, uma linguagem do
tipo 2 é também do tipo 1, e uma linguagem do tipo 1 é também do tipo 0. Estas
inclusões são estritas, isto é, existem linguagens do tipo 0 que não são do tipo 1,
existem linguagens do tipo 1 que não são do tipo 2 e existem linguagens do tipo 2
que não são do tipo 3.

3. Maquina de Turing

A máquina de Turing é um dispositivo criado em 1936, que representa um modelo


idealizado de computação capaz de armazenar / processar informações virtualmente
infinitas. O sistema é uma abstracção matemática construída de uma forma
extraordinariamente simples, mas que facilita a verificação empirista de uma ampla
gama de questões sobre teorias de computabilidade e / ou complexidade. Sua
idealização marcou um grande marco na história da computação, a ponto de ser
considerada a origem dos computadores de hoje (e tecnologias relacionadas, como
tablets ou telefones Móvel).

Uma máquina de Turing é projectada para gravar uma amostra específica de


símbolos ou números, cujo universo possível é frequentemente chamado de

8
"alfabeto". Quando trabalha com código binário, seu alfabeto total é dois (0 ou 1),
mas pode ser tão amplo quanto for considerado apropriado para a função a ser
desempenhada.

Esta é uma importante sub-rotina muito utilizado na rotina "multiplicar".

A máquina de Turing exemplo lida com uma série de 0s e 1s, com 0 representado
pelo símbolo em branco. Sua tarefa é dobrar qualquer série de 1s encontradas na fita
escrevendo um 0 entre eles. Por exemplo, quando a cabeça lê "111", vai escrever um
0, em seguida, "111". A saída será "1110111".

Frequentemente diz-se que as máquinas de Turing, ao contrário de autómatos mais


simples, são tão poderosas quanto máquinas reais, e são capazes de executar qualquer
operação que um programa real executa.

4. Automato de pilha

Um autómato com pilha (PDA), também denominado push down autómata, é um


dispositivo formal não-determinístico reconhecedor de linguagens livre de contexto.
Um PDA é um modelo natural de um analisador sintáctico.

O autômato de pilha (AP) é composto por uma entrada, um autômato finito e uma pilha.
A pilha é uma cadeia de símbolos de algum alfabeto. O símbolo mais à esquerda da pilha
é considerado como seu topo. A máquina será não-determinística, tendo um número finito
de escolhas de movimentos a efetuar em cada situação. Os movimentos podem ser de dois
tipos.
No primeiro tipo de movimento o símbolo da entrada é usado. Dependendo do símbolo
da entrada, do topo da pilha e do estado do autômato finito, algumas escolhas são
possíveis. Cada escolha consiste de um estado seguinte para o autômato finito e uma
cadeia de símbolos (possivelmente vazia) para ser trocada pelo topo da pilha. Após
selecionar uma escolha, um símbolo é consumido da entrada.
O segundo tipo de movimento (chamado ε-movimento) é similar ao primeiro, exceto que
ele não consome símbolos da entrada. Este tipo de movimento permite que o AP manipule
a pilha sem ler símbolos da entrada.
Finalmente, devemos definir a linguagem aceita por um autômato de pilha. Há duas
formas naturais para fazer isto. A primeira, que já foi vista, é definir a linguagem aceita
como sendo o conjunto de todas as entradas para as quais alguma seqüência de

9
movimentos faz com que a pilha do autômato fique vazia. Esta linguagem é conhecida
como a linguagem aceita por pilha vazia.
A segunda forma de definir a linguagem reconhecida é similar à forma utilizadas para
autômatos finitos. Isto é, designamos alguns estados como estados finais e definimos a
linguagem aceita como o conjunto de todas as entradas para as quais alguma escolha de
movimentos leve a um estado final.
Como podemos ver, as duas definições são equivalentes no sentido de que um conjunto
que pode ser aceito por pilha vazia em um AP pode ser aceito por um estado final em
outro AP, e vice-versa.
Reconhecimento por estado final é a noção mais comum, mas é fácil provar o teorema
básico dos autómatos de pilha usando reconhecimento por pilha vazia. Este teorema
estabelece que uma linguagem é aceita por um AP se e somente se ela é uma linguagem
livre de contexto.
Um autómato de pilha M é uma tupla (E, A, P, t, e0, p0, F), onde:
• E é um conjunto finito de estados;
• A é um alfabeto de entrada;
• P é um alfabeto da pilha;
• e0 ∈ E é o estado inicial;
• p0 ∈ P é o símbolo inicial da pilha;
• F ⊆ E é o conjunto de estados finais;
• t é um mapeamento de E × {A ∪ {ε}} × P em subconjuntos finitos de E × P*.
A menos que seja explicitamente dito, usaremos letras minúsculas do início do alfabeto
para denotar símbolos da entrada e letras do fim do alfabeto para denotar cadeias de
símbolos de entrada.
Letras maiúsculas denotarão símbolos da pilha e letras gregas indicarão cadeias de
símbolos da pilha.

10
Conclusão

Depois de uma vasta pesquisa sobre as gramáticas concluímos que elas são uma
ferramenta importante no estudo de compiladores, uma gramática gerativa é um
instrumento formal capaz de construir (gerar) conjuntos de cadeias de uma
determinada linguagem. As gramáticas são instrumentos que facilitam muito a
definição das características sintácticas das linguagens. São instrumentos que
permitem definir, de forma formal e sistemática, uma representação finita para
linguagens infinitas. Usar um método de definição de conjuntos particular para
definir uma linguagem pode ser um passo importante no projecto de um
reconhecedor para a linguagem, principalmente se existirem métodos sistemáticos
para converter a descrição do conjunto em um programa que processa o conjunto.
Como veremos adiante neste curso, certos tipos de gramáticas, que possuem
algoritmos para definir se uma sentença pertence ou não à linguagem que geram, são
utilizadas para implementar compiladores. Já gramáticas que não permitem a
definição de algoritmos não podem ser utilizadas para tal.

11
Bibliografia

Apostila-compiladores-i-campus-de-presidente-apostila-compiladores-i-i-
sumario.pdf

apostila-LFeC-II.pdf

http://www.dcc.ufrj.br/~fabiom/sem

Fabio Mascarenhas - 2013.1 - Compiladores - Gramáticas

Ricardo Luís de Freitas - apostila-de-compiladores-ec.pdf

12

Você também pode gostar