Analisador Léxico

Transcrição

Analisador Léxico

Analisador Léxico
O papel do Analisador Léxico
● Análise Léxica x Análise Sintática
● Tokens, Padrões e Lexemas
● Atributos de tokens
● Erros léxicos
●Especificação de tokens
● Expressões regulares
● Definições regulares
●Reconhecimento de tokens
● Diagramas de transição
● Reconhecimento
de palavras reservadas e
identificadores.
●
O papel do analisador léxico.
Ler os caracteres do programa-fonte, agrupá-los
em lexemas e produzir como saída uma
sequência de tokens para cada lexema no
programa-fonte.
●Enviar
o fluxo de tokens para o analisador
sintático.
●Registrar
na tabela de símbolos informações
sobre os identificadores encontrados.
● Eliminar comentários e espaços em branco
● Correlacionar
mensagens de erros geradas
pelo compilador com o programa-fonte.
●
O papel do analisador léxico.
para análise
semântica
▲
│
programa-fonte
│
▼
---------token-------->
Analisador
Léxico
<--getNextToken--▲
│
▼
Analisador
Sintático
▲
│
▼
Tabela de
Símbolos
Análise Léxica x Análise Sintática
Existem vários motivos para separar análise
léxica da análise sintática:
Simplicidade do projeto é o mais importante
● Melhor eficiência do compilador
● Melhor portabilidade do compilador
●
Tokens, Padrões e Lexemas
Um TOKEN é um par consistindo de um nome e um
valor de atributo(opcional). O nome do token é um
símbolo abstrato que representa o tipo de unidade
léxica.(Esperado como entrada pelo Analisador Sintático)
●
O PADRÂO é uma descrição da forma que os lexemas
de um token podem assumir. Pode ser definido por uma
expressão regular.
●
Um LEXEMA é uma sequência de caracteres do
programa-fonte que casa com o padrão para um token e
é identificado pelo analisador léxico como uma instância
desse token.
●
Tokens, Padrões e Lexemas
TOKEN
if
else
comparação
id
número
literal
Descrição Informal
caracteres i, f
caracteres e, l, s, e
< ou > ou <= ou >= ou == ou !=
letra seguida por letra e digito
qualquer constante numérica
sequência de caracteres entre “
LEXEMAS
if
else
<=, !=
pi, x1
3,14159 , -2
“ hoje “
Atributos de token
Quando mais de um lexema casar com um
padrão, o analisador precisa oferecer às demais
fases do compilador informações adicionais sobre
qual foi o lexema casado.
Por exemplo quando dois tokens número forem
encontrados, o atributo pode ser o valor do
número.
Porém quando um token precisar de mais que um
atributo, é melhor armazená-los na tabela de
símbolos e passar como valor do atributo um
ponteiro para a tabela de símbolos.
Erros Léxicos
É dificíl para o analisador léxico saber, sem o auxílio de
outros componentes, que existe um erro no código-fonte.
Por exemplo : fi
incorreto ???
●
é um identificador ou um if
O erro que pode ser identificado pelo analisador léxico é
um caracter inválido no programa-fonte.
O Tratamento para esse tipo de erro é o que chamamos
de Modo de Pânico onde removermos os caracteres
seguintes até encontrar um token bem formado.
Especificação de Tokens
Expressões Regulares.
TOKEN
Padrão
LEXEMAS
if
else
Comparação
id
Número
literal
if
if
else
else
(< | > |<= | >= | == | != )
<=, !=
(a|b|c|....|z).(a|b|c|....|z|0|1|2....|9)* pi, x1
(-|).(0|1|2|...|9)+[(,(0|1|2|...|9)+ |ε]
3,14159 , -2
“(a|b|c|....|z|0|1|....|9| |_)*”
“ hoje “
Especificações de tokens
Definições regulares
letra → a|b|c|.....|z|A|B|C|...|Z
digito → 0 | 1 | 2 | … | 9
id → letra(letra|digito)*
Reconhecimento de Tokens
Diagrama de Transição
Reconhecimento de Palavras Reservadas e Ids
No quadro negro !!

Analisador Léxico

Transcrição

Documentos relacionados

Introdução à Análise Léxica, Revisão LFA - FACOM

Baixar o PDF

(BILOv3) COM TESTE TOKEN. Josilene Costa Placido de

Diapositivos das aulas teóricas: Introdução

Global Invacom OptiScan - TELE

Analisador de Nitrogênio NDA-702 com carreador de gás duplo

Analisador de Cloro Residual

Analisador de Gás para atmosferas modificadas

Instruções de Preparação para Reciclagem

manual de instalação e inicialização do token safenet 5100

Analisador de antenas do PA1ARE

Guia de instalação de Token

URL - Universidade Federal de São Carlos

esta apresentação em pdf

Manual de Instalação Software do token SafeNet

Lex-Yacc - Unicamp

Certificados Digitais Serasa Experian

Analisador de Gás de Combustão KANE 450

6. atlas lingüístico o amazonas - alam: a natureza e sua

Compilaç˜ao de Corpos Comparáveis Especializados: Devemos

Compiladores

Pablo Picasso Feliciano de Faria PROPRIEDADES DAS LÍNGUAS