首页 文章

ANTLR4简单语法不匹配

提问于
浏览
1

我使用最新版本的Antlr(4.3)来解析这个简单的源文件 . 我正在使用Visual Studio加载项,但这不应该与我的问题有任何关系 .

源文件:

OBJECT Codeunit 80 Sales-Post
{
  OBJECT-PROPERTIES
  {
    Date=11/12/10;
    Time=12:00:00;
    Version List=NAVW16.00.10,NAVBE6.00.01;
  }
}

这应该是非常简单的解析,但我在解析时遇到2个错误:

line 1:16 mismatched input '80' expecting DOCUMENT_ID
line 5:4 mismatched input 'Date' expecting {DOCUMENT_PROPERTY_ID, '}'}

完整的语法:

grammar Cal;

/*
 * Parser Rules
 */
document
    : document_header OPEN_BRACE document_content CLOSE_BRACE
    ;

document_header
    : OBJECT_DEFINITION DOCUMENT_TYPE DOCUMENT_ID DOCUMENT_NAME
    ;

document_content
    : document_properties
    ;

document_properties
    : OBJECT_PROPERTIES OPEN_BRACE document_property* CLOSE_BRACE
    ;

document_property
    : DOCUMENT_PROPERTY_ID EQ DOCUMENT_PROPERTY_VALUE LINE_TERM
    ;


/*
 * Lexer Rules
 */
OBJECT_PROPERTIES
    : 'OBJECT-PROPERTIES'
    ;

OBJECT_DEFINITION
    : 'OBJECT'
    ;

DOCUMENT_TYPE
    : 'Codeunit'
    | 'Table'
    ;

DOCUMENT_PROPERTY_VALUE
    : ([0-9a-zA-Z]|'_'|'-'|'.'|'/'|','|':')+
    ;

DOCUMENT_PROPERTY_ID
    : 'Date'
    | 'Time'
    | 'Version List'
    ;

DOCUMENT_ID
    : [0-9]+
    ;

DOCUMENT_NAME
    : ID
    ;

OPEN_BRACE
    : '{'
    ;

CLOSE_BRACE
    : '}'
    ;

LINE_TERM
    : ';'
    ;

EQ
    : '='
    ;

ID
    : ([a-zA-Z]|'_'|'-')+
    ;

INT
    : [0-9]+
    ;

WS
    : [ \t]+ -> channel(HIDDEN)
    ;

NEWLINE
    :'\r'? '\n' -> channel(HIDDEN)
    ;

这是令牌流的输出(令牌被'<>'包围:

<OBJECT> < > <Codeunit> < > <80> < > <Sales-Post> <
> <{> <
> <  > <OBJECT-PROPERTIES> <
> <  > <{> <
> <    > <Date> <=> <11/12/10> <;> <
> <    > <Time> <=> <12:00:00> <;> <
> <    > <Version List> <=> <NAVW16.00.10,NAVBE6.00.01> <;> <
> <  > <}> <
> <}> <<EOF>

1 回答

  • 1

    在ANTLR中,当两个词法分析器规则可以匹配相同的令牌(长度相同)时,首先出现的规则会获胜 .

    80 可由 DOCUMENT_ID 匹配,但也可由 DOCUMENT_PROPERTY_VALUEINT 匹配,因此请在此处重新排序这些规则 .

    这里的问题与 DOCUMENT_PROPERTY_ID 相同,低于 DOCUMENT_PROPERTY_VALUE (两者都可以匹配 Date ) .

    我建议你把 DOCUMENT_PROPERTY_VALUE 放在 WS 之上:大多数特定规则(即关键词)先行,更广泛的规则最后 .

    您还必须摆脱 DOCUMENT_IDINT ,因为它们具有相同的定义 . 其中一个永远不会匹配 . 您似乎在解析器中不使用 INT ,因此只需删除规则即可 .

相关问题