Я пытаюсь разобраться в операторах построения дерева (^ и!) В ANTLR.
У меня есть грамматика для гибких байтовых массивов (UINT16, который описывает количество байтов в массиве, за которым следует это количество байтов). Я закомментировал все семантические предикаты и связанный с ними код, который действительно подтверждает, что существует столько же байтов в массиве, как указано первыми двумя байтами ... у меня проблемы не с этой частью.
Моя проблема связана с деревом, которое создается после анализа некоторых входных данных. Все, что происходит, - это то, что каждый символ является родственным узлом. Я ожидал, что сгенерированный AST будет похож на дерево, которое вы можете увидеть в окне интерпретатора ANTLRWorks 1.4. Как только я попытаюсь изменить способ создания дерева с помощью символа ^, я получаю исключение в форме:
Unhandled Exception: System.SystemException: more than one node as root (TODO: make exception hierarchy)
Вот грамматика (в настоящее время ориентирована на C #):
grammar FlexByteArray_HexGrammar;
options
{
//language = 'Java';
language = 'CSharp2';
output=AST;
}
expr
: array_length remaining_data
//the amount of remaining data must be equal to the array_length (times 2 since 2 hex characters per byte)
// need to check if the array length is zero first to avoid checking $remaining_data.text (null reference) in that situation.
//{ ($array_length.value == 0 && $remaining_data.text == null) || ($remaining_data.text != null && $array_length.value*2 == $remaining_data.text.Length) }?
;
array_length //returns [UInt16 value]
: uint16_little //{ $value = $uint16_little.value; }
;
hex_byte1 //needed just so I can distinguish between two bytes in a uint16 when doing a semantic predicate (or whatever you call it where I write in the target language in curly brackets)
: hex_byte
;
uint16_big //returns [UInt16 value]
: hex_byte1 hex_byte //{ $value = Convert.ToUInt16($hex_byte.text + $hex_byte1.text); }
;
uint16_little //returns [UInt16 value]
: hex_byte1 hex_byte //{ $value = Convert.ToUInt16($hex_byte1.text + $hex_byte.text); }
;
remaining_data
: hex_byte*
;
hex_byte
: HEX_DIGIT HEX_DIGIT
;
HEX_DIGIT : ('0'..'9'|'a'..'f'|'A'..'F')
;
Вот что я подумал AST будет выглядеть следующим образом:
Вот программа на C #, которую я использовал, чтобы получить визуальное (фактически текстовое, но затем я пропустил через GraphViz, чтобы получить изображение) представление AST:
namespace FlexByteArray_Hex
{
using System;
using Antlr.Runtime;
using Antlr.Runtime.Tree;
using Antlr.Utility.Tree;
public class Program
{
public static void Main(string[] args)
{
ICharStream input = new ANTLRStringStream("0001ff");
FlexByteArray_HexGrammarLexer lex = new FlexByteArray_HexGrammarLexer(input);
CommonTokenStream tokens = new CommonTokenStream(lex);
FlexByteArray_HexGrammarParser parser = new FlexByteArray_HexGrammarParser(tokens);
Console.WriteLine("Parser created.");
CommonTree tree = parser.expr().Tree as CommonTree;
Console.WriteLine("------Input parsed-------");
if (tree == null)
{
Console.WriteLine("Tree is null.");
}
else
{
DOTTreeGenerator treegen = new DOTTreeGenerator();
Console.WriteLine(treegen.ToDOT(tree));
}
}
}
}
Вот какой результат этой программы помещенный в GraphViz выглядит так:
Та же программа на Java (если вы хотите попробовать ее и не использовать C #):
import org.antlr.*;
import org.antlr.runtime.*;
import org.antlr.runtime.tree.*;
public class Program
{
public static void main(String[] args) throws Exception
{
FlexByteArray_HexGrammarLexer lex = new FlexByteArray_HexGrammarLexer(new ANTLRStringStream("0001ff"));
CommonTokenStream tokens = new CommonTokenStream(lex);
FlexByteArray_HexGrammarParser parser = new FlexByteArray_HexGrammarParser(tokens);
System.out.println("Parser created.");
CommonTree tree = (CommonTree)parser.expr().tree;
System.out.println("------Input parsed-------");
if (tree == null)
{
System.out.println("Tree is null.");
}
else
{
DOTTreeGenerator treegen = new DOTTreeGenerator();
System.out.println(treegen.toDOT(tree));
}
}
}