Разобрать строки в кавычках с помощью boost ::Spirit

Я хотел бы проанализировать предложение, в котором некоторые строки могут быть не в кавычках, "в кавычках" или "в кавычках". Код ниже почти работает -, но не соответствует закрывающим кавычкам. Я предполагаю, что это из-за ссылки на qq. Модификация комментируется в коде, модификация приводит к "цитированию" или "цитированию", а также синтаксическому анализу и помогает показать, что исходная проблема связана с закрывающей кавычкой. Код также описывает точную грамматику.

Для полной ясности :анализ строк без кавычек. Строка в кавычках, такая как 'hello', будет анализировать открывающую кавычку ', все символы hello, но затем не сможет проанализировать окончательную кавычку '.

Я предпринял еще одну попытку, похожую на сопоставление начального и конечного тегов в руководствах по повышению , но безуспешно.

template 
struct test_parser : qi::grammar
{
    test_parser()
        :
    test_parser::base_type(test, "test")
    {
        using qi::fail;
        using qi::on_error;
        using qi::lit;
        using qi::lexeme;
        using ascii::char_;
        using qi::repeat;
        using namespace qi::labels;
        using boost::phoenix::construct;
        using boost::phoenix::at_c;
        using boost::phoenix::push_back;
        using boost::phoenix::val;
        using boost::phoenix::ref;
        using qi::space;

        char qq;          

        arrow = lit("->");

        open_quote = (char_('\'') | char_('"')) [ref(qq) = _1];  // Remember what the opening quote was
        close_quote = lit(val(qq));  // Close must match the open
        // close_quote = (char_('\'') | char_('"')); // Enable this line to get code 'almost' working

        quoted_string = 
            open_quote
            >> +ascii::alnum        
            >> close_quote; 

        unquoted_string %= +ascii::alnum;
        any_string %= (quoted_string | unquoted_string);

        test = 
            unquoted_string             [at_c<0>(_val) = _1] 
            > unquoted_string           [at_c<1>(_val) = _1]   
            > repeat(1,3)[any_string]   [at_c<2>(_val) = _1]
            > arrow
            > any_string                [at_c<3>(_val) = _1] 
            ;

        //.. set rule names
        on_error(/*  */);
        // debug rules
    }

    qi::rule arrow;
    qi::rule open_quote;
    qi::rule close_quote;

    qi::rule quoted_string;
    qi::rule unquoted_string;
    qi::rule any_string;     // A quoted or unquoted string

    qi::rule test;

};


// main()
// This example should fail at the very end 
// (ie not parse "str3' because of the mismatched quote
// However, it fails to parse the closing quote of str1
typedef boost::tuple, string> DataT;
DataT data;
std::string str("addx001 add 'str1'   \"str2\"       ->  \"str3'");
std::string::const_iterator iter = str.begin();
const std::string::const_iterator end = str.end();
bool r = phrase_parse(iter, end, grammar, boost::spirit::ascii::space, data);

Для бонусного кредита :Было бы предпочтительнее решение, которое избегает локального члена данных (, такого как char qqв приведенном выше примере ), но с практической точки зрения я буду использовать все, что работает!

5
задан Zero 24 April 2012 в 00:28
поделиться