Разбор пространств имен с помощью clang: различия AST в том, включают ли заголовок в другой исходный файл или анализируют его напрямую.

Извините за многословный вопрос, но я не вижу другого способа прояснить ситуацию. Я пишу инструмент для преобразования файлов заголовков C++ в файлы интерфейса SWIG в качестве основы для дальнейшей тонкой настройки.

В процессе этого я заметил странное поведение clang (v3.0). Если я анализирую заголовочный файл, я получаю существенно иной AST, чем если я анализирую исходный файл, содержащий заголовок.

В целях иллюстрации вот несколько примеров исходных файлов:

Исходный файл:

// example.cpp: Test case for nsbug.py
#include "example.h"


// example.h: Test case for nsbug.py
namespace Geom {

struct Location
    double x, y;

class Shape

    void set_location(const Location &where)
        m_pos = where;

    const Location &get_location() const

    // Draw it...
    virtual void draw() const = 0;

    Location m_pos;

class Circle : public Shape

    virtual void draw() const;
} // namespace Geom

Я использовал следующий код Python для его разбора и создания дампа AST:

# Usage: python nsbug.py <file>

import sys
import clang.cindex

def indent(level):
    """ Indentation string for pretty-printing
    return '  '*level

def output_cursor(cursor, level):
    """ Low level cursor output
    spelling = ''
    displayname = ''

    if cursor.spelling:
        spelling = cursor.spelling
    if cursor.displayname:
        displayname = cursor.displayname
    kind = cursor.kind;

    print indent(level) + spelling, '<' + str(kind) + '>'
    print indent(level+1) + '"'  + displayname + '"'

def output_cursor_and_children(cursor, level=0):
    """ Output this cursor and its children with minimal formatting.
    output_cursor(cursor, level)
    if cursor.kind.is_reference():
        print indent(level) + 'reference to:'
        output_cursor(clang.cindex.Cursor_ref(cursor), level+1)

    # Recurse for children of this cursor
    has_children = False;
    for c in cursor.get_children():
        if not has_children:
            print indent(level) + '{'
            has_children = True
        output_cursor_and_children(c, level+1)

    if has_children:
        print indent(level) + '}'

index = clang.cindex.Index.create()
tu = index.parse(sys.argv[1], options=1)


Когда я запустив это на example.cpp, я получаю (я правильно думаю):


  (Deleted lots of clang-generated declarations such as __VERSION__)

  Geom <CursorKind.NAMESPACE>
    Location <CursorKind.STRUCT_DECL>
      x <CursorKind.FIELD_DECL>
      y <CursorKind.FIELD_DECL>
    Shape <CursorKind.CLASS_DECL>
      Shape <CursorKind.CONSTRUCTOR>
      set_location <CursorKind.CXX_METHOD>
        "set_location(const Geom::Location &)"
        where <CursorKind.PARM_DECL>
            "struct Geom::Location"
          reference to:
            Location <CursorKind.STRUCT_DECL>
      get_location <CursorKind.CXX_METHOD>
          "struct Geom::Location"
        reference to:
          Location <CursorKind.STRUCT_DECL>
      m_pos <CursorKind.FIELD_DECL>
          "struct Geom::Location"
        reference to:
          Location <CursorKind.STRUCT_DECL>
    Circle <CursorKind.CLASS_DECL>
        "class Geom::Shape"
      reference to:
        Shape <CursorKind.CLASS_DECL>
          "class Geom::Shape"
        reference to:
          Shape <CursorKind.CLASS_DECL>
      Circle <CursorKind.CONSTRUCTOR>
      draw <CursorKind.CXX_METHOD>

Но когда я пробую это в заголовочном файле вместе с python nsbug.py example.py, я получаю только :


  (deleted lots of clang-generated definitions such as __VERSION__)

  Geom <CursorKind.VAR_DECL>

Почему пространство имен Geomв AST указано как VAR_DECL? Я бы не ожидал никакой разницы, кроме как в курсорах препроцессора.

Обходной путь очевиден — просто создайте в памяти временный файл, включающий заголовок, — но это не очень удовлетворительно. Кто-нибудь может меня просветить?

