мой вопрос: как передать некоторые аргументы обработчику XML:TWIG, и как возвратить результат обработчика.
Вот мой код, который hardcoded:
<counter name = "music", report type = "month", stringSet index = 4>
.
Как реализовать это при помощи аргументов $counter_name
, $type
, $id
? и как возвратить результат string_list? Спасибо (извините, я не отправил XML-файл здесь, потому что я испытываю некоторые затруднения, чтобы сделать это. что-либо в <и> проигнорировано).
use XML::Twig;
sub parse_a_counter {
my ($twig, $counter) = @_;
my @report = $counter->children('report[@type="month"]');
for my $report (@report){
my @stringSet = $report->children('stringSet[@index=”4”]');
for my $stringSet (@stringSet){
my @string_list = $stringSet->children_text('string');
print @string_list; # in fact I want to return this string_list,
# not just print it.
}
}
$counter->flush; # free the memory of $counter
}
my $roots = { 'counter[@name="music"]' => 1 };
my $handlers = { counter => \&parse_a_counter };
my $twig = new XML::Twig(TwigRoots => $roots,
TwigHandlers => $handlers);
$twig->parsefile('counter_test.xml');
Самый простой и обычный способ передачи аргументов обработчикам - использовать замыкания. Это большое слово, но простая концепция: вы вызываете обработчик следующим образом tag => sub { handler( @_, $my_arg) }
и $my_arg
будет передан обработчику. В Achieving Closure есть более подробные объяснения этой концепции.
Ниже показано, как я написал бы код. Я использовал Getopt::Long
для обработки аргументов и qq{}
вместо кавычек вокруг строк, содержащих выражение XPath, чтобы иметь возможность использовать кавычки в выражении.
#!/usr/bin/perl
use strict;
use warnings;
use XML::Twig;
use Getopt::Long;
# set defaults
my $counter_name= 'music';
my $type= 'month';
my $id= 4;
GetOptions ( "name=s" => \$counter_name,
"type=s" => \$type,
"id=i" => \$id,
) or die;
my @results;
my $twig= XML::Twig->new(
twig_roots => { qq{counter[\@name="$counter_name"]}
=> sub { parse_a_counter( @_, $type, $id, \@results); } } )
->parsefile('counter_test.xml');
print join( "\n", @results), "\n";
sub parse_a_counter {
my ($twig, $counter, $type, $id, $results) = @_;
my @report = $counter->children( qq{report[\@type="$type"]});
for my $report (@report){
my @stringSet = $report->children( qq{stringSet[\@index="$id"]});
for my $stringSet (@stringSet){
my @string_list = $stringSet->children_text('string');
push @$results, @string_list;
}
}
$counter->purge; # free the memory of $counter
}
Самый простой способ - заставить __ parse_a_counter __
возвращать подпрограмму (т. Е. Закрытие) и сохранять результаты в глобальной переменной. Например:
use strict;
use warnings;
use XML::Twig;
our @results; # <= put results in here
sub parse_a_counter {
my ($type, $index) = @_;
# return closure over type & index
return sub {
my ($twig, $counter) = @_;
my @report = $counter->children( qq{report[\@type="$type"]} );
for my $report (@report) {
my @stringSet = $report->children( qq{stringSet[\@index="$index"]} );
for my $stringSet (@stringSet) {
my @string_list = $stringSet->children_text( 'string' );
push @results, \@string_list;
}
}
};
}
my $roots = { 'counter[@name="music"]' => 1 };
my $handlers = { counter => parse_a_counter( "month", 4 ) };
my $twig = XML::Twig->new(
TwigRoots => $roots,
TwigHandlers => $handlers,
)->parsefile('counter_test.xml');
Я тестировал это с помощью следующего XML (это то, что я мог вычислить из вашего примера XML и кода):
<?xml version="1.0" encoding="UTF-8"?>
<root>
<counter name="music">
<report type="week">
<stringSet index="4">
<string>music week 4</string>
</stringSet>
</report>
</counter>
<counter name="xmusic">
<report type="month">
<stringSet index="4">
<string>xmusic month 4</string>
</stringSet>
</report>
</counter>
<counter name="music">
<report type="month">
<stringSet index="4">
<string>music month 4 zz</string>
<string>music month 4 xx</string>
</stringSet>
</report>
</counter>
</root>
И я получил в ответ следующее:
[
[
'music month 4 zz',
'music month 4 xx'
]
];
Это то, чего я ожидал!
DISCLAIMER: Я сам не использовал Twig, поэтому этот ответ может быть не совсем идиоматичным - это общий ответ на вопрос "как мне сохранить состояние в обработчике обратного вызова".
Три способа передачи информации в обработчики и из них:
ОДИН. Состояние, хранящееся в статическом месте
package TwigState;
my %state = ();
# Pass in a state attribute to get
sub getState { $state{$_[0]} }
# Pass in a state attribute to set and a value
sub setState { $state{$_[0]} = $_[1]; }
package main;
sub parse_a_counter { # Better yet, declare all handlers in TwigState
my ($twig, $element) = @_;
my $counter = TwigState::getState('counter');
$counter++;
TwigState::setState('counter', $counter);
}
ДВА. Состояние хранится в самом $t (объект XML::Twig) в некотором члене "state"
# Ideally, XML::Twig or XML::Parser would have a "context" member
# to store context and methods to get/set that context.
# Barring that, simply make one, using a VERY VERY bad design decision
# of treating the object as a hash and just making a key in that hash.
# I'd STRONGLY not recommend doing that and choosing #1 or #3 instead,
# unless there's a ready made context data area in the class.
sub parse_a_counter {
my ($twig, $element) = @_;
my $counter = $twig->getContext('counter');
# BAD: my $counter = $twig->{'_my_context'}->{'counter'};
$counter++;
TwigState::setState('counter', $counter);
$twig->setContext('counter', $counter);
# BAD: $twig->{'_my_context'}->{'counter'} = $counter;
}
# for using DIY context, better pass it in with constructor:
my $twig = new XML::Twig(TwigRoots => $roots,
TwigHandlers => $handlers
_my_context => {});
ТРИ. Сделать обработчик закрытием и заставить его хранить состояние таким образом