hive regexp_extract weirdness

У меня возникли некоторые проблемы с regexp_extract:

Я запрашиваю файл с разделителями табуляции, столбец Я проверяю, есть ли строки, которые выглядят следующим образом:

abc.def.ghi

Теперь, если я это сделаю:

select distinct regexp_extract(name, '[^.]+', 0) from dummy;

Задание MR выполняется, оно работает, и я получаю «abc» из индекса 0.

Но теперь, если я хочу, получить "def" из индекса 1:

select distinct regexp_extract(name, '[^.]+', 1) from dummy;

Hive выходит из строя с:

2011-12-13 23:17:08,132 Stage-1 map = 0%,  reduce = 0%
2011-12-13 23:17:28,265 Stage-1 map = 100%,  reduce = 100%
Ended Job = job_201112071152_0071 with errors
FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask

Файл журнала говорит:

java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: Hive Runtime Error while processing row

Я делаю здесь что-то в корне неправильно?

Спасибо, Марио

11
задан Mario 13 December 2011 в 22:26
поделиться