У меня возникли некоторые проблемы с regexp_extract:
Я запрашиваю файл с разделителями табуляции, столбец Я проверяю, есть ли строки, которые выглядят следующим образом:
abc.def.ghi
Теперь, если я это сделаю:
select distinct regexp_extract(name, '[^.]+', 0) from dummy;
Задание MR выполняется, оно работает, и я получаю «abc» из индекса 0.
Но теперь, если я хочу, получить "def" из индекса 1:
select distinct regexp_extract(name, '[^.]+', 1) from dummy;
Hive выходит из строя с:
2011-12-13 23:17:08,132 Stage-1 map = 0%, reduce = 0%
2011-12-13 23:17:28,265 Stage-1 map = 100%, reduce = 100%
Ended Job = job_201112071152_0071 with errors
FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask
Файл журнала говорит:
java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: Hive Runtime Error while processing row
Я делаю здесь что-то в корне неправильно?
Спасибо, Марио