Как указать разделитель KeyValueTextInputFormat в Hadoop-.20 api?

В новом API (apache.hadoop.mapreduce.KeyValueTextInputFormat), как указать разделитель (разделитель), отличный от табуляции (по умолчанию), для разделения ключа и значения.

Пример ввода:

one,first line
two,second line

Требуемый результат:

Key : one
Value : first line
Key : two
Value : second line

Я указываю KeyValueTextInputFormat как:

    Job job = new Job(conf, "Sample");

    job.setInputFormatClass(KeyValueTextInputFormat.class);
    KeyValueTextInputFormat.addInputPath(job, new Path("/home/input.txt"));

Это нормально работает для табуляции в качестве разделителя.

13
задан pradeep 10 February 2012 в 04:19
поделиться