В новом API (apache.hadoop.mapreduce.KeyValueTextInputFormat), как указать разделитель (разделитель), отличный от табуляции (по умолчанию), для разделения ключа и значения.
Пример ввода:
one,first line
two,second line
Требуемый результат:
Key : one
Value : first line
Key : two
Value : second line
Я указываю KeyValueTextInputFormat как:
Job job = new Job(conf, "Sample");
job.setInputFormatClass(KeyValueTextInputFormat.class);
KeyValueTextInputFormat.addInputPath(job, new Path("/home/input.txt"));
Это нормально работает для табуляции в качестве разделителя.