Получить имя входного файла в потоковой программе Hadoop

Я могу найти имя, если входной файл в классе Mapper использует FilesPlit при написании программы в Java.

Есть ли соответствующий способ сделать это, когда я пишу программу в Python (используя потоковую передачу?)

Я обнаружил следующее в потоковой передаче Hadoop в Apache:

см. Настраиваемые параметры. Во время выполнения потокового задания Имена параметров «MAPRED» преобразуются. Точки (.) стать подчеркиванием (_). Например, mapred.job.id становится mapred_job_id и mapred.jar становится mapred_jar. В вашем коде используйте имена параметров с подчеркиванием.

Но я все еще не могу понять, как использовать это внутри моего Mapper.

Любая помощь высоко ценится.

Спасибо

7
задан Krishnamurthy 16 September 2011 в 19:59
поделиться