Я могу найти имя, если входной файл в классе Mapper использует FilesPlit при написании программы в Java.
Есть ли соответствующий способ сделать это, когда я пишу программу в Python (используя потоковую передачу?)
Я обнаружил следующее в потоковой передаче Hadoop в Apache:
см. Настраиваемые параметры. Во время выполнения потокового задания Имена параметров «MAPRED» преобразуются. Точки (.) стать подчеркиванием (_). Например, mapred.job.id становится mapred_job_id и mapred.jar становится mapred_jar. В вашем коде используйте имена параметров с подчеркиванием.
Но я все еще не могу понять, как использовать это внутри моего Mapper.
Любая помощь высоко ценится.
Спасибо