У меня есть файлы, которые нужно преобразовать в базу данных. Эти файлы (у меня их более 100 тысяч) из старой системы (созданной на основе сценария COBOL). Сейчас я являюсь частью команды, которая переносит данные из этой системы в новую.
Теперь, поскольку у нас много файлов для разбора (каждый файл от 50mb до 100mb), я хочу убедиться, что использую правильные методы для преобразования их в sql-выражения.
Большинство файлов имеют следующий формат:
#id<tab>name<tab>address1<tab>address2<tab>city<tab>state<tab>zip<tab>country<tab>#\n
адрес2 является необязательным и может быть пустым или
#id<tab>client<tab>taxid<tab>tagid<tab>address1<tab>address2<tab>city<tab>state<tab>zip<tab>country<tab>#\n
это 2 наиболее распространенные строки (я скажу, что около 50%), кроме этих, все строки выглядят одинаково, но с разной информацией.
Теперь, мой вопрос в том, что я должен сделать, чтобы открыть их как можно эффективнее и правильно разобрать?