Хорошо, в последнее время я довольно сильно интересовался обработкой естественного языка: однако до сих пор я использовал C для большинства моей работы. Я слышал о NLTK и не знал Python, но мне кажется, что его довольно легко выучить, и он выглядит как действительно мощный и интересный язык. В частности, модуль NLTK кажется очень и очень адаптированным к тому, что мне нужно делать.
Однако, когда я использовал пример кода для NLTK и вставлял его в файл с именем test.py
, я заметил, что его выполнение занимает очень и очень много времени!
Я вызываю это из оболочки так:
time python ./test.py
А на машине с частотой 2,4 ГГц и 4 ГБ ОЗУ это занимает 19,187 секунды!
Возможно, это абсолютно нормально, но у меня сложилось впечатление, что NTLK был чрезвычайно быстрым; Возможно, я ошибался, но есть ли что-то очевидное, что я здесь явно делаю неправильно?