Я нахожусь в процессе оценки возможностей NLTK в обработке арабского текста в исследовании по анализу и извлечению настроений.
Вопрос следующий:
- Способен ли NTLK обрабатывать и анализировать арабский текст?
- Может ли python манипулировать \ токенизировать арабский текст?
- Смогу ли я анализировать и сохранять арабский текст? текст с использованием Python?
Если python и NTLK не являются инструментами для этой работы, какие инструменты вы бы порекомендовали (если они есть)?
Спасибо.
РЕДАКТИРОВАТЬ
На основании исследования:
- NTLK может ограничивать только арабский текст: Ссылка
- Python может обрабатывать арабский текст, поскольку он поддерживает юникод UTF-8: Ссылка
- Синтаксический анализ и лемматизацию арабского текста можно выполнить с помощью:
SNLPG (Стэнфордская группа обработки естественного языка) Статистический синтаксический анализатор: Ссылка
задан Sнаđошƒаӽ 16 February 2016 в 15:05
поделиться