Python Arabic NLP

Я нахожусь в процессе оценки возможностей NLTK в обработке арабского текста в исследовании по анализу и извлечению настроений.

Вопрос следующий:

  1. Способен ли NTLK обрабатывать и анализировать арабский текст?
  2. Может ли python манипулировать \ токенизировать арабский текст?
  3. Смогу ли я анализировать и сохранять арабский текст? текст с использованием Python?

Если python и NTLK не являются инструментами для этой работы, какие инструменты вы бы порекомендовали (если они есть)?

Спасибо.


РЕДАКТИРОВАТЬ

На основании исследования:

  1. NTLK может ограничивать только арабский текст: Ссылка
  2. Python может обрабатывать арабский текст, поскольку он поддерживает юникод UTF-8: Ссылка
  3. Синтаксический анализ и лемматизацию арабского текста можно выполнить с помощью: SNLPG (Стэнфордская группа обработки естественного языка) Статистический синтаксический анализатор: Ссылка

19
задан Sнаđошƒаӽ 16 February 2016 в 15:05
поделиться