Как внедрить тегер части речи (POS)

Я ищу лучший способ на основе PHP сканировать большое количество текстовых записей (объявлений) и извлекать ключевые слова - кто-нибудь знает о тегах части речи? Есть ли способ сделать это в духе PHP?

Я просматриваю множество онлайн-объявлений, но ни одной с категориями! Чтобы ускорить процесс категоризации, я хочу установить тегер части речи (http://en.wikipedia.org/wiki/Part-of-speech_tagging). По сути, это классные программные пакеты для алгоритмического анализа текста, которые могут сказать мне, какие слова являются существительными (например, «Квартира», « m действительно заинтересован в установке моей собственной библиотеки / программного обеспечения и подключении их к моему веб-приложению.

КТО-нибудь знает хороший способ установки POS-тегов, который работает с веб-приложением PHP? Я очень хочу понять это, поэтому я очень ценю любую информацию, совет или другую информацию, которая у вас есть!

Вот список МНОГО различного программного обеспечения POS: m действительно заинтересован в установке моей собственной библиотеки / программного обеспечения и подключении их к моему веб-приложению.

КТО-нибудь знает хороший способ установки тегов POS, который работает с веб-приложением PHP? Я очень хочу понять это, поэтому я очень ценю любую информацию, совет или другую информацию, которая у вас есть!

Вот список МНОГО различного программного обеспечения POS: http://www-nlp.stanford.edu/links/statnlp.html#Taggers (Посмотрите в разделе «POS Taggers»)

Спасибо, что прочитали это!

6
задан Jamison 20 January 2011 в 18:39
поделиться