Есть ли какая-либо библиотека анализа текста с открытым исходным кодом для PHP? [закрытый]

DRM это, DRM, что - издатели, которые вызывают DRM на их проектах, делают его, потому что это является прибыльным. Их экономисты завершают это на данных, которые ни один из нас никогда не буду видеть. "DRM является злыми" сообщениями-розыгрышами, немного заходят слишком далеко.

Для продукта низкой видимости, простая интернет-активация собирается остановить случайное копирование. Любое другое копирование, вероятно, незначительно к Вашей нижней строке.

7
задан Marc 12 December 2009 в 20:59
поделиться

2 ответа

Short Answer

As far as I'm aware there's isn't one, or at least not a well-known / well-distributed one.

Long Answer

The closes de-facto code I've come across is php-text-statistics by Dave Child (since the PEAR version has been unmaintained for years) but that only takes care of readability and sentence, word and syllable counting. Any other data you'd have to get yourself with count_chars, str_word_count, substr_count, preg_match_all and the like. And of course some math skills to calculate all the percentages.

That said, I'm not sure exactly what is it you'd want the library to do, or what http://textalyser.net/ does...
(I mean what is a stoplist anyway? Or an exhaustive polyword phrase, for that matter...?)

3
ответ дан 7 December 2019 в 05:24
поделиться

В данный момент я ищу нечто похожее, и варианты, которые я нашел до сих пор, заключаются в использовании функции поиска Zend Lucene.

http://www.opendocs.net/php/zend/ZendFramework-0.1.5/documentation/end-user/pl/zend.search.exnding.html

или, в качестве альтернативы, изучить API Open Calais . http://www.opencalais.com/ (от Thomson Reuters)

Я еще не изучил ни один из вариантов сколько-нибудь подробно, но я думаю, что в них может быть некоторый пробег для создания динамических ссылок или гипер (кон) текстуализация веб-страниц.

2
ответ дан 7 December 2019 в 05:24
поделиться
Другие вопросы по тегам:

Похожие вопросы: