Какая эффективная библиотека для предположения ключевые слова для контента?

В настоящее время разработают CMS для использования на моем сайте. Мне интересно, имеются какие-либо бесплатные библиотеки для создания тегов на основе содержимого.

Пример

Мне нравятся деревья. Деревья - это растения, которые имеют листья. Листья на дереве могут быть Разноцветные.

будет производить теги деревьев и листья .

Библиотека должна быть PHP или JS.

Отредактируйте 1:

Я нашел простую библиотеку для половины моей задачи - http://www.cafewebmaster.com/get-top-100-words-keywords-text-php

i Отредактировал то, что должна быть технических характеристик библиотеки (благодаря руководству от @nulluserexception) -

  • Подсчитайте все слова (игнорирующие случаи и разрывы), выбросьте слов стоп и выберите те, что с наивысшей частотой

  • редактировать текст, чтобы сделать слова Это более специфики для жанра (может иметь более низкую частоту), иметь более высокое значение. Например, в примере - «Разноцветные» должны стать более высоким значением, потому что он более специфичен для объекта. Однако он должен включать префикс, указывающий, что он относится к объекту (это станет листьями - разноцветными).

Отредактируйте 2:

алгоритм следует удалить слова, которые имеют менее 3 символов , если они в столицах или отформатированы иначе

8
задан liamzebedee 11 September 2011 в 03:57
поделиться