В настоящее время разработают CMS для использования на моем сайте. Мне интересно, имеются какие-либо бесплатные библиотеки для создания тегов на основе содержимого.
Пример
Мне нравятся деревья. Деревья - это растения, которые имеют листья. Листья на дереве могут быть Разноцветные.
будет производить теги деревьев и листья .
Библиотека должна быть PHP или JS.
Отредактируйте 1:
Я нашел простую библиотеку для половины моей задачи - http://www.cafewebmaster.com/get-top-100-words-keywords-text-php
i Отредактировал то, что должна быть технических характеристик библиотеки (благодаря руководству от @nulluserexception) -
Подсчитайте все слова (игнорирующие случаи и разрывы), выбросьте слов стоп и выберите те, что с наивысшей частотой
редактировать текст, чтобы сделать слова Это более специфики для жанра (может иметь более низкую частоту), иметь более высокое значение. Например, в примере - «Разноцветные» должны стать более высоким значением, потому что он более специфичен для объекта. Однако он должен включать префикс, указывающий, что он относится к объекту (это станет листьями - разноцветными).
Отредактируйте 2:
алгоритм следует удалить слова, которые имеют менее 3 символов , если они в столицах или отформатированы иначе