Алгоритмы распознавания именованных объектов

jQuery.param() :

Создать сериализованное представление массива, простого объекта или объекта jQuery, подходящего для использования в строке запроса URL-адреса или Ajax запрос. Если объект jQuery передан, он должен содержать элементы ввода с свойствами name / value.

blockquote>

В документе также указано, что

Если объект прошел находится в массиве, он должен быть массивом объектов в формате, возвращаемом .serializeArray()

blockquote>

Итак, в вашем случае:

var url = '../reports/student.php?' + jQuery.param(serializeArray(data));

Чтобы несериализовать, вы должны использовать функцию jQuery BBQ deparam в соответствии с ответом cce в этом вопросе SO: Обратная функция $ .param () в JavaScript / jQuery .

21
задан caw 22 June 2009 в 12:26
поделиться

3 ответа

Для начала ознакомьтесь с http://www.nltk.org/ , если вы планируете работать с python, хотя, насколько мне известно, код не является "промышленным" сила ", но это поможет вам начать.

Посмотрите раздел 7.5 на http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html , но чтобы понять алгоритмы, которые вы вероятно, придется прочитать большую часть книги.

Также проверьте это http://nlp.stanford.edu/software/CRF-NER.shtml . Это делается с помощью java,

NER - непростая тема, и, вероятно, никто не скажет вам «это лучший алгоритм», у большинства из них есть свои за / против.

Мои 0,05 доллара.

Ура,

13
ответ дан 29 November 2019 в 05:58
поделиться

Это зависит от того, хотите ли вы:

Чтобы узнать о NER : Отличное место для начала - это NLTK и связанная с ним книга .

Чтобы реализовать лучшее решение : Здесь вам нужно будет искать состояние искусства. Посмотрите публикации в TREC . Более специализированное собрание - Biocreative (хороший пример NER, примененного к узкой области).

Для реализации самого простого решения : в этом случае вы просто хотите сделать простую маркировку, и вытащите слова, помеченные как существительные. Вы можете использовать теггер из nltk или даже просто искать каждое слово в PyWordnet и отмечать его наиболее распространенным смыслом слов.


Большинство алгоритмов требуют некоторого обучения и работают лучше всего, когда они обучены контенту, который представляет то, что вы собираетесь просить пометить.

3
ответ дан 29 November 2019 в 05:58
поделиться

Я ничего не знаю о NER, но, судя по тому примеру, вы могли бы создать алгоритм, который искал бы заглавные буквы в словах или что-то в этом роде. Для этого я бы порекомендовал регулярное выражение как наиболее простое в реализации решение, если вы думаете о мелочах.

Другой вариант - сравнить тексты с базой данных, в которой вы найдете строку, предварительно идентифицированную как Интересующие вас теги.

my 5 центов.

-10
ответ дан 29 November 2019 в 05:58
поделиться
Другие вопросы по тегам:

Похожие вопросы: