Я генерирую некоторую статистику для некоторого англоязычного текста, и я хотел бы пропустить неинтересные слова, такие как "a" и. Где я могу найти некоторые списки этих неинтересных слов? Список...
По какой-то причине я не могу удалить «a» из строки. Я вижу, что NLTK уже имеет «a» в списке стоп-слов, но код, который я написал, все еще возвращал это слово. Затем я попытался добавить «а» еще раз ...
Извините, если вопрос немного запутанный. Это похоже на этот вопрос. Я думаю, что этот вопрос близок к тому, что я хочу, но в Clojure. Есть еще один вопрос, мне нужно что-то вроде ...
Я пытаюсь удалить стоп-слова из строки текста: из nltk.corpus импортировать стоп-слова text = 'привет пока привет' text = '' .join ([слово в слово в text.split (), если слово не в (стоп-слова) .words (»...
Я ищу класс или метод, который берет длинную строку многих 100 с слов и маркирует, удаляет стоп-слова и основы для использования в системе IR. Например: "Большая кошка, сказал 'Ваш...
Я хочу сбросить список стоп-слова в mysql для ПОЛНОТЕКСТОВОГО ПОИСКА. Я установил Сервер WAMP в своей системе, которые имеют phpmyadmin к доступу mysql. Но я не знаю, как сбросить стоп-слово в phpmyadmin. Может...
Что я хотел бы сделать (в Clojure): Например, у меня есть вектор слов, которые должны быть удалены: (запрещенные слова определения [":)" """". ""... намного больше...])... и вектор строк: (...
Ниже я делаю базовое моделирование темы для «грубых» данных. Я знаю, что могу удалить стоп-слова, используя tm_map, но я не могу понять, как это сделать после того, как происходит токенизация bigram. библиотека (topicmodels) ...
Я записал запрос, который выполнит Полнотекстовый поиск с помощью полного поискового Индекса в mysql Таблице. Но моя проблема состоит в том, что, когда пользователь ищет с, "для движения" затем, это ничего не будет искать из-за...
Я в настоящее время пытаюсь разработать основной полнотекстовый поиск своего веб-сайта, и я заметил, что определенные слова как "оценка" перечислены как стоп-слова для полнотекстовых поисков MySQL. Это не беспокоит меня...
Я пытаюсь настроить Solr 3.6.0 с помощью Django -haystack Beta 2.0.0. После запуска./manage.py build _схемы solr _и перемещения schema.xml в каталог conf, при посещении http ://localhost :8983/solr/admin,...
Я хочу использовать GREP вместе с файлом StopWords, чтобы отфильтровать общие английские слова из другого файла. Файл «quotfile» содержит одно слово на строку. кошка некоторая |. GREP -V -F STOPWORDS ...
У меня довольно большие трудности с поиском хорошего решения для этого: допустим, у меня есть таблица "Компания" в столбце "Имя". У меня есть полнотекстовый каталог по этой колонке. Если пользователь ...
Есть ли способ получить список стоп-слов в моем полнотекстовом каталоге SQL Server 2008 использует?
И использовать его в моем коде на C #? Я хочу использовать его на странице ASP.NET, которую я использую для поиска и выделения ...
Итак, у меня есть набор данных, из которого я хотел бы удалить стоп-слова из использования stopwords.words ('english') Я изо всех сил пытаюсь использовать это в своем коде, чтобы просто удалить эти слова. У меня есть список ...
Я борюсь с NLTK-стоп-словом. Вот мой код .. Может кто подскажет, что не так? из nltk.corpus import stopwords def removeStopwords (palabras): return [слово в слово в ...
Я хотел бы иметь возможность искать каждое слово, поэтому я очистил список стоп-слов. Чем я перестроил индекс. Но, к сожалению, если я наберу поисковое выражение со стоп-словом в нем, это все еще ...
У меня проблема при поиске с помощью Solr фразы, в которой есть стоп-слова. Solr отправляет результат со стоп-словом, и это не мой ожидаемый результат. Я добавил слово "test" в файл stopwords.txt.
В schema.xml ...
У меня есть таблица с полем названия книги. Я хотел бы иметь возможность отсортировать записи следующим образом: Древний аллигатор Аллигатор тети Энни Полное руководство по подсчитанным аллигаторам ...
Мне нужна была конкретная реализация, чтобы пользователь предоставлял блок текста вроде: «Требования - рабочие знания в среде LAMP с использованием Linux, Apache 2, MySQL 5 и PHP» 5, - ...
У меня есть код, который удаляет стоп-слова из моего набора данных, так как стоп-лист, похоже, не удаляет большинство слов, которые мне бы тоже хотелось, я ищу добавить слова в этот стоп-список, чтобы он ...
Я использую C # для отобразить список названий фильмов, которые я вызываю из базы данных SQLite. В настоящее время я использую специальный класс ListBox, в котором есть функция для сортировки текста, удаляя слово «The» из ...