6
ответов

“Стоп-слова” перечисляют для английского языка? [закрытый]

Я генерирую некоторую статистику для некоторого англоязычного текста, и я хотел бы пропустить неинтересные слова, такие как "a" и. Где я могу найти некоторые списки этих неинтересных слов? Список...
вопрос задан: 26 October 2012 23:47
5
ответов

NLTK: слово & ldquo; a & rdquo; не удаляться как секундомер [дубликат]

По какой-то причине я не могу удалить «a» из строки. Я вижу, что NLTK уже имеет «a» в списке стоп-слов, но код, который я написал, все еще возвращал это слово. Затем я попытался добавить «а» еще раз ...
вопрос задан: 2 October 2013 09:46
4
ответа

Как удалить список слов из списка строк

Извините, если вопрос немного запутанный. Это похоже на этот вопрос. Я думаю, что этот вопрос близок к тому, что я хочу, но в Clojure. Есть еще один вопрос, мне нужно что-то вроде ...
вопрос задан: 23 May 2017 10:30
4
ответа

Более быстрый способ удаления стоп-слов в Python

Я пытаюсь удалить стоп-слова из строки текста: из nltk.corpus импортировать стоп-слова text = 'привет пока привет' text = '' .join ([слово в слово в text.split (), если слово не в (стоп-слова) .words (»...
вопрос задан: 24 October 2013 08:13
3
ответа

Где я могу найти список еврейских стоп-слов?

Где я могу найти список еврейских стоп-слов?Править: отредактируйте мой ответ для добавления больше, если существует больше...
вопрос задан: 6 December 2016 22:38
3
ответа

Токенизатор, удаление стоп-слова, стемминг в Java

Я ищу класс или метод, который берет длинную строку многих 100 с слов и маркирует, удаляет стоп-слова и основы для использования в системе IR. Например: "Большая кошка, сказал 'Ваш...
вопрос задан: 20 February 2013 05:07
3
ответа

Как сбросить стоп-слова в MySQL?

Я хочу сбросить список стоп-слова в mysql для ПОЛНОТЕКСТОВОГО ПОИСКА. Я установил Сервер WAMP в своей системе, которые имеют phpmyadmin к доступу mysql. Но я не знаю, как сбросить стоп-слово в phpmyadmin. Может...
вопрос задан: 26 October 2012 00:13
3
ответа

Как удалить список слов от строк

Что я хотел бы сделать (в Clojure): Например, у меня есть вектор слов, которые должны быть удалены: (запрещенные слова определения [":)" """". ""... намного больше...])... и вектор строк: (...
вопрос задан: 31 March 2010 14:17
1
ответ

Удаление стоп-фраз из DocumentTermMatrix

Ниже я делаю базовое моделирование темы для «грубых» данных. Я знаю, что могу удалить стоп-слова, используя tm_map, но я не могу понять, как это сделать после того, как происходит токенизация bigram. библиотека (topicmodels) ...
вопрос задан: 13 July 2018 19:19
1
ответ

Как я могу записать полный поисковый индексный запрос, который не рассмотрит стоп-слов?

Я записал запрос, который выполнит Полнотекстовый поиск с помощью полного поискового Индекса в mysql Таблице. Но моя проблема состоит в том, что, когда пользователь ищет с, "для движения" затем, это ничего не будет искать из-за...
вопрос задан: 15 May 2010 06:22
1
ответ

MySQL Fulltext Stopwords Rationale

Я в настоящее время пытаюсь разработать основной полнотекстовый поиск своего веб-сайта, и я заметил, что определенные слова как "оценка" перечислены как стоп-слова для полнотекстовых поисков MySQL. Это не беспокоит меня...
вопрос задан: 23 February 2010 19:16
0
ответов

Solr не может найти стоп-слова ресурсов _en.txt

Я пытаюсь настроить Solr 3.6.0 с помощью Django -haystack Beta 2.0.0. После запуска./manage.py build _схемы solr _и перемещения schema.xml в каталог conf, при посещении http ://localhost :8983/solr/admin,...
вопрос задан: 18 January 2018 21:53
0
ответов

Использование GREP Чтобы отфильтровать слова из файла StopWords

Я хочу использовать GREP вместе с файлом StopWords, чтобы отфильтровать общие английские слова из другого файла. Файл «quotfile» содержит одно слово на строку. кошка некоторая |. GREP -V -F STOPWORDS ...
вопрос задан: 27 October 2015 07:08
0
ответов

SQL 2008: Отключить стоп-слова для запроса полнотекстового поиска

У меня довольно большие трудности с поиском хорошего решения для этого: допустим, у меня есть таблица "Компания" в столбце "Имя". У меня есть полнотекстовый каталог по этой колонке. Если пользователь ...
вопрос задан: 8 October 2015 17:01
0
ответов

Как получить список стоп-слов, используемых в моем полнотекстовом каталоге?

Есть ли способ получить список стоп-слов в моем полнотекстовом каталоге SQL Server 2008 использует? И использовать его в моем коде на C #? Я хочу использовать его на странице ASP.NET, которую я использую для поиска и выделения ...
вопрос задан: 10 August 2015 12:17
0
ответов

Влияние стемминга на частоту термина?

Как термин частоты (TF )и обратная частота документа (IDF )затронуты удалением стоп-слова -и выделением корней? Спасибо!
вопрос задан: 11 March 2014 18:36
0
ответов

Как удалить стоп-слова с помощью nltk или python

Итак, у меня есть набор данных, из которого я хотел бы удалить стоп-слова из использования stopwords.words ('english') Я изо всех сил пытаюсь использовать это в своем коде, чтобы просто удалить эти слова. У меня есть список ...
вопрос задан: 6 March 2013 11:53
0
ответов

为什么将这些词视为停用词?

我在自然语言处理中没有正式背景,想知道NLP方面是否有人可以对此有所启发。 我正在使用NLTK库,当时我...
вопрос задан: 26 October 2012 00:11
0
ответов

Избавьтесь от стоп-слов и знаков препинания

Я борюсь с NLTK-стоп-словом. Вот мой код .. Может кто подскажет, что не так? из nltk.corpus import stopwords def removeStopwords (palabras): return [слово в слово в ...
вопрос задан: 26 October 2012 00:04
0
ответов

Полнотекстовый поиск не работает, если включено стоп-слово, хотя список стоп-слов пуст

Я хотел бы иметь возможность искать каждое слово, поэтому я очистил список стоп-слов. Чем я перестроил индекс. Но, к сожалению, если я наберу поисковое выражение со стоп-словом в нем, это все еще ...
вопрос задан: 6 October 2012 10:49
0
ответов

Как остановить результат в solr, если фраза содержит стоп-слово?

У меня проблема при поиске с помощью Solr фразы, в которой есть стоп-слова. Solr отправляет результат со стоп-словом, и это не мой ожидаемый результат. Я добавил слово "test" в файл stopwords.txt. В schema.xml ...
вопрос задан: 30 November 2011 09:04
0
ответов

Игнорирование стоп-слов при сортировке записей SQL Server 2008

У меня есть таблица с полем названия книги. Я хотел бы иметь возможность отсортировать записи следующим образом: Древний аллигатор Аллигатор тети Энни Полное руководство по подсчитанным аллигаторам ...
вопрос задан: 20 June 2011 23:42
0
ответов

Извлечь соответствующий тег / ключевые слова из текстового блока

Мне нужна была конкретная реализация, чтобы пользователь предоставлял блок текста вроде: «Требования - рабочие знания в среде LAMP с использованием Linux, Apache 2, MySQL 5 и PHP» 5, - ...
вопрос задан: 8 June 2011 17:27
0
ответов

Добавление слов в список стоп-слов nltk

У меня есть код, который удаляет стоп-слова из моего набора данных, так как стоп-лист, похоже, не удаляет большинство слов, которые мне бы тоже хотелось, я ищу добавить слова в этот стоп-список, чтобы он ...
вопрос задан: 1 April 2011 09:49
0
ответов

Могу ли я настроить эластичный поиск для использования моего собственного списка стоп-слов?

в частности, я хочу проиндексировать все (например, кто) без списка стоп-слов. Является ли эластичный поиск достаточно гибким и легким для изменения?
вопрос задан: 7 February 2011 22:54
0
ответов

Как я могу отсортировать SQLite-запрос, игнорируя статьи («the», «a» и т. Д.)?

Я использую C # для отобразить список названий фильмов, которые я вызываю из базы данных SQLite. В настоящее время я использую специальный класс ListBox, в котором есть функция для сортировки текста, удаляя слово «The» из ...
вопрос задан: 12 September 2010 21:01