Удалить список стоп-слов из списка в Python (обработка естественного языка)

Question

Удалить список стоп-слов из списка в Python (обработка естественного языка)

Вы также можете использовать метод compareTo() для сравнения двух строк. Если результат compareTo равен 0, то две строки равны, в противном случае сравниваемые строки не равны.

== сравнивает ссылки и не сравнивает фактические строки. Если вы создали каждую строку, используя new String(somestring).intern(), вы можете использовать оператор == для сравнения двух строк, в противном случае могут использоваться только методы equals () или compareTo.

0

python-3.x stanford-nlp opennlp nlp

задан thrinadhn 17 January 2019 в 10:47

2 ответа

Другие вопросы по тегам:

python-3.x stanford-nlp opennlp nlp

Похожие вопросы:

score 0 · Answer 1

У вас есть список списков.

Попробуйте:

word_split1=[['amazon','brand','- ','solimo','premium','almonds',',','250g','by','solimo'],['hersheys','cocoa', 'powder', ',', '225g', 'by', 'hersheys'],['jbl','t450bt','extra','bass','wireless','on-ear','headphones','with','mic','white','by','jbl','and']]
stop_words = set(stopwords.words('english'))
filtered_words=[]
for i in word_split1:
    for j in i:
        if j not in stop_words:
            filtered_words.append(j)

<час>

или сгладьте свой список.

Пример:

from itertools import chain    

word_split1=[['amazon','brand','- ','solimo','premium','almonds',',','250g','by','solimo'],['hersheys','cocoa', 'powder', ',', '225g', 'by', 'hersheys'],['jbl','t450bt','extra','bass','wireless','on-ear','headphones','with','mic','white','by','jbl','and']]
stop_words = set(stopwords.words('english'))
filtered_words=[]
for i in chain.from_iterable(word_split1):
    if i not in stop_words:
        filtered_words.append(i)

или

filtered_words = [i for i in chain.from_iterable(word_split1) if i not in stop_words]

score 0 · Answer 2

Список представляет собой двумерный массив, и вы пытаетесь хэшировать список, сначала преобразовать его в одномерный массив, затем ваш код будет работать нормально,

word_split1 = [j for x in word_split1 for j in x] 

stop_words = set(stopwords.words('english'))

filtered_words=[]
for i in word_split1:
    if i not in stop_words:
        filtered_words.append(i)