В моем конвейере scikits-learn я хотел бы передать пользовательский словарь в CountVectorizer ():
text_classifier = Pipeline([
('count', CountVectorizer(vocabulary=myvocab)),
('tfidf', TfidfTransformer()),
('clf', LinearSVC(C=1000))
])
Однако, насколько я понимаю, когда я вызываю
text_classifier.fit(X_train, y_train)
Конвейер использует метод fit_transform () функции CountVectorizer (), который игнорирует myvocab. Как я могу изменить свой конвейер для использования myvocab? Спасибо!