Scikits-learn: использовать пользовательский словарь вместе с конвейером

В моем конвейере scikits-learn я хотел бы передать пользовательский словарь в CountVectorizer ():

text_classifier = Pipeline([
    ('count', CountVectorizer(vocabulary=myvocab)),
    ('tfidf', TfidfTransformer()),
    ('clf', LinearSVC(C=1000))
])

Однако, насколько я понимаю, когда я вызываю

text_classifier.fit(X_train, y_train)

Конвейер использует метод fit_transform () функции CountVectorizer (), который игнорирует myvocab. Как я могу изменить свой конвейер для использования myvocab? Спасибо!

5
задан ogrisel 23 June 2012 в 13:07
поделиться