У меня есть блоки текста, которые я хочу токенизировать, но Я не хочу использовать пробелы и знаки препинания для токенизации, что, по-видимому, является стандартом для таких инструментов, как NLTK. Есть определенные фразы, которыми я хочу быть ...
вопрос задан: 3 April 2011 20:56