Разделение слов с помощью регулярных выражений в Haskell

Есть несколько пакетов, доступных для использования регулярных выражений в Haskell (например, Text.Regex.Base, Text.Regex.Posix и т. Д. .). Большинство пакетов, которые я видел до сих пор, используют подмножество Regex, которое я знаю, что я имею в виду: я привык разбивать предложение на слова с помощью следующего Regex:

\\w+

Почти все пакеты в Haskell, которые я пробовал до сих пор, не поддержите это (по крайней мере, упомянутое ранее, а также Text.Regex.TDFA). Я знаю, что с Posix использование [[: word:] +] будет иметь такой же эффект, но я хотел бы использовать вариант, упомянутый выше.

Отсюда два вопроса:

  1. Есть ли какой-нибудь пакет для его архивирования?
  2. Если действительно есть, то почему существует другое общее использование?
  3. Какие преимущества или недостатки есть?
10
задан beyeran 7 December 2011 в 14:17
поделиться