Мне нужно уметь распознавать строки даты. Неважно, если я не могу различить месяц и дату (например, 12/12/10), мне просто нужно классифицировать строку как дату, а не преобразовывать ее в объект Date. Итак, это действительно проблема классификации, а не анализа.
У меня будут фрагменты текста, например:
«бла бла бла бла 12 января 2009 г. бла бла бла 01/04/10 bla bla bla "
и мне нужно иметь возможность распознавать начальную и конечную границу для каждой строки даты внутри.
Мне было интересно, знает ли кто-нибудь о каких-либо библиотеках Java которые могут это сделать. Мой google-fu пока ничего не придумал.
ОБНОВЛЕНИЕ: мне нужно уметь распознавать самый широкий набор способов представления дат. Конечно, наивным решением может быть напишите оператор if для каждого мыслимого формата, но подход к распознаванию образов с обученной моделью - это в идеале то, что мне нужно.