Как создать regex для парсинга арабских Дат

Я работаю над программой, которая выполняет серию regexs, чтобы попытаться найти дату в DOM от веб-страницы. Например, в www.engadget.com/2010/07/19/windows-phone-7-in-depth-preview/, я соответствовал бы "19-го июля 2010" своему regex. Дела шли прекрасные в нескольких форматах и языках, пока я не поразил арабскую веб-страницу. Как пример, рассмотрите http://islammaktoob.maktoobblog.com/. Дата 18 июля 2010 появляется на арабском языке наверху сообщения, но я не могу выяснить, как соответствовать ему. У кого-либо есть опыт в соответствии арабским датам? Если бы кто-то мог бы отправить пример или regex, они использовали бы для соответствия той арабской дате, это было бы очень полезно.Спасибо!

Обновление:

Ближе получение:

String fromTheSite = "كتبها اسلام مكتوب ، في 18 تموز 2010 الساعة: 09:42 ص"; 
    NamedMatcher infoMatcher = NamedPattern.compile("(?[0-3]?[0-9]) (?يناير|فبراير|مارس|أبريل|إبريل|مايو|يونيو|يونيه|يوليو|يوليه|أغسطس|سبتمبر|أكتوبر|نوفمبر|ديسمبر|كانون الثاني|شباط|آذار|نيسان|أيار|حزيران|تموز|آب|أيلول|تشرين الأول|تشرين الثاني|كانون الأول) (?[1-2][0-9][0-9][0-9]) ", Pattern.CANON_EQ).matcher(fromTheSite);
    while(infoMatcher.find()){
        System.out.println(infoMatcher.group());
        System.out.println(infoMatcher.group("Day"));
        System.out.println(infoMatcher.group("Month"));
        System.out.println(infoMatcher.group("Year"));
    }

Дает мне

18 تموز 2010
18
تموز
2010

Почему соответствие кажется неисправным?

9
задан Louay Alakkad 4 January 2016 в 11:38
поделиться