Какие конструкции Javascript неправильно лексирует JsLex?

JsLex - это лексер Javascript, который я написал на Python. Он хорошо справляется с дневной работой (или около того), но я уверен, что есть случаи, когда он ошибается. В частности, он ничего не понимает о вставке точек с запятой, и, вероятно, есть способы, которые важны для лексирования. Я просто не знаю, что это такое.

Какой код Javascript делает JsLex lex неправильно? Меня особенно интересует действительный источник Javascript, в котором JsLex неправильно определяет литералы регулярных выражений.

Для ясности, под «лексированием» я подразумеваю идентификацию токенов в исходном файле. JsLex не пытается анализировать Javascript, а тем более выполнять его. Я написал JsLex для полного лексирования, хотя, честно говоря, я был бы счастлив, если бы он просто смог успешно найти все литералы регулярных выражений.

10
задан Ned Batchelder 4 April 2011 в 03:06
поделиться