Justadistraction: разметка английского языка без пробелов. Murakami SheepMan

Мне было интересно, как вы стали бы размечать строки на английском (или других западных языках), если бы были удалены пробелы?

Вдохновением для этого вопроса послужил персонаж «Человек-овца» в романе Мураками « Танец, танец, танец »

В романе «Человек-овца» переводится как говорящий что-то вроде:

«аналогично, мы» "Я могу. Попробовать повторно подключиться к вам, если вы хотите", - сказал Овец. «Но мы не можем делать это в одиночку. Yougottaworktoo».

Итак, некоторые знаки препинания сохранены, но не все. Достаточно для чтения человеком, но несколько произвольно.

Какова была бы ваша стратегия создания синтаксического анализатора для этого? Общие комбинации букв, количества слогов, условной грамматики, регулярных выражений вперед / назад и т. Д.?

В частности, с точки зрения Python, как бы вы структурировали (щадящий) поток перевода? Я не спрашиваю исчерпывающий ответ, а просто больше о том, как бы ваш мыслительный процесс мог решить эту проблему.

Я задаю это легкомысленно, но я думаю, что это вопрос, который может стать интересным (nlp / crypto / frequency / социальные) ответы. ?

В частности, с точки зрения Python, как бы вы структурировали (щадящий) поток перевода? Я не спрашиваю исчерпывающий ответ, а просто больше о том, как бы ваш мыслительный процесс мог решить эту проблему.

Я задаю это легкомысленно, но я думаю, что это вопрос, который может стать интересным (nlp / crypto / frequency / социальные) ответы. ?

В частности, с точки зрения Python, как бы вы структурировали (щадящий) поток перевода? Я не спрашиваю исчерпывающий ответ, а просто больше о том, как бы ваш мыслительный процесс мог решить проблему.

Я задаю это легкомысленно, но я думаю, что это вопрос, который может быть интересным (nlp / crypto / frequency / социальные) ответы. Спасибо!

7
задан craigs 3 October 2010 в 21:57
поделиться