Нахождение значимых субпредложений из предложения

Есть ли способ найти все под-предложения предложения, которые по-прежнему имеют смысл и содержат хотя бы одно подлежащее, глагол и сказуемое / объект?

Например, если у нас есть предложение вроде «Я собираюсь провести семинар по НЛП в SXSW в Остине в следующем месяце». Мы можем извлечь из этого предложения следующие значимые субпредложения: «Я собираюсь провести провести семинар »,« Я собираюсь провести семинар по НЛП »,« Я собираюсь провести семинар по НЛП в SXSW »,« Я собираюсь провести семинар в SXSW »,« Я собираюсь провести семинар в Остине »,« Я собираюсь провести семинар по НЛП в следующем месяце »и т. д.

Обратите внимание, что здесь нет выводимых предложений (например,« В следующем месяце на SXSW будет семинар по НЛП ». верно, нам это не нужно как часть этой проблемы.).Все сгенерированные предложения строго являются частью данного предложения.

Как мы можем подойти к решению этой проблемы? Я думал о создании аннотированных обучающих данных, в которых есть набор допустимых субпредложений для каждого предложения в наборе обучающих данных. А затем напишите несколько контролируемых алгоритмов обучения для создания модели.

Я новичок в НЛП и машинном обучении, поэтому было бы здорово, если бы вы, ребята, могли предложить несколько способов решения этой проблемы.

13
задан Nicolas Kaiser 23 January 2012 в 16:49
поделиться