Я бы использовал dl
или (p
и abbr
) комбинацию.
Вот, на SO разметка выглядит так:
<p><abbr title="Anakin Skywalker">AS</abbr>:
Master Norris, do you really parse HTML with regex?</p>
<p><abbr title="Chuck Norris">CN</abbr>:
Not anymore… I have already parsed it all.</p>
становится:
AS: Мастер Норрис, вы действительно разбираете HTML с помощью regex?
CN: Уже нет... Я уже все разобрал.
Стили CSS плохи, но HTML без таблиц стилей выглядит хорошо, и программы чтения с экрана должны выполнять свою работу правильно.
Идеальная разметка позволила бы легко извлекать только:
Так что dl
, как структура, вполне подойдет, или даже лучше:
<dialogue>
<which>AS</which>
<what>Master Norris, do you really parse HTML with regex?</what>
<which>AS</which>
<what>Not anymore… I have already parsed it all.</what>
</dialogue>
Которая точно такая же структура, как dl
, dt
и dd
.
Еще лучше:
<interview>
<question>
<which>AS</which>
<what>Master Norris, do you really parse HTML with regex?</what>
</question>
<answer>
<which>CN</which>
<what>Not anymore… I have already parsed it all.</what>
</answer>
</interview>
К сожалению, для этого нет валидной разметки в HTML :)