Каков хороший набор эвристик для цепочки твитов?

Всем известно, что если вы хотите разделить электронные письма, вы используете алгоритм Джейми Завински . Но это новый век, и есть новая служба обмена сообщениями.

Какой лучший алгоритм для обновления статуса цепочки, размещенного в Twitter?

Я бы определенно хотел, чтобы он справлялся:

  • Простая часть: использование in_reply_to_status_id , in_reply_to_user_id и in_reply_to_screen_name . (Кстати, найти надлежащую документацию по этим значениям было бы полезно само по себе! Такая документация не нужна! t очевидно связан с from {1}} здесь , например.)

  • Хорошая эвристика для вывода отношения "ответ" из сообщения, в которых упоминается пользователь в соответствии с соглашением @ , но не явным образом в ответ на конкретное сообщение. Эти "упоминания" теперь содержатся в элементе "entity" статусов , если вы это запросите. Эта эвристика может принимать во внимание (а) время между двумя обновлениями статуса, (б) наличие последующих ответов между двумя пользователями и т. Д. (ответы, состоящие из ретвита в старом стиле с дополнительным комментарием , как , упомянутый пользователем85509 ниже , являются лишь примером этого стиля ответа.)

  • Разговоры между более чем двумя пользователями.

  • Работа с набором твитов, переданных алгоритму, или со всеми твитами в Твиттере.

... но, возможно, вы сможете придумать еще кое-что.

14
задан Community 23 May 2017 в 12:07
поделиться