Управление приложениями повторной передачи TCP в Linux

Для нетерпеливых:

Как изменить значение / proc / sys / net / ipv4 / tcp_retries2 для одного соединения в Linux, используя setsockopt () , ioctl () или подобное, или это возможно?

Более подробное описание:

Я разрабатываю приложение, которое использует HTTP-запросы с длинным опросом. На стороне сервера необходимо знать, когда клиент закрыл соединение. Точность не критична, но 15 минут точно не может. Ближе к минуте подойдет.

Для тех, кто не знаком с концепцией, длинный HTTP-запрос на опрос работает следующим образом:

  • Клиент отправляет запрос
  • Сервер отвечает заголовками HTTP, но оставляет ответ открыто. Используется кодирование передачи по частям, что позволяет серверу отправлять биты данных по мере их доступности.
  • Когда все данные отправлены, сервер отправляет «закрывающий фрагмент», чтобы сигнализировать о завершении ответа.

В моем случае приложения, сервер время от времени отправляет клиенту «биения» (по умолчанию 30 секунд). Контрольное сообщение - это просто символ новой строки, который отправляется как фрагмент ответа. Это предназначено для того, чтобы линия была занята, чтобы мы уведомляли о потере соединения.

Нет проблем, когда клиент завершает работу правильно. Но когда он закрывается принудительно (например, клиентский компьютер теряет питание), сброс TCP не отправляется. В этом случае сервер отправляет контрольный сигнал, который клиент не принимает. После этого сервер продолжает повторно передавать пакет в течение примерно 15 минут после отказа и сообщения об ошибке прикладному уровню (нашему HTTP-серверу). В моем случае 15 минут - это слишком долгое ожидание.

Я могу контролировать время повторной передачи, записывая в следующие файлы в / proc / sys / net / ipv4 / :

tcp_retries1 - INTEGER
    This value influences the time, after which TCP decides, that
    something is wrong due to unacknowledged RTO retransmissions,
    and reports this suspicion to the network layer.
    See tcp_retries2 for more details.

    RFC 1122 recommends at least 3 retransmissions, which is the
    default.

tcp_retries2 - INTEGER
    This value influences the timeout of an alive TCP connection,
    when RTO retransmissions remain unacknowledged.
    Given a value of N, a hypothetical TCP connection following
    exponential backoff with an initial RTO of TCP_RTO_MIN would
    retransmit N times before killing the connection at the (N+1)th RTO.

    The default value of 15 yields a hypothetical timeout of 924.6
    seconds and is a lower bound for the effective timeout.
    TCP will effectively time out at the first RTO which exceeds the
    hypothetical timeout.

    RFC 1122 recommends at least 100 seconds for the timeout,
    which corresponds to a value of at least 8.

Значение по умолчанию of tcp_retries2 действительно равно 8, и мой опыт повторной передачи в течение 15 минут (900 секунд) соответствует приведенной выше документации ядра.

Если я изменю значение tcp_retries2 , например, на 5, соединение прервется намного быстрее. Но такая установка влияет на все соединения в системе, и я бы очень хотел установить ее только для этого одного длинного опроса.

Цитата из RFC 1122:

4.2.3.5  TCP Connection Failures

   Excessive retransmission of the same segment by TCP
   indicates some failure of the remote host or the Internet
   path.  This failure may be of short or long duration.  The
   following procedure MUST be used to handle excessive
   retransmissions of data segments [IP:11]:

   (a)  There are two thresholds R1 and R2 measuring the amount
        of retransmission that has occurred for the same
        segment.  R1 and R2 might be measured in time units or
        as a count of retransmissions.

   (b)  When the number of transmissions of the same segment
        reaches or exceeds threshold R1, pass negative advice
        (see Section 3.3.1.4) to the IP layer, to trigger
        dead-gateway diagnosis.

   (c)  When the number of transmissions of the same segment
        reaches a threshold R2 greater than R1, close the
        connection.

   (d)  An application MUST be able to set the value for R2 for
        a particular connection.  For example, an interactive
        application might set R2 to "infinity," giving the user
        control over when to disconnect.

   (e)  TCP SHOULD inform the application of the delivery
        problem (unless such information has been disabled by
        the application; see Section 4.2.4.1), when R1 is
        reached and before R2.  This will allow a remote login
        (User Telnet) application program to inform the user,
        for example.

Мне кажется, что tcp_retries1 и tcp_retries2 в Linux соответствуют R1 и R2 в RFC. В RFC четко указано (в пункте d), что соответствующая реализация ДОЛЖНА позволять устанавливать значение R2 , но я не нашел способа сделать это с помощью setsockopt () , ioctl () или подобное.

Другой вариант - получить уведомление, когда R1 превышено (элемент e). Это не так хорошо, как установка R2 , хотя, как я думаю, R1 будет достигнута довольно скоро (через несколько секунд), а значение R1 не сможет быть установленным для каждого соединения или, по крайней мере, RFC не требует этого.

29
задан Petri Lehtinen 31 July 2013 в 12:27
поделиться