Обновление от возвратов репозитория SVN “Не могло считать ошибку” размера блока

  1. использовать регулярные выражения для извлечения частей (есть разные способы сделать это) и вставить в фрейм данных
    import re
    ner_parts = re.findall('([\w ]+)\s(?:\[\w-([\w]+)]|\n)', string)
    df = pd.DataFrame(ner_parts, columns=['text', 'label'])

                           text label
    0                       ABC   ORG
    1                   Funding   ORG
    2                    Angela   PER
    3                       Ham   PER
    4                 Stockholm   LOC
    5   Chief Executive Officer      
    6               Head of XYZ   ORG

  1. группировать метки подряд
[ 111]
  1. группировать текст вместе
def merge_text(group):
    return pd.Series([group['text'].str.cat(), group['label'].iat[0]],index=['text', 'label'])

df.groupby(groups).apply(merge_text)

                           text label
group                                
1                   ABC Funding   ORG
2                    Angela Ham   PER
3                     Stockholm   LOC
4       Chief Executive Officer      
5                   Head of XYZ   ORG

55
задан Denis 21 April 2009 в 03:39
поделиться

3 ответа

Проверьте журнал ошибок apache, в нем должна быть зарегистрирована ошибка с номером ошибки. Это число поможет выяснить, почему было прервано соединение.

Если в журнале ошибок ничего нет, проверьте настройки антивирусного сканера / брандмауэра: некоторые из этих инструментов прервут соединение, если они считают, что переданные данные опасны.

3
ответ дан 7 November 2019 в 07:30
поделиться

Я тоже это понимаю. Наш сервер - это Apache под управлением Windows. Мой клиент подключен с высокой скоростью, но с довольно высокой задержкой (200 мс). Другая часть загадки заключается в том, что я использую Windows Vista. Включение автомасштабирования и rss, похоже, улучшило ситуацию, но не исправило ее.

0
ответ дан 7 November 2019 в 07:30
поделиться

Я получал сообщение "Не удалось прочитать размер блока" от клиентов на нескольких машинах.

Ключом к выяснению этого была эта ошибка в журнале ошибок Apache:

[Fri May 07 14:26:26 2010] [error] [client 155.35.175.50] Provider encountered an error while streaming a REPORT response.  [500, #0]
[Fri May 07 14:26:26 2010] [error] [client 155.35.175.50] Problem replaying revision  [500, #24]
[Fri May 07 14:26:26 2010] [error] [client 155.35.175.50] Can't open file '/usr/site/svnrep/impc/db/revs/16122': Too many open files  [500, #24]

У процесса Apache, обрабатывающего операцию svn, закончились файловые дескрипторы. На моем сервере Ubuntu я исправил это, отредактировав / etc / security / limits.conf и добавив это внизу:

*               hard    nofile          5000
*               soft    nofile          5000

Что увеличивает предел дескриптора файла с 1024 до 5000. Затем я вошел в систему на свежей оболочке и подтвердил, что лимит был увеличен с помощью ulimit -n. Затем перезапустил Apache.

15
ответ дан 7 November 2019 в 07:30
поделиться
Другие вопросы по тегам:

Похожие вопросы: