import re
ner_parts = re.findall('([\w ]+)\s(?:\[\w-([\w]+)]|\n)', string)
df = pd.DataFrame(ner_parts, columns=['text', 'label'])
text label
0 ABC ORG
1 Funding ORG
2 Angela PER
3 Ham PER
4 Stockholm LOC
5 Chief Executive Officer
6 Head of XYZ ORG
def merge_text(group):
return pd.Series([group['text'].str.cat(), group['label'].iat[0]],index=['text', 'label'])
df.groupby(groups).apply(merge_text)
text label
group
1 ABC Funding ORG
2 Angela Ham PER
3 Stockholm LOC
4 Chief Executive Officer
5 Head of XYZ ORG
Проверьте журнал ошибок apache, в нем должна быть зарегистрирована ошибка с номером ошибки. Это число поможет выяснить, почему было прервано соединение.
Если в журнале ошибок ничего нет, проверьте настройки антивирусного сканера / брандмауэра: некоторые из этих инструментов прервут соединение, если они считают, что переданные данные опасны.
Я тоже это понимаю. Наш сервер - это Apache под управлением Windows. Мой клиент подключен с высокой скоростью, но с довольно высокой задержкой (200 мс). Другая часть загадки заключается в том, что я использую Windows Vista. Включение автомасштабирования и rss, похоже, улучшило ситуацию, но не исправило ее.
Я получал сообщение "Не удалось прочитать размер блока" от клиентов на нескольких машинах.
Ключом к выяснению этого была эта ошибка в журнале ошибок Apache:
[Fri May 07 14:26:26 2010] [error] [client 155.35.175.50] Provider encountered an error while streaming a REPORT response. [500, #0]
[Fri May 07 14:26:26 2010] [error] [client 155.35.175.50] Problem replaying revision [500, #24]
[Fri May 07 14:26:26 2010] [error] [client 155.35.175.50] Can't open file '/usr/site/svnrep/impc/db/revs/16122': Too many open files [500, #24]
У процесса Apache, обрабатывающего операцию svn, закончились файловые дескрипторы. На моем сервере Ubuntu я исправил это, отредактировав / etc / security / limits.conf
и добавив это внизу:
* hard nofile 5000
* soft nofile 5000
Что увеличивает предел дескриптора файла с 1024 до 5000. Затем я вошел в систему на свежей оболочке и подтвердил, что лимит был увеличен с помощью ulimit -n
. Затем перезапустил Apache.