Текстовый редактор для открытия больших (гигантских, огромных, больших) текстовых файлов [закрыто]

Question

Текстовый редактор для открытия больших (гигантских, огромных, больших) текстовых файлов [закрыто]

Я полагаю, вы могли бы (используя базовые манипуляции с строкой) генерировать строку запроса в PreparedStatement, чтобы количество ? соответствовало количеству элементов в вашем списке.

Конечно, если вы делаете это, вы всего лишь шаг от создания гигантского прикованного OR в своем запросе, но без правильного количества ? в строке запроса, я не вижу, как вы можете обойти это.

1023

large-files text-editor editor xml windows

задан 6 revs, 5 users 56% 14 March 2010 в 20:24

2 ответа

Советы и уловки

меньше

Почему вы используете редакторы , чтобы просто просматривать (большой) файл?

В * nix или Cygwin просто используйте меньше . (Есть известная поговорка - «меньше значит больше, больше или меньше» - потому что «меньше» заменило более раннюю команду Unix «больше» с добавлением того, что вы можете прокручивать назад). Поиск и навигация по меньше очень похожи на Vim, но здесь нет файла подкачки и используется мало оперативной памяти.

Есть Win32-порт GNU меньше. См. Раздел «меньше» в ответе выше.

Perl

Perl хорош для быстрых сценариев, а его .. Оператор (range flip-flop) представляет собой удобный механизм выбора, позволяющий ограничить грязь, через которую вам придется пробираться.

Например:

$ perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

Это извлечет все, начиная с 1 миллиона строк и заканчивая 2 миллионами строк, и позволит вам вручную просеивать вывод с меньшим.

Другой пример:

$ perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

Это начинает печать, когда "регулярное выражение" что-то находит, и останавливается, когда «регулярное выражение два» находит конец интересного блока. Он может найти несколько блоков. Просеиваем вывод ...

logparser

Это еще один полезный инструмент, который вы можете использовать. Процитируем статью в Википедии :

logparser - это гибкая утилита командной строки, которая изначально была написана Габриэле Джузеппини, сотрудником Microsoft, для автоматизации тестов для ведения журнала IIS. Он был предназначен для использования с операционной системой Windows и был включен в IIS 6.0 Resource Kit Tools. По умолчанию logparser работает как «конвейер обработки данных», используя выражение SQL в командной строке и выводя строки, содержащие совпадения для выражения SQL.

Microsoft описывает Logparser как мощный, универсальный инструмент, который обеспечивает универсальный доступ к запросам к текстовым данным, таким как файлы журналов, файлы XML и CSV-файлы, а также ключевые источники данных в операционной системе Windows, такие как журнал событий, реестр, файловая система и Active Directory. Результаты входного запроса могут быть отформатированы в текстовом формате или сохранены в более специализированных целях, таких как SQL, SYSLOG или диаграмма.

Пример использования:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000" C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

Относительность размеров

100 МБ не так уж и много. 3 ГБ становятся довольно большими. Раньше я работал в типографии и почтовом отделении, на которое приходилось около 2% почты первого класса в США. На одну из систем, в которой я был техническим руководителем, приходилось около 15 +% почтовых отправлений. Здесь и там у нас было несколько больших файлов для отладки.

И многое другое ...

Не стесняйтесь добавлять сюда больше инструментов и информации. Этот ответ - вики сообщества неспроста! Нам всем нужен совет по работе с большими объемами данных ...

188

ответ дан 19 December 2019 в 20:20
поделиться

Другие вопросы по тегам:
large-files text-editor editor xml windows

Похожие вопросы:

93
Скрытые функции Visual Studio (2005-2010)? - 23 May 2017 02:10

68
Текстовые редакторы на базе Windows [закрываются] - 14 September 2011 06:15

66
Скрытые функции пакетных файлов Windows - 23 May 2017 02:34

56
О каких темных углах Вима твоя мама никогда не говорила? [закрыто] - 23 May 2017 12:34

43
Лучший редактор PHP для [закрытого] Vista - 15 September 2008 22:49

score 1289 · Accepted Answer

VS Code (Windows, macOS, Linux) - Свободный и С открытым исходным кодом с хорошим GUI. Отредактированный файл JSON на 3,6 ГБ, загруженный за минуту. У Вас должно быть достаточно RAM для загрузки файлов.

Свободные средства просмотра только для чтения:

glogg (Windows, macOS, Linux) вЂ “Подтвержденный для обработки файлов мульти-ГБ. Его основной функцией является поиск регулярного выражения. Имеет вкладки, файлы чтений непосредственно от диска, может наблюдать/следовать файлы и позволяет пользователю отмечать строки.
(Windows) вЂ LogExpert “"Замена GUI для tail". Файл поддержек после, поиск, фильтрация, настраиваемое выделение, плагины и внешние инструменты.
Средство просмотра Файла Крупного текста (Windows) вЂ “минималист и имеет очень небольшой исполняемый размер. Представление разделения поддержек, текстовая настройка темы, regex поиск и файл после.
(Windows) вЂ Lister “, Еще более маленький и минималистский. Это - один исполняемый файл, едва 500 КБ, но это все еще поддерживает поиск (с regexes), печать, режим Hex-редактора и настройки.

Свободные редакторы:

Vim и Emacs (Windows, macOS, Linux) вЂ “Классические редакторы Unix. Крутая кривая обучения, но жестоко эффективный. У них есть настройки, которые могут быть настроены для создания их еще быстрее.
Большой Редактор файлов (Windows) вЂ “Открывает и редактирует ТБ + файлы, поддерживает Unicode, использует мало памяти, имеет XML-определенные функции и включает режим двоичного счета.
(Windows) вЂ HxD “Hex-редактор, не текстовый редактор; но это удивительно быстро и полезно.
(Windows) вЂ GigaEdit “Поддерживает поиск, символьную статистику и настройку шрифта. Но это - багги вЂ “с большими файлами, это только позволяет перезаписывать символы, не вставляя их; это не уважает LF как разделитель строки, только CRLF; и это медленно.

Встроенные программы (никакая требуемая установка):

меньше (macOS, Linux) вЂ “традиционный инструмент пейджера командной строки Unix. Позволяет Вам просмотреть текстовые файлы практически любого размера. Может быть установлен в Windows, также.
Блокнот (Windows) вЂ “, Достойный с большими файлами, особенно с выключенным переходом на новую строку.
[еще 1158] (Windows) вЂ “Это обращается к Windows MORE, не Unix more. Консольная программа, которая позволяет Вам просматривать файл, один экран за один раз.

веб-средства просмотра:

htmlpen.com вЂ “Может открыться и ТБ выделения синтаксиса + файлы. Позволяет редактировать, за исключением очень больших файлов. Поиск поддержек, regexes, и экспорт.

readfileonline.com вЂ “Другое большое средство просмотра файла HTML5. Поиск поддержек.

Заплаченные редакторы:

010 Редакторов (Windows, macOS, Linux) вЂ “Открывают гиганта (целых 50 ГБ) файлы.

SlickEdit (Windows, macOS, Linux) вЂ “Открывает большие файлы.

UltraEdit (Windows, macOS, Linux) вЂ “Открывает файлы больше чем 6 ГБ, но конфигурация должна быть изменена для этого, чтобы быть практичной: Меню В» Усовершенствованный В» Конфигурация В» Файл, Обрабатывающий В» Временные Файлы В» Открытый файл без временного файла...

(Windows) вЂ EmEditor “Обрабатывает файлы очень крупного текста приятно (официально до 248 ГБ, но целых 900 ГБ согласно одному отчету).

И наконец, Вы попытались открыть большой файл со своим постоянным редактором? Некоторые редакторы могут на самом деле обработать довольно большие файлы. В частности, Блокнот ++ (Windows) и Сублимированный текст (Windows, macOS, Linux) файлы поддержки в диапазоне на 2 ГБ.