Если ваша проблема связана с утечками памяти, вам следует использовать free (fb) для динамически размещаемых указателей.
Если в системе * nix с хвостом
, вы можете обмануть так:
last_25_lines = `tail -n 25 whatever.txt`
Достаточно ли велик файл, чтобы вам не пришлось читать его целиком? Если нет, вы можете просто сделать
IO.readlines("file.log")[-25..-1]
. Если оно слишком большое, вам может потребоваться использовать IO # seek
для чтения из конца файла и продолжать поиск в начале, пока вы не видел 25 строк.
There is a library for Ruby called File::Tail. This can get you the last N lines of a file just like the UNIX tail utility.
I assume there is some seek optimization in place in the UNIX version of tail with benchmarks like these (tested on a text file just over 11M):
[john@awesome]$du -sh 11M.txt
11M 11M.txt
[john@awesome]$time tail -n 25 11M.txt
/sbin/ypbind
/sbin/arptables
/sbin/arptables-save
/sbin/change_console
/sbin/mount.vmhgfs
/misc
/csait
/csait/course
/.autofsck
/~
/usb
/cdrom
/homebk
/staff
/staff/faculty
/staff/faculty/darlinr
/staff/csadm
/staff/csadm/service_monitor.sh
/staff/csadm/.bash_history
/staff/csadm/mysql5
/staff/csadm/mysql5/MySQL-server-community-5.0.45-0.rhel5.i386.rpm
/staff/csadm/glibc-common-2.3.4-2.39.i386.rpm
/staff/csadm/glibc-2.3.4-2.39.i386.rpm
/staff/csadm/csunixdb.tgz
/staff/csadm/glibc-headers-2.3.4-2.39.i386.rpm
real 0m0.012s
user 0m0.000s
sys 0m0.010s
I can only imagine the Ruby library uses a similar method.
Edit:
for Pax's curiosity:
[john@awesome]$time cat 11M.txt | tail -n 25
/sbin/ypbind
/sbin/arptables
/sbin/arptables-save
/sbin/change_console
/sbin/mount.vmhgfs
/misc
/csait
/csait/course
/.autofsck
/~
/usb
/cdrom
/homebk
/staff
/staff/faculty
/staff/faculty/darlinr
/staff/csadm
/staff/csadm/service_monitor.sh
/staff/csadm/.bash_history
/staff/csadm/mysql5
/staff/csadm/mysql5/MySQL-server-community-5.0.45-0.rhel5.i386.rpm
/staff/csadm/glibc-common-2.3.4-2.39.i386.rpm
/staff/csadm/glibc-2.3.4-2.39.i386.rpm
/staff/csadm/csunixdb.tgz
/staff/csadm/glibc-headers-2.3.4-2.39.i386.rpm
real 0m0.350s
user 0m0.000s
sys 0m0.130s
still under a second, but if there is a lot of file operations this makes a big difference.
Я не могу поручиться за Ruby, но большинство из этих языков придерживаются языка ввода-вывода файлов. Это означает, что нет способа сделать то, что вы просите, кроме поиска. Обычно для этого используется один из двух подходов.
Второй способ - тот, который я предпочитаю, поскольку, если вы правильно выберете первое смещение, вы ' Почти наверняка понадобится только один выстрел. Файлы журналов, как правило, по-прежнему имеют фиксированную максимальную длину строки (я думаю, что кодеры все еще имеют склонность к файлам с 80 столбцами еще после того, как их полезность снизилась). Я склонен выбирать количество желаемых строк, умноженное на 132, в качестве моего смещения.
И из беглого взгляда на документы по Ruby онлайн, похоже, что следует , следуя идиоме Си. Вы бы использовали «ios.seek (25 * -132, IO :: SEEK_END)»
, если бы следовали моему совету, а затем читайте дальше оттуда.
«ios.seek (25 * -132, IO :: SEEK_END)»
, если бы следовали моему совету, а затем читайте дальше оттуда. похоже, он следует , следуя языку C. Вы бы использовали «ios.seek (25 * -132, IO :: SEEK_END)»
, если бы следовали моему совету, а затем читайте дальше оттуда. Как насчет:
file = []
File.open("file.txt").each_line do |line|
file << line
end
file.reverse.each_with_index do |line, index|
puts line if index < 25
end
Производительность была бы ужасной для большого файла, поскольку он повторяется дважды, лучшим подходом было бы уже упомянутое чтение файла и сохранить в памяти последние 25 строк и отобразить их. Но это была альтернативная мысль.