Как захватить произвольный блок из файла на unix/linux [дубликат]

Вот то, как и не забывают проверять, что свойство не находится на опытной цепочке:

var element_count = 0;
for(var e in myArray)
    if(myArray.hasOwnProperty(e))
        element_count++;
11
задан kevinm 13 August 2009 в 15:21
поделиться

5 ответов

Да, сегодня неудобно делать это с dd. Мы рассматриваем возможность добавления параметров skip_bytes и count_bytes в dd в coreutils, чтобы помочь. Однако следующее должно работать:

#!/bin/sh

bs=100000
infile=$1
skip=$2
length=$3

(
  dd bs=1 skip=$skip count=0
  dd bs=$bs count=$(($length / $bs))
  dd bs=$(($length % $bs)) count=1
) < "$infile"
10
ответ дан 3 December 2019 в 04:13
поделиться

Вы можете использовать tail -c + N , чтобы обрезать первые N байтов из ввода, затем вы можете использовать head -cM для вывода только первых байтов M.

$ echo "hello world 1234567890" | tail -c+9 | head -c6
rld 12

Таким образом, используя ваши переменные, это, вероятно, будет:

tail -c+$offset inputfile | head -c$datalength > outputfile


Ах, не видел, что ему нужно было искать. Оставив это как CW.
13
ответ дан 3 December 2019 в 04:13
поделиться

Спасибо за другие ответы. К сожалению, я не могу установить дополнительное программное обеспечение, поэтому опция ddrescue отсутствует. Решение «голова / хвост» интересно (я не понимал, что можно поставить + на хвост), но сканирование данных делает его довольно медленным.

В итоге я написал небольшой скрипт на Python, чтобы делать то, что я хотел. Размер буфера, вероятно, следует настроить так, чтобы он совпадал с некоторыми настройками внешнего буфера, но использование приведенного ниже значения достаточно эффективно в моей системе.

#!/usr/local/bin/python

import sys

BUFFER_SIZE = 100000

# Read args
if len(sys.argv) < 4:
    print >> sys.stderr, "Usage: %s input_file start_pos length" % (sys.argv[0],)
    sys.exit(1)
input_filename = sys.argv[1]
start_pos = int(sys.argv[2])
length = int(sys.argv[3])

# Open file and seek to start pos
input = open(sys.argv[1])
input.seek(start_pos)

# Read and write data in chunks
while length > 0:
    # Read data
    buffer = input.read(min(BUFFER_SIZE, length))
    amount_read = len(buffer)

    # Check for EOF
    if not amount_read:
        print >> sys.stderr, "Reached EOF, exiting..."
        sys.exit(1)

    # Write data
    sys.stdout.write(buffer)
    length -= amount_read
1
ответ дан 3 December 2019 в 04:13
поделиться

Вы можете использовать опцию

--input-position=POS

в ddrescue .

0
ответ дан 3 December 2019 в 04:13
поделиться

Согласно man dd во FreeBSD :

skip = n

Skip n блоков от начала ввода до копирования. На входе, который поддерживает поиск, используется операция lseek (2). В противном случае входные данные считываются и отбрасываются. Для труб считывается правильное количество байтов. Для всех остальных устройств считывается правильное количество блоков без различия читается частичный или полный блок.

Используя dtruss , я убедился, что он действительно использует lseek () во входном файле в Mac OS X. Если вы думаете, что это медленно, то я согласен с комментарием, что это связано с размером блока в 1 байт.

1
ответ дан 3 December 2019 в 04:13
поделиться