При использовании пакета data.table
я немного не уверен, когда мне нужно setkey()
. Например, при использовании оператора :=
с опцией by
кажется, что все по-прежнему работает очень быстро, даже несмотря на то, что я не установил ключ. Может кто-нибудь объяснить, когда setkey()
необходимо, а когда нет? И если нет необходимости перед вызовом :=
с by
, то почему пакет data.table
настолько быстр, поскольку, по-видимому, он должен делать то же самое, что и apply
в стандартном data.frame
R, выполняя последовательный поиск а не двоичный, поскольку он не знает, действительно ли мой data.table
отсортирован по аргументу by
.
Спасибо