Различный вывод из двух запросов SQL, один с оператором row_number ()

Если ваше желание состоит в том, чтобы иметь один фрейм данных и два выходных кадра (не массивы numpy), это должно сделать трюк:

def split_data(df, train_perc = 0.8):

   df['train'] = np.random.rand(len(df)) < train_perc

   train = df[df.train == 1]

   test = df[df.train == 0]

   split_data ={'train': train, 'test': test}

   return split_data
0
задан Tanner 25 February 2015 в 10:46
поделиться