Если производительность важна, переходите к уровню numpy:
import numpy as np
df = pd.DataFrame( {'a':np.random.randint(0,60,600), 'b':[1,2,5,5,4,6]*100})
def f(df):
keys,values=df.sort_values('a').values.T
ukeys,index=np.unique(keys,True)
arrays=np.split(values,index[1:])
df2=pd.DataFrame({'a':ukeys,'b':[list(a) for a in arrays]})
return df2
Тесты:
In [301]: %timeit f(df)
1000 loops, best of 3: 1.64 ms per loop
In [302]: %timeit df.groupby('a')['b'].apply(list)
100 loops, best of 3: 5.26 ms per loop