Считаете ли вы использование schema_plus
( https://github.com/lomba/schema_plus )? Среди прочего (поддержка принудительного использования внешних ключей в базе данных и для представлений), он поддерживает установку индексов без учета регистра для баз данных PostgreSQL и обрабатывает их сброс в схеме. Из Readme: «Если вы используете Postgresql, SchemaPlus обеспечивает поддержку условий, выражений, индексных методов и индексов без учета регистра».
Вы можете попробовать это:
# make some arrays
score = [100, 50, 43, 67, 89, 2, 13, 56, 22, -1, 53]
homework_problem = ['A', 'B', 'C', 'B', 'A', 'D', 'D', 'A', 'C', 'D', 'B']
topic = ['F', 'G', 'H', 'G', 'H', 'F', 'H', 'G', 'G', 'F', 'H']
# put the arrays into a pandas df
df = pd.DataFrame()
df['score'] = score
df['homework_problem'] = homework_problem
df['topic'] = topic
df['scoregroup'] = pd.cut(df['score'],bins=[0,50,75,100], labels=['Poor','Bad','Good'])
#make sure it looks okay
print(df)
# let's groupby and plot
d = df.groupby(['homework_problem','scoregroup'])['topic'].size().unstack()
d.plot(kind='bar',stacked=True, title = "Test")
Выход:
score homework_problem topic scoregroup
0 100 A F Good
1 50 B G Poor
2 43 C H Poor
3 67 B G Bad
4 89 A H Good
5 2 D F Poor
6 13 D H Poor
7 56 A G Bad
8 22 C G Poor
9 -1 D F NaN
10 53 B H Bad