Если байты уже используют соответствующую кодировку символов; вы можете распечатать их напрямую:
sys.stdout.buffer.write(data)
или
nwritten = os.write(sys.stdout.fileno(), data) # NOTE: it may write less than len(data) bytes
Вы можете суммировать цвета, пол и возраст в обоих наборах данных. Затем нарисуйте параллельные диаграммы, используя plotly
в python, например:
# Learn about API authentication here: https://plot.ly/pandas/getting-started
# Find your api_key here: https://plot.ly/settings/api
# Cufflinks binds plotly to pandas dataframes in IPython notebook. Read more
import plotly.plotly as py
import cufflinks as cf
import pandas as pd
import numpy as np
cf.set_config_file(offline=False, world_readable=True, theme='ggplot')
df = pd.DataFrame(np.random.rand(10, 4), columns=['A', 'B', 'C', 'D'])
df.iplot(kind='bar', filename='cufflinks/grouped-bar-chart')
Это пример кода, но вы поняли идею. Вы можете узнать больше здесь .
Вы должны построить популяцию и выборку на одном графике. У вас будет 3 графика (цвет, пол и возраст), каждый с двумя столбиками для каждой категории. Давайте возьмем цвет для примера: у вас будет красный, зеленый и синий. Для красного у вас будет 2 бара (популяция и выборка), для зеленого - 2 бара (популяция и выборка), а для синего - 2 бара (популяция и выборка). эта структура будет расширяться на всех 3 участках. Я надеюсь, что вы поняли идею.