Экспорт Pandas DataFrame с применением стилей в pdf или png [duplicate]

Локальные переменные и примитивы должны быть инициализированы перед использованием, потому что вы знаете, чего ожидать от значений. Исторически, когда была создана новая переменная, она содержала бы случайные значения из памяти [и невозможно предсказать значение]. Java также требует этого, потому что он предотвращает наличие потерянных переменных.

15
задан user2370852 31 October 2014 в 16:43
поделиться

2 ответа

Если у вас установлены pdflatex и imagemagick, вы можете экспортировать DataFrame в tex, использовать pdflatex, чтобы преобразовать его в pdf-файл, а затем преобразовать pdf в png с помощью imagemagick:

import pandas as pd
import numpy as np
import subprocess

df = pd.DataFrame({'d': [1., 1., 1., 2., 2., 2.],
                   'c': np.tile(['a', 'b', 'c'], 2),
                   'v': np.arange(1., 7.)})
filename = 'out.tex'
pdffile = 'out.pdf'
outname = 'out.png'

template = r'''\documentclass[preview]{{standalone}}
\usepackage{{booktabs}}
\begin{{document}}
{}
\end{{document}}
'''

with open(filename, 'wb') as f:
    f.write(template.format(df.to_latex()))

subprocess.call(['pdflatex', filename])
subprocess.call(['convert', '-density', '300', pdffile, '-quality', '90', outname])

enter image description here [/g1]

Если вы установили phantomjs и imagemagick, вы можете экспортировать DataFrame в HTML, а затем использовать phantomjs для преобразования HTML в png и imagemagick, чтобы обрезать результат:

import pandas as pd
import numpy as np
import subprocess

df = pd.DataFrame({'d': [1., 1., 1., 2., 2., 2.],
                   'c': np.tile(['a', 'b', 'c'], 2),
                   'v': np.arange(1., 7.)})
filename = '/tmp/out.html'
outname = '/tmp/out.png'
cropname = '/tmp/cropped.png'

with open(filename, 'wb') as f:
    f.write(df.to_html())
rasterize = '/path/to/phantomjs/examples/rasterize.js'
subprocess.call(['phantomjs', rasterize, filename, outname])
subprocess.call(['convert', outname, '-trim', cropname])

enter image description here [/g2]

12
ответ дан unutbu 15 August 2018 в 21:14
поделиться
  • 1
    Полный ответ. Благодаря! – user2370852 15 November 2014 в 17:17
  • 2
    Мне казалось, что версия латекса работает в Python 3, кодируя латексную строку f.write(bytes(template.format(df.to_latex()),'UTF-8')). – pylang 1 September 2015 в 04:02

С помощью некоторого дополнительного кода вы даже можете сделать вывод достойным:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import six

df = pd.DataFrame()
df['date'] = ['2016-04-01', '2016-04-02', '2016-04-03']
df['calories'] = [2200, 2100, 1500]
df['sleep hours'] = [2200, 2100, 1500]
df['gym'] = [True, False, False]


def render_mpl_table(data, col_width=3.0, row_height=0.625, font_size=14,
                     header_color='#40466e', row_colors=['#f1f1f2', 'w'], edge_color='w',
                     bbox=[0, 0, 1, 1], header_columns=0,
                     ax=None, **kwargs):
    if ax is None:
        size = (np.array(data.shape[::-1]) + np.array([0, 1])) * np.array([col_width, row_height])
        fig, ax = plt.subplots(figsize=size)
        ax.axis('off')

    mpl_table = ax.table(cellText=data.values, bbox=bbox, colLabels=data.columns, **kwargs)

    mpl_table.auto_set_font_size(False)
    mpl_table.set_fontsize(font_size)

    for k, cell in  six.iteritems(mpl_table._cells):
        cell.set_edgecolor(edge_color)
        if k[0] == 0 or k[1] < header_columns:
            cell.set_text_props(weight='bold', color='w')
            cell.set_facecolor(header_color)
        else:
            cell.set_facecolor(row_colors[k[0]%len(row_colors) ])
    return ax

render_mpl_table(df, header_columns=0, col_width=2.0)

16
ответ дан volodymyr 15 August 2018 в 21:14
поделиться
  • 1
    Я получаю ошибку ImportError: No module named externals. – Alex F 17 May 2017 в 19:48
  • 2
    шесть - в стандартной библиотеке. Я скорректировал ответ. Теперь он должен работать - спасибо за указание. Он должен писать Python 2 и Python 3 совместимый код. Вам нужен только Python 3? – volodymyr 18 May 2017 в 10:06
  • 3
    Это мило. Но как мы можем сохранить фактический файл ..? – zerohedge 3 December 2017 в 01:27
  • 4
    @zerohedge Я изменил функцию в этом ответе, чтобы выплюнуть топором и fig, и использовал fig.savefig () – Luc Gendrot 5 December 2017 в 03:02
  • 5
    Конечно, вы можете выводить изображение и сохранять изображение внутри функции, как правило, желательно, чтобы функция выполняла одно и только одно. Сохранение фигуры отличается от рисунка - есть параметры формата, настройки dpi и т. Д. В нашей настройке сохранение в .png (и добавление этих .png-s в слайды Google) обрабатывается другим методом. Более того, вы всегда можете получить цифру с оси ax.get_figure(), поэтому вывод обоих является избыточным (однако может быть удобным, поэтому вам не нужно вызывать ax.get_figure()). – volodymyr 5 December 2017 в 09:24
Другие вопросы по тегам:

Похожие вопросы: