как преобразовать pandas DataFrame в вложенный dict [duplicate]

Question

как преобразовать pandas DataFrame в вложенный dict [duplicate]

Как писала Виктория, Google Maps больше не является бесплатным, но вы можете переключить своего поставщика карт. Вы можете быть заинтересованы в OpenStreetMap, есть простой способ использовать его на вашем сайте, описанном здесь: https://handyman.dulare.com/switching-from-google-maps-to-openstreetmap/

К сожалению, на OpenStreetMap нет простого способа предоставить маршруты из одной точки в другую, нет уличного обзора.

17

python pandas dictionary dataframe

задан Yu Hao 7 June 2016 в 06:53

4 ответа

Вы можете восстановить свой словарь так легко, как показано ниже

>>> result = {}
>>> for lst in df.values:
...     leaf = result
...     for path in lst[:-2]:
...        leaf = leaf.setdefault(path, {})
...     leaf.setdefault(lst[-2], list()).append(lst[-1])
...
>>> result
{'A': {'A1': {'A11': [1]}, 'A2': {'A21': [6], 'A12': [2]}}, 'C': {'C1': {'C11': [4]}}, 'B':  {'B1': {'B12': [3]}, 'B2': {'B21': [5]}}}

Если вы уверены, что ваши листья не будут перекрываться, замените последнюю строку

...     leaf.setdefault(lst[-2], list()).append(lst[-1])

на

...     leaf[lst[-2]] = lst[-1]

, чтобы получить желаемый результат:

>>> result
{'A': {'A1': {'A11': 1}, 'A2': {'A21': 6, 'A12': 2}}, 'C': {'C1': {'C11': 4}}, 'B': {'B1': {'B12': 3}, 'B2': {'B21': 5}}}

Пример данных, используемых для тестов:

import pandas as pd
data = {'name': ['A','A','B','C','B','A'],
          'v1': ['A1','A2','B1','C1','B2','A2'],
          'v2': ['A11','A12','B12','C11','B21','A21'],
          'v3': [1,2,3,4,5,6]}
df = pd.DataFrame.from_dict(data)

4

ответ дан alko 28 August 2018 в 06:25

Вот еще одно решение, использующее defaultdict

df = pd.DataFrame({'name': {0: 'A', 1: 'A', 2: 'B', 3: 'C', 4: 'B', 5: 'A'},
 'v1': {0: 'A1', 1: 'A2', 2: 'B1', 3: 'C1', 4: 'B2', 5: 'A2'},
 'v2': {0: 'A11', 1: 'A12', 2: 'B12', 3: 'C11', 4: 'B21', 5: 'A21'},
 'v3': {0: 1, 1: 2, 2: 3, 3: 4, 4: 5, 5: 6}})


output = defaultdict(dict)

for lst in df.values:
    try:
        output[lst[0]][lst[1]].update({lst[2]:lst[3]})
    except KeyError:
        output[lst[0]][lst[1]] = {}
    finally:
        output[lst[0]][lst[1]].update({lst[2]:lst[3]})

output

или:

output = defaultdict(dict)

for row in df.values:

    item1,item2 = row[0:2]

    if output.get(item1, {}).get(item2) == None:
        output[item1][item2] = {}

    output[item1][item2].update({row[2]:row[3]})

0

ответ дан Anton vBR 28 August 2018 в 06:25

см. здесь здесь , поскольку они представляют собой некоторые параметры, которые вы можете передать, чтобы получить результат в нескольких разных формах.

In [5]: df
Out[5]: 
  name  v1   v2  v3
0    A  A1  A11   1
1    A  A2  A12   2
2    B  B1  B12   3
3    C  C1  C11   4
4    B  B2  B21   5
5    A  A2  A21   6

In [6]: df.to_dict()
Out[6]: 
{'name': {0: 'A', 1: 'A', 2: 'B', 3: 'C', 4: 'B', 5: 'A'},
 'v1': {0: 'A1', 1: 'A2', 2: 'B1', 3: 'C1', 4: 'B2', 5: 'A2'},
 'v2': {0: 'A11', 1: 'A12', 2: 'B12', 3: 'C11', 4: 'B21', 5: 'A21'},
 'v3': {0: 1, 1: 2, 2: 3, 3: 4, 4: 5, 5: 6}}

Вот способ создания json-формата, то буквально eval его, чтобы создать фактический dict

In [11]: import ast

In [15]: ast.literal_eval(df.to_json(orient='values'))
Out[15]: 
[['A', 'A1', 'A11', 1],
 ['A', 'A2', 'A12', 2],
 ['B', 'B1', 'B12', 3],
 ['C', 'C1', 'C11', 4],
 ['B', 'B2', 'B21', 5],
 ['A', 'A2', 'A21', 6]]

2

ответ дан Jeff 28 August 2018 в 06:25

1

– haki 5 November 2013 в 22:33
2

– Jeff 5 November 2013 в 22:36
3

– haki 5 November 2013 в 22:42
4

– Jeff 5 November 2013 в 22:44
5

– haki 5 November 2013 в 22:50

Другие вопросы по тегам:

python pandas dictionary dataframe

Похожие вопросы:

score 28 · Accepted Answer

Я не понимаю, почему в вашем dict нет B2. Я также не уверен, что вы хотите совершить в случае повторяющихся значений столбца (каждый, кроме последнего, я имею в виду.) Предполагая, что первым является надзор, мы можем использовать рекурсию:

def recur_dictify(frame):
    if len(frame.columns) == 1:
        if frame.values.size == 1: return frame.values[0][0]
        return frame.values.squeeze()
    grouped = frame.groupby(frame.columns[0])
    d = {k: recur_dictify(g.ix[:,1:]) for k,g in grouped}
    return d

, который производит

>>> df
  name  v1   v2  v3
0    A  A1  A11   1
1    A  A2  A12   2
2    B  B1  B12   3
3    C  C1  C11   4
4    B  B2  B21   5
5    A  A2  A21   6
>>> pprint.pprint(recur_dictify(df))
{'A': {'A1': {'A11': 1}, 'A2': {'A12': 2, 'A21': 6}},
 'B': {'B1': {'B12': 3}, 'B2': {'B21': 5}},
 'C': {'C1': {'C11': 4}}}

. Возможно, проще использовать непандасский подход:

def retro_dictify(frame):
    d = {}
    for row in frame.values:
        here = d
        for elem in row[:-2]:
            if elem not in here:
                here[elem] = {}
            here = here[elem]
        here[row[-2]] = row[-1]
    return d