Warm tip: This article is reproduced from serverfault.com, please click

其他-将零填充到Python列表

(其他 - Pad zeros to a Python list)

发布于 2020-11-28 22:02:01

我有一个数据框,如下所示:

df=
year|text|value
2001|text1|10
2001|text2|11
2002|text2|12
2003|text3|56
2005|text8|8
2005|text1|23

现在,我想从数据框中创建一个列表列表,如下所示:

l1=[[[10,0,0,23],[0,12,0,0],[0,0,56,0],[0,0,0,8]],[text1,text2,text3,text8],[2001,2002,2003,2005]]

当特定年份的文本没有价值时,我想在列表中添加零。

我尝试了以下代码:

for value in list(df['text'].values):
        df1=df[df['text']==value]
        series_list.append(list(df1['value'].values))
        names_list.append(value)
        year_list.append(list(df1['year'].values))  

我没有得到预期的输出。我最初尝试制作3个单独的列表。

Questioner
Sam
Viewed
11
DYZ 2020-11-29 07:14:32

将前两列转换为MultiIndex。通过拆开一级索引来构建矩形矩阵。提取值并将其排列到列表中。

matrix = df.set_index(['text', 'year']).unstack(fill_value=0)
matrix.values.tolist()
#[[10, 0, 0, 23], [11, 12, 0, 0], [0, 0, 56, 0], [0, 0, 0, 8]]

如有必要,添加索引和列:

matrix.values.tolist() + [matrix.index.tolist()] \
                       + [matrix.columns.levels[1].tolist()]
#[[10, 0, 0, 23], [11, 12, 0, 0], [0, 0, 56, 0], [0, 0, 0, 8],
# ['text1', 'text2', 'text3', 'text8'], [2001, 2002, 2003, 2005]]