大 pandas 长到宽的多栏重塑

本教程将介绍大 pandas 长到宽的多栏重塑的处理方法,这篇教程是从别的地方看到的,然后加了一些国外程序员的疑问与解答,希望能对你有所帮助,好了,下面开始学习吧。

大 pandas 长到宽的多栏重塑 教程 第1张

问题描述

我有一个 pandas 数据框,如下所示:

 request_id  crash_id  counter  num_acc_x  num_acc_y  num_acc_z
 745109.0 670140638.0  00.0100.000  -0.045
 745109.0 670140638.0  10.016  -0.006  -0.034
 745109.0 670140638.0  20.016  -0.006  -0.034

我的id变量是:"请求_id"和"崩溃_id",目标变量是nu_acc_x、num_acc_y和num_acc_z
我想创建一个新的DataFrame,其中的目标变量被广泛重塑,即添加max(Count)*3个新变量,如num_acc_x_0、num_acc_x_1、...Num_acc_y_0、num_acc_y_1、...Num_acc_z_0、num_acc_z_1可能没有透视表作为最终结果(我希望像R中那样为True DataFrame)。

提前感谢您的关注

推荐答案

我认为您需要set_indexunstack,最后一次创建列名来自MultiIndexbymap

df = df.set_index(['request_id','crash_id','counter']).unstack()
df.columns = df.columns.map(lambda x: '{}_{}'.format(x[0], x[1]))
df = df.reset_index()
print (df)
request_id  crash_id  num_acc_x_0  num_acc_x_1  num_acc_x_20 745109.0  670140638.00.01  0.016  0.016

num_acc_y_0  num_acc_y_1  num_acc_y_2  num_acc_z_0  num_acc_z_10 0.0 -0.006 -0.006 -0.045 -0.034

num_acc_z_20 -0.034

另一个具有聚合功能的解决方案与pivot_table重复:

df = df.pivot_table(index=['request_id','crash_id'], columns='counter', aggfunc='mean')
df.columns = df.columns.map(lambda x: '{}_{}'.format(x[0], x[1]))
df = df.reset_index()
print (df)
request_id  crash_id  num_acc_x_0  num_acc_x_1  num_acc_x_20 745109.0  670140638.00.01  0.016  0.016

num_acc_y_0  num_acc_y_1  num_acc_y_2  num_acc_z_0  num_acc_z_10 0.0 -0.006 -0.006 -0.045 -0.034

num_acc_z_20 -0.034

df = df.groupby(['request_id','crash_id','counter']).mean().unstack()
df.columns = df.columns.map(lambda x: '{}_{}'.format(x[0], x[1]))
df = df.reset_index()
print (df)
request_id  crash_id  num_acc_x_0  num_acc_x_1  num_acc_x_20 745109.0  670140638.00.01  0.016  0.016

num_acc_y_0  num_acc_y_1  num_acc_y_2  num_acc_z_0  num_acc_z_10 0.0 -0.006 -0.006 -0.045 -0.034

num_acc_z_20 -0.034

好了关于大 pandas 长到宽的多栏重塑的教程就到这里就结束了,希望趣模板源码网找到的这篇技术文章能帮助到大家,更多技术教程可以在站内搜索。