我有一个Pandas数据框,数据格式非常广泛......例如:
ID Equipment Function Task exprt_cond1_time exprt_cond2_time exprt_cond1_freq exprt_cond2_freq novce_cond1_time novce_cond2_time novce_cond1_freq novce_cond2_freq
0 eq_type_1 Fxn_a task_1 12 24 0.031 0.055 15 31 0.042 0.059
1 eq_type_1 Fxn_a task_2 10 22 0.028 0.052 12 29 0.039 0.055
2 eq_type_1 Fxn_b task_3 13 25 0.033 0.057 18 34 0.047 0.062
3 eq_type_1 Fxn_b task_4 9 19 0.027 0.051 10 28 0.038 0.054
4 eq_type_2 Fxn_a task_1 14 27 0.036 0.056 16 32 0.043 0.061
5 eq_type_2 Fxn_a task_2 11 26 0.030 0.054 14 30 0.041 0.058
但我想使用列标签中的文本将其转换为更整齐的长格式以创建新列...例如,来自上面的第一行和最后一行的数据可能看起来更像这样:
ID Equipment Function Task Experience Condition Time Freq
0 eq_type_1 Fxn_a task_1 expert cond1 12 0.031
1 eq_type_1 Fxn_a task_1 expert cond2 24 0.055
2 eq_type_1 Fxn_a task_1 novice cond1 15 0.042
3 eq_type_1 Fxn_a task_1 novice cond2 31 0.059
...
16 eq_type_2 Fxn_a task_2 expert cond1 11 0.030
17 eq_type_2 Fxn_a task_2 expert cond2 26 0.054
18 eq_type_2 Fxn_a task_2 novice cond1 14 0.041
19 eq_type_2 Fxn_a task_2 novice cond2 30 0.058
我无法弄清楚融合/堆栈/重塑/ MultiIndex或其他翻译功能的正确组合,以使这种情况有效发生,或者没有我的代码变得丑陋,笨拙,几乎不可读 . This question和this question很接近并帮助我一些,但它们似乎只根据标签中的单个属性进行转换 . 非常喜欢SO社区的任何帮助或提示!
2 回答
让我们尝试
pd.wide_to_long
两次使用一些列重命名使一切成为可能:输出:
pd.wide_to_long在Pandas中处理"simultaneous melts" . 首先,我们需要重命名这些列以使pd.wide_to_long中的stubnames工作 .
这是我的尝试 - 我试图只使用
pd.wide_to_long
一次:结果:
说明: