首页 文章

Python,如何打印在索引值范围内分组的Pandas系列

提问于
浏览
1

我是Pandas和ML的新手 . 我正在阅读这本书 Think Stats 并进行练习 . 随附的代码将NSFG Cycle 6数据加载为编码示例的数据帧 . 其中一个练习指示用户使用数据框中的可用功能来显示名为'preglngth'的系列 . 然后它要求用NSFG的Codebook交叉检查结果 . 我的代码如下,

import nsfg
df = nsfg.ReadFemPreg()
df.prglngth.value_counts(sort=True)

我得到以下输出,

+----------------+  
| 39        4744 |  
| 40        1120 |  
| 38         609 |  
| 9          594 |  
| 41         591 |  
| 6          543 |  
| 37         457 |  
| 13         446 |  
| 4          412 |  
| 8          409 |  
| 35         357 |  
| 36         329 |  
+----------------+

等等...

名称:prglngth,dtype:int64

代码簿link以下列方式显示它,

Screenclip

我想根据上面显示的索引值范围显示Series值 . 我该怎么办?谢谢 .

Krish .

1 回答

  • 0

    pd.qcut()函数可帮助您存储值 . 您想要对索引值进行bin,因此您可以在groupby函数中传递它们 .

    s = df.prglngth.value_counts(sort=True)
    s.groupby(pd.cut(s.index, [0, 13.5, 26.5, 100])).sum()
    

相关问题