Зводная статыстыка па катэгорыях выкарыстоўваючы Python

У мяне ёсць datset з баламі і катэгорый, і я хацеў бы, каб вылічыць сумарную статыстыку для кожнай з гэтых катэгорый. Дадзеныя выглядаць прыкладна так:

Category    Score    
AAAA        1
AAAA        3
AAAA        1
BBBB        1
BBBB        100
BBBB        159
CCCC        -10
CCCC        9

Што б я тады хацеў бы нешта падобнае

Category    Count   Mean   Std   Min   25%   50%   75%   Max     
AAAA        
AAAA        
AAAA        
BBBB        
BBBB        
BBBB        
CCCC        
CCCC        

Я глядзеў на выкарыстанне панд з камбінацыяй абодвух .groupby() і .describe() , як гэта

df.groupby('Category')['Score'].describe()

і гэта выглядае амаль як тое, што я хачу, але калі я прыйшоў, каб разглядаць гэта як Dataset, усе артыкулы ў індэксе. Я хацеў бы, каб дадзеныя былі ў выглядзе табліцы, так што я магу выводзіць яго і стварыць візуалізацыю ад задняй часткі яго.

Любыя ідэі?

дзякуй

3
Прабачэнні @MaxU. Спадзяюся, я ўдакладніў, у цяперашні час :-)
дададзена аўтар TomTom, крыніца
Не маглі б вы ўдакладніць ваш пытанне? Гэта не вельмі зразумела, што вы спрабуеце дасягнуць ... Што не так з кодам <> df.groupby ( «Катэгорыя») [ «Score»]. Апісаць() ?
дададзена аўтар MaxU, крыніца

1 адказы

IIUC:

In [80]: df.groupby("Category")['Score'].describe().reset_index()
Out[80]:
  Category  count       mean        std   min    25%    50%     75%    max
0     AAAA    3.0   1.666667   1.154701   1.0   1.00    1.0    2.00    3.0
1     BBBB    3.0  86.666667  79.839422   1.0  50.50  100.0  129.50  159.0
2     CCCC    2.0  -0.500000  13.435029 -10.0  -5.25   -0.5    4.25    9.0
8
дададзена