Разлік стандартнага адхіленні па катэгорыях выкарыстоўваючы Python

У мяне ёсць datset з баламі і катэгорый, і я хацеў бы, каб вылічыць стандартнае адхіленне гэтых паказчыкаў, у кожнай катэгорыі. Дадзеныя выглядаць прыкладна так:

Category    Score    
AAAA        1
AAAA        3
AAAA        1
BBBB        1
BBBB        100
BBBB        159
CCCC        -10
CCCC        9

Што б я тады хацеў гэта стандартнае адхіленне кожнай катэгорыі. Я ведаю, што з NumPy я магу выкарыстоўваць наступнае:

numpy.std(a)

Але прыклад я магу знайсці толькі гэта стаўленне да спісу, а не шэраг розных катэгорый у DataFame.

2
Я настойліва рэкамендую вам выкарыстоўваць панд ў гэтых відах работ, так як адказ прапанаваў.
дададзена аўтар wweicker, крыніца

1 адказы

Вы можаце лёгка зрабіць гэта з дапамогай панд:

import pandas as pd
import numpy as np

df = pd.DataFrame([["AA", 1], ["AA", 3], ["BB", 3], ["CC", 5], ["BB", 2], ["AA", -1]])
df.columns = ["Category", "Score"]
print df.groupby("Category").apply(np.std)
3
дададзена
Дзіўна. Вялікі адказ!
дададзена аўтар TomTom, крыніца
Я думаю, што мы можам пазбавіцца ад .Не() -. <Код> df.groupby ( "Катэгорыя") станд (ddof = 0)
дададзена аўтар MaxU, крыніца