StoreID | Sales | SalesDate | Channel |
---|---|---|---|
A | 100 | 2018/1/1 | 01 |
A | 90 | 2018/1/1 | 02 |
A | 110 | 2018/1/2 | 01 |
B | 82.2 | 2018/1/1 | 01 |
B | 90 | 2018/1/2 | 02 |
如果要按StoreID來統(tǒng)計每一家店的營業(yè)日期數(shù)(可以通過不計重復的count “SalesDate”來完成)
代碼如下:
data.groupby(['StoreID']).SalesDate.nunique()
補充:pandas 統(tǒng)計分組內不重復計數(shù)
在數(shù)據(jù)分析中的數(shù)據(jù)處理過程中,經(jīng)常需要對數(shù)據(jù)進行分組計數(shù),看下下面這組數(shù)據(jù)
數(shù)據(jù)中name 為C 的有三行,其中有2個code是重復的
按name 分組,統(tǒng)計每組中code的不重復數(shù)量
df.groupby('name')['code'].nunique() # 以name 分組后,統(tǒng)計code的不重復數(shù)目
結果如下:
df.groupby('name')['code'].nunique().sort_values(ascending=False) # 以name 分組后,統(tǒng)計code的不重復數(shù)目
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。