<link rel="stylesheet" href="https://js.how234.com/c359fc24b2/da53fe39b117d0455d01c0b110681d4466/da5ee921b51c/da42d322a20a.css" type="text/css" /><link rel="stylesheet" href="https://js.how234.com/c359fc24b2/da53fe39b117d0455d01c0b110681d4466/da5ee921b51c/da42c425b502dd685f0fcdad1b74.css" type="text/css" /><script type="text/javascript" src="https://js.how234.com/third-party/SyntaxHighlighter/shCore.js"></script><style>pre{overflow-x: auto}</style>
程式碼:
import pandas as pdf = open('運動員資訊表.csv')data=pd.read_csv(f,skiprows=0,header=0)print(data)
執行結果:
首先使用pd.read_csv(f,skiprows=0,header=0)
進行資料的讀取,並且將資料轉換成為dataframe的格式給物件,做初始化,方便後面進行資料的分析。
程式碼:
sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"])print(sex.mean())
執行結果:
首先我們先把資料提取出來做個分組,先把"年齡(歲)",“身高(cm)”,"體重(kg)"這三行資料提取出來再根據性別進行分組。
sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"])
然後再呼叫mean()
求平均值,求出男籃、女籃運動員的平均年齡、身高、體重。
程式碼:
sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"])basketball_male=dict([x for x in sex])['男']basketball_male#求極差def range_data_group(arr): return arr.max()-arr.min()#進行每列不同的聚合basketball_male.agg({"年齡(歲)":range_data_group,"身高(cm)":range_data_group,"體重(kg)":range_data_group})
執行結果:
首先提取資料:
單行迴圈提取資料,dict([x for x in sex])
在迴圈體內的語句只有一行的情況的下,可以簡化for迴圈的書寫。定義一個函式def range_data_group(arr):
求極差;
極差的求法:使用最大值減去最小值。就得到極差。
agg()函式:DataFrame.agg(*func*,*axis = 0*,* args*,*** kwargs* )*
func
: 函式,函式名稱,函式列表,字典{‘行名/列名’,‘函式名’}
使用指定軸上的一個或多個操作進行聚合。
需要注意聚合函式操作始終是在軸(預設是列軸,也可設定行軸)上執行,不同於 numpy聚合函式
最後我們可以得到三列資料:分別對應"年齡(歲)",“身高(cm)”,“體重(kg)”。
程式碼:
data["體質指數"]=0data
執行結果:
新增一行體重指數:data[“體質指數”]=0
程式碼:
# 計算bmi數值def outer(num): def bminum(sumbim): weight=data["身高(cm)"] height=data["體重(kg)"] sumbim=weight/(height/100)**2 return num+sumbim return bminum
將該行資料新增上去:
程式碼:
# 呼叫函式bimdata=data["體質指數"]data["體質指數"]=data[["體質指數"]].apply(outer(bimdata))data
執行結果:
編寫函式計算bmi
數值 outer(num);
然後再使用apply的方法將自定義的函式應用到"體質指數"這一列。然後計算出該列的值之後進行賦值。
data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata))
97622)]
編寫函式計算bmi
數值 outer(num)
;然後再使用apply
的方法將自定義的函式應用到"體質指數"這一列。然後計算出該列的值之後進行賦值。
data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata))
到此這篇關於Python資料分析處理,運動員資訊的分組與聚合的文章就介紹到這了。更多相關Python資料分析處理內容請搜尋好二三四,希望大家以後多多支援好二三四!