網站首頁學習教育 IT科技金融知識旅遊規劃生活小知識家鄉美食養生小知識健身運動美容百科遊戲知識綜合知識

運動員資訊的分組與聚合|Python資料分析處理(三)

欄目: 學習教育 / 釋出於: / 人氣:1.99W

1、資料的爬取

程式碼：

import pandas as pdf = open('運動員資訊表.csv')data=pd.read_csv(f,skiprows=0,header=0)print(data)

執行結果：

首先使用pd.read_csv(f,skiprows=0,header=0)進行資料的讀取，並且將資料轉換成為dataframe的格式給物件，做初始化，方便後面進行資料的分析。

2、統計男籃、女籃運動員的平均年齡、身高、體重

程式碼：

sex=data[["年齡（歲）","身高(cm)","體重(kg)"]].groupby(data["性別"])print(sex.mean())

執行結果：

首先我們先把資料提取出來做個分組，先把"年齡（歲）",“身高(cm)”,"體重(kg)"這三行資料提取出來再根據性別進行分組。

sex=data[["年齡（歲）","身高(cm)","體重(kg)"]].groupby(data["性別"])

然後再呼叫mean()求平均值，求出男籃、女籃運動員的平均年齡、身高、體重。

3、統計男籃運動員年齡、身高、體重的極差值

程式碼：

sex=data[["年齡（歲）","身高(cm)","體重(kg)"]].groupby(data["性別"])basketball_male=dict([x for x in sex])['男']basketball_male#求極差def range_data_group(arr):    return arr.max()-arr.min()#進行每列不同的聚合basketball_male.agg({"年齡（歲）":range_data_group,"身高(cm)":range_data_group,"體重(kg)":range_data_group})

執行結果：

首先提取資料：

單行迴圈提取資料，dict([x for x in sex])在迴圈體內的語句只有一行的情況的下，可以簡化for迴圈的書寫。定義一個函式def range_data_group(arr):求極差；

極差的求法：使用最大值減去最小值。就得到極差。

agg()函式：DataFrame.agg（*func*，*axis = 0*，* args*，*** kwargs* ）*

func : 函式，函式名稱，函式列表，字典{‘行名/列名’，‘函式名’}

使用指定軸上的一個或多個操作進行聚合。

需要注意聚合函式操作始終是在軸（預設是列軸，也可設定行軸）上執行，不同於 numpy聚合函式

最後我們可以得到三列資料：分別對應"年齡（歲）",“身高(cm)”,“體重(kg)”。

4 、統計男籃運動員的體質指數

4.1新增體重指數

程式碼：

data["體質指數"]=0data

執行結果：

新增一行體重指數：data[“體質指數”]=0

4.2計算bmi值並新增資料

程式碼：

# 計算bmi數值def outer(num):    def bminum(sumbim):        weight=data["身高(cm)"]        height=data["體重(kg)"]        sumbim=weight/(height/100)**2        return num+sumbim    return bminum

將該行資料新增上去：

程式碼：

# 呼叫函式bimdata=data["體質指數"]data["體質指數"]=data[["體質指數"]].apply(outer(bimdata))data

執行結果:

編寫函式計算bmi數值 outer(num)；然後再使用apply的方法將自定義的函式應用到"體質指數"這一列。然後計算出該列的值之後進行賦值。

data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata)) 97622)]

編寫函式計算bmi數值 outer(num) ；然後再使用apply的方法將自定義的函式應用到"體質指數"這一列。然後計算出該列的值之後進行賦值。

data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata))

到此這篇關於Python資料分析處理，運動員資訊的分組與聚合的文章就介紹到這了。更多相關Python資料分析處理內容請搜尋好二三四，希望大家以後多多支援好二三四！

Tags：聚合分組 Python 資料分析運動員

運動員資訊的分組與聚合|Python資料分析處理(三)

1、 資料的爬取

2、統計男籃、女籃運動員的平均年齡、身高、體重

3、統計男籃運動員年齡、身高、體重的極差值

4 、統計男籃運動員的體質指數

4.1新增體重指數

4.2計算bmi值並新增資料

1、資料的爬取