久久精品中文字幕免费_91香蕉国产亚洲一区二区三区_国产精品巨作无遮拦_亚洲人成电影

    <center id="oy65s"><ol id="oy65s"></ol></center>

  • <menu id="oy65s"></menu>
    當(dāng)前位置:首頁 > 足球資訊 > 正文內(nèi)容

    數(shù)據(jù)分析實例——足球運動員數(shù)據(jù)集(1)

    杏彩體育2年前 (2023-01-31)足球資訊58

    又開始做實例了~在本次數(shù)據(jù)集中,包含了2017年所有活躍的足球運動員的個人數(shù)據(jù),包括身高體重等基本數(shù)據(jù),以及力量、速度、技巧等多個指標(biāo)。C羅、梅西、內(nèi)馬爾,到底誰比較厲害呢?答案我們可以從數(shù)據(jù)中獲得。(有意思~)

    數(shù)據(jù)來源:

    本次數(shù)據(jù)集的來源是kesci,提供者是Ustinian,想自己動手試試的同學(xué)可以去了解一下~

    下面開始我們的實例學(xué)習(xí)之路~

    一、了解數(shù)據(jù)集

    下面是和鯨社區(qū)中,對數(shù)據(jù)集的描述,主要包括了:數(shù)據(jù)集的主要內(nèi)容、以及數(shù)據(jù)內(nèi)的各個標(biāo)簽的中文注釋。

    (1)數(shù)據(jù)內(nèi)容:

    2017年所有活躍的足球運動員。

    (2)數(shù)據(jù)說明(標(biāo)簽名):

    Name 姓名

    Nationality 國籍

    National_Position 國家隊位置

    National_Kit 國家隊號碼

    Club 所在俱樂部

    Club_Position 所在俱樂部位置

    Club_Kit 俱樂部號碼

    Club_Joining 加入俱樂部時間

    Contract_Expiry 合同到期時間

    Rating 評分

    Height 身高

    Weight 體重

    Preffered_Foot 擅長左(右)腳

    Birth_Date 出生日期

    Age 年齡

    Preffered_Position 擅長位置

    Work_Rate 工作效率

    Weak_foot 非慣用腳使用頻率

    Skill_Moves 技術(shù)等級

    Ball_Control 控球技術(shù)

    Dribbling 盤球(帶球)能力

    Marking 盯人能力

    Sliding_Tackle 鏟球

    Standing_Tackle 逼搶能力

    Aggression 攻擊能力

    Reactions 反擊

    Attacking_Position 攻擊性跑位

    Interceptions 搶斷

    Vision 視野

    Composure 鎮(zhèn)靜

    Crossing 下底傳中

    Short_Pass 短傳

    Long_Pass 長傳

    Acceleration 加速度

    Speed 速度

    Stamina 體力

    Strength 強壯

    Balance 平衡

    Agility 敏捷度

    Jumping 跳躍

    Heading 投球

    Shot_Power 射門力量

    Finishing 射門

    Long_Shots 遠射

    Curve 弧線

    Freekick_Accuracy 任意球精準(zhǔn)度

    Penalties 點球

    Volleys 凌空能力

    GK_Positioning 門將位置感

    GK_Diving 撲救能力

    GK_Kicking 門將踢球能力

    GK_Handling 撲球脫手幾率

    GK_Reflexes 門將反應(yīng)度

    (3)導(dǎo)入數(shù)據(jù):

    import numpy as np import pandas as pd df = pd.read_csv(rC:\Users\Administrator\Desktop\zuqiu8543\football.csv)

    (4)查看數(shù)據(jù)基本信息:

    df.head()
    df.shape

    查看數(shù)據(jù)缺失情況:

    df.isnull().sum()

    從運行結(jié)果可以看到,出現(xiàn)數(shù)據(jù)缺失的特征總共有六列,而主要缺失的有兩列,分別是:National_Position 國家隊位置、National_Kit 國家隊號碼,出現(xiàn)缺失的原因,有可能是部分球員并沒有在國家隊里服役,因此也就沒有相應(yīng)的號碼和位置。同時,由于‘Club 所在俱樂部’、‘Club_Position 所在俱樂部位置’、 ‘Club_Kit 俱樂部號碼’、 ‘Club_Joining 加入俱樂部時間 ’、‘Contract_Expiry 合同到期時間’這5項指標(biāo)也不在我們的研究范圍之內(nèi)。

    因此,針對以上缺失值,我們不做處理。(對我們接下去的數(shù)據(jù)分析和可視化沒有影響的~)

    二、進行簡單數(shù)據(jù)分析

    (1)查看球員的身高、體重的具體信息

    首先我們使用head( )查看一下:

    df[[Weight,Height]].head()

    可以看到,我們的數(shù)據(jù)是帶有‘kg’、‘cm’等單位的,因此我們先對這些單位進行移除,同時修改數(shù)據(jù)類型,以方便后面的操作。

    (忘記應(yīng)該怎么做的同學(xué)可以看這里)

    df[Height]=df[Height].apply(lambda x:x[0:-3]) df[Weight]=df[Weight].apply(lambda x:x[0:-3]) df[[Height,Weight]]=df[[Height,Weight]].astype(int)

    我們可以查看修改后的數(shù)據(jù):

    df[[Weight,Height]].head()

    使用agg()查看所有球員身高、體重的均值和最值:

    df[[Height,Weight]].agg([mean,max,min])

    可以看到,數(shù)據(jù)集中的球員平均身高達到了181cm、平均體重75kg。

    上述操作的主要目的是想讓大家暖一下手,下面才是我們對這個球員數(shù)據(jù)集分析的真正開始。

    作為非專業(yè)球員(嘻嘻,球迷or足球愛好者),我們當(dāng)然還是更想看看能不能從數(shù)據(jù)反映出球員的個人實力。所以下面我們就要進行深入分析。

    三、通過球員數(shù)據(jù),鑒定球員能力

    在我們的球員數(shù)據(jù)集中,總共有這么兩項數(shù)據(jù):Rating 評分、Skill_Moves 技術(shù)等級,這兩項數(shù)據(jù)就是我們的主要研究目標(biāo)。我們將圍繞這兩項數(shù)據(jù),建立研究需求。

    研究需求:

    分值(Rating)高低的評分依據(jù)是什么?如何構(gòu)建評分依據(jù)?

    技術(shù)等級(Skill_Moves)的評價標(biāo)準(zhǔn)是什么?如何構(gòu)建評價標(biāo)準(zhǔn)?

    對研究需求的初步解讀:

    首先我們還是先對我們的目標(biāo)列加深認(rèn)知:

    (1)分值(Rating):

    df[Rating].unique()
    df[Rating].nunique()

    可以看到,分值(Rating)這一目標(biāo)值是連續(xù)型的,總共有49個不同值。

    (2)技術(shù)等級(Skill_Moves):

    df[Skill_Moves].unique()
    df[Skill_Moves].nunique()

    可以看到,技術(shù)等級(Skill_Moves)更像是分類型的,總共有1-5五個等級。

    進行球員分析前的須知:

    總所周知,足球場上總共有11個球員,大致可以分為兩類,分別是:1個守門員,及非守門員(前鋒、中場、后衛(wèi)),守門員的能力與非守門員的能力肯定是有區(qū)別的,因此我們在通過球員數(shù)據(jù)鑒定球員能力時,不能按照同一套標(biāo)準(zhǔn)。

    對于守門員,我們更多的考究他的護框能力,與其他非守門員球員是截然不同的。

    我們可以通過查看數(shù)據(jù),進一步觀察守門員和非守門員能力的差異:

    我們提取出7列特征:

    Name 姓名Preffered_Position 擅長位置Speed 速度Finishing 射門Freekick_Accuracy 任意球精準(zhǔn)度Shot_Power 射門力量GK_Diving 撲救能力GK_Reflexes 門將反應(yīng)度

    接著,我們查看前五名球員的這些數(shù)值差距:

    df[[Name,Preffered_Position,Speed,Finishing,Shot_Power,GK_Diving,GK_Reflexes]].head()

    在上面五位球員中,前四位是非守門員,第五位是守門員。

    從數(shù)值上,可以明顯看出區(qū)別。(忘記各個特征中文名的同學(xué)可以去上面看哦,我就不改數(shù)據(jù)表了)

    下面開始正式分析球員能力值的評分標(biāo)準(zhǔn)~

    1、守門員的評分標(biāo)準(zhǔn)

    在數(shù)據(jù)集中,GK是表示守門員(門將)的意思,同時,主要有5個特征用于衡量守門員的能力,分別是:

    GK_Positioning 門將位置感GK_Diving 撲救能力GK_Kicking 門將踢球能力GK_Handling 撲球脫手幾率GK_Reflexes 門將反應(yīng)度

    因此,我們可以將這幾列特征提取出來,連同球員得分及技能等級,繪制成一個新數(shù)據(jù)表——門將數(shù)據(jù)表。

    df_GK = df[[Name,Rating,Skill_Moves,GK_Positioning,GK_Diving ,GK_Kicking,GK_Handling,GK_Reflexes]][df[Preffered_Position]==GK]

    查看表格情況:

    df_GK.head()

    查看一下技能等級(Skill_Moves)的分級情況:

    df_GK[Skill_Moves].unique()

    可以看到,在所有守門員中,技術(shù)等級只有1和2兩個等級。

    我們進一步查看等級的個數(shù):

    df_GK[Skill_Moves].value_counts()

    可以看到,在技術(shù)等級為1的球員有2002個,等級為2的只有1個,差距太大,這里其實L考慮過做數(shù)據(jù)平衡化,但是效果不是很好。

    綜合考慮后,決定在考量守門員的能力時,僅考慮分值(Rating)這一項數(shù)據(jù),不考慮技術(shù)等級(Skill_Moves)。

    (由于在數(shù)據(jù)表中,球員的單項特征的得分越高,證明這名球員的這項能力更突出,也就是說,這里的特征均屬于數(shù)值類型,而不是類別型特征。因此,在這里我們不需要進行one-hot獨熱編碼。)

    可以看到,特征列都是數(shù)值型的。

    下面,我們將結(jié)合這五項特征,使用機器學(xué)習(xí)的方法技巧進行分析。(這里總共分為幾個部分,由于篇幅原因,可能會將所有內(nèi)容分為幾篇文章。)

    一、回歸樹

    首先,我們使用決策樹中的DecisionTreeRegressor(回歸樹)進行分析。

    1、將數(shù)據(jù)集分割成訓(xùn)練集和測試集

    導(dǎo)入做決策樹相應(yīng)需要的包:

    from sklearn import tree from sklearn.model_selection import train_test_split

    首先,將原數(shù)據(jù)集按特征和目標(biāo)進行分割:

    df_x=df_GK.drop(labels=[Name,Rating,Skill_Moves],axis=1) df_y1=df_GK.loc[:,Rating]

    然后,使用train_test_split將數(shù)據(jù)分成訓(xùn)練集和測試集。

    注意~在這里我們指定了拆分系數(shù)為0.3,也是說將7/10的數(shù)據(jù)作為訓(xùn)練集,剩下3/10的數(shù)據(jù)作為測試集。

    #指定評分為目標(biāo)時: X_train, X_test, Y_train, Y_test = train_test_split(df_x,df_y,test_size=0.3)

    下面開始建模,并進行數(shù)據(jù)訓(xùn)練:

    reg = tree.DecisionTreeRegressor(random_state=0) reg = reg.fit(X_train, Y_train)

    查看一下在測試集上的準(zhǔn)確度(將經(jīng)過訓(xùn)練集訓(xùn)練后的模型,應(yīng)用到測試集里,并查看擬合的得分情況)

    score = reg.score(X_test, Y_test) score

    可以看到,擬合度是比較高的,也就是說這里我們可以借助回歸樹對球員評分進行預(yù)測。

    2、同時,我們也可以畫出決策樹.(但是如果考慮實際問題的話,這里其實并不建議這么做)

    import graphviz reg = tree.DecisionTreeRegressor(random_state=0) reg = reg.fit(X_train, Y_train) dot_data = tree.export_graphviz(reg ,out_file = None ,class_names=["球員評分"] ,filled=True ,rounded=True ) graph = graphviz.Source(dot_data) graph

    除此之外,我們也可以利用隨機森林回歸、線性回歸、邏輯回歸包括支持向量機等方法,進行模型擬合及預(yù)測,當(dāng)然了,使用每種方法的步驟與注意點均有些許不同,這些我也將會在下次為大家說明。

    以上便是<數(shù)據(jù)分析實例——足球運動員數(shù)據(jù)集(1)>的內(nèi)容,感謝大家的細(xì)心閱讀,同時歡迎感興趣的小伙伴一起討論、學(xué)習(xí),想要了解更多內(nèi)容的可以看我的其他文章,同時可以持續(xù)關(guān)注我的動態(tài)~

    掃描二維碼推送至手機訪問。

    版權(quán)聲明:本文由財神資訊-領(lǐng)先的體育資訊互動媒體轉(zhuǎn)載發(fā)布,如需刪除請聯(lián)系。

    本文鏈接:http://www.daniuzhishi.com/?id=46261

    “數(shù)據(jù)分析實例——足球運動員數(shù)據(jù)集(1)” 的相關(guān)文章

    哥就是一個傳說!C羅大四喜率葡萄牙足球比分5-1大勝立陶宛!

    哥就是一個傳說!C羅大四喜率葡萄牙足球比分5-1大勝立陶宛!

    北京時間9月11日凌晨2點45,B組一場焦點大戰(zhàn)在葡萄牙與立陶宛之間展開。此前,葡萄牙三戰(zhàn)取得1勝2平,積5分排名小組第2,上一輪4-2客場擊敗塞爾維亞,狀態(tài)不錯。而他們的對手立陶宛四輪1平3負(fù)小組墊底,兩隊實力...

    美媒很狂,稱世界杯不公平,足球強國是道德敗壞,不符美國價值觀

    美媒很狂,稱世界杯不公平,足球強國是道德敗壞,不符美國價值觀

    這次卡塔爾世界杯,由于該國的一些針對LGBT以及球迷的政策,引發(fā)了西方媒體的口誅筆伐。在這些傲慢的西方媒體眼中,卡塔爾就是野蠻人,他們的規(guī)定完全是不值一提。不過我們要看到,西方媒體把足球政治化,里面有一個重大的問題,就是美國。因為美國這個西方國家的領(lǐng)頭羊,實際足球很弱,這次美國和...

    2-0!阿根廷世界杯首勝來了!梅西逆境中爆發(fā),轟1球1助告慰老馬

    2-0!阿根廷世界杯首勝來了!梅西逆境中爆發(fā),轟1球1助告慰老馬

    繼遭遇1-2不敵沙特隊的爆冷后,阿根廷隊的出線形勢岌岌可危,在這絕不能輸?shù)哪婢持?,潘帕斯雄?0號成功站了出來。梅西上演傳射建功,力助球隊2-0取得首勝,用最好的方式告慰逝世兩周年的馬拉多納! 首輪的爆冷輸球,讓原本被認(rèn)為是奪冠熱門的阿根廷隊突然站在了懸崖邊,第2輪如果...

    競彩足球的的為什么總感覺這么坑人?

    競彩足球其實也不坑,??有“锥?,為什么這么說? 眾所周知競彩足球不是彩民和莊的游戲,是屬于彩民與彩民的游戲,看法不一樣贏下的是對方的錢,一場比賽勝平負(fù),三種結(jié)果,賽果出來卻只能出一種,選其余兩種結(jié)果的自然要奉獻上自己的注金,所以要的是你會...

    【競彩足球推薦】002 瑞超:索爾納 VS 馬爾默004 荷甲:烏德勒支 VS 阿爾克馬 能否穩(wěn)定發(fā)揮?你看好哪一隊??

    【競彩足球推薦】002 瑞超:索爾納 VS 馬爾默004 荷甲:烏德勒支 VS 阿爾克馬 能否穩(wěn)定發(fā)揮?你看好哪一隊??

    體彩公益,樂善人生 為國家公益事業(yè)添磚加瓦 從我做起 前言: 以下賽事解讀,僅代表個人看法。 風(fēng)水輪流轉(zhuǎn),競彩亞盤也是這般!選擇和勇氣同樣重要!合理投注,理性選擇,穩(wěn)步收金! ——小王 奧利給!昨日競彩足球分析了對了!老規(guī)...

    【關(guān)注】競彩網(wǎng)發(fā)布通知:暫停發(fā)布全國聯(lián)網(wǎng)單場競猜游戲足球賽程

    【關(guān)注】競彩網(wǎng)發(fā)布通知:暫停發(fā)布全國聯(lián)網(wǎng)單場競猜游戲足球賽程

    剛剛競彩網(wǎng)發(fā)布中國體育賽事公告,公告提到“由于各大主流足球聯(lián)賽受新冠肺炎疫情影響推遲,即日起暫停發(fā)布全國聯(lián)網(wǎng)單場競猜游戲(競彩)足球賽程?;謴?fù)時間視賽事情況另行通知,請關(guān)注競彩網(wǎng)公告?!?競彩停售對于體彩店主來說可謂是當(dāng)頭一棒。引起彩票店主熱烈議論,紛紛表示 “撐不下去了...

    ?