亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

盤點(diǎn)Pandas的100個(gè)常用函數(shù)

數(shù)據(jù)分析與開發(fā) ? 來源:數(shù)據(jù)分析1480 ? 作者:劉順祥 ? 2021-04-01 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

經(jīng)過一段時(shí)間的整理,本期將分享我認(rèn)為比較常規(guī)的100個(gè)實(shí)用函數(shù),這些函數(shù)大致可以分為六類,分別是統(tǒng)計(jì)匯總函數(shù)、數(shù)據(jù)清洗函數(shù)、數(shù)據(jù)篩選、繪圖與元素級(jí)運(yùn)算函數(shù)、時(shí)間序列函數(shù)和其他函數(shù)。

一、統(tǒng)計(jì)匯總函數(shù)數(shù)據(jù)分析過程中,必然要做一些數(shù)據(jù)的統(tǒng)計(jì)匯總工作,那么對(duì)于這一塊的數(shù)據(jù)運(yùn)算有哪些可用的函數(shù)可以幫助到我們呢?具體看如下幾張表。

96410908-9247-11eb-8b86-12bb97331649.png

96624186-9247-11eb-8b86-12bb97331649.png

import pandas as pd import numpy as np x = pd.Series(np.random.normal(2,3,1000)) y = 3*x + 10 + pd.Series(np.random.normal(1,2,1000)) # 計(jì)算x與y的相關(guān)系數(shù) print(x.corr(y)) # 計(jì)算y的偏度 print(y.skew()) # 計(jì)算y的統(tǒng)計(jì)描述值 print(x.describe()) z = pd.Series([‘A’,‘B’,‘C’]).sample(n = 1000, replace = True) # 重新修改z的行索引 z.index = range(1000) # 按照z分組,統(tǒng)計(jì)y的組內(nèi)平均值 y.groupby(by = z).aggregate(np.mean)

968a6328-9247-11eb-8b86-12bb97331649.png

96a9b8b8-9247-11eb-8b86-12bb97331649.jpg

# 統(tǒng)計(jì)z中個(gè)元素的頻次 print(z.value_counts()) a = pd.Series([1,5,10,15,25,30]) # 計(jì)算a中各元素的累計(jì)百分比 print(a.cumsum() / a.cumsum()[a.size - 1])

96cea812-9247-11eb-8b86-12bb97331649.png

二、數(shù)據(jù)清洗函數(shù)同樣,數(shù)據(jù)清洗工作也是必不可少的工作,在如下表格中羅列了常有的數(shù)據(jù)清洗的函數(shù)。

96e2916a-9247-11eb-8b86-12bb97331649.jpg

x = pd.Series([10,13,np.nan,17,28,19,33,np.nan,27]) #檢驗(yàn)序列中是否存在缺失值 print(x.hasnans) # 將缺失值填充為平均值 print(x.fillna(value = x.mean())) # 前向填充缺失值 print(x.ffill())

96f12176-9247-11eb-8b86-12bb97331649.png

96f9eba8-9247-11eb-8b86-12bb97331649.png

income = pd.Series([‘12500元’,‘8000元’,‘8500元’,‘15000元’,‘9000元’]) # 將收入轉(zhuǎn)換為整型 print(income.str[:-1].astype(int)) gender = pd.Series([‘男’,‘女’,‘女’,‘女’,‘男’,‘女’]) # 性別因子化處理 print(gender.factorize()) house = pd.Series([‘大寧金茂府 | 3室2廳 | 158.32平米 | 南 | 精裝’, ‘昌里花園 | 2室2廳 | 104.73平米 | 南 | 精裝’, ‘紡大小區(qū) | 3室1廳 | 68.38平米 | 南 | 簡(jiǎn)裝’]) # 取出二手房的面積,并轉(zhuǎn)換為浮點(diǎn)型 house.str.split(‘|’).str[2].str.strip().str[:-2].astype(float)

9740314e-9247-11eb-8b86-12bb97331649.png

三、數(shù)據(jù)篩選數(shù)據(jù)分析中如需對(duì)變量中的數(shù)值做子集篩選時(shí),可以巧妙的使用下表中的幾個(gè)函數(shù),其中部分函數(shù)既可以使用在序列身上,也基本可以使用在數(shù)據(jù)框?qū)ο笾小?/p>

976a23fa-9247-11eb-8b86-12bb97331649.png

np.random.seed(1234) x = pd.Series(np.random.randint(10,20,10)) # 篩選出16以上的元素 print(x.loc[x 》 16]) print(x.compress(x 》 16)) # 篩選出13~16之間的元素 print(x[x.between(13,16)]) # 取出最大的三個(gè)元素 print(x.nlargest(3)) y = pd.Series([‘ID:1 name:張三 age:24 income:13500’, ‘ID:2 name:李四 age:27 income:25000’, ‘ID:3 name:王二 age:21 income:8000’]) # 取出年齡,并轉(zhuǎn)換為整數(shù) print(y.str.findall(‘a(chǎn)ge:(d+)’).str[0].astype(int))

97983e3e-9247-11eb-8b86-12bb97331649.png

四、繪圖與元素級(jí)函數(shù)

97adf68e-9247-11eb-8b86-12bb97331649.png

np.random.seed(123) import matplotlib.pyplot as plt x = pd.Series(np.random.normal(10,3,1000)) # 繪制x直方圖 x.hist() # 顯示圖形 plt.show() # 繪制x的箱線圖 x.plot(kind=‘box’) plt.show() installs = pd.Series([‘1280萬’,‘6.7億’,‘2488萬’,‘1892萬’,‘9877’,‘9877萬’,‘1.2億’]) # 將安裝量統(tǒng)一更改為“萬”的單位 def transform(x): if x.find(‘億’) != -1: res = float(x[:-1])*10000 elif x.find(‘萬’) != -1: res = float(x[:-1]) else: res = float(x)/10000 return res installs.apply(transform)

97fc5bbc-9247-11eb-8b86-12bb97331649.png

981dfbdc-9247-11eb-8b86-12bb97331649.png

983ede6a-9247-11eb-8b86-12bb97331649.png

五、時(shí)間序列函數(shù)

98644f1a-9247-11eb-8b86-12bb97331649.png

987f2696-9247-11eb-8b86-12bb97331649.png

98daee0e-9247-11eb-8b86-12bb97331649.png

六、其他函數(shù)

9912aa10-9247-11eb-8b86-12bb97331649.png

import numpy as np import pandas as pd np.random.seed(112) x = pd.Series(np.random.randint(8,18,6)) print(x) # 對(duì)x中的元素做一階差分 print(x.diff()) # 對(duì)x中的元素做降序處理 print(x.sort_values(ascending = False)) y = pd.Series(np.random.randint(8,16,100)) # 將y中的元素做排重處理,并轉(zhuǎn)換為列表對(duì)象 y.unique().tolist()

9955e87a-9247-11eb-8b86-12bb97331649.png

9977d3ae-9247-11eb-8b86-12bb97331649.png

原文標(biāo)題:100 個(gè) pandas 數(shù)據(jù)分析函數(shù)總結(jié)

文章出處:【微信公眾號(hào):數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4404

    瀏覽量

    66626

原文標(biāo)題:100 個(gè) pandas 數(shù)據(jù)分析函數(shù)總結(jié)

文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    倉(cāng)庫(kù)盤點(diǎn)誤差大總出錯(cuò),咋整?試試智能盤點(diǎn)解決方法

    倉(cāng)庫(kù)盤點(diǎn)頻繁賬實(shí)不符?人工盤點(diǎn)誤差高、效率低,還吃掉利潤(rùn)?RFID 智能盤點(diǎn)技術(shù)幫你解決!可以在2-25 米遠(yuǎn)距離批量讀寫,庫(kù)存準(zhǔn)確率飆升 99%+,盤點(diǎn)時(shí)間縮短一半,適配倉(cāng)儲(chǔ)物流、制
    的頭像 發(fā)表于 11-05 11:56 ?72次閱讀
    倉(cāng)庫(kù)<b class='flag-5'>盤點(diǎn)</b>誤差大總出錯(cuò),咋整?試試智能<b class='flag-5'>盤點(diǎn)</b>解決方法

    大彩講堂:VisualHMI-LUA教程-on_press回調(diào)函數(shù)使用指南

    屏幕會(huì)觸發(fā)回調(diào)函數(shù)100ms回調(diào)一次)?state:0-彈起、1-按下、2-長(zhǎng)按?x:按下時(shí)X軸坐標(biāo)?y:按下時(shí)Y軸坐標(biāo)觸摸回調(diào)函數(shù)常用于做自定義待機(jī)邏輯,搭配
    的頭像 發(fā)表于 07-23 16:32 ?838次閱讀
    大彩講堂:VisualHMI-LUA教程-on_press回調(diào)<b class='flag-5'>函數(shù)</b>使用指南

    精準(zhǔn)盤點(diǎn),無憂管理——RFID智能盤點(diǎn)終端解析

    RFID智能盤點(diǎn)終端高效、精準(zhǔn),利用RFID技術(shù)實(shí)現(xiàn)快速批量識(shí)別,實(shí)時(shí)更新數(shù)據(jù),確保庫(kù)存信息準(zhǔn)確無誤。其輕便易攜設(shè)計(jì)及簡(jiǎn)潔操作界面使盤點(diǎn)工作輕松便捷。此外,該終端具有高可靠性,適用于各種環(huán)境,為企業(yè)帶來高效、精準(zhǔn)的盤點(diǎn)體驗(yàn)。
    的頭像 發(fā)表于 07-14 14:17 ?309次閱讀

    MSP430常用內(nèi)聯(lián)函數(shù)說明

    電子發(fā)燒友網(wǎng)站提供《MSP430常用內(nèi)聯(lián)函數(shù)說明.docx》資料免費(fèi)下載
    發(fā)表于 06-05 17:20 ?0次下載

    FPC標(biāo)簽在盤點(diǎn)中的應(yīng)用

    RFID是一種通過無線電信號(hào)識(shí)別特定目標(biāo)并讀取相關(guān)數(shù)據(jù)的技術(shù)。與傳統(tǒng)的條形碼技術(shù)相比,RFID技術(shù)具有顯著的優(yōu)勢(shì),如遠(yuǎn)距離讀取、存儲(chǔ)更多信息以及更高的準(zhǔn)確性和可靠性RFID在庫(kù)存盤點(diǎn)中的具體應(yīng)用1.
    的頭像 發(fā)表于 05-09 15:21 ?360次閱讀
    FPC標(biāo)簽在<b class='flag-5'>盤點(diǎn)</b>中的應(yīng)用

    函數(shù)指針的六個(gè)常見應(yīng)用場(chǎng)景

    函數(shù)指針在嵌入式開發(fā)中有著廣泛的應(yīng)用,它讓代碼更加靈活,減少冗余,提高可擴(kuò)展性。很多時(shí)候,我們需要根據(jù)不同的情況動(dòng)態(tài)調(diào)用不同的函數(shù),而函數(shù)指針正是實(shí)現(xiàn)這一需求的重要工具。本文將介紹六個(gè)
    的頭像 發(fā)表于 04-07 11:58 ?935次閱讀
    <b class='flag-5'>函數(shù)</b>指針的六<b class='flag-5'>個(gè)</b>常見應(yīng)用場(chǎng)景

    詳解RTOS中的Hook函數(shù)

    Hook函數(shù)是RTOS中的一個(gè)關(guān)鍵特性,通過該函數(shù),用戶可以增強(qiáng)對(duì)任務(wù)管理的控制,定義系統(tǒng)行為。
    的頭像 發(fā)表于 03-24 16:14 ?746次閱讀

    大模型領(lǐng)域常用名詞解釋(近100個(gè)

    本文總結(jié)了大模型領(lǐng)域常用的近100個(gè)名詞解釋,并按照模型架構(gòu)與基礎(chǔ)概念,訓(xùn)練方法與技術(shù),模型優(yōu)化與壓縮,推理與應(yīng)用,計(jì)算與性能優(yōu)化,數(shù)據(jù)與標(biāo)簽,模型評(píng)估與調(diào)試,特征與數(shù)據(jù)處理,倫理與公平性、其他
    的頭像 發(fā)表于 02-19 11:49 ?1169次閱讀
    大模型領(lǐng)域<b class='flag-5'>常用</b>名詞解釋(近<b class='flag-5'>100</b><b class='flag-5'>個(gè)</b>)

    HAL庫(kù)的函數(shù)調(diào)用示例

    HAL(Hardware Abstraction Layer,硬件抽象層)庫(kù)是STM32等微控制器中常用的庫(kù),它為開發(fā)者提供了訪問和控制硬件設(shè)備的接口。以下是一些常用的HAL庫(kù)函數(shù)及其調(diào)用示例: 一
    的頭像 發(fā)表于 12-02 14:01 ?2579次閱讀

    同樣是函數(shù),在C和C++中有什么區(qū)別

    同樣是函數(shù),在 C 和 C++ 中有什么區(qū)別? 第一個(gè)返回值。 C語言的函數(shù)可以不寫返回值類型,編譯器會(huì)默認(rèn)為返回 int。 但是 C++ 的函數(shù),除了構(gòu)造和析構(gòu)這兩
    的頭像 發(fā)表于 11-29 10:25 ?1198次閱讀

    RAPIDS cuDF將pandas提速近150倍

    在 NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬 pandas 用戶帶來 GPU 加速,且無需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?998次閱讀
    RAPIDS cuDF將<b class='flag-5'>pandas</b>提速近150倍

    常用SQL函數(shù)及其用法

    SQL(Structured Query Language)是一種用于管理和操作關(guān)系數(shù)據(jù)庫(kù)的編程語言。SQL 提供了豐富的函數(shù)庫(kù),用于數(shù)據(jù)檢索、數(shù)據(jù)更新、數(shù)據(jù)刪除以及數(shù)據(jù)聚合等操作。以下是一些常用
    的頭像 發(fā)表于 11-19 10:18 ?2045次閱讀

    RNN的損失函數(shù)與優(yōu)化算法解析

    函數(shù)有以下幾種: 交叉熵?fù)p失函數(shù) :交叉熵(Cross Entropy)是一種評(píng)估兩個(gè)概率分布之間差異的度量方法,即通過比較模型預(yù)測(cè)的概率分布和真實(shí)概率分布之間的差異,來評(píng)估模型訓(xùn)練的性能。在RNN中,交叉熵?fù)p失
    的頭像 發(fā)表于 11-15 10:16 ?1738次閱讀

    如何優(yōu)化SUMIF函數(shù)的效率

    在Excel中, SUMIF 函數(shù)是一個(gè)非常有用的工具,它可以根據(jù)指定的條件對(duì)數(shù)據(jù)進(jìn)行求和。然而,在處理大量數(shù)據(jù)時(shí), SUMIF 函數(shù)可能會(huì)變得效率低下。以下是一些優(yōu)化 SUMIF 函數(shù)
    的頭像 發(fā)表于 11-11 09:20 ?1846次閱讀

    SUMIF函數(shù)在數(shù)據(jù)分析中的應(yīng)用

    在商業(yè)和科學(xué)研究中,數(shù)據(jù)分析是一項(xiàng)基本且關(guān)鍵的技能。Excel作為最常用的數(shù)據(jù)分析工具之一,提供了多種函數(shù)來幫助用戶處理和分析數(shù)據(jù)。SUMIF函數(shù)就是其中之一,它允許用戶根據(jù)特定的條件對(duì)數(shù)據(jù)進(jìn)行求和
    的頭像 發(fā)表于 11-11 09:14 ?1289次閱讀