資訊內(nèi)容
python 操作 excel 系列之:數(shù)據(jù)清洗

python 在對(duì) excel 操作的同時(shí),前面文章中說(shuō)了數(shù)據(jù)的讀取、插入、簡(jiǎn)單分析,還有一個(gè)非常重要的點(diǎn)就是數(shù)據(jù)清洗。那什么叫數(shù)據(jù)清洗,說(shuō)白了就是去除數(shù)據(jù)文本中的垃圾值,比如:存在的空值、多余的空格、數(shù)據(jù)格式等等的處理。SnY少兒編程網(wǎng)-https://www.pxcodes.com
相關(guān)免費(fèi)學(xué)習(xí)推薦:python視頻教程SnY少兒編程網(wǎng)-https://www.pxcodes.com
1,導(dǎo)入 python 庫(kù)、讀取 excel 數(shù)據(jù)# 導(dǎo)入 pandas 庫(kù)import pandas as pd# read_excel() 讀取 excel 數(shù)據(jù)# DataFrame() 將讀取到的數(shù)據(jù)轉(zhuǎn)換為 DataFrame 數(shù)據(jù)df = pd.DataFrame(pd.read_excel('data.xlsx'))2,數(shù)據(jù)清洗(去除空值)# dropna() 函數(shù)去除 df 數(shù)據(jù)表中存在空值的所有行df.dropna(how='any')# mean() 函數(shù)計(jì)算 age 字段所在列的平均值age_pre = df['age'].mean()# 使用 fillna() 函數(shù)對(duì)存在的空值進(jìn)行填充,將 age_pre 的值填充到字段為空的值內(nèi)面df['age'].fillna(age_pre)3,數(shù)據(jù)清洗(清除字段中的空格)# 清除字段的空格df['name'] = df['name'].map(str.strip)4,數(shù)據(jù)清洗(對(duì)某個(gè)列進(jìn)行重命名)# rename() 函數(shù)對(duì)列進(jìn)行重命名df.rename(columns={'name': 'name_new'})5,數(shù)據(jù)清洗(清除某一列中的重復(fù)值)# 從前往后查找某個(gè)列中的重復(fù)值,如果存在則清除后面所出現(xiàn)的重復(fù)值df['name'].drop_duplicates()# 從后往前查找某個(gè)列中的重復(fù)值,如果存在則清除前面所出現(xiàn)的重復(fù)值df['city'].drop_duplicates(keep='last')# 兩種正好是按照相反的清除順序6,數(shù)據(jù)清洗(數(shù)據(jù)值替換)# 將某一列中的具體值進(jìn)行替換df['name'].replace('laow', 'lwsbc')相關(guān)免費(fèi)學(xué)習(xí)推薦:python教程(視頻)
以上就是python 操作 excel 系列之:數(shù)據(jù)清洗的詳細(xì)內(nèi)容,更多請(qǐng)關(guān)注少兒編程網(wǎng)其它相關(guān)文章!SnY少兒編程網(wǎng)-https://www.pxcodes.com

- 上一篇
學(xué)習(xí)Python解決高等數(shù)學(xué)問(wèn)題
簡(jiǎn)介Python解決高等數(shù)學(xué)問(wèn)題,媽媽再也不用擔(dān)心我的學(xué)習(xí)使用Python解決高等數(shù)學(xué)中極限、導(dǎo)數(shù)、偏導(dǎo)數(shù)、定積分、不定積分、雙重積分等問(wèn)題Sympy是一個(gè)Python的科學(xué)計(jì)算庫(kù),它旨在成為功能齊全的計(jì)算機(jī)代數(shù)系統(tǒng)。SymPy包括從基本符號(hào)算術(shù)到微積分,代數(shù),離散數(shù)學(xué)和量子物理學(xué)的功能。它可以在LaT
- 下一篇
python怎么判斷是否為字符串
簡(jiǎn)介在python中可以使用isinstance()函數(shù)來(lái)判斷是否為字符串,語(yǔ)法格式“isinstance(object,basestring)”;isinstance()函數(shù)是用于判斷一個(gè)對(duì)象是否是一個(gè)已知的類型。本教程操作環(huán)境:windows7系統(tǒng)、python3版,DELLG3電腦python判斷