Python pandas刪除指定行/列數據的方法實例
pandas是很常用的數據分析,數據處理的包。anaconda已經有這個包了,純凈版python的可以自行pip安裝。
刪除重復值 drop_duplicates()
df=pd.DataFrame({'state':[1,1,2,2,1,2,2],'pop':['a','b','c','d','b','c','d']})
語法:drop_duplicates(subset,keep,inplace),其中參數 keep:{‘first’,‘last’,False},默認’first’
first:保留第一次出現的重復項,刪除第二次及之后出現的重復項。
last:保留最后一次出現的重復項,刪除之前出現的重復項。
"false":刪除所有重復項。
查看有nan的行,和不含有nan的行
#1 查看含有nan的行 df[df.isna().any(axis=1)]
#2 查看不含有nan的行 df[~df.isna().any(axis=1)] #有一個符號 ~ 一定要注意這一點
示例:提取pandas dataframe中’商品名稱‘列包含’手機’字符的所有數據:
#提取含有指定字符的行
df2=df[df['商品名稱'].str.contains(pat='手機',regex=False)] #regex=True則pat是一個正則表達式,regex=False表示pat是一個字符串
刪除pandas dataframe中’商品名稱’列包含’手機’字符的所有數據:
#刪除含有指定字符的行
df2=df.drop(df[df['商品名稱'].str.contains(pat='手機',regex=False)].index,inplace=True) #regex=True則pat是一個正則表達式,regex=False表示pat是一個字符串
去掉某些具體值
數據集df中,對于屬性appPlatform(最后一列),我們想刪除掉取值為2的那些樣本。如何做?非常簡單。
df[(True-df['appPlatform'].isin([2]))]
當然,有時候我們需要去掉不止一個值,這個時候只需要在isin([])的列表中添加。更具體來說,例如,對于appID這個屬性,我們想去掉appID=278和appID=382的樣本。
df[(True-df['appID'].isin([278,382]))]
另外,我們有時候并不只是考慮某一列,還需要考慮另外若干列的情況。例如,我們需要過濾掉appPlatform=2而且appID=278和appID=382的樣本呢?非常簡單。
df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]
很詳細的介紹鏈接:https://www.jb51.net/article/236118.htm#_lab2_0_4
官網詳細解釋鏈接:https://pandas.pydata.org/docs/reference/api/pandas.Series.str.contains.html?highlight=contains#pandas.Series.str.contains
小的示例
import pandas as pd
df = {'地址':['北京','上海','長沙','北京省會','廣州市區'],'table':['user','student','course','sc','book']}
df = pd.DataFrame(df)
print(df)
print('================')
citys = ['北京', '天津', '上海']
address = '|'.join(citys)
df_new = df[df['地址'].str.contains(address)] #包含對應關鍵字
print(df_new)
- 相關閱讀
- 留言板留言板V7.0
- 如何讓百度、Google收錄你的站點
- chrome谷歌瀏覽器中的谷歌翻譯有問題一鍵修復處理
- iframe里阻止_blank彈出新窗口的方法
- 網站管理后臺
- 還在備案期間是否可以提前購買系統?
- ASP利用fso讀取文件夾里所有文件的名字
- ASP鏈接地址欄參數的加密
- 共有0條關于《Python pandas刪除指定行/列數據的方法實例》的評論
- 發表評論
您發布的評論即表示同意遵守以下條款:
一、不得利用本站危害國家安全、泄露國家秘密,不得侵犯國家、社會、集體和公民的合法權益;
二、不得發布國家法律、法規明令禁止的內容;互相尊重,對自己在本站的言論和行為負責;
三、本站對您所發布內容擁有處置權。
- 更多>>同類信息
- Android移動端自動化測試:使用UIAutomatorViewer與Selenium定位元素
- python通過代碼修改pip下載源讓下載庫飛起
- python里面requests.post返回的res.text還有其它的嗎
- windows7環境下安裝配置jdk
- python對微信操作要用到這兩個庫wxpy與itchat
- 8種Python字符串拼接的方法,你知道幾種
- 更多>>最新添加文章
- dw里面查找替換使用正則刪除sqlserver里面的CONSTRAINT
- Android移動端自動化測試:使用UIAutomatorViewer與Selenium定位元素
- 抖音直播音掛載小雪花 懂車帝小程序
- javascript獲取瀏覽器指紋可以用來做投票
- 火狐Mozilla Firefox出現:無法載入您的Firefox配置文件 它可能已經丟失 或是無法訪問 問題解決集合處理辦法
- 在Android、iOS、Windows、MacOS中微信小程序的文件存放路徑
- python通過代碼修改pip下載源讓下載庫飛起
- python里面requests.post返回的res.text還有其它的嗎