AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 軟件

四個解決特定的任務(wù)的Pandas高效代碼

來源: 責(zé)編: 時間:2023-12-04 17:25:59 274觀看
導(dǎo)讀在本文中,我將分享4個在一行代碼中完成的Pandas操作。這些操作可以有效地解決特定的任務(wù),并以一種好的方式給出結(jié)果。從列表中創(chuàng)建字典我有一份商品清單,我想看看它們的分布情況。更具體地說:希望得到唯一值以及它們在列

在本文中,我將分享4個在一行代碼中完成的Pandas操作。這些操作可以有效地解決特定的任務(wù),并以一種好的方式給出結(jié)果。vPM28資訊網(wǎng)——每日最新資訊28at.com

vPM28資訊網(wǎng)——每日最新資訊28at.com

從列表中創(chuàng)建字典

我有一份商品清單,我想看看它們的分布情況。更具體地說:希望得到唯一值以及它們在列表中出現(xiàn)的次數(shù)。vPM28資訊網(wǎng)——每日最新資訊28at.com

Python字典是以這種格式存儲數(shù)據(jù)的好方法。鍵將是字典,值是出現(xiàn)的次數(shù)。vPM28資訊網(wǎng)——每日最新資訊28at.com

這里可以使用value_counts和to_dict函數(shù),這項任務(wù)可以在一行代碼中完成。vPM28資訊網(wǎng)——每日最新資訊28at.com

這里有一個簡單的例子來說明這種情況:vPM28資訊網(wǎng)——每日最新資訊28at.com

import pandas as pd  grades = ["A", "A", "B", "B", "A", "C", "A", "B", "C", "A"]  pd.Series(grades).value_counts().to_dict()  # output {'A': 5, 'B': 3, 'C': 2}

將列表轉(zhuǎn)換為Pandas Series,這是Pandas的一維數(shù)據(jù)結(jié)構(gòu),然后應(yīng)用value_counts函數(shù)來獲得在Series中出現(xiàn)頻率的唯一值,最后將輸出轉(zhuǎn)換為字典。這個操作非常高效且易于理解。vPM28資訊網(wǎng)——每日最新資訊28at.com

從JSON文件創(chuàng)建DataFrame

JSON是一種常用的存儲和傳遞數(shù)據(jù)的文件格式。vPM28資訊網(wǎng)——每日最新資訊28at.com

當我們清理、處理或分析數(shù)據(jù)時,我們通常更喜歡使用表格格式(或類似表格的數(shù)據(jù))。由于json_normalize函數(shù),我們可以通過一個操作從json格式的對象創(chuàng)建Pandas DataFrame。vPM28資訊網(wǎng)——每日最新資訊28at.com

假設(shè)數(shù)據(jù)存儲在一個名為data的JSON文件中。一般情況我們都是這樣讀取:vPM28資訊網(wǎng)——每日最新資訊28at.com

import json  with open("data.json") as f:     data = json.load(f)  data # output {'data': [{'id': 101,    'category': {'level_1': 'code design', 'level_2': 'method design'},    'priority': 9},  {'id': 102,    'category': {'level_1': 'error handling', 'level_2': 'exception logging'},    'priority': 8}]}

如果我們將這個變量傳遞給DataFrame構(gòu)造函數(shù),它將創(chuàng)建如下的DataFrame,這絕對不是一個可用的格式:vPM28資訊網(wǎng)——每日最新資訊28at.com

df = pd.DataFrame(data)

vPM28資訊網(wǎng)——每日最新資訊28at.com

但是如果我們使用json_normalize函數(shù)將得到一個整潔的DataFrame格式:vPM28資訊網(wǎng)——每日最新資訊28at.com

df = pd.json_normalize(data, "data")

vPM28資訊網(wǎng)——每日最新資訊28at.com

Explode函數(shù)

如果有一個與特定記錄匹配的項列表。需要重新格式化它,為該列表中的每個項目提供單獨的行。vPM28資訊網(wǎng)——每日最新資訊28at.com

vPM28資訊網(wǎng)——每日最新資訊28at.com

這是一個經(jīng)典的行分割成列的問題。有許多的不同的方法來解決這個任務(wù)。其中最簡單的一個(可能是最簡單的)是Explode函數(shù)。vPM28資訊網(wǎng)——每日最新資訊28at.com

我們以這個df為例vPM28資訊網(wǎng)——每日最新資訊28at.com

vPM28資訊網(wǎng)——每日最新資訊28at.com

使用explosion函數(shù)并指定列名:vPM28資訊網(wǎng)——每日最新資訊28at.com

df_new = df.explode(column="data").reset_index(drop=True)

vPM28資訊網(wǎng)——每日最新資訊28at.com

reset_index會為DataFrame分配一個新的整數(shù)索引。vPM28資訊網(wǎng)——每日最新資訊28at.com

combine_first函數(shù)

combine_first函數(shù)用于合并兩個具有相同索引的數(shù)據(jù)結(jié)構(gòu)。vPM28資訊網(wǎng)——每日最新資訊28at.com

它最主要的用途是用一個對象的非缺失值填充另一個對象的缺失值。這個函數(shù)通常在處理缺失數(shù)據(jù)時很有用。在這方面,它的作用與SQL中的COALESCE函數(shù)相同。vPM28資訊網(wǎng)——每日最新資訊28at.com

df = pd.DataFrame(    {         "A": [None, 0, 12, 5, None],          "B": [3, 4, 1, None, 11]    } )

vPM28資訊網(wǎng)——每日最新資訊28at.com

我們需要a列中的數(shù)據(jù)。如果有一行缺少值(即NaN),用B列中同一行的值填充它。vPM28資訊網(wǎng)——每日最新資訊28at.com

df["A"].combine_first(df["B"])  # output 0     3.0 1     0.0 2    12.0 3     5.0 4    11.0 Name: A, dtype: float64

可以看到的列A的第一行和最后一行取自列B。vPM28資訊網(wǎng)——每日最新資訊28at.com

如果我們想要使用3列,我們可以鏈接combine_first函數(shù)。下面的代碼行首先檢查列a。如果有一個缺失的值,它從列B中獲取它。如果列B中對應(yīng)的行也是NaN,那么它從列C中獲取值。vPM28資訊網(wǎng)——每日最新資訊28at.com

df["A"].combine_first(df["B"]).combine_first(df["C"])

我們還可以在DataFrame級別使用combine_first函數(shù)。在這種情況下,所有缺失的值都從第二個DataFrame的相應(yīng)值(即同一行,同列)中填充。vPM28資訊網(wǎng)——每日最新資訊28at.com

df1 = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8]}, index=['a', 'b', 'c', 'd']) df2 = pd.DataFrame({'A': [10, np.nan, 30, 40], 'B': [50, 60, np.nan, 80]}, index=['a', 'b', 'c', 'd']) result_df = df1.combine_first(df2)

在合并的過程中,df1 中的非缺失值填充了 df2 中對應(yīng)位置的缺失值。這有助于處理兩個數(shù)據(jù)集合并時的缺失值情況。vPM28資訊網(wǎng)——每日最新資訊28at.com

Merged DataFrame:       A     B a   1.0   5.0 b   2.0  60.0 c  30.0   7.0 d   4.0   8.0

總結(jié)

從計算簡單的統(tǒng)計數(shù)據(jù)到高度復(fù)雜的數(shù)據(jù)清理過程,Pandas都可以快速解決任務(wù)。上面的代碼可能不會經(jīng)常使用,但是當你需要處理這種任務(wù)時,它們是非常好的解決辦法。vPM28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-26-37666-0.html四個解決特定的任務(wù)的Pandas高效代碼

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 深入淺出JavaScript異步編程

下一篇: 開發(fā)者必備的五類AI工具,不容錯過!

標簽:
  • 熱門焦點
  • 一加Ace2 Pro真機揭曉 鈦空灰配色質(zhì)感拉滿

    終于,在經(jīng)過了幾波預(yù)熱之后,一加Ace2 Pro的外觀真機圖在網(wǎng)上出現(xiàn)了。還是博主數(shù)碼閑聊站曝光的,這次的外觀設(shè)計還是延續(xù)了一加11的方案,只是細節(jié)上有了調(diào)整,例如新加入了鈦空灰
  • Mate60手機殼曝光 致敬自己的經(jīng)典設(shè)計

    8月3日消息,今天下午博主數(shù)碼閑聊站帶來了華為Mate60的第三方手機殼圖,可以讓我們在真機發(fā)布之前看看這款華為全新旗艦的大致輪廓。從曝光的圖片看,Mate 60背后攝像頭面積依然
  • 得物效率前端微應(yīng)用推進過程與思考

    一、背景效率工程隨著業(yè)務(wù)的發(fā)展,組織規(guī)模的擴大,越來越多的企業(yè)開始意識到協(xié)作效率對于企業(yè)團隊的重要性,甚至是決定其在某個行業(yè)競爭中突圍的關(guān)鍵,是企業(yè)長久生存的根本。得物
  • JavaScript學(xué)習(xí) -AES加密算法

    引言在當今數(shù)字化時代,前端應(yīng)用程序扮演著重要角色,用戶的敏感數(shù)據(jù)經(jīng)常在前端進行加密和解密操作。然而,這樣的操作在網(wǎng)絡(luò)傳輸和存儲中可能會受到惡意攻擊的威脅。為了確保數(shù)據(jù)
  • 虛擬鍵盤 API 的妙用

    你是否在遇到過這樣的問題:移動設(shè)備上有一個固定元素,當激活虛擬鍵盤時,該元素被隱藏在了鍵盤下方?多年來,這一直是 Web 上的默認行為,在本文中,我們將探討這個問題、為什么會發(fā)生
  • 簽約井川里予、何丹彤,單視頻點贊近千萬,MCN黑馬永恒文希快速崛起!

    來源:視聽觀察永恒文希傳媒作為一家MCN公司,說起它的名字來,可能大家會覺得有點兒陌生,但是說出來下面一串的名字之后,或許大家就會感到震驚,原來這么多網(wǎng)紅,都簽約這家公司了。根
  • 消息稱小米汽車開始篩選交付中心:需至少120個車位

    IT之家 7 月 7 日消息,日前,有微博簡介為“汽車行業(yè)從業(yè)者、長三角一體化擁護者”的微博用戶 @長三角行健者 發(fā)文表示,據(jù)經(jīng)銷商集團反饋,小米汽車目前
  • Windows 11發(fā)布,微軟一改往常對老機型開放的態(tài)度

    距離 Windows 11 發(fā)布已經(jīng)過去一周,在過去一周里,很多數(shù)碼愛好者圍繞其對 Android 應(yīng)用的支持、對老機型的升級問題展開了激烈討論。與以往不同的是,在這次大
  • 蘋果140W USB-C充電器:采用氮化鎵技術(shù)

    據(jù)10 月 30 日 9to5 Mac 消息報道,當蘋果推出新的 MacBook Pro 2021 時,該公司還推出了新的 140W USB-C 充電器,附贈在 MacBook Pro 16 英寸機型的盒子里,也支
Top