竹内纱里奈和大战黑人_欧美成人黄色小视频_91福利影视_欧美在线观看视频网站_h色网站免费观看_97综合

極客小將

您現在的位置是:首頁 » python編程資訊

資訊內容

Python介紹嵌套 JSON 秒變 Dataframe!

極客小將2021-01-17-
簡介Python教程欄目介紹如何嵌套JSON推薦(免費):Python教程調用API和文檔數據庫會返回嵌套的JSON對象,當我們使用Python嘗試將嵌套結構中的鍵轉換為列時,數據加載到pandas中往往會得到如下結果:df=pd.DataFrame.from_records(results[“issu
python教程欄目介紹如何嵌套JSONK8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

推薦(免費):python教程K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

調用API和文檔數據庫會返回嵌套的JSON對象,當我們使用Python嘗試將嵌套結構中的鍵轉換為列時,數據加載到pandas中往往會得到如下結果:K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

df = pd.DataFrame.from_records(results [“ issues”],columns = [“ key”,“ fields”])說明:這里results是一個大的字典,issues是results其中的一個鍵,issues的值為一個嵌套JSON對象字典的列表,后面會看到JSON嵌套結構。

問題在于API返回了嵌套的JSON結構,而我們關心的鍵在對象中確處于不同級別。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

嵌套的JSON結構張成這樣的。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

而我們想要的是下面這樣的。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

下面以一個API返回的數據為例,API通常包含有關字段的元數據。假設下面這些是我們想要的字段。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

key:JSON密鑰,在第一級的位置。summary:第二級的“字段”對象。status name:第三級位置。statusCategory name:位于第4個嵌套級別。

如上,我們選擇要提取的字段在issues列表內的JSON結構中分別處于4個不同的嵌套級別,一環扣一環。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

{ "expand": "schema,names", "issues": [ { "fields": { "issuetype": { "avatarId": 10300, "description": "", "id": "10005", "name": "New Feature", "subtask": False }, "status": { "description": "A resolution has been taken, and it is awaiting verification by reporter. From here issues are either reopened, or are closed.", "id": "5", "name": "Resolved", "statusCategory": { "colorName": "green", "id": 3, "key": "done", "name": "Done", } }, "summary": "Recovered data collection Defraglar $MFT problem" }, "id": "11861", "key": "CAE-160", }, { "fields": { ... more issues], "maxResults": 5, "startAt": 0, "total": 160 }

一個不太好的解決方案K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

一種選擇是直接擼碼,寫一個查找特定字段的函數,但問題是必須對每個嵌套字段調用此函數,然后再調用.apply到DataFrame中的新列。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

為獲取我們想要的幾個字段,首先我們提取fields鍵內的對象至列:K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

df = ( df["fields"] .apply(pd.Series) .merge(df, left_index=True, right_index = True) )

從上表看出,只有summary是可用的,issuetype、status等仍然埋在嵌套對象中。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

下面是提取issuetype中的name的一種方法。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

# 提取issue type的name到一個新列叫"issue_type" df_issue_type = ( df["issuetype"] .apply(pd.Series) .rename(columns={"name": "issue_type_name"})["issue_type_name"] ) df = df.assign(issue_type_name = df_issue_type)

像上面這樣,如果嵌套層級特別多,就需要自己手擼一個遞歸來實現了,因為每層嵌套都需要調用一個像上面解析并添加到新列的方法。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

對于編程基礎薄弱的朋友,手擼一個其實還挺麻煩的,尤其是對于數據分析師,著急想用數據的時候,希望可以快速拿到結構化的數據進行分析。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

下面東哥分享一個pandas的內置解決方案。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

內置的解決方案K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

pandas中有一個牛逼的內置功能叫 .json_normalize。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

pandas的文檔中提到:將半結構化JSON數據規范化為平面表。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

前面方案的所有代碼,用這個內置功能僅需要3行就可搞定。步驟很簡單,懂了下面幾個用法即可。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

確定我們要想的字段,使用 . 符號連接嵌套對象。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

將想要處理的嵌套列表(這里是results["issues"])作為參數放進 .json_normalize 中。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

過濾我們定義的FIELDS列表。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

FIELDS = ["key", "fields.summary", "fields.issuetype.name", "fields.status.name", "fields.status.statusCategory.name"] df = pd.json_normalize(results["issues"]) df[FIELDS]

沒錯,就這么簡單。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

其它操作K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

記錄路徑K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

除了像上面那樣傳遞results["issues"]列表之外,我們還使用record_path參數在JSON對象中指定列表的路徑。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

# 使用路徑而不是直接用results["issues"] pd.json_normalize(results, record_path="issues")[FIELDS]

自定義分隔符K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

還可以使用sep參數自定義嵌套結構連接的分隔符,比如下面將默認的“.”替換“-”。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

### 用 "-" 替換默認的 "." FIELDS = ["key", "fields-summary", "fields-issuetype-name", "fields-status-name", "fields-status-statusCategory-name"] pd.json_normalize(results["issues"], sep = "-")[FIELDS]

控制遞歸K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

如果不想遞歸到每個子對象,可以使用max_level參數控制深度。在這種情況下,由于statusCategory.name字段位于JSON對象的第4級,因此不會包含在結果DataFrame中。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

# 只深入到嵌套第二級 pd.json_normalize(results, record_path="issues", max_level = 2)

下面是.json_normalize的pandas*方文檔說明,如有不明白可自行學習,本次東哥就介紹到這里。K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

pandas*方文檔:https://pandas.pydata.org/pan...

以上就是Python介紹嵌套 JSON 秒變 Dataframe!的詳細內容,更多請關注少兒編程網其它相關文章!K8Y少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

預約試聽課

已有385人預約都是免費的,你也試試吧...

主站蜘蛛池模板: 色69av | 日韩中文字幕在线视频 | 99久草| 91网站在线看 | 在线小视频 | 亚洲视频在线观看网站 | 范冰冰一级做a爰片久久毛片 | 亚洲精品国产成人 | 韩日av片| 91在线一区二区 | 高清久久| 日韩在线观看网站 | 欧美日韩成人在线观看 | 成人区精品一区二区婷婷 | 精品欧美乱码久久久久久1区2区 | 免费成人一级片 | 亚洲国产一区二区三区, | 免费在线日韩av | 免费看成年人视频在线观看 | 亚洲区一区二区 | 欧美成人一区二区三区片免费 | 久久国产精品久久久久久 | 男女视频免费 | 精精国产xxxx视频在线播放 | 午夜精品久久 | 韩国三级日本三级少妇99 | 精品无人乱码一区二区三区 | 日韩欧美精品一区 | 国产高清av在线 | 欧美日韩第一区 | 日本九九视频 | 欧美xx网站| 一区二区三区在线观看国产 | 色婷婷综合久久久中字幕精品久久 | 国产精品久久久久永久免费观看 | 日韩欧美在线观看视频网站 | 九九热精品在线观看 | 欧美日韩一区二区三区在线视频 | 欧美婷婷色 | 欧美精品1区2区3区 91久久精品一区二区 | 九九香蕉视频 |