AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 軟件

一日一技:爬蟲如何解析JavaScript Object?

來源: 責編: 時間:2023-10-28 16:30:17 289觀看
導讀我們在開發爬蟲的過程中,經常發現有一些網站,會直接把數據放到HTML中的<script>標簽里面。這些數據長得有點像JSON,但又有差異,如下圖所示:圖片這種格式,我們叫做JavaScript Object。長得很像Python的字典,又很像是JSON。但

我們在開發爬蟲的過程中,經常發現有一些網站,會直接把數據放到HTML中的<script>標簽里面。這些數據長得有點像JSON,但又有差異,如下圖所示:6dt28資訊網——每日最新資訊28at.com

圖片圖片6dt28資訊網——每日最新資訊28at.com

這種格式,我們叫做JavaScript Object。長得很像Python的字典,又很像是JSON。但是這個格式在Python里面,無論直接當字典解析,還是當JSON解析,都會報錯,如下圖所示:6dt28資訊網——每日最新資訊28at.com

圖片圖片6dt28資訊網——每日最新資訊28at.com

遇到這種情況,有同學準備使用正則表達式來解析,又有同學直接放棄。6dt28資訊網——每日最新資訊28at.com

但實際上,這種數據結構,使用Yaml是可以直接解析成Python的字典。我們首先來安裝一下Yaml:6dt28資訊網——每日最新資訊28at.com

pip install pyyaml

然后直接像解析JSON一樣解析:6dt28資訊網——每日最新資訊28at.com

import yamldata = '''{    name: '青南',    salary: 999999999,    address: '上海',    pro: true}'''info = yaml.safe_load(data)

運行效果如下圖所示,已經直接解析成了Python的字典:6dt28資訊網——每日最新資訊28at.com

圖片圖片6dt28資訊網——每日最新資訊28at.com

Yaml格式是JSON格式的超集,因此,使用pyyaml庫也能直接解析正常的JSON:6dt28資訊網——每日最新資訊28at.com

圖片圖片6dt28資訊網——每日最新資訊28at.com

甚至各種復雜的混合格式也能正常解析:6dt28資訊網——每日最新資訊28at.com

圖片圖片圖片6dt28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-26-15576-0.html一日一技:爬蟲如何解析JavaScript Object?

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 開始學習Go編程

下一篇: Go的單元測試進階:Mock與Stub的使用

標簽:
  • 熱門焦點
Top