上次參加COSCUP 2014時候,電腦不只會幫你選土豆,還會幫你選新聞
最近無聊做個小實驗
使用requests、BeautifulSoup實作抓資料存成json
結果發現不會太難
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| from selenium import webdriver from bs4 import BeautifulSoup import requests import re import json
#browser = webdriver.Firefox() #browser.get("/* url */") #html_source = browser.page_source
soup = BeautifulSoup(requests.get("/* url */").text)
fp = open("/* you can not know it o.< */","w+") fp.write(json.dumps(b)) fp.close()
|
selenium通常是用來程式測試上面
但也可以抓取網頁HTML
通常用爬蟲requests和beautifulsoup就夠方便了XD