2019年10月15日 星期二

要抓網路表格,取原始碼的哪個table或id(Python爬蟲)




如標題,

重點在於,使用Chrome瀏覽器,在要抓取的表格上,使用右鍵「檢查」,可以得知表格的原

始碼所在位置。

往上找,找到table的tag name和css或者是id 的定位資料。就可以定位table位置。

在往table的原始碼找,先找到<tr>,可以知道rows的內容。

在往rows的原始碼找,可以找到<td>,就可以知道columns的內容。

-----------------------------------------------------------------------------------------------
02 用Requests下載資料與用BeautifulSoup切割資料

03 用BeautifulSoup切割DIV與TD的資料

沒有留言:

張貼留言