python上市櫃三大法人買賣超日報資料下載 - 程式設計不分區

c_c_lai

博士班 Rank: 6 Rank: 6

帖子: 2035
主題: 24
精華: 0
積分: 2031
點名: 0
作業系統: Win7
軟體版本: Office2010
閱讀權限: 100
性別: 男
註冊時間: 2012-3-22
最後登錄: 2024-2-1

62^#

發表於 2016-9-11 07:03 | 只看該作者

回復 61# zyzzyva
請教 print(d.text) 它會從哪裡顯示結果？
我按了 Shift Enter 後即石沉大海，謝謝你！

帖子: 109
主題: 1
精華: 0
積分: 116
點名: 0
作業系統: win7
軟體版本: 2007
閱讀權限: 20
註冊時間: 2016-8-4
最後登錄: 2018-10-22

論壇榮譽勳章論壇贊助勳章

63^#

發表於 2016-9-11 08:04 | 只看該作者

本帖最後由 zyzzyva 於 2016-9-11 08:06 編輯

回復 62# c_c_lai
石沉大海...因為真的沒有資料XD
不知道為啥程式碼貼上的時候論壇系統會修改，下面這段
data = soup.find_all('tr',['tb__a', 'tb__b'])，應該是

修改一下應該就正常了。

c_c_lai

博士班 Rank: 6 Rank: 6

帖子: 2035
主題: 24
精華: 0
積分: 2031
點名: 0
作業系統: Win7
軟體版本: Office2010
閱讀權限: 100
性別: 男
註冊時間: 2012-3-22
最後登錄: 2024-2-1

64^#

發表於 2016-9-11 08:31 | 只看該作者

回復 63# zyzzyva
感謝！終於石榴開花了！

速度非常快，再來多個好範例學習學習。
謝謝囉！

帖子: 109
主題: 1
精華: 0
積分: 116
點名: 0
作業系統: win7
軟體版本: 2007
閱讀權限: 20
註冊時間: 2016-8-4
最後登錄: 2018-10-22

論壇榮譽勳章論壇贊助勳章

65^#

發表於 2016-9-11 08:42 | 只看該作者

本帖最後由 zyzzyva 於 2016-9-11 08:45 編輯

到這邊離GBKEE版大爬到的詳細資料還有相當距離。
我們的下一步應該是要取得頁面中各教會的連結：

import requests
from bs4 import BeautifulSoup
s = requests.session()
for i in range(11,13):
url = 'http://church.oursweb.net/slocation.php?w=1&c=TW&a=&t=&p=' + str(i)
res = s.get(url)
res.encoding = 'utf-8'
soup = BeautifulSoup(res.text, 'lxml')
#--------下面改成這樣以取出頁面中各教會的連結
for d in soup.select('a[href^="church.php?pkey"]'):
myUrl = 'http://church.oursweb.net/' + d.get('href')
print(myUrl) #先把連結印出來測試一下
#get_detail(myUrl,s) 之後用個function處理頁面中的資料
i += 1

複製代碼

再來就是要弄個function，看了一下網頁，這裡應該是比較麻煩的地方。

帖子: 109
主題: 1
精華: 0
積分: 116
點名: 0
作業系統: win7
軟體版本: 2007
閱讀權限: 20
註冊時間: 2016-8-4
最後登錄: 2018-10-22

論壇榮譽勳章論壇贊助勳章

66^#

發表於 2016-9-11 08:43 | 只看該作者

回復 64# c_c_lai
這個我會做比較完整的，目標是像GBKEE版大抓下來的各教會的詳細資料。

c_c_lai

博士班 Rank: 6 Rank: 6

帖子: 2035
主題: 24
精華: 0
積分: 2031
點名: 0
作業系統: Win7
軟體版本: Office2010
閱讀權限: 100
性別: 男
註冊時間: 2012-3-22
最後登錄: 2024-2-1

67^#

發表於 2016-9-11 09:00 | 只看該作者

回復 66# zyzzyva

靜觀其變，先謝謝囉！
其實我個人也蠻希望如此窮追不捨地去尋根。