.進階封包分析技巧,掌握數據來源熟悉度。
.逐步說明的實戰範例,輕鬆學會網站爬蟲技巧。
.清楚分類網站類型,系統性了解網站全貌。
.多語言開發技巧,快速提升程式開發能力。
.多元開發技巧,節省自行搜尋與研究時間。
本書著重多語言操作應用(Excel VBA、Python、JavaScript)與多解法開發爬蟲程式、網路封包側錄分析、網站資料尋找分析,有別於坊間爬蟲書籍僅以Python作為爬蟲操作語言與單一方式解決問題的作法。
著重原理與觀念,多角度學習,效果更佳
承襲《Excel VBA 實戰技巧|金融數據x網路爬蟲》中提過的觀念,「爬蟲原理與觀念通了,任何程式語言都可以做爬蟲程式」與多元開發的精神。本書在加入Python後,並以Python常見的爬蟲模組來解決同一個爬蟲問題,讓讀者可從多角度去學習Python與爬蟲程式的開發技巧。
JavsScript加密混淆破解技法大公開
JavaScript對於網頁是非常重要的腳本語言,而讀者遇到以JavaScript做加密、混淆、美化等技巧的網頁,往往就望之興嘆無法再進行分析與開發爬蟲,藉由Excel VBA、Python對JavaScript操作範例練習,讓讀者面對相關網頁不再裹足不前。
針對封包側錄與發送過程進行詳細的探討與解說
封包分析是開發爬蟲程式最重要的一環,若封包側錄、分析、發送等環節出錯,將會導致開發爬蟲程式出現嚴重錯誤,陷入「一步錯步步錯」的窘境,要解決此問題就必須對封包發送內容能清楚掌握,本書針對封包側錄與發送過程進行詳細的探討與解說,透過工具設定與操作,明確封包內容資訊,進一步提升爬蟲分析能力。
分析網站資料產生的流程,分成網頁操作、封包側錄與分析、連線測試等階段,將每個階段的特徵記錄、整理、歸納而成「網頁操作分析表」,讓讀者在分析網站能一目了然網頁全貌,可避免分析了後面忘了前面的分析,導致開發爬蟲程式遺漏了關鍵步驟而造成無法抓取網頁資料。
各界推薦
國立政治大學應用數學系副教授 蔡炎龍
Tivo168教你Excel輕鬆投資理財 Tivo Chang
算利教官 楊禮軒
- 基礎篇(第1頁)
- 01 Python 環境安裝與指令操作(第2頁)
- 02 Python 開發環境(第32頁)
- 03 Excel 與 Python 相互操作(第100頁)
- 04 Excel VBA、Python 與腳本語言 操作(第145頁)
- 05 側錄發送封包(第188頁)
- 實戰篇(第225頁)
- 01 全家超商門市(第226頁)
- 02 證交所三大法人(第261頁)
- 03 Investing 美元指數(第317頁)
- 04 Goodinfo 個股外資持股比例(第353頁)
- 05 公開資訊觀測站:重大訊息(第398頁)
- 06 鉅亨網台股股價創新高(第435頁)
- 07 投信投顧公會基金投資明細 - 月前十大(第468頁)
- 08 PTT 八卦版標題與文章連結(第502頁)
- 09 MacroMicro 財經 M 平方(第549頁)
- 10 行政院主計處經濟成長率(第587頁)
紙本書 NT$ 750
單本電子書
NT$
750
同分類熱門書