書名:文科生也學得會的網路爬蟲:Excel VBA + Web Scraper
原文書名:
產品代碼:
9789863126188系列編號:
F0362定價:
599元作者:
陳會安頁數:
624頁開數:
23x17x2.8裝訂:
平裝上市日:
20200305出版日:
20200305出版社:
旗標科技股份有限公司CIP:
312市場分類:
電腦資訊產品分類:
書籍免稅聯合分類:
電腦資訊類- ※在庫量小
商品簡介
★學會用「網路爬蟲」蒐集資料,告別苦力又傷眼的「複製、貼上」!★
在網路發達的時代,整個網路就像是一個大型資料庫,不論是想進行商品比價、想預測股價的漲跌趨勢、想知道競爭者的商品資訊、想了解社群網站的熱門議題,再搭配時事來規劃行銷活動、想透過匯率走勢預測何時可以低價買進美金或日幣、……等等,都可以從相關網站取得資料。
雖然取得資料不難,但是要如何將這些大量、雜亂的資料抓取下來並整理成有用的資訊,就是一門學問了。如果還不懂得運用「網路爬蟲」,就只能慢慢地複製、貼上資料了!
★徹底解析網頁結構,精確爬取目標資料不卡關★
為了幫助您學習網路爬蟲,本書使用 Chrome 瀏覽器的 Web Scraper 擴充功能,讓您不用撰寫任何程式碼,就能夠輕鬆爬取約七成以上的網站資料,而且透過 Web Scraper 工具,還可以幫您一邊爬取資料一邊學習 HTML 標籤+ CSS選擇器,精確爬取目標資料,並從實作中了解 Web 網站的各種巡覽結構。
★互動式網頁資料也能抓!★
雖然 Web Scraper 能夠爬取大多數的網站資料,但是對於 JavaScript、AJAX 技術等互動式的網頁資料,就不易直接爬取回來。我們將教您使用 Excel VBA+IE瀏覽器自動化來爬取互動網站,還可以建立 Excel VBA+Selenium 網路爬蟲程式,讓您在網頁上看得到資料,就能夠爬得到資料。
★找出有意義的指標,做出最佳決策!★
最後,我們還將介紹如何用Excel內建功能,進行「資料清理」及「資料視覺化」,讓您充份掌握資訊,迅速做出最佳的決策。
本書特色:
►►► 以 Step by Step 的方式,解說 Web Scraper 爬取資料的過程,消除初學者對寫程式的恐懼!
►►► 以生活化的例子帶領初學者實際用 Web Scraper 爬取資料,例如:足球聯賽成績、本週電影資訊、全國電子門市資料、NBA 球員資料、各城市空氣品質與天氣資訊、股價資訊、匯率、……等,建立初學者的自信及成就感。
►►► 教您使用 Chrome 的擴充功能,快速判別網頁內容是 AJAX 技術還是 JavaScript 產生的動態網頁,以便精確爬取目標資料。
►►► 以豐富的實作案例,帶您建立 Excel VBA 程式爬取 JavaScript 產生的動態網頁及使用者互動的網站。
★學會用「網路爬蟲」蒐集資料,告別苦力又傷眼的「複製、貼上」!★
在網路發達的時代,整個網路就像是一個大型資料庫,不論是想進行商品比價、想預測股價的漲跌趨勢、想知道競爭者的商品資訊、想了解社群網站的熱門議題,再搭配時事來規劃行銷活動、想透過匯率走勢預測何時可以低價買進美金或日幣、……等等,都可以從相關網站取得資料。
雖然取得資料不難,但是要如何將這些大量、雜亂的資料抓取下來並整理成有用的資訊,就是一門學問了。如果還不懂得運用「網路爬蟲」,就只能慢慢地複製、貼上資料了!
★徹底解析網頁結構,精確爬取目標資料不卡關★
為了幫助您學習網路爬蟲,本書使用 Chrome 瀏覽器的 Web Scraper 擴充功能,讓您不用撰寫任何程式碼,就能夠輕鬆爬取約七成以上的網站資料,而且透過 Web Scraper 工具,還可以幫您一邊爬取資料一邊學習 HTML 標籤+ CSS選擇器,精確爬取目標資料,並從實作中了解 Web 網站的各種巡覽結構。
★互動式網頁資料也能抓!★
雖然 Web Scraper 能夠爬取大多數的網站資料,但是對於 JavaScript、AJAX 技術等互動式的網頁資料,就不易直接爬取回來。我們將教您使用 Excel VBA+IE瀏覽器自動化來爬取互動網站,還可以建立 Excel VBA+Selenium 網路爬蟲程式,讓您在網頁上看得到資料,就能夠爬得到資料。
★找出有意義的指標,做出最佳決策!★
最後,我們還將介紹如何用Excel內建功能,進行「資料清理」及「資料視覺化」,讓您充份掌握資訊,迅速做出最佳的決策。
本書特色:
►►► 以 Step by Step 的方式,解說 Web Scraper 爬取資料的過程,消除初學者對寫程式的恐懼!
►►► 以生活化的例子帶領初學者實際用 Web Scraper 爬取資料,例如:足球聯賽成績、本週電影資訊、全國電子門市資料、NBA 球員資料、各城市空氣品質與天氣資訊、股價資訊、匯率、……等,建立初學者的自信及成就感。
►►► 教您使用 Chrome 的擴充功能,快速判別網頁內容是 AJAX 技術還是 JavaScript 產生的動態網頁,以便精確爬取目標資料。
►►► 以豐富的實作案例,帶您建立 Excel VBA 程式爬取 JavaScript 產生的動態網頁及使用者互動的網站。
作者簡介
書籍目錄
第一篇:免寫程式學網路爬蟲:邊爬邊學 HTML 標籤+ CSS 選擇器
Ch01 認識網路爬蟲、HTML 和 CSS
Ch02 爬取 HTML 標題、段落與文字格式標籤
Ch03 爬取清單項目和表格標籤
Ch04 爬取圖片和超連結標籤
Ch05 爬取 HTML 容器和版面配置標籤
Ch06 爬取階層選單和上、下頁巡覽的網站
Ch07 爬取頁碼、「更多」按鈕和捲動頁面巡覽的網站
Ch08 免寫程式網路爬蟲實戰:新聞、商務和金融數據爬取
第二篇:Excel VBA 網路爬蟲:網路資料擷取實戰
Ch09 認識網頁技術及 Excel VBA 網路爬蟲
Ch10 建立 Excel VBA 爬蟲程式
Ch11 Excel VBA 爬蟲的資料擷取方法
Ch12 用 Excel VBA 爬取 AJAX 網頁與 Web API
Ch13 用 VBA 控制 IE 瀏覽器及使用 Selenium 爬取互動網頁
Ch14 Excel VBA 爬蟲實戰:Web API、AJAX 與互動網頁資料爬取
第三篇:Excel 資料分析:資料清理與資料視覺化
Ch15 Excel 資料清理
Ch16 在 Excel 中進行「資料視覺化」
附錄 A Excel VBA 程式設計入門
附錄 B 離線安裝本書使用的 Chrome 擴充功能