書名:Python資料科學學習手冊 第二版
原文書名:Python Data Science Handbook, 2nd Edition
產品代碼:
9786263246843系列名稱:
程式設計/APP開發系列編號:
A727定價:
980元作者:
Jake VanderPlas譯者:
何敏煌頁數:
576頁開數:
18.5x23x2.88裝訂:
平裝上市日:
20231206出版日:
20231206出版社:
歐萊禮CIP:
略市場分類:
電腦資訊產品分類:
書籍免稅聯合分類:
電腦資訊類- ※在庫量小
商品簡介
處理大量資料的基本工具
「這本書提供了清晰且易於遵循的範例,幫助您設置與使用最重要的資料科學和機器學習工具。」
—Anne Bonner
Content Simplicity創辦人和CEO
Python是許多研究人員的首選工具,它擁有豐富的儲存、操作及洞察資料的程式庫。這些資源散布在資料科學的領域中,藉由本書,您可以一次獲得這些資源,包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn和其它相關的工具。
對於熟悉Python,需要處理大量資料的資料科學家和資料處理人員來說,這是一本非常有價值的案頭書。可以有效率地處理每天面對的問題,像是操作、轉換及清理資料,視覺化不同形式的資料,建立統計學或機器學習模型等。
藉由本書,你將可以學習到:
•IPython和Jupyter:提供資料科學家使用的Python計算環境
•NumPy:在Python中進行高效儲存及操作密集資料陣列的ndarrys
•Pandas:在Python中進行對於標籤式/欄位式的資料高效率儲存與操作
•Matplotlib:在Python中進行彈性範圍的資料視覺化功能
•Scikit-Learn:提供機器學習演算法以及簡潔的Python實作
處理大量資料的基本工具
「這本書提供了清晰且易於遵循的範例,幫助您設置與使用最重要的資料科學和機器學習工具。」
—Anne Bonner
Content Simplicity創辦人和CEO
Python是許多研究人員的首選工具,它擁有豐富的儲存、操作及洞察資料的程式庫。這些資源散布在資料科學的領域中,藉由本書,您可以一次獲得這些資源,包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn和其它相關的工具。
對於熟悉Python,需要處理大量資料的資料科學家和資料處理人員來說,這是一本非常有價值的案頭書。可以有效率地處理每天面對的問題,像是操作、轉換及清理資料,視覺化不同形式的資料,建立統計學或機器學習模型等。
藉由本書,你將可以學習到:
•IPython和Jupyter:提供資料科學家使用的Python計算環境
•NumPy:在Python中進行高效儲存及操作密集資料陣列的ndarrys
•Pandas:在Python中進行對於標籤式/欄位式的資料高效率儲存與操作
•Matplotlib:在Python中進行彈性範圍的資料視覺化功能
•Scikit-Learn:提供機器學習演算法以及簡潔的Python實作
作者簡介
Jake VanderPlas 是Google Research的軟體工程師,致力於開發支援資料密集型研究的工具。 他創建並開發了用於資料密集型科學的Python工具,包括Scikit-Learn、SciPy、AstroPy、Altair、JAX等。
書籍目錄
第一章 IPython:更好用的Python
Shell還是Notebook
IPython 的求助與說明文件
在IPython Shell中的快捷鍵
IPython的Magic命令
輸入和輸出的歷程
IPython和Shell命令
和Shell相關的Magic命令
錯誤以及除錯
剖析和測定程式碼的時間
第二章 NumPy介紹
瞭解Python的資料型態
NumPy陣列基礎
NumPy 陣列屬性
陣列索引:存取單一個陣列元素
在NumPy陣列中的計算:Universal Functions
聚合操作:Min、Max、以及兩者間的所有事
在陣列上的計算:Broadcasting
比較、遮罩以及布林邏輯
Fancy索引
排序陣列
結構化的資料:NumPy的結構化陣列
更多進階的複合型態
第三章 使用Pandas操作資料
安裝並使用Pandas
Pandas 物件的介紹
資料的索引和選擇
在Pandas中操作資料
處理缺失資料
階層式索引
資料集的合併:Concat 和Append
合併資料集:Merge 以及Join
聚合計算與分組
樞紐分析表
向量化字串操作
使用時間系列
高效率Pandas:eval() 以及query()
第四章 使用Matplotlib進行視覺化
通用的Matplotlib技巧
買一送一的介面
簡單的線條圖形
簡單的散佈圖
視覺化誤差
密度圖和等高線圖
直方圖、分箱法及密度
自訂圖表的圖例
自訂色彩條
多重子圖表
文字和註解
自訂刻度
客製化Matplotlib:系統配置和樣式表
在Matplotlib中的三維繪圖法
Basemap的地理資料
使用Seaborn進行視覺化
第五章 機器學習
什麼是機器學習?
Scikit-Learn簡介
超參數以及模型驗證
特徵工程
深究:Naive Bayes Classification
深究:線性迴歸(Linear Regression)
深究:Support Vector Machines
深究:決策樹(Decision Tree)和隨機森林(Random Forest)
深究:主成份分析(Principal Component Analysis)
深究:流形學習(Manifold Learning)
深究:k- 均集群法
深究:高斯混合模型(Gaussian Mixture Models)
深究:核密度估計(Kernel Density Estimation)
應用:臉部辨識的管線