-
機器學習最強入門:基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來
-
點閱:697
491人已收藏
- 作者: 洪錦魁著
- 出版社:深智數位
- 出版年:2023
- ISBN:9786267273784
- EISBN:9786267273876 PDF
- 格式:PDF,JPG
- 頁數:772
- 附註:本電子書附件請至內文VI連結下載 附錄: 1, 函數與方法索引表--2, 本書程式實例彩色執行結果圖表 含索引
租期14天
今日租書可閱讀至2025-05-26
機器學習最強入門
基礎數學/機率/統計
邁向
AI真實數據 x 專題實作
★★★★★【數學原理 + 演算法 + 真實案例+ 專題實作】★★★★★
★★★★★【最簡明的數學、機率、統計知識】★★★★★
★★★★★【最完整的機器學習演算法】★★★★★
★★★★★【最豐富的真實數據 x 專題實作】★★★★★
本書特色
★最白話解釋數學原理
☆從簡單的數據開始理解機器學習的演算法
★將理論知識轉化為實際的程式碼
☆實際案例分析
全書有約416個Python程式實例,讀者可以由本書內容,了解下列與機器學習有關的基礎數學、機率、統計知識:
★方程式與函數
☆ 完整Python語法
★ 一元函數到多元函數
☆ 最小平方法
★ 基礎統計
☆ 機率與單純貝式理論
★ 指數與對數
☆ logit函數與logistic函數
★ 向量與矩陣
☆ 二次函數、三次函數與多項式函數
當讀者有了上述知識後,筆者從簡單的實例開始介紹下列機器學習的演算法,每一種演算法皆是從基礎數據開始解說,然後跨入真實數據,解說應該如何將演算法應用到真實案例環境:
★線性迴歸 – 波士頓房價
☆邏輯迴歸 – 信用卡/葡萄酒/糖尿病
★決策樹 – 葡萄酒/鐵達尼號/Telco/Retail
☆隨機森林樹 – 波士頓房價/鐵達尼號/Telco/收入分析
★KNN演算法 – 電影推薦/足球射門/鳶尾花/小行星撞地球
☆支援向量機 – 鳶尾花/乳癌/汽車燃料
★單純貝式分類 – 垃圾郵件/中英文的新聞分類/情感分析/電影評論
☆集成機器學習 – 蘑菇/醫療保險/玻璃/加州房價
★K-means分群 – 購物中心消費/葡萄酒評價
☆PCA主成分分析 – 手寫數字/人臉數據
★階層式分群 – 小麥數據/老實泉
☆DBSCAN演算法 – 購物中心客戶分析
在講解上述演算法時,筆者同時介紹下列機器學習應該知道的知識:
★特徵選擇
☆用直方圖了解特徵分佈
★用箱型圖了解異常值
☆數據預處理
★殘差圖(Residual plot)
☆機器學習性能評估
★過擬合(overfitting)
☆欠擬合(underfitting)
★數據洩漏(Data leakage)
☆繪製決策樹圖(Decision tree map)
★可視化熱力圖(Heat map)
☆決策邊界(Decision Boundary)
★增加數據維度與超平面
☆交叉驗證(Cross-validation)
★泛化能力(Generalization Ability)
☆弱學習器(Weaks learners)
★強學習器(Strong learners)
☆學習模型(base learner)
本書最後一章,介紹了熱門的AI主題「語音辨識」,從本章內容讀者可以學會下列知識:
★ 語音轉文字
☆ 文字轉語音
※ 本書所有程式實例可至深智官網下載:deepwisdom.com.tw
★★★★★【最完整的機器學習演算法】★★★★★
★★★★★【最豐富的真實數據 x 專題實作】★★★★★
本書特色
★最白話解釋數學原理
☆從簡單的數據開始理解機器學習的演算法
★將理論知識轉化為實際的程式碼
☆實際案例分析
全書有約416個Python程式實例,讀者可以由本書內容,了解下列與機器學習有關的基礎數學、機率、統計知識:
★方程式與函數
☆ 完整Python語法
★ 一元函數到多元函數
☆ 最小平方法
★ 基礎統計
☆ 機率與單純貝式理論
★ 指數與對數
☆ logit函數與logistic函數
★ 向量與矩陣
☆ 二次函數、三次函數與多項式函數
當讀者有了上述知識後,筆者從簡單的實例開始介紹下列機器學習的演算法,每一種演算法皆是從基礎數據開始解說,然後跨入真實數據,解說應該如何將演算法應用到真實案例環境:
★線性迴歸 – 波士頓房價
☆邏輯迴歸 – 信用卡/葡萄酒/糖尿病
★決策樹 – 葡萄酒/鐵達尼號/Telco/Retail
☆隨機森林樹 – 波士頓房價/鐵達尼號/Telco/收入分析
★KNN演算法 – 電影推薦/足球射門/鳶尾花/小行星撞地球
☆支援向量機 – 鳶尾花/乳癌/汽車燃料
★單純貝式分類 – 垃圾郵件/中英文的新聞分類/情感分析/電影評論
☆集成機器學習 – 蘑菇/醫療保險/玻璃/加州房價
★K-means分群 – 購物中心消費/葡萄酒評價
☆PCA主成分分析 – 手寫數字/人臉數據
★階層式分群 – 小麥數據/老實泉
☆DBSCAN演算法 – 購物中心客戶分析
在講解上述演算法時,筆者同時介紹下列機器學習應該知道的知識:
★特徵選擇
☆用直方圖了解特徵分佈
★用箱型圖了解異常值
☆數據預處理
★殘差圖(Residual plot)
☆機器學習性能評估
★過擬合(overfitting)
☆欠擬合(underfitting)
★數據洩漏(Data leakage)
☆繪製決策樹圖(Decision tree map)
★可視化熱力圖(Heat map)
☆決策邊界(Decision Boundary)
★增加數據維度與超平面
☆交叉驗證(Cross-validation)
★泛化能力(Generalization Ability)
☆弱學習器(Weaks learners)
★強學習器(Strong learners)
☆學習模型(base learner)
本書最後一章,介紹了熱門的AI主題「語音辨識」,從本章內容讀者可以學會下列知識:
★ 語音轉文字
☆ 文字轉語音
※ 本書所有程式實例可至深智官網下載:deepwisdom.com.tw
- 第 1 章 機器學習基本觀念(第1-1頁)
- 1-1 人工智慧、機器學習、深度學習(第1-2頁)
- 1-2 認識機器學習(第1-3頁)
- 1-3 機器學習的種類(第1-3頁)
- 1-4 機器學習的應用範圍(第1-6頁)
- 1-5 深度學習(第1-7頁)
- 第 2 章 機器學習的基礎數學(第2-1頁)
- 2-1 用數字描繪事物(第2-2頁)
- 2-2 變數觀念(第2-2頁)
- 2-3 從變數到函數(第2-3頁)
- 2-4 等式運算的規則(第2-4頁)
- 2-5 代數運算的基本規則(第2-5頁)
- 2-6 用數學抽象化開餐廳的生存條件(第2-5頁)
- 2-7 基礎數學的結論(第2-7頁)
- 第 3 章 認識方程式 / 函數 / 座標圖形(第3-1頁)
- 3-1 認識方程式(第3-2頁)
- 3-2 方程式文字描述方法(第3-3頁)
- 3-3 一元一次方程式(第3-3頁)
- 3-4 函數(第3-4頁)
- 3-5 座標圖形分析(第3-6頁)
- 3-6 將線性函數應用在機器學習(第3-10頁)
- 3-7 二元函數到多元函數(第3-14頁)
- 3-8 Sympy 模組(第3-17頁)
- 第 4 章 從聯立方程式看機器學習的數學模型(第4-1頁)
- 4-1 數學觀念建立連接兩點的直線(第4-2頁)
- 4-2 機器學習使用聯立方程式推估數據(第4-5頁)
- 4-3 從 2 條直線的交叉點推估科學數據(第4-10頁)
- 4-4 兩條直線垂直交叉(第4-14頁)
- 第 5 章 從畢氏定理看機器學習(第5-1頁)
- 5-1 驗證畢氏定理(第5-2頁)
- 5-2 將畢氏定理應用在性向測試(第5-3頁)
- 5-3 將畢氏定理應用在三維空間(第5-5頁)
- 5-4 將畢氏定理應用在更高維的空間(第5-6頁)
- 5-5 電影分類(第5-6頁)
- 第 6 章 聯立不等式與機器學習(第6-1頁)
- 6-1 聯立不等式與機器學習(第6-2頁)
- 6-2 再看聯立不等式的基本觀念(第6-2頁)
- 6-3 聯立不等式的線性規劃(第6-3頁)
- 6-4 Python 計算(第6-7頁)
- 第 7 章 機器學習需要知道的二次函數(第7-1頁)
- 7-1 二次函數的基礎數學(第7-2頁)
- 7-2 從一次到二次函數的實務(第7-12頁)
- 7-3 認識二次函數的係數(第7-14頁)
- 7-4 使用 3 個點求解一元二次函數(第7-15頁)
- 7-5 二次函數的配方法(第7-19頁)
- 7-6 二次函數與解答區間(第7-22頁)
- 第 8 章 機器學習的最小平方法(第8-1頁)
- 8-1 最小平方法基本觀念(第8-2頁)
- 8-2 簡單的企業實例(第8-3頁)
- 8-3 機器學習建立含誤差值的線性方程式(第8-4頁)
- 8-4 Numpy 實作最小平方法(第8-8頁)
- 8-5 線性迴歸(第8-9頁)
- 8-6 實務應用(第8-11頁)
- 第 9 章 機器學習必須懂的集合(第9-1頁)
- 9-1 使用 Python 建立集合(第9-2頁)
- 9-2 集合的操作(第9-4頁)
- 9-3 子集、宇集與補集(第9-7頁)
- 9-4 加入與刪除集合元素(第9-9頁)
- 9-5 冪集與 Sympy 模組(第9-9頁)
- 9-6 笛卡兒積(第9-10頁)
- 第 10 章 機器學習必須懂的排列與組合(第10-1頁)
- 10-1 排列基本觀念(第10-2頁)
- 10-2 有多少條回家路(第10-3頁)
- 10-3 排列組合(第10-4頁)
- 10-4 階乘的觀念(第10-7頁)
- 10-5 重複排列(第10-11頁)
- 10-6 組合(第10-12頁)
- 第 11 章 機器學習需要認識的機率(第11-1頁)
- 11-1 機率基本觀念(第11-2頁)
- 11-2 數學機率與統計機率(第11-5頁)
- 11-3 事件機率名稱(第11-5頁)
- 11-4 事件機率規則(第11-6頁)
- 11-5 抽獎的機率 – 加法與乘法綜合應用(第11-7頁)
- 11-6 餘事件與乘法的綜合應用(第11-9頁)
- 11-7 條件機率(第11-10頁)
- 11-8 貝氏定理(第11-12頁)
- 11-9 蒙地卡羅模擬(第11-20頁)
- 11-10 Numpy 的隨機模組 random(第11-22頁)
- 第 12 章 二項式定理(第12-1頁)
- 12-1 二項式的定義(第12-2頁)
- 12-2 二項式的幾何意義(第12-2頁)
- 12-3 二項式展開與規律性分析(第12-3頁)
- 12-4 找出 xn-ᵏyᵏ項的係數(第12-4頁)
- 12-5 二項式的通式(第12-6頁)
- 12-6 二項式到多項式(第12-7頁)
- 12-7 二項分佈實驗(第12-7頁)
- 12-8 將二項式觀念應用在業務數據分析(第12-8頁)
- 12-9 二項式機率分佈 Python 實作(第12-10頁)
- 12-10 Numpy 隨機數模組的 binomial( ) 函數(第12-13頁)
- 第 13 章 指數觀念與指數函數(第13-1頁)
- 13-1 認識指數函數(第13-2頁)
- 13-2 指數運算的規則(第13-5頁)
- 13-3 指數函數的圖形(第13-7頁)
- 第 14 章 對數 (logarithm)(第14-1頁)
- 14-1 認識對數函數(第14-2頁)
- 14-2 對數表的功能(第14-5頁)
- 14-3 對數運算可以解決指數運算的問題(第14-6頁)
- 14-4 認識對數的特性(第14-9頁)
- 14-5 對數的運算規則與驗證(第14-10頁)
- 第 15 章 歐拉數與邏輯函數(第15-1頁)
- 15-1 認識歐拉數(第15-2頁)
- 15-2 邏輯函數(第15-6頁)
- 15-3 logit 函數(第15-9頁)
- 15-4 邏輯函數的應用(第15-11頁)
- 第 16 章 三角函數(第16-1頁)
- 16-1 直角三角形的邊長與夾角(第16-2頁)
- 16-2 三角函數的定義(第16-2頁)
- 16-3 計算三角形的面積(第16-3頁)
- 16-4 角度與弧度(第16-5頁)
- 16-5 程式處理三角函數(第16-7頁)
- 16-6 從單位圓看三角函數(第16-8頁)
- 16-7 三角函數與機器學習的關係(第16-9頁)
- 第 17 章 基礎統計與大型運算子(第17-1頁)
- 17-1 母體與樣本(第17-2頁)
- 17-2 數據加總(第17-3頁)
- 17-3 數據分佈(第17-3頁)
- 17-4 數據中心指標(第17-4頁)
- 17-5 數據分散指標(第17-11頁)
- 17-6 Σ 符號運算規則與驗證(第17-15頁)
- 17-7 活用 Σ 符號(第17-16頁)
- 17-8 迴歸分析(第17-18頁)
- 17-9 隨機函數的分佈(第17-24頁)
- 第 18 章 機器學習的向量(第18-1頁)
- 18-1 向量的基礎觀念(第18-2頁)
- 18-2 向量加法的規則(第18-8頁)
- 18-3 向量的長度(第18-11頁)
- 18-4 向量方程式(第18-12頁)
- 18-5 向量內積(第18-15頁)
- 18-6 皮爾遜相關係數(第18-24頁)
- 18-7 向量外積(第18-29頁)
- 第 19 章 機器學習的矩陣(第19-1頁)
- 19-1 矩陣的表達方式(第19-2頁)
- 19-2 矩陣相加與相減(第19-3頁)
- 19-3 矩陣乘以實數(第19-4頁)
- 19-4 矩陣乘法(第19-5頁)
- 19-5 方形矩陣(第19-9頁)
- 19-6 單位矩陣(第19-9頁)
- 19-7 反矩陣(第19-10頁)
- 19-8 用反矩陣解聯立方程式(第19-11頁)
- 19-9 張量 (Tensor)(第19-12頁)
- 19-10 轉置矩陣(第19-13頁)
- 第 20 章 向量、矩陣與多元線性回歸(第20-1頁)
- 20-1 向量應用在線性迴歸(第20-2頁)
- 20-2 向量應用在多元線性迴歸(第20-3頁)
- 20-3 矩陣應用在多元線性迴歸(第20-4頁)
- 20-4 將截距放入矩陣(第20-5頁)
- 20-5 簡單的線性迴歸(第20-6頁)
- 第 21 章 三次函數迴歸曲線的程式實作(第21-1頁)
- 21-1 繪製數據的散點圖(第21-2頁)
- 21-2 三次函數的迴歸曲線模型(第21-3頁)
- 21-3 使用 scikit-learn 模組評估迴歸模型(第21-5頁)
- 21-4 預測未來值(第21-9頁)
- 21-5 不適合的三次函數迴歸數據(第21-10頁)
- 第 22 章 機器學習使用scikit-learn 入門(第22-1頁)
- 22-1 scikit-learn 的歷史(第22-2頁)
- 22-2 機器學習的數據集(第22-2頁)
- 22-3 scikit-learn 生成數據實作(第22-5頁)
- 22-4 scikit-learn 數據預處理(第22-14頁)
- 22-5 機器學習 scikit-learn 入門(第22-17頁)
- 22-6 分類演算法 - 機器學習模型的性能評估(第22-27頁)
- 22-7 機器學習必需會的非數值資料轉換(第22-35頁)
- 22-8 機器學習演算法(第22-40頁)
- 22-9 使用隨機數據學習線性迴歸(第22-40頁)
- 第 23 章 線性迴歸 - 波士頓房價(第23-1頁)
- 23-1 從線性迴歸到多元線性迴歸(第23-2頁)
- 23-2 簡單資料測試(第23-3頁)
- 23-3 波士頓房價數據集(第23-5頁)
- 23-4 用 Pandas 顯示與預處理數據(第23-8頁)
- 23-5 特徵選擇(第23-11頁)
- 23-6 使用最相關的特徵做房價預估(第23-13頁)
- 23-7 多項式迴歸(第23-20頁)
- 23-8 用所有特徵執行波士頓房價預估(第23-31頁)
- 23-9 殘差圖 (Residual plot)(第23-34頁)
- 23-10 梯度下降迴歸 SGDRegressor( )(第23-36頁)
- 第 24 章 邏輯迴歸 - 信用卡 / 葡萄酒 / 糖尿病(第24-1頁)
- 24-1 淺談線性迴歸的問題(第24-2頁)
- 24-2 邏輯迴歸觀念回顧(第24-3頁)
- 24-3 邏輯迴歸模型基礎應用(第24-6頁)
- 24-4 台灣信用卡持卡人數據集(第24-12頁)
- 24-5 葡萄酒數據(第24-17頁)
- 24-6 糖尿病數據(第24-22頁)
- 第 25 章 決策樹 – 葡萄酒 / 鐵達尼號 / Telco / Retail(第25-1頁)
- 25-1 決策樹基本觀念(第25-2頁)
- 25-2 從天氣數據認識決策樹設計流程 - 分類應用(第25-5頁)
- 25-3 葡萄酒數據 - 分類應用(第25-8頁)
- 25-4 鐵達尼號 - 分類應用(第25-12頁)
- 25-5 Telco 電信公司 - 分類應用(第25-18頁)
- 25-6 Retail Data Analytics - 迴歸應用(第25-28頁)
- 第 26 章 隨機森林樹 – 波士頓房價 / 鐵達尼號 / Telco / 收入分析(第26-1頁)
- 26-1 隨機森林樹基本觀念(第26-2頁)
- 26-2 波士頓房價 - 迴歸應用(第26-2頁)
- 26-3 鐵達尼號 – 分類應用(第26-4頁)
- 26-4 Telco 客戶流失 – 分類應用(第26-6頁)
- 26-5 美國成年人收入分析 – 分類應用(第26-7頁)
- 第 27 章 KNN 演算法 – 鳶尾花 / 小行星撞地球(第27-1頁)
- 27-1 KNN 演算法基礎觀念(第27-2頁)
- 27-2 電影推薦 / 足球射門 - 分類應用(第27-3頁)
- 27-3 房價計算 / 選舉準備香腸 – 迴歸應用(第27-13頁)
- 27-4 鳶尾花數據 - 分類應用(第27-19頁)
- 27-5 小行星撞地球 – 分類應用(第27-31頁)
- 第 28 章 支援向量機 – 鳶尾花 / 乳癌 / 汽車燃料(第28-1頁)
- 28-1 支援向量機的基礎觀念(第28-2頁)
- 28-2 支援向量機 - 分類應用的基礎實例(第28-6頁)
- 28-3 從 2 維到 3 維的超平面(第28-15頁)
- 28-4 認識核函數(第28-21頁)
- 28-5 鳶尾花數據 - 分類應用(第28-29頁)
- 28-6 乳癌數據 - 分類應用(第28-32頁)
- 28-7 支援向量機 – 迴歸應用的基礎實例(第28-37頁)
- 28-8 汽車燃耗效率數據集 - 迴歸分析(第28-41頁)
- 第 29 章 單純貝式分類 – 垃圾郵件 / 新聞分類 / 電影評論(第29-1頁)
- 29-1 單純貝式分類原理(第29-2頁)
- 29-2 詞頻向量模組 - CountVerctorizer(第29-8頁)
- 29-3 多項式單純貝式模組 - MultinomialNB(第29-11頁)
- 29-4 垃圾郵件分類 – Spambase 數據集(第29-14頁)
- 29-5 新聞郵件分類 – 新聞數據集 20newsgroups(第29-17頁)
- 29-6 情感分析 – 電影評論 IMDB Dataset 分析(第29-25頁)
- 29-7 單純貝式分類於中文的應用(第29-28頁)
- 29-8 今日頭條數據集(第29-31頁)
- 第 30 章 集成機器學習 – 蘑菇 / 醫療保險 / 玻璃 / 加州房價(第30-1頁)
- 30-1 集成學習的基本觀念(第30-2頁)
- 30-2 集成學習 - 投票法 Voting ( 鳶尾花 / 波士頓房價)(第30-4頁)
- 30-3 集成學習 - 裝袋法 Bagging ( 蘑菇 / 醫療保險)(第30-9頁)
- 30-4 集成學習 - 提升法 AdaBoost ( 糖尿病 / 波士頓房價)(第30-21頁)
- 30-5 集成學習 - 提升法 Gradient Boosting ( 玻璃 / 加州房價)(第30-25頁)
- 30-6 集成學習 – 堆疊法 Stacking ( 信用卡違約 / 房價預估)(第30-34頁)
- 第 31 章 K-means 分群 – 購物中心消費 / 葡萄酒評價(第311頁)
- 31-1 認識無監督學習(第312頁)
- 31-2 K-means 演算法(第314頁)
- 31-3 scikit-learn 的 KMeans 模組(第3110頁)
- 31-4 評估分群的效能(第3116頁)
- 31-5 最佳群集數量(第3122頁)
- 31-6 消費分析 - 購物中心客戶消費數據(第3124頁)
- 31-7 價格 vs 評價 - 葡萄酒 Wine Reviews(第3129頁)
- 第 32 章 PCA 主成份分析 – 手寫數字 / 人臉數據(第32-1頁)
- 32-1 PCA 基本觀念(第32-2頁)
- 32-2 鳶尾花數據的 PCA 應用(第32-6頁)
- 32-3 數字辨識 – 手寫數字 digits dataset(第32-11頁)
- 32-4 人臉辨識 – 人臉數據 Labeled Faces in the Wild(第32-22頁)
- 第 33 章 階層式分層 – 小麥數據 / 老實泉(第33-1頁)
- 33-1 認識階層式分群(第33-2頁)
- 33-2 凝聚型 (Agglomerative) 分群(第33-3頁)
- 33-3 小麥數據集 Seeds dataset(第33-13頁)
- 33-4 老實泉數據 Old Faithful Geyser Data(第33-18頁)
- 第 34 章 DBSCAN 演算法 – 購物中心客戶分析(第34-1頁)
- 34-1 DBSCAN 演算法(第34-2頁)
- 34-2 scikit-learn 的 DBSCAN 模組(第34-4頁)
- 34-3 消費分析 - 購物中心客戶消費數據(第34-8頁)
- 第 35 章 語音辨識(第35-1頁)
- 35-1 語音轉文字(第35-2頁)
- 35-2 文字轉語音(第35-4頁)
- 附錄 A 函數與方法索引表(第A-1頁)
- 附錄 B 電子書 - 本書程式實例彩色執行結果圖表(第B-1頁)
同分類熱門書