PDF JPG
本書有DRM加密保護,需使用HyRead閱讀軟體開啟
  • 大數據X資料探勘X智慧營運
  • 點閱:6
  • 作者: 梁棟, 張兆靜, 彭木根著
  • 出版社:崧博出版 崧燁文化發行 紅螞蟻圖書總經銷
  • 出版年:2020[民109]
  • ISBN:9789577359926
  • 格式:PDF,JPG
  • 附註:原著書名: 大数据、资料探勘与智慧营运营
租期14天 今日租書可閱讀至2021-11-11

【想深入了解大數據、資料探勘的讀者請進!!】 

什麼是資料前處理? 
電信業者跟資料探勘有什麼關係? 
神經網路具體到底是什麼? 

集群分析的演算法有哪些? 

◎資料探勘的「十大經典演算法」你都認識嗎? 
  國際權威的學術組織the IEEE International Conference on Data Mining (ICDM)評出了資料探勘領域的十大經典演算法:C4.5、K-Means、SVM、Apriori、EM、PageRank、AdaBoost、KNN、Naive Bayes和CART。 

1.C4.5演算法 
  C4.5是一種用在機器學習和資料探勘領域的分類問題中的演算法。它基於以下假設:給定一個資料集,其中的每一個元組都能用一組屬性值來描述,每一個元組屬於一個互斥的類別中的某一類。C4.5的目標是透過學習,找到一個從屬性值到類別的映射關係,並且這個映射能用於對新的類別未知的實體進行分類。 

2.The K-Means Algorithm (K-Means演算法) 
  K-MeansAlgorithm是一種聚類演算法,它把n個對象根據他們的屬性分為k個分割,k
◎結構化/半結構化/非結構化資料有什麼不同? 
  (一)結構化資料:能夠用數據或統一的結構加以表示的資料,如數字、符號。傳統的關係資料模型,儲存於資料庫,通常可用二維表結構表示。 
  (二)非結構化資料:是指其欄位長度可變,並且每個欄位的記錄又可以由可重複或不可重複的子欄位構成的資料庫,用它不僅可以處理結構化資料(如數字、符號等資訊)而且更適合處理非結構化資料(全文文字、圖像、聲音、影視、超媒體等資訊)。 
  (三)半結構化資料: XML、HTML文檔就屬於半結構化資料。它一般是自描述的,資料結構和內容混在一起,沒有明顯的區分。 

◎如何設計神經網路的拓撲結構? 
  在開始訓練之前,用戶必須確定網路拓撲,說明輸入層的單元數、隱藏層數(如果多於一層)、每個隱藏層的單元數和輸出層的單元數。 

對訓練元組中每個屬性的輸入測量值進行規範化將有助於加快學習過程。通常,對輸入值規範化,使得它們落入0.0和1.0之間。離散值屬性可以重新編碼,使得每個域值有一個輸入單元。例如,如果屬性A有3個可能的或已知的值{a0,a1,a2}則可以分配三個輸入單元表示A,即我們可以用I0,I1,I2作為輸入單元。每個單元都初始化為0。如果A=a0,則I0置為1,其餘為0;如果A=a1,則I1置1,其餘為0;諸如此類。 

神經網路可以用於分類(預測給定元組的類標號)和數值預測(預測連續值輸出)。對於分類,一個輸出單元可以用來表示兩個類(其中值1代表一個類,而值0代表另一個類)。如果多於兩個類,則每個類使用一個輸出單元。 

★全書特色 
全書分為九章,內容包括:大資料探勘與智慧營運的概念,資料前處理,資料探勘中的四種主流演算法:集群分析、分類分析、迴歸分析、關聯分析,增強型資料探勘演算法,資料探勘在營運商智慧營運中的應用案例,未來大資料探勘的發展趨勢等。主要提供給電信業者及其他高科技企業員工、大專院校學生和研究生,以及其他對資料探勘與精準行銷感興趣的讀者。 


梁棟、張兆靜、彭木根

  • 前言(第i頁)
  • 第1章 大數據、資料探勘與智慧營運綜述(第1頁)
    • 1.1 資料探勘的發展史(第1頁)
    • 1.2 資料探勘的主要流程與金字塔模型(第14頁)
    • 1.3 資料探勘對智慧營運的意義(第24頁)
    • 1.4 大數據時代已經來臨(第32頁)
    • 1.5 非結構化資料探勘的研究進展(第35頁)
    • 1.6 資料探勘與機器學習、深度學習、人工智慧及雲端計算(第55頁)
    • 1.7 現有資料探勘的主要分析軟體與系統(第68頁)
  • 第2章 資料統計與資料前處理(第79頁)
    • 2.1 資料屬性類型(第79頁)
    • 2.2 資料的統計特性(第82頁)
    • 2.3 資料前處理(第95頁)
    • 2.4 資料欄位的衍生(第111頁)
    • 2.5 SPSS軟體中的資料前處理案例(第114頁)
  • 第3章 集群分析(第120頁)
    • 3.1 概述(第120頁)
    • 3.2 聚類演算法的評估(第125頁)
    • 3.3 基於劃分的聚類:K-means(第129頁)
    • 3.4 基於層次化的聚類:BIRCH(第146頁)
    • 3.5 基於密度的聚類:DBSCAN(第149頁)
    • 3.6 基於網格的聚類:CLIQUE(第153頁)
  • 第4章 分類分析(第158頁)
    • 4.1 分類分析概述(第158頁)
    • 4.2 分類分析的評估(第161頁)
    • 4.3 決策樹分析(第165頁)
    • 4.4 最近鄰分析(KNN)(第201頁)
    • 4.5 貝氏分析(第209頁)
    • 4.6 神經網路(第218頁)
    • 4.7 支援向量機(第224頁)
  • 第5章 迴歸分析(第233頁)
    • 5.1 迴歸分析概述(第233頁)
    • 5.2 一元線性迴歸(第234頁)
    • 5.3 多元線性迴歸(第242頁)
    • 5.4 非線性迴歸(第249頁)
    • 5.5 邏輯迴歸(第254頁)
  • 第6章 關聯分析(第264頁)
    • 6.1 關聯分析概述(第264頁)
    • 6.2 關聯分析的評估指標(第266頁)
    • 6.3 Apriori演算法(第268頁)
    • 6.4 FP-tree演算法(第280頁)
    • 6.5 SPSS Modeler關聯分析實例(第284頁)
  • 第7章 增強型資料探勘演算法(第289頁)
    • 7.1 增強型資料探勘演算法概述(第289頁)
    • 7.2 隨機森林(第291頁)
    • 7.3 Bagging演算法(第296頁)
    • 7.4 AdaBoost演算法(第300頁)
    • 7.5 提高不平衡資料的分類準確率(第306頁)
    • 7.6 遷移學習(第316頁)
  • 第8章 資料探勘在營運商智慧營運中的應用(第327頁)
    • 8.1 概述(第327頁)
    • 8.2 單個業務的精準行銷——合約機外呼行銷(第329頁)
    • 8.3 多種互聯網業務的精準推送(第350頁)
    • 8.4 方案精準適配(第367頁)
    • 8.5 客戶保有(第376頁)
    • 8.6 投訴預警(第386頁)
    • 8.7 網路品質柵格化呈現(第392頁)
    • 8.8 無線室內定位(第399頁)
  • 第9章 面向未來大數據的資料探勘與機器學習發展趨勢(第409頁)
    • 9.1 大數據時代資料探勘與機器學習面臨的新挑戰(第409頁)
    • 9.2 IEEE ICDM會議資料探勘與機器學習的最新研究進展(第420頁)
    • 9.3 「電腦奧運」——Sort Benchmark(第426頁)
紙本書 NT$ 650
單本電子書
NT$ 455

點數租閱 20點
租期14天
今日租書可閱讀至2021-11-11
還沒安裝 HyRead 3 嗎?馬上免費安裝~
QR Code