1.點(diǎn)擊下面按鈕復(fù)制微信號(hào)
點(diǎn)擊復(fù)制微信號(hào)
上海威才企業(yè)管理咨詢有限公司
商業(yè)數(shù)據(jù)挖掘分析是通過算法對(duì)大量商業(yè)數(shù)據(jù)進(jìn)行探索并最終找出隱藏于數(shù)據(jù)背后的高價(jià)值信息及知識(shí)的方法。數(shù)據(jù)挖掘分析方法是一種商業(yè)決策支持過程,它可以高度自動(dòng)化地對(duì)企業(yè)商業(yè)數(shù)據(jù)進(jìn)行分析,做出歸納性推理,從中挖掘出潛在模式規(guī)律,最終幫助決策者做出正確經(jīng)營(yíng)決策。
近年來,數(shù)據(jù)挖掘引起了信息產(chǎn)業(yè)界的極大關(guān)注,其主要原因是企業(yè)存在大量可廣泛應(yīng)用的有效數(shù)據(jù),并且迫切需要將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識(shí)。獲取的信息和知識(shí)可以廣泛應(yīng)用于企業(yè)生產(chǎn)經(jīng)營(yíng)中的各個(gè)方面,包括但不限于生產(chǎn)管理、質(zhì)量控制、市場(chǎng)分析、營(yíng)銷管理、運(yùn)營(yíng)管理、財(cái)務(wù)管理、人力管理等……學(xué)習(xí)該課程可以系統(tǒng)培養(yǎng)數(shù)據(jù)分析人員的數(shù)據(jù)挖掘分析能力,幫助企業(yè)從數(shù)據(jù)中:
● 發(fā)現(xiàn)數(shù)據(jù)背后深層業(yè)務(wù)問題
● 找到突破業(yè)務(wù)增長(zhǎng)瓶頸的突破口
● 找到業(yè)務(wù)行為模式的最優(yōu)解
● 洞察市場(chǎng)先機(jī)以及經(jīng)營(yíng)風(fēng)險(xiǎn),預(yù)測(cè)未來經(jīng)營(yíng)走勢(shì)
● 掌握數(shù)據(jù)挖掘分析工具Python的使用方法;
● 掌握Python數(shù)據(jù)清洗方法;
● 掌握統(tǒng)計(jì)分析方法;
● 掌握多種算法模型的使用方法;
● 掌握商業(yè)數(shù)據(jù)挖掘分析實(shí)戰(zhàn)方法。
Python語言基礎(chǔ):幫助學(xué)員掌握Python語言的基礎(chǔ)編程方法,掌握應(yīng)用Python進(jìn)行數(shù)據(jù)加載、數(shù)據(jù)整理、數(shù)據(jù)清洗、數(shù)據(jù)可視化等方法,本節(jié)內(nèi)容為后續(xù)內(nèi)容奠定工具應(yīng)用基礎(chǔ);
1. Python編程基礎(chǔ)(Python安裝啟動(dòng)、數(shù)據(jù)類型、控制流操作、函數(shù)、面向?qū)ο缶幊?、文件操作?/span>
2. Python加在數(shù)據(jù)(向量\矩陣\數(shù)組、加在樣本數(shù)據(jù)集、加在數(shù)據(jù)文件數(shù)據(jù)、查詢SQL數(shù)據(jù)庫(kù))
3. Python數(shù)據(jù)整理(創(chuàng)建及瀏覽數(shù)據(jù)幀、處理缺失值、數(shù)據(jù)替換、連接及合并數(shù)據(jù)幀、數(shù)據(jù)分組聚合、更改數(shù)據(jù)類型等)
4. Python數(shù)據(jù)清洗(Numpy應(yīng)用方法、Pandas應(yīng)用方法)
5. Python數(shù)據(jù)可視化(Matplotlib繪圖、Pandas繪圖、Pyecharts交互式圖表繪制)
6. 綜合案例應(yīng)用
時(shí)間序列分析:時(shí)間序列分析是一種重要的定量預(yù)測(cè)分析方法,本節(jié)將幫助學(xué)員系統(tǒng)掌握時(shí)間序列分析方法;
1. Pandas時(shí)間序列處理
2. 時(shí)間序列特征
3. 時(shí)間序列模型應(yīng)用(AR、MA、ARMA、ARIMA)
4. 時(shí)間序列建模
5. 綜合案例應(yīng)用
機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘基礎(chǔ):本節(jié)內(nèi)容將為大家介紹機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的基礎(chǔ)理論知識(shí),并針對(duì)有監(jiān)督學(xué)習(xí)算法以及無監(jiān)督學(xué)習(xí)算法進(jìn)行展開介紹;
1. 機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘理論基礎(chǔ)(數(shù)據(jù)挖掘概要,數(shù)據(jù)挖掘方法論,機(jī)器學(xué)習(xí)基本思想、常用算法分類、主要解決的問題,機(jī)器學(xué)習(xí)流程,模型評(píng)價(jià)指標(biāo),算法庫(kù)等)
2. 有監(jiān)督學(xué)習(xí)算法入門(KNN基本原理,函數(shù)詳解,KNN數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn),KNN算法實(shí)例)
3. 無監(jiān)督學(xué)習(xí)算法入門(聚類分析入門,K-Means快速聚類基本原理,K-Means快速聚類手動(dòng)實(shí)現(xiàn),K-Means模型評(píng)估指標(biāo)及穩(wěn)定性討論,輪廓系數(shù))
機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘進(jìn)階:本節(jié)將為大家進(jìn)一步介紹機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的進(jìn)階算法以及應(yīng)用案例;
1. 常用有監(jiān)督學(xué)習(xí)算法(線性回歸(線性回歸模型的推導(dǎo)和求解,梯度下降法,帶正則項(xiàng)的線性回歸),邏輯回歸(邏輯回歸的引入,sigmoid函數(shù),模型的求解,多分類問題),貝葉斯(樸素貝葉斯,貝葉斯網(wǎng)絡(luò)),SVM支持向量機(jī)分類和支持向量機(jī)回歸(線性SVM,硬邊距與軟邊距,非線性SVM,核函數(shù)的理解)
2. 有監(jiān)督學(xué)習(xí)算法進(jìn)階(決策樹模型(C4.5、C5.0和CART樹,決策樹的可視化),集成學(xué)習(xí)基礎(chǔ)(集成學(xué)習(xí)思想,分類,boosting和bagging聯(lián)系與區(qū)別),集成算法之Bagging類算法(Bagging、隨機(jī)森林等),集成算法之Boosting類算法(Adaboosting、GBDT梯度提升樹、XgBoost等)
3. 無監(jiān)督學(xué)習(xí)算法進(jìn)階(聚類分析:DBSCAN密度聚類、層次聚類等,數(shù)據(jù)降維方法(PCA主成分分析和SVD奇異值分解)
4. 特征工程與高級(jí)數(shù)據(jù)預(yù)處理(特征工程的目的與重要性,特征預(yù)處理(無量綱化,分析,編碼,統(tǒng)計(jì)編號(hào),特征組合),特征構(gòu)造(時(shí)間和時(shí)間序列特征構(gòu)造,空間特征構(gòu)造,用戶行為特征構(gòu)造,文本特征構(gòu)造,圖像特征構(gòu)造),特征選擇(特征選擇標(biāo)準(zhǔn),方法分類),特征轉(zhuǎn)換與特征學(xué)習(xí))
文本分析:文本數(shù)據(jù)中包含大量有用信息,使用文本分析方法可以有效提取這部分信息為商業(yè)決策提供幫助。本節(jié)內(nèi)容將幫助學(xué)員系統(tǒng)掌握應(yīng)用Python進(jìn)行文本分析的方法;
1. 文本分析概述(文本數(shù)據(jù)與文本挖掘,自然語言處理的流派,文本挖掘常見商業(yè)應(yīng)用,自然語言處理的層次,流程與挑戰(zhàn))
2. 獲取文本數(shù)據(jù)(語料和語料庫(kù),常見語料庫(kù),語料庫(kù)的獲取,文本的爬取)
3. 文本向量化(離散化表示方法(詞集模型,詞袋模型,TF-IDF),分布式表示方法(word2vec,glove))
4. 文本分類與聚類(百度數(shù)據(jù)聚類,新聞分類,情感分類)
5. 基于深度學(xué)習(xí)的文本分析(深度學(xué)習(xí)在文本分析中的應(yīng)用,基于LSTM的情感分析,基于深度學(xué)習(xí)的新聞分類)
圖像處理與分析:除了文本數(shù)據(jù)之外,圖像數(shù)據(jù)同樣蘊(yùn)藏了大量有價(jià)值的信息與知識(shí),本節(jié)將幫助學(xué)員系統(tǒng)掌握?qǐng)D像數(shù)據(jù)的處理與分析方法;
1. 圖像處理基本概念(位圖,灰度,通道,深度,色相,色調(diào),圖像分辨率,顏色模型(RGB,HSI,HSV))
2. 基于OpenCV的圖像處理(OpenCV基本介紹,圖像和視頻的獲取,圖像裁剪、通道獲取邊界填充,圖像計(jì)算,調(diào)亮圖片,改變圖像大小圖像融合,閾值處理,圖像濾波,圖像運(yùn)算,圖像金字塔)
3. 圖像特征的理解與計(jì)算(顏色特征,形狀特征,LBP特征,HAAR特征,HOG特征)
4. 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理(卷積神經(jīng)網(wǎng)絡(luò)的模型搭建和訓(xùn)練,常見卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)分析)
5. 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類實(shí)戰(zhàn)(基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別實(shí)戰(zhàn))
綜合應(yīng)用案例(大綱只列舉部分典型案例,可以根據(jù)企業(yè)實(shí)際需求進(jìn)行選擇或定制):本節(jié)通過多個(gè)實(shí)戰(zhàn)案例將前邊相關(guān)知識(shí)進(jìn)行串聯(lián)、鞏固與提高,幫助學(xué)員將所學(xué)應(yīng)用到實(shí)際商業(yè)場(chǎng)景下,掌握商業(yè)數(shù)據(jù)挖掘分析的全流程方法;
1. 電商案例分析(統(tǒng)計(jì)描述性,宏觀市場(chǎng)和微觀市場(chǎng)分析,波士頓矩陣分析)
2. 航空客戶價(jià)值分析(RFM分析,客戶畫像,聚類分析,精準(zhǔn)營(yíng)銷)
3. 保險(xiǎn)行業(yè)用戶畫像,精準(zhǔn)營(yíng)銷(決策樹應(yīng)用)
4. 航班動(dòng)態(tài)延誤預(yù)測(cè)(隨機(jī)森林,集成學(xué)習(xí)應(yīng)用)
5. 基于不同場(chǎng)景之下共享單車投放量的精準(zhǔn)預(yù)測(cè)(嶺回歸,lasso回歸)
6. 京東用戶商品購(gòu)買預(yù)測(cè)(xgboost集成學(xué)習(xí))
7. 電商銷售商品數(shù)據(jù)分析(關(guān)聯(lián)規(guī)則應(yīng)用)
8. 門戶網(wǎng)站新聞分類分析(貝葉斯應(yīng)用)
9. 手寫數(shù)字識(shí)別案例(邏輯回歸,knn應(yīng)用)
10. 人臉識(shí)別與分類案例(SVM應(yīng)用)
11. 圖像分類(CNN應(yīng)用)
12. 電商文本情感分析(LSTM應(yīng)用)
13. 數(shù)字化人力資源之員工流失風(fēng)險(xiǎn)預(yù)警(邏輯回歸應(yīng)用)
14. 基于用于欺詐檢測(cè)的綜合財(cái)務(wù)數(shù)據(jù)集預(yù)測(cè)金融支付服務(wù)中的欺詐行為(集成學(xué)習(xí)應(yīng)用)
15. 信用評(píng)分卡案例
例: 講解獲取外部數(shù)據(jù)
例: 講解應(yīng)用文本分析對(duì)網(wǎng)站注冊(cè)用戶特征需求進(jìn)行分析
聯(lián)系電話:4006-900-901
微信咨詢:威才客服
企業(yè)郵箱:shwczx@shwczx.com
深耕中國(guó)制造業(yè)
助力企業(yè)轉(zhuǎn)型
2021年度咨詢客戶數(shù)
資深實(shí)戰(zhàn)導(dǎo)師
客戶滿意度
續(xù)單和轉(zhuǎn)介紹