- 課程詳情
- 上課校區(3)
課程亮點:
科學的內容設置
七年數據科學教學積淀,內容體系全面,講解深入淺出從基礎內容到前沿知識、從理論基礎到工具實踐,算法全體系知識一站式解決!
前沿的教學模式
案例驅動式教學,告別枯燥乏味的學習體驗,海量實戰項目你的學習效率!CDA AI實驗室在線編程環境和免費算力使用。算法競賽項目結業,高能力可以被驗證!
專業的講師助教
高校專家、名企大咖合力精研課程體系,精英講師、助教全力保障授課服務課程導學、行業解析、視頻授課、一對一督學,四大團隊全程伴你成長。
完善的就業服務
百家合作企業內部推薦,完善就業輔導體系提供全方位指導行業紅利+合作企業+就業服務,三重保障助你新職業揚帆起航!
學習目標:
內容服務全面升級、轉行就業一步到位,回歸教育本質,真正讓學員為學習結果買單
課程內容:
第1階段
預備知識:數據科學的數據庫基礎
了解數據庫在行業應用中的價值及其在數據分析中的地位,掌握數據庫中數據存儲、數據查詢、數據處理技術,了解與工業場景中Python 操作數據庫的邏輯和方法,并攻克BAT數據庫重點筆試題。
第1章:數據的存儲、讀取及簡單處理
(一)導學直播:數據庫應用價值及其在數據分析中的地位
(二)操作數據庫-數據的存儲
(三)查詢數據庫中的數據-查詢語句
(四)數據庫高級操作-函數
(五)工業場景下數據庫數據的提取與處理形式:Python連接數據庫
(六)專題直播:BAT數據庫面試題精講
(七)階段作業
第二階段
數據分析工具熟練運用養成計劃
了解Python在數據科學、人工智能領域的地位,3倍速高效掌握Python編程、Python數據處理與可視化核心技術,并理解可視化技術實現結果輸出與內容美化的數據表達邏輯。
第二章:3倍速學習Python核心編程技術
(一)導學直播:Python數據分析工具的市場競爭力分析
(二)Python編程的破冰之旅
(三)掌握Python序列對象:字符串、列表、元組、字典
(四)建立python控制流語句知識模型:條件判斷和循環的藝術
(五)實現Python的模塊化程序設計:函數
(六)面向對象編程與類
(八)專題直播:使用Git和Github進行版本控制
(九)階段作業
第三章:數據分析入門:使用Numpy+Matplotlib分析數據
(一)導學直播:巧用Python強大的第三方庫功能,大幅度提升編程任務效率
(二)共享單車每季度平均騎行時間對比
(三)動手創建一個批量溫度轉換器
(四)共享單車各類用戶的平均騎行時間趨勢對比
(五)氣溫數據的描述性統計分析:大值、小值、平均值
(六)共享單車的用戶類別分析:比例
(七)氣溫數據的可視化分析
(八)共享單車用類別分析的統計圖形繪制
(九)功能強大的Numpy的高級操作
(十)階段作業
第四章:Pandas從數據分析到可視化
(一)導學直播:數據表達邏輯-結果輸出與內容美化
(二)比較咖啡店各類飲品的數量與熱量
(三)PM*.5的數值展示及不同來源數值差異對比展示
(四)分析電子游戲在各國的營收情況并用堆疊圖展示
(五)房屋價格影響因素探索與房價趨勢的可視化展示
(六)神奇寶貝數據的變量關系探索與分析
(七)不同手機操作系統的流量使用情況分析
(八)統計不同專業的員工平均薪資
(九)股票行情分析及價格趨勢的可視化展示
(十)幸福指數的等級分析
(十一)專題直播:python實現excel辦公自動化
(十二)階段作業
第三階段
數據價值的挖掘及預測技術實戰
掌握機器學習、深度學習的數學基礎、機器學習理論及實現、深度學習理論及實現;掌握機器學習、深度學習在推薦系統、金融、量化等領域的工業應用實踐及模型部署上線
第五章:數據價值挖掘及預測的數學基礎知識
(一)導學直播:數學基礎在機器學習中的重要性與必要性講解
(二)構建機器學習的線性代數知識模型
(三)掌握機器學習算法原理推導中的微積知識
(四)掌握機器學習算法必知必會的統計學知識
(五)專題直播:Python實現統計分析的方法-statsmodel的介紹及使用
(六)階段作業
第六章:掌握數據價值挖掘及預測的監督學習算法基礎
(一)導學直播:機器學習入門與算法總覽
(二)根據像素值對CIFAR10圖像數據進行KNN算法分類
(三)動手實現基于決策樹的收入分類與可視化
(四)使用線性回歸模型實現Ames房價預測
(五)使用邏輯回歸構建信用卡反欺詐預測模型
(六)使用樸素貝葉斯構建垃圾郵件分類器
(七)使用支持向量機對金融支付服務的欺詐行為進行預測
(八)通過boosting提升傳統算法在海外電商企業用戶細分項目中的效果
(九)使用XGBoost提升樹對人類發展指數官方數據集進行回歸預測
(十)監督學習綜合應用實戰:基于超參數優化的Gradient Boosting的銷售預測
(十一)專題直播:機器學習的人才需求及技術應用現狀分析
(十二)階段作業
第七章:掌握數據價值挖掘及預測的無監督學習算法基礎
(一)導學直播:實際工作中我們應該如何根據場景選擇適合的機器學習算法模型
(二)使用KMeans進行旅游企業客戶分群
(三)使用PCA進行基因序列異常檢測實現癌癥診斷
(四)基于潛在狄利克雷分配(LDA)的內容主題挖掘
(五)使用Apriori進行322萬知乎用戶的關注話題關聯分析
(十二)階段作業
第八章:使用深度學習完成你的第1個AI項目-人臉識別
(一)導學直播:深度學習的行業應用價值及技術發展趨勢
(二)單層感知器與多層感知器在反欺詐預測上的表現對比
(三)使用神經網絡進行手寫數字圖片識別
(四)快速上手構建一個人臉識別系統
(五)專題直播:深度學習主流框架介紹
(六)階段作業
第九章 工業項目實戰保障機器學習技術的落地實踐
(一)導學直播:工業場景下的機器學習模型應用與模型部署
(二)推薦系統案例精講
(三)金融風控案例精講
(四)時間序列案例精講
(五)算法模型的部署-在人工智能實驗室 中部署我們的反欺詐預測模型
(六)專題直播:機器學習工程師職業成長路徑
(七)階段作業
第四階段
分布式機器學習的工具基礎與工業項目實戰
看了解大數據工具運用的工業應用價值、大數據生態系統的重要組件、大數據架構搭建方法;掌握海量數據的存儲與處理技術;了解Spark大數據處理工具及相關組件;了解分布式機器學習的工業應用價值,掌握Spark MLlib分布式機器學習實現的邏輯及其在金融、計算廣告、推薦系統、量化投資等領域的應用。
第十章:海量數據存儲和處理技術:Linux環境下Sp****.x+Python開發環境的
(一)導學直播:海量數據處理的市場需求分析及工具介紹
(二)導入本地虛擬機至virtualbox及啟動系統和遠程桌面連接
(二)大數據環境快速搭建:Hadoop偽分布式集群的搭建
(三)大數據環境快速搭建:Linux系統下安裝PySpark模塊并遠程啟動Anaconda
(四)使用結構化海量數據處理框架Spark SQL、Spark DataFrame進行航空數據分析
(五)專題直播:Spark DataFrame與Python DataFrame異同
(六)階段作業
第十一章:千萬級別數據的機器學習問題:機器學習的分布式計算實現
(一)分布式機器學習的工業價值及技術發展趨勢介紹
(二)PySpark機器學習:Spark Mllib實現算法模型構建
(三)構建分類模型預測StumbleUpon給用戶個性化推薦的網頁是否長期受歡迎
(四)構建回歸模型實現共享單車需求量預測
(五)分布式環境下的Avazu廣告數據集性別標簽預測
(六)基于Avazu廣告數據的廣告排名及CTR預估
(七)分布式環境下的Audioscrobbler音樂推薦系統開發
(八)基于分布式機器學習的實現個人貸款違約預測
(九)基于分布式機器學習的銀行零售產品的交叉營銷
(十)基于分布式XGBoost的量化投資項目實戰-股票價格的預測
(十一)專題直播:運用Spark ML Pipeline組建簡易文本分類案例需求分析
(十二)階段作業
作業
第五階段
結業項目競賽
學員將組隊參加DC平臺、阿里天池競賽,提交項目代碼到平臺,根據項目得分及排名情況進行優秀學員評選
第十二章:項目競賽及競賽案例詳解
第六階段
就業階段
本階段將為學員提供專業的簡歷指導和就業推薦服務,為學員的就業保駕護航。學員入職后持續提供為期1年的入職護航服務,入職不滿意重新推薦
課程內容:
第1階段
預備知識:數據科學的數據庫基礎
了解數據庫在行業應用中的價值及其在數據分析中的地位,掌握數據庫中數據存儲、數據查詢、數據處理技術,了解與工業場景中Python 操作數據庫的邏輯和方法,并攻克BAT數據庫重點筆試題。
第1章:數據的存儲、讀取及簡單處理
(一)導學直播:數據庫應用價值及其在數據分析中的地位
(二)操作數據庫-數據的存儲
(三)查詢數據庫中的數據-查詢語句
(四)數據庫高級操作-函數
(五)工業場景下數據庫數據的提取與處理形式:Python連接數據庫
(六)專題直播:BAT數據庫面試題精講
(七)階段作業
第二階段
數據分析工具熟練運用養成計劃
了解Python在數據科學、人工智能領域的地位,3倍速高效掌握Python編程、Python數據處理與可視化核心技術,并理解可視化技術實現結果輸出與內容美化的數據表達邏輯。
第二章:3倍速學習Python核心編程技術
(一)導學直播:Python數據分析工具的市場競爭力分析
(二)Python編程的破冰之旅
(三)掌握Python序列對象:字符串、列表、元組、字典
(四)建立python控制流語句知識模型:條件判斷和循環的藝術
(五)實現Python的模塊化程序設計:函數
(六)面向對象編程與類
(八)專題直播:使用Git和Github進行版本控制
(九)階段作業
第三章:數據分析入門:使用Numpy+Matplotlib分析數據
(一)導學直播:巧用Python強大的第三方庫功能,大幅度提升編程任務效率
(二)共享單車每季度平均騎行時間對比
(三)動手創建一個批量溫度轉換器
(四)共享單車各類用戶的平均騎行時間趨勢對比
(五)氣溫數據的描述性統計分析:大值、小值、平均值
(六)共享單車的用戶類別分析:比例
(七)氣溫數據的可視化分析
(八)共享單車用類別分析的統計圖形繪制
(九)功能強大的Numpy的高級操作
(十)階段作業
第四章:Pandas從數據分析到可視化
(一)導學直播:數據表達邏輯-結果輸出與內容美化
(二)比較咖啡店各類飲品的數量與熱量
(三)PM*.5的數值展示及不同來源數值差異對比展示
(四)分析電子游戲在各國的營收情況并用堆疊圖展示
(五)房屋價格影響因素探索與房價趨勢的可視化展示
(六)神奇寶貝數據的變量關系探索與分析
(七)不同手機操作系統的流量使用情況分析
(八)統計不同專業的員工平均薪資
(九)股票行情分析及價格趨勢的可視化展示
(十)幸福指數的等級分析
(十一)專題直播:python實現excel辦公自動化
(十二)階段作業
第三階段
數據價值的挖掘及預測技術實戰
掌握機器學習、深度學習的數學基礎、機器學習理論及實現、深度學習理論及實現;掌握機器學習、深度學習在推薦系統、金融、量化等領域的工業應用實踐及模型部署上線
第五章:數據價值挖掘及預測的數學基礎知識
(一)導學直播:數學基礎在機器學習中的重要性與必要性講解
(二)構建機器學習的線性代數知識模型
(三)掌握機器學習算法原理推導中的微積知識
(四)掌握機器學習算法必知必會的統計學知識
(五)專題直播:Python實現統計分析的方法-statsmodel的介紹及使用
(六)階段作業
第六章:掌握數據價值挖掘及預測的監督學習算法基礎
(一)導學直播:機器學習入門與算法總覽
(二)根據像素值對CIFAR10圖像數據進行KNN算法分類
(三)動手實現基于決策樹的收入分類與可視化
(四)使用線性回歸模型實現Ames房價預測
(五)使用邏輯回歸構建信用卡反欺詐預測模型
(六)使用樸素貝葉斯構建垃圾郵件分類器
(七)使用支持向量機對金融支付服務的欺詐行為進行預測
(八)通過boosting提升傳統算法在海外電商企業用戶細分項目中的效果
(九)使用XGBoost提升樹對人類發展指數官方數據集進行回歸預測
(十)監督學習綜合應用實戰:基于超參數優化的Gradient Boosting的銷售預測
(十一)專題直播:機器學習的人才需求及技術應用現狀分析
(十二)階段作業
第七章:掌握數據價值挖掘及預測的無監督學習算法基礎
(一)導學直播:實際工作中我們應該如何根據場景選擇適合的機器學習算法模型
(二)使用KMeans進行旅游企業客戶分群
(三)使用PCA進行基因序列異常檢測實現癌癥診斷
(四)基于潛在狄利克雷分配(LDA)的內容主題挖掘
(五)使用Apriori進行322萬知乎用戶的關注話題關聯分析
(十二)階段作業
第八章:使用深度學習完成你的第1個AI項目-人臉識別
(一)導學直播:深度學習的行業應用價值及技術發展趨勢
(二)單層感知器與多層感知器在反欺詐預測上的表現對比
(三)使用神經網絡進行手寫數字圖片識別
(四)快速上手構建一個人臉識別系統
(五)專題直播:深度學習主流框架介紹
(六)階段作業
第九章 工業項目實戰保障機器學習技術的落地實踐
(一)導學直播:工業場景下的機器學習模型應用與模型部署
(二)推薦系統案例精講
(三)金融風控案例精講
(四)時間序列案例精講
(五)算法模型的部署-在人工智能實驗室 中部署我們的反欺詐預測模型
(六)專題直播:機器學習工程師職業成長路徑
(七)階段作業
第四階段
分布式機器學習的工具基礎與工業項目實戰
看了解大數據工具運用的工業應用價值、大數據生態系統的重要組件、大數據架構搭建方法;掌握海量數據的存儲與處理技術;了解Spark大數據處理工具及相關組件;了解分布式機器學習的工業應用價值,掌握Spark MLlib分布式機器學習實現的邏輯及其在金融、計算廣告、推薦系統、量化投資等領域的應用。
第十章:海量數據存儲和處理技術:Linux環境下Sp****.x+Python開發環境的
(一)導學直播:海量數據處理的市場需求分析及工具介紹
(二)導入本地虛擬機至virtualbox及啟動系統和遠程桌面連接
(二)大數據環境快速搭建:Hadoop偽分布式集群的搭建
(三)大數據環境快速搭建:Linux系統下安裝PySpark模塊并遠程啟動Anaconda
(四)使用結構化海量數據處理框架Spark SQL、Spark DataFrame進行航空數據分析
(五)專題直播:Spark DataFrame與Python DataFrame異同
(六)階段作業
第十一章:千萬級別數據的機器學習問題:機器學習的分布式計算實現
(一)分布式機器學習的工業價值及技術發展趨勢介紹
(二)PySpark機器學習:Spark Mllib實現算法模型構建
(三)構建分類模型預測StumbleUpon給用戶個性化推薦的網頁是否長期受歡迎
(四)構建回歸模型實現共享單車需求量預測
(五)分布式環境下的Avazu廣告數據集性別標簽預測
(六)基于Avazu廣告數據的廣告排名及CTR預估
(七)分布式環境下的Audioscrobbler音樂推薦系統開發
(八)基于分布式機器學習的實現個人貸款違約預測
(九)基于分布式機器學習的銀行零售產品的交叉營銷
(十)基于分布式XGBoost的量化投資項目實戰-股票價格的預測
(十一)專題直播:運用Spark ML Pipeline組建簡易文本分類案例需求分析
(十二)階段作業
作業
第五階段
結業項目競賽
學員將組隊參加DC平臺、阿里天池競賽,提交項目代碼到平臺,根據項目得分及排名情況進行優秀學員評選
第十二章:項目競賽及競賽案例詳解
第六階段
就業階段
本階段將為學員提供專業的簡歷指導和就業推薦服務,為學員的就業保駕護航。學員入職后持續提供為期1年的入職護航服務,入職不滿意重新推薦
-
上地十街
地址:北京市海淀區上地十街
電話:400-029-0976 轉 **** 查看號碼
-
高粱橋斜街59號
地址:北京市海淀區高粱橋斜街59號
電話:400-029-0976 轉 **** 查看號碼
-
廠洼街校區
地址:廠洼路丹龍大廈
電話:400-029-0976 轉 **** 查看號碼
關于我們 詳情

數據分析師核心優勢? ?CDA數據分析師系統培訓立足于數據分析領域教育事業,覆蓋了國內企業招聘數據分析師所要求的技能,進一步提升數據分析師的職業素養與能力水平,促進數據分析行業的高質量持續快速發展。數據分析師機構簡介? ?經管之家于2003年成立與中國人民大學經濟學院,致力于推動經濟的進步,傳播優秀教育資源,目前已經發展成為國內大型的經濟、管理、金融、統計類的在線教育和咨詢網站,也是國內*活躍和具影響力的經管類網絡社區。? ? 經管之家運營團隊:北京國富如荷網絡科技有限公司,成立于2006年6月,公司以經管之家為運營平臺,經營業務包括培訓業務、數據處理和分析服務和教輔產品等。經管之家"數據分析培訓中心" 自2007年成立以來,致力于開展統計軟件、數據分析和數據挖掘的培訓與咨詢服務,目前已有專家、講師團隊100多位,擁有自主版權的視頻課程60多門,每年開設現場培訓班100余場,建立了完備的數據分析培訓課程體系,每年培訓學員3000多人。服務過的企業包括中國電子商務中心、招商銀行、中國人民銀行、中國郵政儲蓄、中國聯通、中國汽車技術研究中心、南京梅鋼等機構。?? ? 發展至今,經管之家"數據分析培訓中心"已經成為具有影響力和知名度的數據分析培訓機構,我們一直努力做到:將數據分析變成一門常識,讓統計軟件成為學術研究的好伙伴,企業經營的好軍師。數據分析師學校優勢? ? CDA優勢如何?? ? 2013年,經管之家創立"CDA數據分析師"品牌,致力于為社會各界數據分析愛好者提供*優質、*科學、*系統的數據分析教育。截止2015年已成功舉辦40期系統培訓,培訓學員達3千余名; 中國數據分析師俱樂部(CDA CLUB),已舉辦30期線下免費沙龍活動,累積會員2千余名;中國數據分析師行業峰會(CDA Summit),一年兩次,參會人數達2千余名,在大數據領域影響力超前。"CDA數據分析師"隊伍在業界不斷壯大,對數據分析人才產業起到了巨大的推動作用。? ? 優勢一:師資與課程研發? ? CDA數據分析師系統培訓,由經管之家根據CDA認證標準而設立的一套針對數據分析師技能的全面系統培訓。培訓師資目前來自學界、實務界相關領域的講師、教授、專家、工程師以及企業資深分析師,名師薈萃,代表了國內數據分析培訓的專業水平,可以更好地保證培訓的學員既能學到扎實的數據分析理論知識,又能具備較強的利用軟件解決實際問題的能力,保證學員能勝任各行業數據分析師工作的要求。CDA數據分析師培訓注重結合實際,把具技術含量、具價值理念的課程傳授給學員。課程還注重啟發式教學,讓學員在動手解決問題中去學習。? ? ?CDA數據分析師課程的大綱和內容,既由經管之家、CERTIFIED DATA ANALYST INSTITUTE(CDA協以及大數據、數據挖掘領域專家潛心開發和反復研究,又經過科學的調研確定,并且將不斷地隨著數據分析的市場需求和數據分析技術的發展而調整,課程內容始終關注市場、關注前沿。課程內容的設計更注重階梯化、體系化的原則,每一個學員,不論學習和工作的背景如何,都能在該課程體系中很快找到適合自己的課程,并不斷學習提高。? ? 優勢二:繼續學習? ? 所有CDA學員除了學習現場課程之外,還會得到全程視頻錄像及輔助學習視頻課程(包括統計軟件、數據挖掘、大數據等內容),此系列視頻課程可以進行后期鞏固學習和進修學習,可扎實現學技能、拓展課余知識、升華技術層級。CDA數據分析師培訓體系除了CDA LEVEL認證培訓以外,還推出了CDA就業脫產培訓,使跨行、跨專業的學生、待業人員能夠進行全面的脫產集訓,并在培訓后解決學員就業,拿到高薪工作。除此之外,CDA還為有基礎的學員提供了更多元化更高級的行業專題培訓,包括*前沿的PYTHON、SPARK等工具,電商、金融、游戲等各行業專題,以及量化投資、CRM營銷、臨床醫學等細分領域。? ? 優勢三:在線學習? ? Pe******et(就學教育)為CDA數據分析師在線學習平臺。視頻可實現隨時隨地在線聽課,10分鐘一小節,可進行個性化、碎片化學習,更具針對性與便利性。CDA上課方式分為現場及遠程兩種方式,遠程在線學習引進了*新設備與技術,與思科的合作解決了各地區學員的需求,實現了如同現場般的遠程答疑及討論氛圍。? ? 優勢四:人才認證? ? 參與CDA培訓學員可以參加一年兩次的"CDA數據分析師認證考試",并獲得專業證書與持證人特權。CDA認證考試目前有"LEVEL 1業務數據分析師","LEVEL 2建模分析師","LEVEL 2大數據分析師",考試由經管之家主辦,通過者獲得經管之家CDA認證證書,并可到臺灣申請由"中華資料采礦協會"頒發的"資料采礦分析師"證書,亦可獲得由CDA協會認證的"CERTIFIED DATA ANALYST CERTIFICATION"。? ? 優勢五:CDA社群? ? 經管之家有十二個社區,七百個版塊,六百萬會員。每日討論的熱點話題及資料以千計。學員在學后可以到"CDA數據分析師"版塊進行交流、提問、下載資料等,形成數據分析專業聚集地,促進學員在圈子交流中高效發展。? ? 除了在線平臺,中國數據分析師俱樂部(CDA CLUB)匯聚了數據分析領域的各界興趣愛好者,截止2015年已舉辦30期線下沙龍活動,會員累計2千余名,有高級會員與普通會員。在俱樂部中各會員可以通過共享資源方式獲得相應積分,以積分兌換其他優質資源,形成了自發式的交流互動。? ? 中國數據分析師行業峰會、大數據生態縱覽峰會(CDA SUMMIT)。一年兩次的行業峰會,匯聚了國內*的專家學者,發布前沿思想與技術,參會人員上千名,盛世浩大,影響超前,為數據人才和大數據行業的發展起到了極大的推動作用。發展歷程:"2006年?開展數據統計、計量實戰,學術研究等相關培訓視頻和現場班2007年?開展數據統計、數據分析相關培訓班2011年?隨著大數據熱潮的來臨,依托累計上萬類共享資料,多年沉淀師資團隊,論壇召集多位專家,研發CDA數據分析師體系2013年CDA數據分析師品牌成立,提供系統化的大數據、數據分析人才培養和認證2014年?CDA INSTITUTE 成立 ,并推出第一屆全國CDA數據分析師認證考試2015年第一屆中國數據分析師行業峰會(CDAS)在9月11日成功舉辦,參會人數逾3000人2016年?CDA匯聚海內外大數據、數據分析專家上千人,推出就業班、數據科學家訓練營、企業內訓、CDA俱樂部等多個項目2017年整合論壇與CDA數據分析師業內資源,形成數據分析領域生態圈,并進一步升級CDA企業內訓體系,正式推出大數據實驗室2018年北上廣深等多個城市均有校區;擁有200多位專業師資;培養學員超過3萬人,每年6月/12月全國28個城市舉辦CDA認證考試2019年已舉辦九屆數據分析師認證考試,得到業界廣泛認可,學員遍布各大知名企業。人工智能產品“好學AI”問世,引領DT時代新一波技術培訓浪潮"數據分析師師資力量