培訓受眾:
大數據研究者,大型企業公司,網絡工作者
課程收益:
深入詳細的分析大數據,結合實際分析大數據與商業結合。
課程大綱:
任務0
1. 大數據的定義,科學發展淵源;
2. 如何科學看待大數據?
3. 如何把握大數據,分別從“知著”、“顯微”、“曉義”三個層面闡述科學的大數據觀.
任務1
1. 大數據與云計算;
2. 私有云計算平臺經濟的解決方案:如何集成OpenStack,Xen,Hadoop,MongoDB,Nutch等開源項目搭建最經濟的云計算
平臺,實現大數據的基礎技術架構平臺
3. 大數據存儲架構、大數據并行計算平臺、大數據應用系統構建。
任務2
1. 通用搜索引擎與大數據垂直業務的矛盾
2. 大數據精準搜索的基本技術:快速增量在線倒排索引、結構化與非機構化數據融合、大數據排序算法、語義關聯、自動緩存與優化機制;
3. 大數據精準搜索語法:鄰近搜索、復合搜索、情感搜索、精準搜索;
4. 大數據精準搜索應用案例:中國郵政搜索、國家標準搜索、內網文檔搜索、輿情搜索;
任務3
1. 語義理解基礎:ICTCLAS與漢語分詞
2. 內容關鍵語義自動標引與詞云自動生成;
3. 大數據聚類;
4. 大數據分類與信息過濾;
5. 大數據去重、自動摘要;
任務4大數據搜索與挖掘平臺工具實訓
1. 學員采用大數據搜索與挖掘進行實戰演練
2. 大數據與新型電子商務
3. 電子商務基于大數據技術的推薦系統
4. 電商如何應對大數據時代的挑戰?
任務5
1. 電子政務平臺的大數據特性
2. 公文的主題詞自動標引
3. 北京外事辦典型電子政務平臺的大數據應用案例分享
任務6
1. 微博大數據宏觀特性挖掘
2. 微博微觀行為建模
3. 微博大數據監控系統應用案例