園區各企業:
《機器學習實訓—短視頻推薦系統項目》本課程將引領學員在真實的“項目開發”模式下實現一個完整的推薦系統產 品。從一個系統產品的工程項目視角,掌握從產品的需求,概要設計,數據下載與處理,基于內容推薦,協同過濾,點擊率預估,算法組合與優化,服務性能評測與 監控,基本Web/App服務等產品研發環節,全面提升學員在推薦系統方面的工程實踐經驗。
【培訓特點】
周末線下小班學習(限制人數) 完整的推薦系統產品項目 導師現場輔導+線上一對一輔導答疑 優秀學員將獲得推薦就業機會
【培訓人群】
有Python編程經驗 至少1年軟件工程研發經驗 初步掌握機器學習算法的理論基礎
【培訓講師】
鄒 博 中國科學院副教授,某氣象公司首席科學家 研究方向機器學習、數據挖掘、計算幾何,應用于大型氣象設備的圖像與本挖掘、股票交易與預測、傳統農資產品價格預測和決策等領域。
王 亮 華中科技大學博士,前騰訊研究員。 曾在騰訊負責過多個社區搜索和推薦系統,在人工智能領域有超過10年的經驗。研究領域包括搜索排序算法、推薦系統、NLP。2015年初創業,創立APPBK運營助手,關注AI在企業服務中的應用。
【培訓模式】
1.實踐為主 學習期間將按照真實的“項目開發”模式進行 每天課程3小節,每小節2小時 學生動手實踐(講師全程輔導):1~1.5小時 講師安排任務,點評代碼:30分鐘+
2.線上輔助 2位導師+4位助教在線提供一對一答疑輔導
【培訓內容】
第1天:工具準備
1. python解釋器與概況
2. 數據挖掘和機器學習包的應用
3. 爬蟲的編寫
4. json與數據交換
第2天:推薦系統的算法基礎
1. 線性回歸
2. Logistic回歸
3. 協同過濾
4. 卷積神經網絡
第3天:開題,短視頻“熱門推薦”
第一節:從產品需求到代碼構建
1. 理解產品需求說明書
2. 完成系統概要設計
3. 完成基本軟硬件環節的構建
第二節:數據比算法更重要
1. 完成短視頻結構和數據庫的設計
2. 完成youku和weibo短視頻的spider下載系統,下載至少500條數據
第三節:工程比算法更重要
1. 完成視頻發布流程
2. 完成短視頻推薦基本服務
3. 接入基本的web系統
額外任務:
1. 服務的性能如何衡量、評測、如何監控?
2. 我們用的web頁面,怎么轉成APP?
第4天:基于“內容”的短視頻推薦
第一節:搜索是推薦的系統基礎
1. 基于完成阿里云的視頻搜索系統構建
2. 基于搜索系統,完成相關視頻推薦服務
第二節:分類標簽是推薦的數據基礎
1. 完成愛奇藝分類語錄數據下載
2. 完成基于liblinear的文本分類模型設計
3. 為下載的視頻記錄打分類標簽
第三節:建立用戶興趣模型
1. 構建少量用戶訪問記錄
1. 構建用戶關鍵詞模型
2. 構建用戶興趣類別模型
額外任務:
1. 自己寫一個簡單的搜索引擎
第5天:基于“協同過濾”的短視頻推薦
第一節:用戶訪問記錄構建
1. 基于標準測試集,構建用戶訪問記錄
第二節:user-based 推薦
1. 完成實時的user-based推薦
2. 完成離線的user-based推薦
第三節:item-based 推薦
1. 完成離線的item-based計算任務
2. 完成線上的item-based 服務
額外任務:
1. 如何基于hadoop跑相關的任務
第6天:完成短視頻“點擊預估推薦”,結題
第一節:特征工程:數據挖掘工程師的工作主題
1. 完成特征選擇文檔
2. 完成特征的構建
第二節:LR:簡單即王道
1. 完成基于LR的點擊預估模型訓練
2. 完成基于LR的線上推薦服務
3. 完成多種推薦算法的整合
第三節:結題
1. 完成系統的全方位監控
2. 完成項目總結
額外任務:
1. 如何獲得更多的特征,如截圖。
2.是否能使用深度學習模型。
【培訓時間】
2017年8月12日 - 9月2日
線下:連續3個周六日線下授課
。8月12日-13日,8月19日-20日,8月26-27日)
線上: 2017年8月12日-9月2日,期間線上提供一對一答疑輔導
【培訓地點】
北京海淀立方庭大廈東側一層
【培訓費用】
費用標準: 8000元/人
【報名方式】(以下兩種報名方式任選其一)
1. 郵件報名:請下載填寫報名表(附件1),并發送郵件至zgcyxxy@163.com,報名成功者會在開課前一天收到工作人員的電話確認。
2. 聯系電話:13811366081(滑老師)
18601144812(柳老師)
中關村創新研修學院
2017年8月4日