课程介绍

机器学习在近几十年已发展为一门多领域交叉学科,主要涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。从词义上看,机器学习主要是设计和分析一些让计算机可以自动“学习”的算法。具体的来讲,机器学习算法可以认为是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。目前,机器学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,其交集也被称为统计学习理论。算法设计方面,机器学习关注可以实现的,行之有效的学习算法。实际应用中,很多机器学习研究是开发容易处理的近似算法,以实现对具体问题的解决。 

本次《机器学习》课程内容包括:特征、模型选择、核方法、支持向量机、分类、回归树及剪枝、随机森林、聚类、朴素贝叶斯等基本机器学习方法,以及自然语言处理、推荐系统等数据科学领域高级算法讲解与运用和强化学习介绍。

课程目录

讲师简介

  • 何珂俊

    2010年毕业于北京大学数学科学学院并取得学士学位;2012年与2017分别在美国纽约州立大学奥尔巴尼分校和美国得克萨斯农工大学获得数学硕士和统计学博士学位。博士毕业后加入中国人民大学统计与大数据研究院并担任助理教授。 何珂俊博士主要研究领域包括非参数模型降维和高维变量选择,对机器学习和统计计算也有浓厚的研究兴趣。同时也致力于统计方法在实际问题中的应用,比如统计遗传学等。已有若干学术成果发表在国际知名期刊上,如《Journal of the American Statistical Association》、《Journal of Time Series Analysis》等。

  • Ella

    Google 数据科学家

  • John

    现在在WalmartLabs担任首席数据科学家。精通机器学习和统计建模,在多个垂直领域有丰富的经验和深刻的见解,例如 ecommerce, recommendation, search, relevance, customer acquisition and retention, CTR and conversion modeling, Ad bidding, financial risk modeling, fraud detection, NLP and text mining。曾经就职于FinTech初创公司,和大数据咨询公司。在布朗大学获得博士学位,并在MIT从事两年的博士后研究。

  • 阮巨城

    卡内基梅隆大学电机电脑工程博士学位,以及机器学习硕士学位。论文方向为 “结合机器学习及专家系统以分析及提升计算效能”。来美国以前,于台湾国立清华大学获得计算机学士学位,并服务于台湾中央研究院约一年,主要工作内容为分析基因序列与data mining。 来美后于 Intel Research 工作,主要内容为使用 machine learning 及 data analytics 分析晶片良率。现于 Google Research 工作,主要内容为改良 semi-supervised learning 以及 deep learning 的演算法及效能。