MS004123-机器学习原理与应用

发布者：王源发布时间：2022-03-01浏览次数：2087

研究生课程开设申请表

开课院（系、所）：信息科学与工程学院

课程申请开设类型：新开√ 重开□ 更名□（请在□内打勾，下同）

课程

名称

中文

机器学习原理与应用

英文

Principle and Applicationof Machine Learning

待分配课程编号

MS004123

课程适用学位级别

博士

硕士

√

总学时

课内学时

学分

实践环节

用机小时

课程类别

□公共基础 □ 专业基础 □ 专业必修 √专业选修

开课院(系)

信息科学与工程学院

开课学期

秋季

考核方式

A.√笔试（√开卷 □闭卷） B. □口试

C.□笔试与口试结合 D. □其他

课程负责人

教师

姓名

蒋忠进

职称

副教授

e-mail

zjjiang@seu.edu.cn

网页地址

授课语言

中文

课件地址

适用学科范围

信息与通信工程、电子科学与技术、电子信息

所属一级学科名称

信息与通信工程

实验(案例)个数

先修课程

数字信号处理

教学用书

教材名称

教材编者

出版社

出版年月

版次

主要教材

机器学习

周志华

清华大学出版社

2016年1月

第一版

主要参考书

统计学习方法

李航

清华大学出版社

2019年5月

第二版

一、课程介绍（含教学目标、教学要求等）（300字以内）

本课程的目的在于让学生掌握机器学习方面的基础理论、常用算法和应用技术，建立机器学习相关的知识结构，提升利用机器学习解决实际问题的能力。本课程选取较常用的知识点予以讲授，包括多个机器学习模型、模型评估方法和多个应用案例，让学生在理解机器学习数学原理的同时，感性认识如何用机器学习算法来解决实际问题。提倡和指导学生练习机器学习算法的编程实现，培养将机器学习算法用于真实案例的经验和技巧。本课程在传授专业知识的同时，强调机器学习在科技、经济、民生和军事领域的重要意义，激发学生的家国情怀，树立学生科技报国的理想，达到思政育人的目的。

二、教学大纲（含章节目录）：（可附页）

1、绪论

机器学习的常见概念、基本术语、应用背景和发展现状等。

2、模型评估与选择

机器学习模型的评估和比较，即什么样的学习模型更好；训练数据和测试数据的划分、几种常用的学习性能指标。

3、线性模型

基于线性模型的回归和对数几率回归、线性判别分析、多分类学习和类别不平衡问题。

4、决策树

决策树的基本流程、基于信息增益和增益率确定各种属性的优越性、对决策树进行预剪枝和后剪枝以减少过拟合、连续属性的离散化机器优越性评估、属性值存在缺失时的优越性评估。

5、神经网络

神经元模型、感知机与多层网络、基于误差逆传播算法的网络训练、全局极小问题与局部极小问题、几种常见的神经网络模型、深度学习概念。

6、支持向量机

间隔与支持向量的概念、对偶问题与超平面求解、核函数与超平面求解、软间隔与正则化、支持向量回归。

7、贝叶斯分类

基于风险最小化的贝叶斯决策论、极大似然估计、朴素贝叶斯分类器、EM算法。

8、集成学习

集成学习概念、Boosting与学习器性能提升、学习器的结合策略。

9、聚类

最常见的无监督学习-聚类、聚类性能度量、距离计算、k均值聚类与高斯混合聚类、密度聚类、层次聚类。

10、降维与度量学习

k近邻学习、主成分分析与特征降维、核化线性降维。

11、特征选择与稀疏学习

子集搜索与评价、过滤式选择与特征优化、嵌入式选择与L1正则化、稀疏表示与字典学习、压缩感知概述。

12、计算学习理论

经验误差与泛化误差、概率近似正确（PAC）、有限假设空间、假设空间的VC维。

13、半监督学习

未标记样本与半监督学习、生成式方法、半监督SVM、半监督聚类。

14、概率图模型

隐马尔可夫模型、马尔可夫随机场、条件随机场、学习与推断。

三、教学周历

周次	教学内容	教学方式
1	绪论、模型评估与选择	讲课
2	线性模型	讲课
3	决策树	讲课
4	神经网络	讲课
5	神经网络、支持向量机	讲课
6	支持向量机	讲课
7	贝叶斯分类	讲课
8	总结与复习	讲课
9	集成学习、聚类	讲课
10	聚类	讲课
11	降维与度量学习	讲课
12	特征选择与稀疏学习	讲课
13	特征选择与稀疏学习	讲课
14	计算学习理论、半监督学习	讲课
15	概率图模型	讲课
16	总结与复习	讲课
17	考试周（如不考试则答疑）
18	考试周

注：1.以上一、二、三项内容将作为中文教学大纲，在研究生院中文网页上公布，四、五内容将保存在研究生院。2.开课学期为：春季、秋季或春秋季。3.授课语言为：汉语、英语或双语教学。4.适用学科范围为：公共，一级，二级，三级。5.实践环节为：实验、调研、研究报告等。6.教学方式为：讲课、讨论、实验等。7.学位课程考试必须是笔试。8.课件地址指在网络上已经有的课程课件地址。9.主讲教师简介主要为基本信息（出生年月、性别、学历学位、专业职称等）、研究方向、教学与科研成果，以100至500字为宜。

四、主讲教师简介：

蒋忠进，男，生于1973年9月，博士，副教授，科研方向以雷达探测为背景，基于机器学习、信号处理、图像处理和计算电磁学等学科，从事目标检测跟踪与抗干扰、基于回波信号的目标识别与抗干扰、散射中心提取与高分辨ISAR成像、基于SAR图像的目标检测与识别、目标电磁散射特性与隐身等方面的研究。在国内外发表学术论文近40余篇，主持和参与多个科研项目，多个学术期刊的审稿人。

五、任课教师信息（包括主讲教师）：

任课教师

学科（专业）

办公

电话

住宅

电话

手机

电子邮件

通讯地址

邮政

编码

蒋忠进

电磁场与微波技术

zjjiang@seu.edu.cn

江苏省南京市玄武区四牌楼2号

210096

六、课程开设审批意见

所在院（系）

审批意见

负责人：

日期：

所在学位评定分

委员会审批意见

分委员会主席：

日期：

研究生院审批意见

负责人：

日期：

备注

说明：1．研究生课程重开、更名申请也采用此表。表格下载：http:/seugs.seu.edu.cn/down/1.asp

2．此表一式三份，交研究生院、院（系）和自留各一份，同时提交电子文档交研究生院。

Application Form for Opening Graduate Courses

School (Department/Institute)：School of Information Science and Engineering

Course Type: New Open √ Reopen □ Rename □（Please tick in □, the same below）

Course Name

Chinese

机器学习原理与应用

English

Principle and Applicationof Machine Learning

Course Number

MS004123

Type of Degree

Ph. D

Master

√

Total Credit Hours

In Class Credit Hours

Credit

Practice

Computer-using Hours

Course Type

□Public Fundamental □Major Fundamental □Major Compulsory√Major Elective

School (Department)

School of Information Science and Engineering

Term

Autumn

Examination

A.√Paper（√Open-book □ Closed-book）B. □Oral

C. □Paper-oral Combination D. □ Others

Chief

Lecturer

Name

Zhongjin Jiang

Professional Title

Associate Professor

E-mail

zjjiang @ seu.edu.cn

Website

Teaching Language used in Course

Chinese

Teaching Material Website

Applicable Range of Discipline

Public

Name of First-Class Discipline

Information and Communication Engineering

Number of Experiment

Preliminary Courses

Teaching Books

Textbook Title

Author

Publisher

Year of Publication

Edition Number

Main Textbook

Machine Learning

Zhihua Zhou

Tsinghua University Press

Jun 2016

The 1th Edition

Main Reference Books

Statistical Learning Method

Hang Li

Tsinghua University Press

May 2019

The 2th Edition

Course Introduction (including teaching goals and requirements) within 300 words:

The purpose of this course is to enable students to master the basic theory, common algorithms and application background of machine learning, and provide help for subsequent scientific research. This course selects basic and commonly used knowledge points as the lesson contents, including linear model, decision tree, neural network, support vector machine, Bayesian classification, integrated learning, clustering, dimension reduction and measurement learning, feature selection and sparse learning, computational learning theory, semi supervised learning and probability graph model. The teaching content also includes several application cases to enable students to perceptually understand how to use machine learning algorithms to solve practical problems, and promote and guide students to exercise programming of machine learning algorithms. While imparting professional knowledge, this course emphasizes the significance of machine learning in science and technology, economy, people's livelihood and military fields, stimulates students' feelings of home and country, and help students to establish the ideal of serving the country through science and technology.

Teaching Syllabus (including the content of chapters and sections. A sheet can be attached):

1. Introduction

Common concepts, basic terms, application background and development status of machine learning.

2. Model evaluation and selection

Evaluation and comparison of machine learning models; Division of training data and test data, and several commonly used learning performance indicators.

3. Linear model

Regression and log probability regression based on linear model, linear discriminant analysis, multi classification learning and category imbalance.

4. Decision tree

The basic process of decision tree, determining the superiority of various attributes based on information gain and gain rate, pre pruning and post pruning of decision tree to reduce over fitting, discretization of continuous attributes, machine superiority evaluation, and superiority evaluation when attribute values are missing.

5. Neural network

Neuron model, perceptron and multilayer network, network training based on error back propagation algorithm, global minimum problem and local minimum problem, several common neural network models and concepts of deep learning.

6. Support vector machine

Concept of interval and support vector, dual problem and hyperplane solution, kernel function and hyperplane solution, soft interval and regularization, support vector regression.

7. Bayesian classification

Bayesian decision theory based on risk minimization, maximum likelihood estimation, naive Bayesian classifier, EM algorithm.

8. Integrated learning

The concept of integrated learning, the performance improvement of boosting and learners, and the combination strategy of learners.

9. Clustering

The most common unsupervised learning-clustering, clustering performance measurement, distance calculation, K-means clustering and Gaussian mixture clustering, density clustering and hierarchical clustering.

10. Dimension reduction and metric learning

K-nearest neighbor learning, principal component analysis and feature dimensionality reduction, kernel linear dimensionality reduction.

11. Feature selection and sparse learning

Subset search and evaluation, filtered selection and feature optimization, embedded selection and L1 regularization, sparse representation and dictionary learning, compressed sensing overview.

12. Computational learning theory

Empirical error and generalization error, probability approximate correct (PAC), finite hypothesis space, VC dimension of hypothesis space.

13. Semi supervised learning

Unlabeled samples and semi supervised learning, generative method, semi supervised SVM, semi supervised clustering.

14. Probability graph model

Hidden Markov model, Markov random field, conditional random field, learning and inference.

Teaching Schedule:

Week	Course Content	Teaching Method
1	Introduction; Model evaluation and selection
2	Linear model
3	Decision tree
4	Neural network
5	Neural network; Support vector machine
6	Support vector machine
7	Bayesian classification
8	Conclusion and review
9	Integrated learning; Clustering
10	Clustering
11	Dimension reduction and metric learning
12	Feature selection and sparse learning
13	Feature selection and sparse learning
14	Computational learning theory; Semi supervised learning
15	Probability graph model
16	Conclusion and review
17	Week of final exam ( Answer question if no final exam )
18	Week of final exam

Note: 1.Above one, two, and three items are used as teaching Syllabus in Chinese and announced on the Chinese website of Graduate School. The four and five items are preserved in Graduate School.

2. Course terms: Spring, Autumn , and Spring-Autumn term.

3. The teaching languages for courses: Chinese, English or Chinese-English.

4. Applicable range of discipline: public, first-class discipline, second-class discipline, and third-class discipline.

5. Practice includes: experiment, investigation, research report, etc.

6. Teaching methods: lecture, seminar, practice, etc.

7. Examination for degree courses must be in paper.

8. Teaching material websites are those which have already been announced.

9. Brief introduction of chief lecturer should include: personal information (date of birth, gender, degree achieved, professional title), research direction, teaching and research achievements. (within 100-500 words)

Brief Introduction of Chief lecturer:

Jiang Zhongjin, male, born in September 1973, doctor, associate professor. With radar detection as the background, and based on machine learning, signal processing, image processing and computational electromagnetism, he is engaged in target detection and tracking and anti-jamming, target recognition and anti-jamming based on echo signal, scattering center extraction and high-resolution ISAR imaging, target detection and recognition based on SAR image, target electromagnetic scattering characteristics and stealth. He has published nearly 40 academic papers at home and abroad, presided over and participated in many scientific research projects, and is a reviewer of many academic journals.

Lecturer Information (include chief lecturer)

Lecturer

Discipline

(major)

Office

Phone Number

Home Phone Number

Mobile Phone Number

Address

Postcode

Zhongjin Jiang

Electromagnetic Field and Microwave Technology

zjjiang@seu.edu.cn

No. 2 Sipailou, Xuanwu District, Nanjing, Jiangsu

210096

“机器学习原理与应用”课程教学大纲

课程基本信息

课程代码
课程名称	机器学习原理与应用（Principle and Application of Machine Learning）
学分/学时	3学分/48学时
学时分配	课堂教学学时：48；实验学时：0；课外学时：0
课程类别	选修课
开课学期	研一（秋季）
开课单位	信息科学与工程学院
适用专业	信息与通信工程，电子科学与技术
教学语言	中文
先修课程	高等数学、线性代数、概率统计
后续课程	涉及人工智能相关课程
课程简介	本课程的目的在于让学生掌握机器学习方面的基础理论、常用算法和应用技术，建立机器学习相关的知识结构，提升利用机器学习解决实际问题的能力。本课程选取较常用的知识点予以讲授，包括多个机器学习模型、模型评估方法和多个应用案例，让学生在理解机器学习数学原理的同时，感性认识如何用机器学习算法来解决实际问题。提倡和指导学生练习机器学习算法的编程实现，培养将机器学习算法用于真实案例的经验和技巧。本课程在传授专业知识的同时，强调机器学习在科技、经济、民生和军事领域的重要意义，激发学生的家国情怀，树立学生科技报国的理想，达到思政育人的目的。

课程目标

本课程的目的在于让学生掌握机器学习方面的基础理论、常用算法和应用技术，提升学生在工程知识、问题分析、设计和实现解决方案、研究和优化解决方案等方面的机器学习专业水平，建立机器学习相关的知识结构，提升利用机器学习解决实际问题的能力。

为了培养学生的科技报国精神，本课程引入多个机器学习在军事方面的应用案例，让学生了解该学科的广泛应用，帮助学生树立科技报国的理想、提升社会责任感与家国情怀，达到思政育人的目的。

1、指导学生掌握机器学习相关的应用背景、数学基础、机器学习模型和模型评估等理论和算法，为应用机器学习解决实际问题奠定理论基础。

2、培养学生分析问题的能力。针对需要解决的实际问题，能从机器学习的角度进行认识和分析，选定合理的机器学习模型和优化方法。

3、培养学生解决问题的能力。针对既定的机器学习问题，能制定解决问题的技术路线，编程实现机器学习算法，进行模型训练和测试。能调试和优化算法，使机器学习方案得到不断改进。

课程支撑的毕业要求指标点

本课程支撑信息工程专业毕业要求中的如下指标点：

指标点1.2：掌握工程基础知识，并能够应用其基本概念、基本理论和基本方法解决实际问题。
指标点2.3：能够应用工程基础和专业基础基本原理，研究分析信息工程领域复杂工程问题，获得有效结论。
指标点3.2：掌握信息处理基础知识，能够设计/开发信息处理系统解决方案。

课程目标与课程支撑的指标点的对应关系

序号	课程目标	课程支撑的指标点
1	指导学生掌握机器学习相关的应用背景、数学基础、机器学习模型和模型评估等理论和算法，为应用机器学习解决实际问题奠定理论基础。	指标点1.2：掌握工程基础知识，并能够应用其基本概念、基本理论和基本方法解决实际问题。
2	培养学生分析问题的能力。针对需要解决的实际问题，能从机器学习的角度进行认识和分析，选定合理的机器学习模型和优化方法。	指标点2.3：能够应用工程基础和专业基础基本原理，研究分析信息工程领域复杂工程问题，获得有效结论。
3	培养学生解决问题的能力。针对既定的机器学习问题，能制定解决问题的技术路线，编程实现机器学习算法，进行模型训练和测试。能调试和优化算法，使机器学习方案得到不断改进。	指标点3.2：掌握信息处理基础知识，能够设计/开发信息处理系统解决方案。

课程目标与教学内容和教学环节对应关系表

序号	课程目标	教学内容	教学环节
序号	课程目标	教学内容	课堂教学	课后作业	互动研讨	案例编程
1	指导学生掌握机器学习相关的应用背景、数学基础、机器学习模型和模型评估等理论和算法，为应用机器学习解决实际问题奠定理论基础。	1）课堂授课，讲授机器学习相关的数学基础、机器学习模型、模型评估方法、应用案例等方面的内容，为学生构建机器学习相关的知识结构。 2）课后作业，通过布置习题作业，巩固和深化课堂上学到的理论知识。	＋	＋
2	培养学生分析问题的能力。针对需要解决的实际问题，能从机器学习的角度进行认识和分析，选定合理的机器学习模型和优化方法。	1）课堂授课，讲授机器学习的应用案例，启发学生建立机器学习模型与具体应用之间的联系。 2）互动研讨，针对既定的实际问题，通过课堂提问和互动讨论，帮助学生建立机器学习应用案例的技术路线和实现方案。	＋		＋
3	培养学生解决问题的能力。针对既定的机器学习问题，能制定解决问题的技术路线，编程实现机器学习算法，进行模型训练和测试。能调试和优化算法，使机器学习方案得到不断改进。	1）课堂授课，针对既定应用案例，讲解算法流程、编程语言、编程技术和注意事项。 2）案例编程，鼓励和指导学生进行机器学习算法编程，主要选择使用Matlab语言或者Python语言。 3）互动研讨，通过讨论来交流彼此的经验和教训，提升调试程序的能力，完善机器学习源代码，优化机器学习指标，并进行分析和总结。	＋		＋	＋

课程内容与学时分配

课程教学学时：48。教学内容与学时分配如下：

1、绪论（1学时/课内）：机器学习的常见概念、基本术语、应用背景和发展现状等。增加思政元素，给出多个机器学习在军事上得到应用的例子，提升学生科技报国的爱国情怀，增强保家卫国的民族责任感。

2、模型评估与选择（2学时/课内）：机器学习模型的评估和比较，即什么样的学习模型更好；训练数据和测试数据的划分、几种常用的学习性能指标。

3、线性模型（3学时/课内）：基于线性模型的回归和对数几率回归、线性判别分析、多分类学习和类别不平衡问题。

4、决策树（3学时/课内）：决策树的基本流程、基于信息增益和增益率确定各种属性的优越性、对决策树进行预剪枝和后剪枝以减少过拟合、连续属性的离散化机器优越性评估、属性值存在缺失时的优越性评估。

5、神经网络（5学时/课内）：神经元模型、感知机与多层网络、基于误差逆传播算法的网络训练、全局极小问题与局部极小问题、几种常见的神经网络模型、深度学习概念。

6、支持向量机（4学时/课内）：间隔与支持向量的概念、对偶问题与超平面求解、核函数与超平面求解、软间隔与正则化、支持向量回归。

7、贝叶斯分类（3学时/课内）：基于风险最小化的贝叶斯决策论、极大似然估计、朴素贝叶斯分类器、EM算法。

8、总结与复习（3学时/课内）：对前半学期的学习内容进行复习，梳理知识要点；组织应用案例编程相关的研讨交流。增加思政元素，讲解机器学习在民用和军事中得到的应用案例，激励学生建立科技报国的理想。

9、集成学习（2学时/课内）：集成学习概念、Boosting与学习器性能提升、学习器的结合策略。

10、聚类（4学时/课内）：最常见的无监督学习-聚类、聚类性能度量、距离计算、k均值聚类与高斯混合聚类、密度聚类、层次聚类。

11、降维与度量学习（3学时/课内）：k近邻学习、主成分分析与特征降维、核化线性降维。

12、特征选择与稀疏学习（6学时/课内）：子集搜索与评价、过滤式选择与特征优化、嵌入式选择与L1正则化、稀疏表示与字典学习、压缩感知概述。

13、计算学习理论（2学时/课内）：经验误差与泛化误差、概率近似正确（PAC）、有限假设空间、假设空间的VC维。

14、半监督学习（1学时/课内）：未标记样本与半监督学习、生成式方法、半监督SVM、半监督聚类。

15、概率图模型（3学时/课内）：隐马尔可夫模型、马尔可夫随机场、条件随机场、学习与推断。

16、总结与复习（3学时/课内）：对后半学期的学习内容进行复习，梳理知识要点；组织应用案例编程相关的研讨交流。增加思政元素，讲解机器学习在民用和军事中得到的应用案例，激励学生建立科技报国的理想。

教学方法

1、在课堂教学中，分应用背景、理论要点、理论推导、公式总结、习题等部分来讲授；挑出该堂课的难点，准备好详细的备课与讲授方法；

2、为每堂课准备科普案例和应用案例，将所讲理论知识与实际应用相结合，让学生感性地理解理论知识；

3、对讲解知识点进行逻辑上的分解，并搭配VISIO和MATLAB生成的图示，通过多媒体教学方式，化抽象为形象；

4、调整教师的教学风格，增强亲和力；整肃课堂纪律，不许看与课程无关的书本和IT设备；增强师生互动，每堂课都有多次提问，要求学生投入；

5、鼓励学生参与案例编程，将机器学习算法用于实践，并得到相关体验和能力提升。在课堂上留出一定时间，与学生相互讨论，交流不同的编程思路和技巧。

6、在教学中融入思政元素，通过各种案例，介绍机器学习知识在军事和经济方面的大量应用，提升学生对本课程的重视程度，培养学生科技报国的爱国情怀，增强学生保家卫国的民族责任感。

课程考核与成绩评定

课程将考核学生对课程目标的达成程度，检查学生对教学内容的掌握程度。课程成绩包括2个部分，分别为平时成绩和期末考试成绩。

成绩评定方式如下表所示：

考核环节	分值	考核/评价细则
平时成绩	20	根据学生的课后作业完成情况、案例编程水平，构成平时成绩，再作为20%计入课程总成绩。
期末考试	80	考试内容涵盖课程讲授的重要知识点，包括数学基础、机器学习模型、模型评估和应用案例，以期末考试的卷面成绩，再作为60%计入课程总成绩。

课程目标与课程考核环节关系：

序号	课程目标	平时成绩	期末考试	合计
1	指导学生掌握机器学习相关的应用背景、数学基础、机器学习模型和模型评估等理论和算法，为应用机器学习解决实际问题奠定理论基础。	60%	60%	60
2	培养学生分析问题的能力。针对需要解决的实际问题，能从机器学习的角度进行认识和分析，选定合理的机器学习模型和优化方法。	30%	30%	30
3	培养学生解决问题的能力。针对既定的机器学习问题，能制定解决问题的技术路线，编程实现机器学习算法，进行模型训练和测试。能调试和优化算法，使机器学习方案得到不断改进。	10%	10%	10
总计		100%	100%	100

课程教材与主要参考书

教材：

周志华，机器学习，清华大学出版社，2016年1月，第一版；

参考书：

李航，统计学习方法，清华大学出版社，2019年5月，第二版；