跳转至

1690026734

人工智能安全

IS 专业必修

不要与 AI 专业的人工智能伦理与安全混淆

课程学习内容

上课内容包括:

  • 概论,进行总的介绍,以及 AI 安全问题的分类
  • 人工智能基本概念
  • 对抗样本攻击,及其检测与防御
  • 数据投毒攻击及防御
  • 后门攻击及防御
  • 人工智能隐私性,隐私攻击与防御
  • 人工智能公平性
  • 人工智能可解释性

每个专题都会首先讲解主要概念,并对四五个相关论文的工作进行详细介绍,带人深入了解。论文以 2017 年到 2021 年这一时期的为主,因此不少还是很新颖的工作(这一点我很喜欢)。总的来说,可以学到人工智能安全主流方向与研究进展,了解多种安全技术,是一门不错的课程。

这门课挺好的,任务不多,有 4 次自己上网搜集资料,整理回答,不算难,然后实验课就是跑通两次代码写报告,最后复现一次大作业就好了,虽然看着很多,但是他学分也多啊(乐),总之上课体验良好,没有特别卷,老师讲的也很好,一个这方面的小白都了解了这块内容,实验也不难,可以选的。

—— CC98 上一位同学的评价,https://www.cc98.org/topic/5646762

这门课的作业包括(看起来很多但事实上并不多):

  • 大概三四次平时作业,都是几道思考题的形式,根据上课内容以及自己简单查些文献基本都能做出来,内容并不多;
  • 一篇综述的报告。22-23 春夏学期读的综述是关于对抗样本攻击的, Yuan, X., He, P., Zhu, Q., & Li, X. (2017). Adversarial Examples: Attacks and Defenses for Deep Learning. https://arxiv.org/abs/1712.07107
  • 三次实验,22-23 春夏学期中,第一次实验是配环境(送分的),第二次是对抗样本攻击,第三次是联邦学习;实验课要求线下到课,需要写实验报告;
  • 一次大作业。大作业为小组完成,1-2 人一组,共同提交一份报告。内容是复现或自己提出一种 AI 安全特定方向的相关技术,并至少在一个目标模型和一个目标数据集上完成相应测试。23 年留的是公平性和成员推断攻防;在这之前留的是对抗样本攻击。

实验课春学期不上,夏学期是每两周一次。不上实验课的那周,会请蚂蚁专家来进行线上讲座,这个个人认为讲得有些过于商业了,不是很能听进去 :-)

没有期末考试。

先修要求

最好对基本数学知识、神经网络、一些常见 AI 算法和模型有基本了解(安利 Stanford University CS231n: Deep Learning for Computer Vision)。但如果没有基础也是可以的的,因为老师上课都会把需要了解的相关内容的讲一遍,也有一节课专门介绍 AI 基本概念。

当然基本的 Python Pytorch 知识还是要有的,毕竟有实验和大作业。

任课教师

有王志波、杨子祺两位老师。两位老师都可以选,至少他们都是对这一方向很了解的(不过笔者认为杨讲得更清楚一些)。

两位老师都会随机点名。给分都不错,査老师上均绩都 > 4.5

分数构成

课堂出勤(10%)+ 平时作业(30%)+ 实验上机(20%)+ 期末大作业(40%)。

推荐书目

AI 安全的书并不多,而且很多技术比较前沿。可以一看的有

参考笔记