跳转至

1688359488

计算摄影学

CS 专业选修

课程学习内容

课程内容与《计算机视觉导论》和《计算机视觉》有很多重合,但相对 cv 更加深入,相对 cv 导论前沿内容少一些。课程内容主要为

  • 概论与图像信息处理基础

    • 第一周:整个学期课程内容概述
    • 第二周:图像的数字化、颜色空间、滤波与频域变换
    • 第三周:泊松图像编辑与交互式数字蒙太奇
  • ML, DL 与图像拼接技术

    • 第四、五周:机器学习、深度学习基础
    • 第六周:特征匹配与光流
    • 第七周:全景图拼接
  • SLAM 与三维重建

    • 第八、九周:相机模型,SLAM 与增强现实
    • 第十、十一周:单视图 / 多视图三维重建
  • 面向细化任务的杂谈

    • 第十二周:图像缩放与补全
    • 第十三周:图像上色
    • 第十四周:图像去模糊,HDR 和虚拟视点合成

大的方向上,春学期的内容偏基础一些,主要用作小实验;冬学期的内容偏工程应用一些,很多都是面向论文 / 具体的工作而谈,基本上每个主题都对应一个大程的选题。第十五、十六周用于大程的 pre

20 级的大程可选主题有:

  • Image Completion with Structure Propagation
  • Interactive Digital Photomontage
  • Multi-view 3D Reconstruction
  • Monocular Depth Estimation
  • Image Colorization
  • Style transfer for traditional Chinese paintings
  • Visual SLAM
  • Visual Localization

先修要求

如果临时学,零基础也能学。所有用到的基础都会简单地讲一遍,如果没有先修的话或许也能学会,只是要付出更多的精力。具体而言,这门课会用到(或重复教授)以下三门课的相关知识:

  • 图像信息处理
  • 计算机图形学
  • 计算机视觉

但是有趣的是,以上三门课的知识重叠也是很大的。除了以上的专业知识,这门课还需要以下的基础能力:

  • C++ oop
  • 熟练的线性代数
  • 一定的凸优化和微分方程基础(了解即可)

除了深度学习之外的所有小实验,以及大程的部分选题目前都是要求用 C++ 实现的,甚至部分实验会给出代码框架(如接口类)要求具体实现。

课程教材

无。面向前沿的专业课一般没教材,后期近于论文集。

分数构成

本门课程的评分分为 3 个部分,每个部分分数分配如下:

  • 上课出勤与课程作业(50%)
    • 5 次必做课程作业 + 1 次选做课程作业
    • 必做作业常有 bonus,选作作业是纯 bonus
    • 平时成绩最多加 3 分,但最多不能超过 50
    • 偶尔会有签到,章国锋的课签到概率比较高,签到如何计入成绩暂时未知
  • 项目设计和演示(40%)
    • 据教学内容自选一个项目,完成算法和程序设计 ( 会提供程序框架和测试数据,学生只要按规定完成相应的模块即可 ),最后提交完整 demo 和项目报告
    • 要求独立或分组合作完成,鼓励单刷,如果组队会有更高的要求
    • 20 级只有单刷和 2 人队,每个项目会有 bonus2 人队必做部分 bonus,单刷做了 bonus 可以加分
    • 答辩后上交代码、报告以及 PPT 等材料
  • 项目课堂答辩(10%)
    • 期末最后两周答辩,各队确定选题上报助教,助教安排时间和次序
    • 20 级每队答辩总时间 15 分钟左右,大约 3-5 分钟的时间用于老师提问
    • 一周由章国锋老师评分,一周由周晓巍老师评分。zxw zgf 的提问更切中要害,但是也很温柔。zgf 则会提醒你该怎么继续做以拿到高分()
    • 据观察,这部分高分可以达到 9/9.5 分,普通的也有 8/8.5 分,只有非常拉胯的才会只有 5/6

任课教师

由章国锋和周晓巍两位老师共同开设。

章国锋老师是无情的半个 PPT reader,因为他 PPT 也读得不是很流畅,听他的讲课会增大对 PPT 理解的难度()但是 zgf 人很好,也很为学生着想,虽然喜欢签到但是急匆匆赶来(甚至课后才来的)都会给补签,也会偷偷介绍怎样可以拿高分。zgf 的学术水平也很不错,具体可以看他的 google scholar,在这里就不赘述了。

周晓巍老师是神。人比较温柔,讲课也引人入胜,能够把课程内容从细微之处到最前沿讲得清清楚楚,ai 的同学学过他的 cv 导论应该就非常清楚了。zgf zxw 各讲一半的课,导致笔者一半的课学得很清楚,另一半学得迷迷糊糊。最后的大程,绝大部分同学选的也是 zxw 老师讲解的主题相关的大程(笑)

参考资料

理解三维重建可能需要一些多视图几何的知识,给出一本许多人推荐的参考书《计算机视觉中的多视图几何》,虽然笔者还没有看过。

Multiple View Geometry in Computer Vision, Richard Hartley Andrew Zisserman

学习建议

图像信息处理、计算机图形学、计算机视觉、计算摄影学算是 cs cv & cg 方向的系列课程了,但是没学过前三门也没有关系,笔者只学了图形学和视觉两门课,学起来感觉压力也不大;也有同学只学了 cv,也觉得压力还好。但是如果只学过图像信息处理或者三门都没学过的同学,如果精力有限的话学这门课可能会有些吃力,毕竟是 4 学分大课,虽然相对同等 4 学分的课会轻松一些,但是该有的 workload 还是有的。

这门课的给分相当不错,从分数比例上就能看出来了。值得一提的是小作业就算迟交,迟交一天也只扣掉小作业单次满分 100 中的 2 分,迟交 10 天就会冻结止损。也就是说,哪怕你期末才交小作业,你的小作业的基本分还是能达到 80,更何况几乎每次小作业都有 bonus 可以往上加分,还有选做作业可以加分。平时分很容易满的,再好好做做大程就行。

从学习角度,zxw 的讲课十分不错,你能在一半的时间获得极致的体验。当然你也可以选择 ai cv 导论课,体验只会更好。另外笔者本人在实验的过程中感到对 ML, DL 以及凸优化的理解更加深入了,并在大程中注意到了长足的进步,总体感觉还是不错的。