1688359488
计算摄影学 ¶
课程学习内容 ¶
课程内容与《计算机视觉导论》和《计算机视觉》有很多重合,但相对 cv 更加深入,相对 cv 导论前沿内容少一些。课程内容主要为
-
概论与图像信息处理基础
- 第一周:整个学期课程内容概述
- 第二周:图像的数字化、颜色空间、滤波与频域变换
- 第三周:泊松图像编辑与交互式数字蒙太奇
-
ML, DL 与图像拼接技术
- 第四、五周:机器学习、深度学习基础
- 第六周:特征匹配与光流
- 第七周:全景图拼接
-
SLAM 与三维重建
- 第八、九周:相机模型,SLAM 与增强现实
- 第十、十一周:单视图 / 多视图三维重建
-
面向细化任务的杂谈
- 第十二周:图像缩放与补全
- 第十三周:图像上色
- 第十四周:图像去模糊,HDR 和虚拟视点合成
大的方向上,春学期的内容偏基础一些,主要用作小实验;冬学期的内容偏工程应用一些,很多都是面向论文 / 具体的工作而谈,基本上每个主题都对应一个大程的选题。第十五、十六周用于大程的 pre。
20 级的大程可选主题有:
- Image Completion with Structure Propagation
- Interactive Digital Photomontage
- Multi-view 3D Reconstruction
- Monocular Depth Estimation
- Image Colorization
- Style transfer for traditional Chinese paintings
- Visual SLAM
- Visual Localization
先修要求 ¶
如果临时学,零基础也能学。所有用到的基础都会简单地讲一遍,如果没有先修的话或许也能学会,只是要付出更多的精力。具体而言,这门课会用到(或重复教授)以下三门课的相关知识:
- 图像信息处理
- 计算机图形学
- 计算机视觉
但是有趣的是,以上三门课的知识重叠也是很大的。除了以上的专业知识,这门课还需要以下的基础能力:
- C++ 与 oop
- 熟练的线性代数
- 一定的凸优化和微分方程基础(了解即可)
除了深度学习之外的所有小实验,以及大程的部分选题目前都是要求用 C++ 实现的,甚至部分实验会给出代码框架(如接口类)要求具体实现。
课程教材 ¶
无。面向前沿的专业课一般没教材,后期近于论文集。
分数构成 ¶
本门课程的评分分为 3 个部分,每个部分分数分配如下:
- 上课出勤与课程作业(50%)
- 5 次必做课程作业 + 1 次选做课程作业
- 必做作业常有 bonus,选作作业是纯 bonus
- 平时成绩最多加 3 分,但最多不能超过 50 分
- 偶尔会有签到,章国锋的课签到概率比较高,签到如何计入成绩暂时未知
- 项目设计和演示(40%)
- 据教学内容自选一个项目,完成算法和程序设计 ( 会提供程序框架和测试数据,学生只要按规定完成相应的模块即可 ),最后提交完整 demo 和项目报告
- 要求独立或分组合作完成,鼓励单刷,如果组队会有更高的要求
- 20 级只有单刷和 2 人队,每个项目会有 bonus,2 人队必做部分 bonus,单刷做了 bonus 可以加分
- 答辩后上交代码、报告以及 PPT 等材料
- 项目课堂答辩(10%)
- 期末最后两周答辩,各队确定选题上报助教,助教安排时间和次序
- 20 级每队答辩总时间 15 分钟左右,大约 3-5 分钟的时间用于老师提问
- 一周由章国锋老师评分,一周由周晓巍老师评分。zxw 比 zgf 的提问更切中要害,但是也很温柔。zgf 则会提醒你该怎么继续做以拿到高分()
- 据观察,这部分高分可以达到 9/9.5 分,普通的也有 8/8.5 分,只有非常拉胯的才会只有 5/6 分
任课教师 ¶
由章国锋和周晓巍两位老师共同开设。
章国锋老师是无情的半个 PPT reader,因为他 PPT 也读得不是很流畅,听他的讲课会增大对 PPT 理解的难度()但是 zgf 人很好,也很为学生着想,虽然喜欢签到但是急匆匆赶来(甚至课后才来的)都会给补签,也会偷偷介绍怎样可以拿高分。zgf 的学术水平也很不错,具体可以看他的 google scholar,在这里就不赘述了。
周晓巍老师是神。人比较温柔,讲课也引人入胜,能够把课程内容从细微之处到最前沿讲得清清楚楚,ai 的同学学过他的 cv 导论应该就非常清楚了。zgf 和 zxw 各讲一半的课,导致笔者一半的课学得很清楚,另一半学得迷迷糊糊。最后的大程,绝大部分同学选的也是 zxw 老师讲解的主题相关的大程(笑)
参考资料 ¶
理解三维重建可能需要一些多视图几何的知识,给出一本许多人推荐的参考书《计算机视觉中的多视图几何》,虽然笔者还没有看过。
Multiple View Geometry in Computer Vision, Richard Hartley Andrew Zisserman
学习建议 ¶
图像信息处理、计算机图形学、计算机视觉、计算摄影学算是 cs 的 cv & cg 方向的系列课程了,但是没学过前三门也没有关系,笔者只学了图形学和视觉两门课,学起来感觉压力也不大;也有同学只学了 cv,也觉得压力还好。但是如果只学过图像信息处理或者三门都没学过的同学,如果精力有限的话学这门课可能会有些吃力,毕竟是 4 学分大课,虽然相对同等 4 学分的课会轻松一些,但是该有的 workload 还是有的。
这门课的给分相当不错,从分数比例上就能看出来了。值得一提的是小作业就算迟交,迟交一天也只扣掉小作业单次满分 100 中的 2 分,迟交 10 天就会冻结止损。也就是说,哪怕你期末才交小作业,你的小作业的基本分还是能达到 80,更何况几乎每次小作业都有 bonus 可以往上加分,还有选做作业可以加分。平时分很容易满的,再好好做做大程就行。
从学习角度,zxw 的讲课十分不错,你能在一半的时间获得极致的体验。当然你也可以选择 ai 的 cv 导论课,体验只会更好。另外笔者本人在实验的过程中感到对 ML, DL 以及凸优化的理解更加深入了,并在大程中注意到了长足的进步,总体感觉还是不错的。