1750860173
大数据存储与计算技术 ¶
课程学习内容 ¶
- 大数据基本概念
- 传统存储技术
- 信息存储基本概念
- 数据保护 RAID
- 网络存储架构:NAS,DAS,SAN
- 业务连续性与存储可靠性
- 云存储:云计算与大数据存储
- 图存储:图计算与大数据存储
- 存算一体化计算
先修要求 ¶
若为了完全理解这门课所讲授的内容,或许学过数据结构基础,计算机组成,计算机网络以及操作系统等课程,可能更容易理解,但考虑这门课和通识课比较像,整体比较水,且上课讲述的内容并没有直接考核,所以对于准备水水过的同学,先修要求是无。
任课教师 ¶
这门课只有陈华钧开设,陈老师在这门课的教学上也是经典的上水课的风格,全程自顾自地讲,下面的同学干自己的事情,平时上课不点名不点人回答问题,如果想抬头听的话还是能学到东西的,如果有问题也可以在课后向老师提问,老师也会积极回答。
课程教材 ¶
无,老师会按照 PPT 来讲,可以在课后找老师拷贝 PPT 自己课后看。
分数构成 ¶
期末展示占全部 100% 分数,期末展示会在学期的最后几周进行,最多四人一个小组准备一个展示,老师会给一些需要存储系统的场景,需要小组完成场景存储需求的分析和系统设计,完成一个五分钟的 PPT 和一份三到五页的报告。内容要包括:存储需求分析,存储媒质选择,网络存储架构设计,RAID 级别的选择及解释,备份策略的设计等。下面是教师给出的示例题目,供同学们参考。
某单位主要负责接受和处理遥感影响数据。由对地观测卫星所产生的遥感影像数据规模巨大,一般单颗卫星一次成像产生的单轨数据可能在数 10G 甚至数 100G。数据进一步加工产生更高级别的应用产品,日均产生数据量在 10TB 左右,并同时服务于数十家用户。请根据该案例设计合理的存储体系结构。
学习建议 ¶
专业模块课中的大水课,听着像通识课,感兴趣的同学可以多听听老师的讲解,如果干别的事情去了没注意听问题也不大。如果上课没怎么听的话,期末展示前看看 PPT,再查查资料即可,由于组队完成展示,可以只用学习一部分的课程内容,压力还是不大的。根据身边人的情况来看,这门课给分的情况很好,期末展示不出什么岔子基本能拿到 90 分以上的总评,期末展示时老师也不怎么注意听,甚至我们组当时交的设计报告老师还在未读状态。期末展示时每组展示完老师都会选几位同学来进行提问,并记录提问同学的名字和组别,想拿到满绩就一定要参加展示时的提问环节,我认识展示表现很好但没参加提问的同学,最终总评被卡在了 94,所以猜测参加提问环节应该是满绩的必要条件。
然而根据 25 春夏的情况,大部分想水这门课的同学仅能拿到 3.9 左右的绩点。期末展示极其草台:
- 老师不回私信和群消息,也不会在群里通知「展示时要交纸质报告」等事项。等你急的快死了,才在群里发课件和展示组队登记表。
- 有约 180 名学生,4 人一组约 45 个小组,展示时间为 5 分钟 / 组。每周两课时,满打满算只能展示 18 个小组。
- 展示第一节课就花了 20 分钟拷 PPT,两节拖堂到三节,展示了两周还没展示完,剩余部分小组在期末周期间线上展示。
- 大多数同学没什么准备,使用 AI 临时生成 PPT 和内容,机械读稿。老师也不怎么听内容,只管到 5 分钟马上打断。
笔者和部分同学讨论比较后有下面的结论:
- 提问应该是固定 +2 分。
- 做教师提供的选题,只能拿到 3.9/4.2 左右。即使在期末展示中提问可能也于事无补。
-
自己选题并适当准备,可以拿到 4.5/4.8 左右的绩点。
2025-05-29 第 3-4 节,有多个组做了《小红书数据存储系统设计》,展示了数据模型、图存储、云原生与容器化等方面的设计,难度较高。
此外,做 AI 相关内容也能得到不错的分数,举例如:LLM 权重存储等。
-
有设计实验,进行大规模验证取得充足的数据,可以拿到满绩。
2025-05-29 第 3-4 节,由 ZJUSCT 第一个进行的展示,由强大的硬件设施、细致的调研分析和丰富的实验数据支撑,获得满绩。