跳转至

1726833425

大模型应用与实践

大二短学期 课程综合实践 Ⅱ

课程学习内容

课程名是大模型应用与实践,但从课程内容上看,是偏向入门性质的课程。主要涉及的内容如下:

  • LLM 的基本介绍:包括发展历程、基本类型和原理以及特性和应用场景
  • 提示词工程(Prompt Engineering):涉及零样本和少样本提示 (Zero-shot & Few-shot)、上下文学习 (ICL)、自注意力和多头注意力机制 (Self-AttentionMulti-Head Attention)
  • Transformer 架构:介绍了位置编码 (Positional Encoding)、编码器(Encoder)和解码器(Decoder)、指令微调 (Fine-Tuing) 以及基于人类反馈的强化学习 (RLHF)
  • Agent 智能体:介绍了 Agent 智能体的基本概念、基于 LLM Agent 智能体的设计、多 Agent 系统的设计以及检索增强型大语言模型 (RA-LLM)

除此之外,课程还会请到清华、北航、百度等学校和公司的专家分享自己的研究经验和实践经验。

这些讲座分享的内容会分享科研界和工业界关于 LLM 的前沿技术,涉及的方向很多,包括但不限于:

  • 视频生成 Video Generation
  • 行为识别 Action Recognition

具体分享内容应该会随着每年请到的老师不同而变化。

总体而言,是一门适合入门和快速上手 LLM 的课程。

先修要求

理论上没有先修要求,但建议有基础的 Python 编程能力;如果有 AI 课程基础,在理解课堂知识上会事半功倍。

任课教师

本课程挂的是王文冠 / 朱霖潮两位老师的名字,但实际上课的只有朱霖潮一位老师。

朱霖潮老师上课讲的很清楚,质量很好且有求必应。很照顾还没跟上进度的学生,并且手上还会随机刷新小零食,分给同学。下课前会做当堂课的内容总结,帮同学重新梳理思路。而且很喜欢同学问问题 (“问题其实就是一种 Prompting”),跟他多多交流。

分数构成

本课程没有考勤分,不过朱老师会给多次出勤的同学小零食

  • Assignment1(20%):属于 Prompt Engineering 的作业,需要自己创建一个小的问题集,测试几个本地大模型的能力和性能
  • Assignment2(60%):属于 Agent 智能体的作业,需要使用本地大模型创建一个 Agent 智能体,完成一个数据分析和可视化的任务
  • Lab1(10%):在本地,使用小规模的莎士比亚文集数据上训练小型 GPT 模型,输出莎士比亚风格的文字
  • Lab2(10%):在本地实现 Llama 2 7B 模型的推理和量化,观察量化操作对模型推理性能的影响

Lab1 Lab2 都是认定型分数,只要验收通过就是满分。

参考资料

下面是笔者在 2024 年短学期的资源: