关于我
我是清华大学计算机科学与技术系 THUIR 的四年级博士生,导师是 刘奕群 教授。
我的研究重点包括以下领域:
大语言模型的后训练: 专注于通过有效的后训练策略提升大语言模型的性能,包括:
- ✨ 垂直领域知识注入 通过持续预训练或指令微调将专家级知识集成到大语言模型中,以增强其在专业任务上的能力。
- 📚 高效强化学习算法 开发更有效和高效的基于强化学习的方法,推动大语言模型在推理和决策方面的能力边界。
奖励建模与大模型评判: 探索大语言模型作为奖励模型的潜力和应用,以实现更精确和可扩展的奖励建模,进而促进模型的自动化演进。关键方面包括:
- 🎯 性能评估 研究大语言模型如何评估模型能力(如生成质量、推理能力),构建统一的评估框架。
- 🚀 模型演进 利用基于大语言模型的评估反馈来指导新模型的设计和优化,加速迭代开发。
- ⚖️ 偏见缓解 开发更可靠的大模型评判器,减少偏见并增强公平性,确保值得信赖和公正的评估结果。
我也对大语言模型在复杂问题分解与求解、多智能体协作、检索增强生成(RAG)和信息检索方面有浓厚兴趣。期待与这些领域的研究者合作交流!
教育经历
- 2022年9月至今 博士,计算机科学与技术系,清华大学,中国。
- 2018年9月-2022年6月 学士,电子信息工程,北京航空航天大学,中国。
- 2019年9月-2022年6月 辅修,数学,北京航空航天大学,中国。
新闻动态
- 2025 🏆 荣获国家奖学金、中国科协青年科技人才培育工程博士生专项以及清华大学探臻学者(全校15人)!
- 2024年12月 🎉 荣获钟士模奖学金,清华大学计算机系最高荣誉,每年仅授予6名学生。
- 2024年6月 🌟 荣幸获得西贝尔学者奖,该奖项每年全球仅授予83位学者。详情。
论文发表
请参考 谷歌学术 📚
荣誉奖项
- 2025 国家奖学金
- 2025 中国科协青年科技人才培育工程博士生专项
- 2025 清华大学探臻学者
- 2024 钟士模奖学金 1/6,清华大学计算机系最高荣誉。
- 2024 西贝尔学者奖 1/83(全球),$30,000。
- 2023 国家奖学金
- 2022 北京冬奥会和冬残奥会突出贡献个人,全国5名志愿者。
- 2022 中国大学生自强之星
- 2022 天翼奖学金
- 2022 北京市优秀毕业生
- 2021 小米特等奖学金
- 2021 飞young奖学金
- 2021 华为智能基座奖学金
- 2021 北航最高本科生荣誉沈元奖章
- 2021 北航榜样
- 2021 挑战杯:北京市一等奖
- 2021 中国大学生互联网+创新创业大赛:北京市二等奖
- 2021 集成电路设计竞赛:一等奖,北京市第二名
- 2021 北京市优秀学生干部
- 2020 国家奖学金
- 2020 美国大学生数学建模竞赛:特等奖提名,全球前1%。
- 2020 中国大学生数学建模竞赛:全国二等奖,北京市一等奖
- 2020 数学建模国际赛(MathorCup):全国二等奖
工作经历
- 2022年9月至今 清华大学计研41党支部书记
- 2022年9月至今 清华大学计研41带班助理
- 2021年9月-2022年6月 校团委志愿服务部部长,北京航空航天大学
- 2019年9月-2020年6月 学院学生会主席,北京航空航天大学
🌍 访客地图
感谢来自世界各地的访问!
