


“他利用对英伟达GPU的熟悉,基于对底层逻辑的深刻理解,顺势驾驭华为NPU。更绝的是,他用AI Agent自动生成高质量训练数据,让小模型跑出高精度,硬是在资源劣势下逆袭拿到特等奖,成为该赛道最年轻的特等奖得主之一。”近日,杭电老师盛庆华骄傲地跟记者夸起爱徒——凭借“推理大模型的训练调优与性能加速助力全栈自主AI”项目获得第十九届“挑战杯”揭榜挂帅国赛“特等奖”的陈龙昊。

杭电卓越学院计算机科学英才班2022级学生陈龙昊面对老师的夸奖,有些害羞却自信地表示:“大模型推理优化与算法加速是我的兴趣所在,与其有关的学习、研究、竞赛,奇妙无比。”
为什么能在大三就拿下这么多硬核奖项?面对外界的疑惑,陈龙昊答道:“我是项目驱动型学习者。”
2024年寒假,陈龙昊偶然看到“AICAS 2024 IEEE人工智能电路与系统国际会议大挑战”比赛信息,主题是“通用算力大模型推理性能软硬协同优化”。此时大模型热度正盛,而更吸引他的是:入围团队可受邀参加国际会议并报销差旅费。
“既是学习机会,又能开阔眼界。”抱着这样的初衷,陈龙昊决定试一试。在比赛过程中,他系统自学了大语言模型结构、推理加速原理、量化方法以及主流推理引擎架构,建立起完整的知识框架,并且结合硬件特性,创新性地提出了一种减少计算过程中指令的方法,加快了计算速度。最终,他所在团队在全球众多高校和企业队伍中脱颖而出,成功入围,并由此开启了他在大模型算力优化方向的深入探索。
这场经历不仅带来了荣誉,更重要的是为后续多个关键项目打下坚实基础。当他转战“挑战杯”揭榜挂帅专项赛——《大模型训练调优与性能加速》时,面对华为NPU(神经网络处理单元)平台这一从未接触过的硬件环境,他并未慌乱。凭借此前对NVIDIA GPU(英伟达显卡)软硬件架构的深入理解,他快速识别出不同平台之间的共性逻辑,仅用数小时便完成平台迁移与初步部署。
“很多技术本质相通,关键是能不能打通底层思维。”他说,“挑战杯”真正的挑战是,如何在有限资源下训练出一个参数量小但精度高的模型。性能排名靠前的队伍往往依赖庞大算力堆叠,而陈龙昊选择走一条更具创新性的路——从数据源头入手。他设计了一套基于AI Agent的数据集生成与筛选系统,历时近一个月,构建出高质量、高覆盖率的训练数据集。这套系统不仅能自动评估样本有效性,还能根据反馈动态调整生成策略,极大提升了模型泛化能力。

不仅如此,陈龙昊还针对性地改进训练算法,在复赛阶段虽性能略逊于部分对手,但其模型精度显著领先,最终凭借综合优势斩获挑战杯华为赛题特等奖,成为该赛道最年轻的顶尖选手之一。
在另一项国家级赛事——中国高校机器人创意大赛中,因为有队员退出他“临危受命”,加入团队后迅速与另外两名队员合作补全视觉识别模块,并提出将大语言模型融入智能鱼缸系统的创新构想。用户只需说出“水温有点高”或“喂食时间到了”,系统即可自主响应并执行操作。这一融合自然语言交互的智能生态设计,荣获该赛事一等奖,展现出他对跨模态融合应用的前瞻视野。
截至目前,他已以一作身份或参与发表多篇高水平论文,包括SCI期刊论文1篇、EI检索会议和期刊论文3篇,内容涵盖大模型压缩、推理加速架构设计及低资源微调技术、数值模拟等前沿方向。
在为一套目前已经在用的大模型做总体算法架构时,他提出了一整套从数据生成、监督微调到强化学习的完整训练流程。面对缺乏大规模标注数据的困境,他再次启用AI Agent技术,让智能体先“理解”内容输出遵循的讲清楚、讲明白、讲得让人感兴趣、讲得激发人动力的“四讲”原则,再据此生成符合教育传播规律的高质量文本数据。
“我不玩游戏,也不刷短视频,省下来的时间都用来思考和做项目。”说起自己成功的秘诀,陈龙昊说有三条——劳逸结合,保持清醒头脑;跳出课本,主动拓展前沿知识;先独立思考,再寻求帮助,培养解决问题的能力。