team:芯火相传 time:2025年6月28日
我们正处在一个由人工智能(AI)定义的全新时代。从大语言模型(LLM)到AIGC(生成式人工智能)的浪潮,正在深刻重塑全球的产业、经济和社会形态。在这场变革的核心,是对海量、高效智能算力的无尽需求,而AI芯片正是提供这种算力的关键引擎,是未来数字世界的绝对基石。
然而,在这条决定未来的黄金赛道上,我国的人才储备与产业的高速发展需求之间存在着尖锐的矛盾。一方面,AI算法和应用层的人才蓬勃发展;但另一方面,能够设计、优化并实现高性能AI芯片的顶尖人才却极度稀缺。这种在“根技术”上的短板,已成为制约我国AI产业实现更高质量、更可持续发展的核心瓶颈。
我国计算机专业当前所面临的较为突出的人才培养问题,主要体现在计算机应用开发人员数量相对饱和,而底层软硬件研发人才匮乏,特别是计算机处理器芯片设计人才不足,这固然与过去多年中国处理器芯片的产业环境有关,但同时也与国内高校的处理器芯片人才培养方式密切相关。具体表现为缺少类似医院临床实习那样的动手环节,学生们虽然能从课本上学习到很多知识,但是却很难理解这些知识点背后所蕴含的原理,也就无法真正掌握处理器芯片设计能力。
AI芯片的设计挑战远超通用CPU,它是一个需要算法、体系结构、编译器与芯片实现四大领域知识深度融合的跨学科难题。当前高校的传统人才培养模式,往往在这些领域之间形成了“知识孤岛”:
软件与硬件的割裂:计算机系的学生精通PyTorch、TensorFlow等AI框架和算法,但对这些计算任务如何高效映射到硬件知之甚少;微电子系的学生虽然掌握电路设计和版图实现,却可能不理解上层AI模型的具体计算范式和性能瓶颈。
理论与实践的脱节:学生们学习了卷积神经网络(CNN)、Transformer等模型结构,却缺乏机会去亲手设计一个能为这些模型加速的专用处理单元(NPU),无法体会算法与硬件之间相互制约、相互优化的微妙关系。
这种培养模式导致学生难以建立“软硬件协同设计(Hardware-Software Co-design)”的系统性思维,无法成长为产业界真正渴求的、能够进行全栈式创新的AI芯片架构师与工程师。
为直面上述挑战,打破AI芯片人才培养的壁垒,我们正式发起“芯火相传”AI芯片实践育人项目。
项目取名“芯火相传”,寓意深远:
“芯”,是我们的事业核心——自主可控的高性能AI芯片。
“火”,是AI时代的创新火花,是知识的火种,更是投身国家战略科技的奋斗热火。
“相传”,代表着一种精神、一种技术、一种使命的代代传承,将软硬件协同设计的思想和工程经验,传递给新一代的青年才俊。
“芯火相传”项目的核心是“贯通”与“融合”。我们致力于打造一个让学生亲历AI芯片诞生全过程的实战平台,带领他们走完从AI算法落地分析、领域专用架构(DSA)设计、RTL代码实现、编译器与工具链开发适配,到后端物理实现、流片与板级验证的完整闭环。通过这个过程,我们旨在帮助学生:
建立协同思维:深刻理解AI算法对硬件架构的需求,以及特定硬件如何反向赋能或制约算法的性能,将AI模型中的“计算算子”真正转化为高效的硬件电路。
掌握全栈技能:熟练运用产业级EDA工具和AI框架,学习AI芯片设计从软件到硬件的全栈技术链,具备定义和解决复杂工程问题的能力。
激发创新潜能:在掌握主流AI芯片设计方法的基础上,鼓励学生针对前沿算法探索新型计算范式与高效能硬件架构,培育未来的行业领军人才。
综上所述,“芯火相传”项目不仅是对现有教育模式的一次深刻变革,更是为我国在人工智能这一决定性赛道上构筑坚实人才基础的战略投资。我们的终极愿景是,为国家培养一批既懂算法、又懂硬件的AI芯片设计领军人才,让自主创新的“芯”火,在智能时代熊熊燃烧,代代相传,生生不息。
“芯火相传”项目教学团队提出“AI芯片全栈创新人才”的核心培养目标。即以开源AI加速器架构为切入点,以敏捷的领域专用架构(DSA)设计方法为实践手段,将人工智能(算法)、计算机体系结构、编译器技术与微电子工程(芯片实现)等关键专业领域进行贯通式设计。项目突出科教融合与产学研融合特色,坚持理论与实践并重,通过教学流片计划最终实现从算法到芯片(Algorithm-to-Silicon)的教学闭环,致力于培养AI芯片领域的全栈式领军人才。
“芯火相传”的核心理念,可以凝练为一句话:“让一个学生带着自己定义的、设计的、并成功点亮的AI芯片毕业” 。
我们坚信,降低AI芯片设计门槛的关键在于提供一个能够亲手实践的平台。AI芯片的成功不仅在于硬件电路的精巧,更在于其对上层算法的深刻理解和高效适配。“芯火相传”旨在打破软硬件之间的壁垒,让更多的学生,特别是对人工智能充满热情的学生,能够完整地、系统地参与到从算法分析到芯片验证的每一个环节,在实践中真正掌握软硬件协同设计的思想精髓
“公益性”与“开放性”是“芯火相传”的灵魂属性。
我们致力于为所有怀揣AI芯片梦想的人才提供学习机会。项目的报名和在线学习完全免费,无论是对AI芯片充满好奇的在校本硕博学生,还是希望转型进入该领域的已毕业工程师,都可以加入我们的学习社区。
当然,由于芯片流片成本高昂,免费流片机会目前主要面向考核通过的在校学生。
我们相信,热情是最好的老师。“芯火相传”对申请者不设年级、专业和学校的限制,即使是“零基础”的同学,只要你对AI芯片设计拥有浓厚的兴趣,有投身智能计算事业的决心和毅力,我们都热烈欢迎你的报名和加入。
在战略层面,“芯火相传”项目旨在实现三大核心目标:
1.打破前沿教育资源的壁垒
AI芯片设计是尖端交叉学科,优质教育资源高度集中。“芯火相传”坚持公益与开放,全年不设门槛开放报名,随到随学。我们欢迎任何对AI芯片设计抱有热忱的学生,无论其学校背景、年级阶段、专业基础,都有机会系统性地参与学习,这对提升我国AI芯片领域人才培养的广度与深度,具有至关重要且积极的意义。
2.突破传统学科划分的边界,构建融合算法、软件与硬件的全栈人才培养方案
“芯火相传”项目的灵魂在于构建一套算法-软件-硬件”深度协同、并打通设计与验证全链条的AI芯片教学流程。我们要求学生不仅要懂得如何用代码设计AI加速器,更要深刻理解AI模型(如Transformer)的计算需求如何被自己设计的硬件满足,同时还要掌握AI编译器(如TVM/MLIR)如何将高层计算图映射到底层硬件,最终形成可供流片的物理版图。
3.构建“产学研用”的正向循环生态
我们积极鼓励并引导参与本项目的优秀学生,贡献于顶尖的AI软硬件开源社区(如MLIR、TVM、Chisel等),或进入相关领军企业实习与工作,在真实的产业一线攻克国家亟需解决的高能效AI计算难题。同时,我们会将这些来自产业前沿的成果与经验,持续沉淀并反哺到我们的教学方案中,吸引更多优秀学生参与,实现人才培养与技术创新的良性正向循环。
在教学层面,“芯火相传”项目坚持两大原则:
1.坡度缓,趣味强。
AI芯片设计链路长、难度大。项目团队将复杂的学习流程,精心划分为多个难度递进的阶段。通过引入预学习环节,帮助零基础学生建立信心,平滑过渡到核心知识学习。同时,每个阶段都设置了明确的AI模型加速目标(例如,从成功运行LeNet-5,到高效实现MobileNet,再到挑战Transformer关键算子),将学习过程转化为“打怪升级”般的体验,极大地增加了趣味性,并激励学生不断探索,设计出性能更强的AI芯片。
2.标准高,重能力。
我们不仅要求学生掌握知识,更要培养其独立解决未知问题的能力。在项目中,学生需要深度理解AI计算图是如何一步步被编译器分解、调度,并最终在自己设计的硬件电路上执行的。助教团队重在“引导”而非“灌输”,在关键节点上提供方向性指引,鼓励学生主动探索、动手试错,最终独立找到问题的最优解决方案。
随着AI技术的飞速迭代,“芯火相传”的教学内容也在持续进化。近期,我们计划引入四大全新看点:
1.学习路径的进一步细化与平滑。
我们将对核心的“AI加速器设计”阶段进行更精细的拆分,设立一系列新的子目标(如从单MAC单元设计->MAC阵列构建->片上存储规划),在保持高标准的同时,进一步放缓学习坡度,让零基础的同学也能循序渐进,稳步提升。
2.全面融入“软硬件协同设计”理念。
在核心阶段中期,我们将系统性地融入AI编译器与SoC整合知识。学生将学习如何将自己设计的AI加速器(NPU)作为IP核,集成到一个完整的SoC系统中,并理解从上层AI框架(PyTorch)到C函数,再到指令、总线请求、硬件信号的每一个抽象层细节,彻底打通软硬件协同的“任督二脉”。
3.引入前沿敏捷开发工具与流程。
在核心阶段后期,我们将引入更前沿的AI芯片敏捷开发方法。学生将学习使用高级语言(如Chisel/SpinalHDL)进行高层次综合(HLS),并探索形式化验证等先进验证技术,同时配套引入开源EDA工具链,让学生接触并掌握与业界接轨的高效工作流。
4.开发并发布专业级AI芯片开源Benchmark。
针对当前开源社区缺乏标准AI芯片测试集的痛点,我们将开发并发布一套覆盖主流模型与关键算子的开源Benchmark(暂名“AI-CoreBench”)。后续,我们计划提供如英伟达DLA、香山“智能小核”等开源AI加速器的性能数据,让同学们设计的芯片能与之公开“打榜”,在性能、功耗、面积等多个维度上进行对标,获得最直观的反馈与成就感。
随着项目多年的迭代与发展,并深刻洞察到AI芯片设计的高度跨学科特性,“芯火相传”项目独创并推出了一套“三位一体”协同矩阵分组机制。
该机制不仅旨在将进度水平相近的同学聚集在一起交流学习,更核心的目标是促进算法、架构、硬件等不同背景学生的深度融合,并据此提供更专业的答疑服务与更高质量的对口人才发展路径。
我们认识到,一个成功的AI芯片团队,需要三种核心角色的紧密协作。因此,我们鼓励学生根据自身兴趣和专长,在项目初期选择一个主要的技术方向:
1.算法与模型方向(Algorithm-Track):专注于理解前沿AI模型的计算原理、性能瓶颈分析,以及模型量化、剪枝等优化策略。他们是团队的“领航员”,定义了“我们要加速什么”。
2.架构与编译方向(Architecture-Track):专注于设计领域专用架构(DSA),定义AI加速器的指令集、计算阵列、内存层次结构,并探索编译器如何将高层算法高效映射到硬件上。他们是团队的“总设计师”,规划了“我们该如何加速”。
3硬件实现与验证方向(Implementation-Track):专注于使用RTL(如Verilog/Chisel)进行硬件代码的编写、功能仿真与验证、以及后端物理实现。他们是团队的“实干家”,确保了“加速器能被正确地制造出来”。
基于“三位一体”的技术角色,我们构建了一个矩阵式的社群结构:
1.横向按“学习阶段”分组:所有同学会根据其学习进度(如“启航阶段”、“筑基阶段”、“攻坚阶段”)被分入大的进度群组。这确保了同一组的同学面临相似的挑战,能够进行高效的互助和讨论,共同攻克难关。
2.纵向按“技术方向”分组:在大的进度群组内,会再建立三个垂直的技术方向子群(算法群、架构群、实现群)。这使得同学们可以与相同技术背景的伙伴进行深度交流,助教和导师也能在此提供高度专业化、针对性的答疑解惑。
“芯火相传”项目的学习路线经过精心设计,旨在提供一条目标明确、层层递进、理论与实践深度结合的AI芯片人才成长路径。每个阶段都设有清晰的里程碑任务,引导学生从零开始,逐步攀登AI芯片设计的知识高峰。
目前,所有报名参与“芯火相传”计划的同学,都需要完成从【填写报名问卷】到【核心功能验证与能力考核】之间的所有核心任务,以构建坚实的AI芯片设计基础。
核心学习路径(全体参与者)
【填写报名问卷】
【环境搭建与基础预习】安装配置开发所需EDA工具、AI框架与仿真环境。
【数字电路与硬件语言基础】学习并掌握Verilog/Chisel等硬件描述语言,完成基础数字逻辑模块的设计。
【AI计算范式与加速原理】深入学习CNN、Transformer等主流AI模型的计算原理,理解定点化、并行计算等硬件加速的基本思想。
【领域专用加速器(NPU)设计与实现】这是项目的核心环节。学生需要自主设计并实现一个具备核心AI算子(如卷积、矩阵乘)加速能力的NPU。
【核心功能验证与能力考核】编写测试用例,通过仿真验证自己设计的NPU功能的正确性,并以此作为核心能力考核的标准。
在此基础上,我们会邀请在核心阶段表现优异、学有余力的学生,参与到更具挑战性的全栈与后端环节的学习中。这部分内容旨在打通从软件到芯片物理实体的全链路,培养真正的行业领军人才。
进阶学习路径(邀请制)
【编译器栈适配与软硬件协同】学习使用TVM/MLIR等AI编译器,将一个完整的AI模型编译到自己设计的NPU上,并编写驱动程序,在仿真环境中跑通“模型-编译器-硬件”的全流程。
【SoC集成与后端物理实现】将自己设计的NPU作为IP核,与RISC-V CPU核、总线、内存控制器等模块集成,构成一个完整的SoC系统。并学习使用工业级工具进行综合、布局布线等后端设计,最终生成可以用于流片的GDSII文件。
【流片与板级验证调试】(针对顶尖学员)我们将提供宝贵的流片机会。芯片返回后,学生将学习焊接、测试板卡,进行上电“点亮”,并最终在自己亲手设计的芯片上,运行一个真实的AI应用(如手写数字识别)。
我们的最终目标是,希望每一位从“芯火相传”计划毕业的学员,都能成为既精通AI算法与软硬件协同设计(广义前端),又深度掌握芯片后端实现与硅后验证方法(物理后端)**的复合型、全栈式AI芯片创新人才。
我们深知,每一位参与者付出的时间与汗水都弥足珍贵。为此,“芯火相传”项目不仅提供硬核的技术成长路径,更准备了丰富的激励与权益,确保大家学有所成,满载而归。
启航激励礼包:
凡是正式报名参与“芯火相传”计划的同学,在完成学习路线中的关键节点(如通过“筑基阶段”基础考核、“攻坚阶段”核心设计认证)后,都将免费收到一份“芯火”专属大礼包。礼品将随着您学习的不断深入而变得更加精美和富有纪念意义,见证您的每一步成长。
权威能力认证:
“芯火相传”计划将根据AI芯片设计的技术栈,提供从低到高多个等级的能力认证选择(如“AI算子硬件实现工程师”、“NPU架构设计师”、“全栈AI系统工程师”等)。同学们可在学习过程中自主选择挑战目标。完成并通过相应考核后,即可获得由“芯火相传”项目组颁发的官方认证证书。该证书将包含您的能力等级认证、项目亮点以及导师评语,是您技术能力与项目经验的权威证明,具有极高的行业参考价值。
除了上述权益,更重要的是您将获得脱胎换骨般的核心能力成长。
技术水平:
您将掌握的不仅是单一的硬件或软件技能,而是从AI算法到硬件实现的全栈技术视野。深刻理解软硬件协同设计的精髓,具备定义、设计、验证并部署一颗AI芯片的综合能力,这是您未来职业生涯中最宝贵的资产。
科研能力:
项目将全面锻炼您的独立解决问题的能力。面对无从下手的Bug,您将学会如何分析、定位、解决;面对开放性的设计目标,您将学会如何发掘潜在的研究方向,并勇敢地探索未知技术领域。
心理素质与工程师精神:
AI芯片设计是一个充满未知与快速迭代的领域,您在学习过程中,几乎必然会遇到各种棘手的问题,并可能伴随着挫败感和焦虑。我们认为,除了技术,教会您如何面对挑战是本计划更深远的意义。
我们希望您能理解:当挑战一件有巨大价值的事情时,困难是客观存在的,但解决方法也一定存在。与其焦虑内耗,不如放平心态,对自己充满信心,将每一次失败都视为一次宝贵的学习机会。通过在“芯火相传”中不断克服困难并获得正向反馈,您不仅能收获“点亮”芯片时的巨大成就感,更能锤炼出面对压力坚韧不拔、面对未知积极探索的强大心理素质与卓越工程师精神。