现状:
当前国产异构AI平台多采用下x86或Arm架构处理器,知识产权存在隐患。最新龙芯3A5000处理器采用完全自主的LoongArch指令集,但基于此处理器的异构AI平台研究偏少,和国产寒武纪、昇腾、天数等GPU/NPU的适配工作偏少。同时,在AI算法方面,由于工艺等因素的限制,国产AI板卡和芯片相对国外高端产品计算能力偏弱,而AI算法计算量大,难以快速运行在国产芯片上,无法满足大数据驱动的智能计算要求。
需解决问题:
项目旨在搭建基于自主LoongArch指令集的龙芯3A5000处理器的AI异构平台,在整机硬件研制、AI芯片适配、AI算法优化、典型应用构建等方面开展研究,解决CPU与GPU/ASIC总线互联设计技术、系统前端设计技术、基于高效管道和优化器的快速训练技术、基于自蒸馏的深度模型压缩技术等关键技术。
达到的指标:
预期形成基于LoongArch指令集的异构AI计算机,实现对3款主流AI芯片板卡的适配与优化;深度快速训练技术可减少训练时间20%以上;基于自蒸馏的模型压缩技术可压缩模型尺寸30%以上,减少计算量30%以上。

基于龙芯LoongArch架构的异构AI计算平台关键技术研发
发布者:
拟投入资金额:面议
期望达产效益:根据实际情况而定
发布时间:
有效期:
对接成功:0
申请对接:0
收藏
申请
对接 邀约 洽谈 交易
对接 邀约 洽谈 交易
- 详情描述
需求项目所属阶段:研制阶段
项目需求缘由:新产品开发
意向合作方式: