中国经济网北京3月25日讯(记者 王惠绵)人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。日前,以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024在北京举办,会上发布了昇思MindSpore 2.3版本,该版本让大模型开发训推更简、更稳、更高效。
昇思MindSpore作为国内主流的开源AI框架,积极探索前沿技术,支撑大模型原生高效训练。通过原创的多副本、多流水交织等8种并行技术,使集群线性度达到90%(业界不足60%),通过整图优化及下沉执行等,使得算力利用率达到55%(业界不足40%);针对集群故障率高,恢复时间长的普遍问题,通过编译快照,确定性CKPT技术实现20分钟完成故障恢复。
在大模型部署上,昇思通过训推一体的架构升级实现脚本、分布式策略,运行时的统一,Baichuan2-13B的推理部署只需1天。在大模型推理上,通过LLM Serving 实现推理吞吐提升2倍多;升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。
会上,中国工程院院士、中国人工智能学会副理事长何友表示,中国人工智能学会与昇思MindSpore紧密合作,携手鹏城实验室、昇思MindSpore开展学术基金2.0项目,加速推动基于昇思的原生学术创新及论文成果发表,发挥学术人才的原生力,结合昇思的技术原创力,以学术创新支撑人工智能产业繁荣。
“AI框架的并行计算能力、简洁编程能力、便捷部署能力等,逐渐成为大模型训练的关键成功要素。”华为ICT Marketing总裁周军表示,昇思将持续创新探索,聚焦根技术,以更开放的技术体系,让伙伴和开发者更灵活的实现大模型创新,加速大模型应用规模落地。
2021年图灵奖获得者、田纳西大学计算机科学杰出教授Jack Dongarra分享了计算和框架的发展趋势。他指出,开源本质上有很多优点,能切实地为未来提供更好的软件基础,开发MindSpore开源框架推动了软件性能提升。
“基于昇思MindSpore,生成式气动设计大模型平台打破传统设计范式,设计时长由月级缩短到分钟级,满足概念设计要求。”中国科学院院士、中国空气动力学会理事长唐志共表示,未来,该平台将扩展到航空、航天、船舶、高铁、能源、汽车等多个行业领域,引领工业装备的设计和制造能力跨越式发展。
据悉,华为于2020年3月开源昇思MindSpore AI框架,开源后获得国内外开发者的积极响应,访问量数千万,超过687万下载安装使用,在码云千万开源项目中综合排名第一。2023年以来,基于昇思框架发表的顶级会议论文数量超过1200篇,已成为国内最具创新活力的AI开源社区。