您的位置:首页 > 深度 >

源头创新突破算力瓶颈国产大模型进入成长关键期

来源:千龙网 2023-10-26 07:56   阅读量:5732   

分享

国产大模型百模大战激战正酣之际,美国升级对华芯片出口管制带来新的不确定性。全球供应链震荡之下,国产大模型进入成长关键期。

源头创新突破算力瓶颈国产大模型进入成长关键期

要坚持源头创新,提高生成式人工智能的核心竞争力。业内专家表示,只有制定高端算力芯片、大模型算法等基础性、原创性技术攻关的中长期专项规划,实现更多从0到1的突破,大模型才有望突破瓶颈。

算力需求将是未来十年挑战

近日,美国升级对华芯片出口管制。根据英伟达10月17日在一份文件中披露的受限芯片详情,包括高性能GPU芯片A800和H800。这两款是该公司专为中国市场设计的AI(人工智能)芯片。

随着大模型浪潮掀起,英伟达成了AI淘金时代的卖铲人,其开发的GPU芯片需求井喷。GPU即图形处理器,被设计用来处理并行计算,更适合同时处理相同类型的大量数据。它最早设计用于处理图像、视频和3D图形渲染,后被引入AI计算,成为大模型训练与推理不可或缺的算力基础设备。

一颗A800芯片的售价已经高达15万元,半年前,这一价格不过八九万元。有芯片经销商对记者透露,相关存量芯片价格一路看涨。

尽管中国开发的AI算法非常强大,但国内硬件的计算能力仍有差距。科大讯飞创始人、董事长刘庆峰表示,中国企业在训练AI大模型上面临的挑战之一,就是训练主要是在英伟达的硬件上完成的,企业内部只能做出微小的调优和训练。

我相信对计算能力的需求,将会是未来十年对所有人的挑战。半导体公司AMD全球副总裁唐晓蕾表示,这不仅涉及对能源、算力的需求,还关系到整个环境改变的需求,这是一种大势,跟以前不一样。

行业呼唤自主可控算力底座

科大讯飞日前宣布联合华为推出基于昇腾生态的飞星一号大模型算力平台,国内的大模型厂商信心得以提振。此外,当天发布的星火认知大模型V3.0,据称已全面对标ChatGPT,在中文能力上实现超越。

星火3.0可以说是除了华为内部应用之外,当前第一个真正在国产算力平台上训练出来的大模型。虽然没有透露新一代昇腾芯片性能参数,但刘庆峰提到,飞星一号半年内就实现了星火大模型训练和推理效率均翻番。国产算力平台要有从不好用到好用、再到生态繁荣的过程。如果谁都不往前走一步,那始终无法自立自强。

自主可控的算力底座也有望解决大模型训练成本过于高昂的问题。近日,毕马威中国与联想集团联合发布《普慧算力开启新计算时代》报告显示,以构建GPT-3为例,OpenAI数据显示,满足GPT-3算力需求至少要上万颗英伟达GPU A100,一次模型训练成本超过1200万美元,这还不包括模型推理成本和后续升级所需的训练成本。

此前,科大讯飞在三季报业绩说明会上表示,公司已于2023年初与华为昇腾启动专项攻关,让国产大模型架构在自主创新的软硬件基础之上,当前华为昇腾910B能力已经基本可对标英伟达A100,后者是当下AI大模型训练市场上应用最广泛的GPU芯片。

做好源头创新 突破多而不强

截至今年7月底,我国累计有130个人工智能大模型问世。首批通过《生成式人工智能服务管理暂行办法》备案的11个大模型产品也获批向全社会开放服务。

对国产大模型而言,亟待解决的问题是多而不强。北京工业大学经济与管理学院教授何喜军表示,因底层技术突破难,很多公司选择调用较为成熟的大模型,直接应用到原有产品和服务上,技术同质化严重,且缺乏源头创新,高质量落地应用较少。要建设一批国家级开源平台、代码托管及大模型开发测试平台,确保核心算法自主可控。

刘庆峰也坦言,国产大模型必须正视与GPT-4的差距。国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT-4还有差距。他表示,唯有实事求是,才能实现超越。

着重培育源头创新的步伐正在加快。近日,工信部运行监测协调局局长陶青表示,要夯实人工智能技术底座,通过科技创新重大项目,着力推动大模型算法、框架等基础性原创性的技术突破,提升智能芯片算力水平,释放数据价值,强化根技术研发。

各大厂商也在扎牢底层的算法和算力。腾讯集团副总裁蒋杰表示,混元大模型掌握了从模型算法、机器学习框架、人工智能基础设施的全链路自研技术。蚂蚁集团首席技术官何征宇也表示,蚂蚁大模型走纯自研的技术路线,底层算力集群可达万卡规模。

相关新闻

杨元庆:人人可享个人大模型

本报讯在联想集团日前举行的Tech World上,公司董事长兼CEO杨元庆在大会上展示了首款AI PC(人工智能电脑)。杨元庆称,智能设备是人工智能触达终端用户的终极载体,未来的智能设备将是用户的数字延伸,如同个人的人工智能双胞胎。

生成式AI、大语言模型带来了灯塔式的指引,而人工智能真正落地离不开硬件和设备的负载。大会上展示了联想首款AI PC,利用大模型压缩技术,用户自己的智能终端和设备将可拥有运行个人级大模型的能力。在这些支持人工智能功能的设备和边缘设备上,将建有本地知识库,更好地了解使用者,个人大模型将使用存储在设备或家庭服务器上的个人数据进行推理。据称,它甚至可以根据你的思维模式预测任务,并自主寻找解决方案。

未来的个人电脑将是人工智能电脑,未来的手机将是人工智能手机,未来的工作站将是人工智能工作站。智能设备是用户的数字延伸,如同用户的双胞胎,我们称之为lsquo;个人的人工智能双胞胎rsquo;。杨元庆说。

IDC报告此前提出,生成式AI等技术的普及,将是推动PC行业发展的重要因素,AI PC能够在更深层次上个性化用户体验,同时能够保护数据隐私,未来AI PC将迎来新一轮爆发。

国产大模型百模大战激战正酣之际,美国升级对华芯片出口管制带来新的不确定性。全球供应链震荡之下,国产大模型进入成长关键期。

要坚持源头创新,提高生成式人工智能的核心竞争力。业内专家表示,只有制定高端算力芯片、大模型算法等基础性、原创性技术攻关的中长期专项规划,实现更多从0到1的突破,大模型才有望突破瓶颈。

算力需求将是未来十年挑战

近日,美国升级对华芯片出口管制。根据英伟达10月17日在一份文件中披露的受限芯片详情,包括高性能GPU芯片A800和H800。这两款是该公司专为中国市场设计的AI(人工智能)芯片。

随着大模型浪潮掀起,英伟达成了AI淘金时代的卖铲人,其开发的GPU芯片需求井喷。GPU即图形处理器,被设计用来处理并行计算,更适合同时处理相同类型的大量数据。它最早设计用于处理图像、视频和3D图形渲染,后被引入AI计算,成为大模型训练与推理不可或缺的算力基础设备。

一颗A800芯片的售价已经高达15万元,半年前,这一价格不过八九万元。有芯片经销商对记者透露,相关存量芯片价格一路看涨。

尽管中国开发的AI算法非常强大,但国内硬件的计算能力仍有差距。科大讯飞创始人、董事长刘庆峰表示,中国企业在训练AI大模型上面临的挑战之一,就是训练主要是在英伟达的硬件上完成的,企业内部只能做出微小的调优和训练。

我相信对计算能力的需求,将会是未来十年对所有人的挑战。半导体公司AMD全球副总裁唐晓蕾表示,这不仅涉及对能源、算力的需求,还关系到整个环境改变的需求,这是一种大势,跟以前不一样。

行业呼唤自主可控算力底座

科大讯飞日前宣布联合华为推出基于昇腾生态的飞星一号大模型算力平台,国内的大模型厂商信心得以提振。此外,当天发布的星火认知大模型V3.0,据称已全面对标ChatGPT,在中文能力上实现超越。

星火3.0可以说是除了华为内部应用之外,当前第一个真正在国产算力平台上训练出来的大模型。虽然没有透露新一代昇腾芯片性能参数,但刘庆峰提到,飞星一号半年内就实现了星火大模型训练和推理效率均翻番。国产算力平台要有从不好用到好用、再到生态繁荣的过程。如果谁都不往前走一步,那始终无法自立自强。

自主可控的算力底座也有望解决大模型训练成本过于高昂的问题。近日,毕马威中国与联想集团联合发布《普慧算力开启新计算时代》报告显示,以构建GPT-3为例,OpenAI数据显示,满足GPT-3算力需求至少要上万颗英伟达GPU A100,一次模型训练成本超过1200万美元,这还不包括模型推理成本和后续升级所需的训练成本。

此前,科大讯飞在三季报业绩说明会上表示,公司已于2023年初与华为昇腾启动专项攻关,让国产大模型架构在自主创新的软硬件基础之上,当前华为昇腾910B能力已经基本可对标英伟达A100,后者是当下AI大模型训练市场上应用最广泛的GPU芯片。

做好源头创新 突破多而不强

截至今年7月底,我国累计有130个人工智能大模型问世。首批通过《生成式人工智能服务管理暂行办法》备案的11个大模型产品也获批向全社会开放服务。

对国产大模型而言,亟待解决的问题是多而不强。北京工业大学经济与管理学院教授何喜军表示,因底层技术突破难,很多公司选择调用较为成熟的大模型,直接应用到原有产品和服务上,技术同质化严重,且缺乏源头创新,高质量落地应用较少。要建设一批国家级开源平台、代码托管及大模型开发测试平台,确保核心算法自主可控。

刘庆峰也坦言,国产大模型必须正视与GPT-4的差距。国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT-4还有差距。他表示,唯有实事求是,才能实现超越。

着重培育源头创新的步伐正在加快。近日,工信部运行监测协调局局长陶青表示,要夯实人工智能技术底座,通过科技创新重大项目,着力推动大模型算法、框架等基础性原创性的技术突破,提升智能芯片算力水平,释放数据价值,强化根技术研发。

各大厂商也在扎牢底层的算法和算力。腾讯集团副总裁蒋杰表示,混元大模型掌握了从模型算法、机器学习框架、人工智能基础设施的全链路自研技术。蚂蚁集团首席技术官何征宇也表示,蚂蚁大模型走纯自研的技术路线,底层算力集群可达万卡规模。

相关新闻

杨元庆:人人可享个人大模型

本报讯在联想集团日前举行的Tech World上,公司董事长兼CEO杨元庆在大会上展示了首款AI PC(人工智能电脑)。杨元庆称,智能设备是人工智能触达终端用户的终极载体,未来的智能设备将是用户的数字延伸,如同个人的人工智能双胞胎。

生成式AI、大语言模型带来了灯塔式的指引,而人工智能真正落地离不开硬件和设备的负载。大会上展示了联想首款AI PC,利用大模型压缩技术,用户自己的智能终端和设备将可拥有运行个人级大模型的能力。在这些支持人工智能功能的设备和边缘设备上,将建有本地知识库,更好地了解使用者,个人大模型将使用存储在设备或家庭服务器上的个人数据进行推理。据称,它甚至可以根据你的思维模式预测任务,并自主寻找解决方案。

未来的个人电脑将是人工智能电脑,未来的手机将是人工智能手机,未来的工作站将是人工智能工作站。智能设备是用户的数字延伸,如同用户的双胞胎,我们称之为lsquo;个人的人工智能双胞胎rsquo;。杨元庆说。

IDC报告此前提出,生成式AI等技术的普及,将是推动PC行业发展的重要因素,AI PC能够在更深层次上个性化用户体验,同时能够保护数据隐私,未来AI PC将迎来新一轮爆发。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。