由于英伟达多款芯片出口受限,原本AI算力市场“有人报低价,客户去买又没货”的“价格畸形”现象不复存在,自算力租赁概念股汇纳科技(300609.SZ)11月中旬宣布英伟达A100算力收费上调一倍以来,业内涨价声便不绝于耳。
财联社记者近期多方采访获悉,英伟达A、H显卡涨幅200%已是常态,AI算力作为业界焦点备受瞩目,亦引得网络安全公司下场“跨界”布局。当前算力瓶颈下,多元算力成为诸多厂商发力点,不过开发适配周期长、定制开发投入大、业务迁移时间久等问题仍客观存在。
显卡价格涨2倍是常态
“近期英伟达计算卡涨幅平均在1.5-2倍,前一阵就连4090都涨了5倍,不过后来又降下来了。”一位AI厂商人士告诉财联社记者。
据汇纳科技公告,算力需求大幅增加,算力资源持续紧张,其内嵌英伟达A100芯片的高性能服务器算力服务收费将上调100%。对此,某服务器厂商产品人士表示,“市场非理性,现在供不应求的情况下涨100%很正常。”
其他企业的涨价情况如何?财联社记者以投资者身份致电中贝通信(603220.SH),证券部人士称“根据我们之前披露的(合同订单价)大概是50%。”据财联社记者梳理,中贝通信为前期A股算力租赁板块中唯一详细披露合同单价的企业,9月7日、10月25日、11月16日,其算力服务单价分别为12万元/P/年(H800)、2.5万美元/P/年(即约17.84万元/P/年)、18万元/P/年。
值得一提的是,中贝通信前述订单均显示为框架合同,公司人士告诉财联社记者,公司已披露的框架合同“就算正式的合同,后续不会再签正式合同了”。
恒润股份(603985.SH)内部人士亦告诉财联社记者,“现在(显卡)只有存量了,我们公司的算力租赁价格根据市场变化也有上调,按市场价现货涨幅可能在40%-50%。”
(图源恒润股份子公司润六尺官网)
值得注意的是,AI算力作为业界焦点备受瞩目,引得有GPU资源的企业均下场“跨界”布局。一位网络安全头部上市公司人士对财联社记者表示,“我们这边也在做算力租赁,主要以A卡为主,销售都在发动态,说还有余量、尽快下单。”
该网安人士告诉财联社记者,其算力租赁客户中“腾讯、阿里、华为、UCloud都有。”而上市公司的客户中,亦不乏智谱AI、百川智能、360在内加码大模型的厂商及青海联通等的身影。
厂商瞄准多元算力
财联社记者注意到,恒润股份在规划算力方面处在上市公司中的“第一梯队”,不过财联社记者问及“公司的显卡还能够满足多久的客户需求?”,前述公司人士称,“这个可能无法量化,因为算力市场还是跟着市场供需走的。”
大模型参数量、训练数据量的提升需通过更大算力部署规模实现,特别是当前推理场景和需求增长,有AI大模型厂商更是称“现在算力基础硬件是跟不上的”。
财联社记者从业内获悉,当前的算力瓶颈下,多元算力成为发展趋势。恒润股份、中贝通信在内的厂商均告诉记者,国产芯片在不断升级和技术突破中,将和国产高端芯片公司保持密切交流。润建股份(002929.SZ)人士近期也告诉记者,“与华为一直有合作关系,前期算力规划中,英伟达和华为的产品均有采用。”
此外,浪潮信息(000977.SZ)方面打造了G7多元算力平台,兼容国际国内15种AI芯片。记者获悉,浪潮信息在源1.0大模型发布后,已和部分国内推理芯片厂商落地合作,训练层面亦将联合国产算力提供方持续做优化。
初创公司潞晨科技方面则透露,其Colossal-AI已经适配了较多算力,“我们系统本身是基于英伟达架构,也对华为昇腾、壁仞、摩尔线程等国产硬件做了适配。”
值得注意的是,近期的2023人工智能计算大会上,北京智源人工智能研究院副院长林咏华表示,中国AI芯片大模型训练性能与国外约有三年差距,“当前中国AI芯片的大模型集群训练性能只有个别接近A100/A800,大多数不到50%。”不过也有业内人士认为,前述性能相差三年的观点可能较为乐观。
实际上多位受访人士均认同,要实现多元算力挑战不小。
“国内外高端AI训练芯片当前已经超过了40种,但因为每个厂商在开发过程当中采用的技术路线不一样,所以在接口互联等方面还存在较多不兼容,这也会带来AI算力系统整个开发适配周期很长、定制开发投入大、业务迁移时间久的问题。”浪潮信息高级副总裁刘军在2023人工智能计算大会上如是称。