• 精密塑胶模具
咨询电话:13302615729

AI训练成本暴跌:2024年中国企业引领全球算力降价潮


时间: 2025-02-11 19:25:18 |   作者: 精密塑胶模具

  2024年,AI领域经历了一次惊心动魄的飞跃,行业内多个现象引起了关注,尤其是训练成本的显著下降。在这一年中,大模型加速落地的热切、应用场景的创新速度,伴随着高投入与商业化缓慢而带来的焦虑,让整个行业措手不及。回首过去,一些业界共识的议题在2024年被重新审视,例如中国是不是真的短缺智能算力?企业的“算力焦虑”是不是合理?Scaling Law是否依旧值得坚守?

  在这样的背景下,中国AI企业站在了变革的风口浪尖,找到了一系列降低训练成本的策略和技术。2024年12月27日,来自中国的DeepSeek-V3模型在海外社会化媒体平台上引发热议。其在只使用2048个GPU、耗时两个月、预算仅600万美元的情况下,与高成本的GPT-4o等经典模型相竞争,堪称极致性价比。相较之下,GPT-4o模型的训练成本高达1亿美元,所需的GPU数量接近万级。

  经过算法、框架和硬件的系统优化,DeepSeek的预训练阶段仅需18万个GPU小时,最终全训练耗费278.8万个GPU小时,整体训练成本仅557.6万美元。这一成果并非孤例,其他中国AI企业也在不断探索降本增效的路径。

  例如,极佳科技的联合发起人朱政透露,公司训练视觉模型的成本已经从500万美元降低到100万美元以下。他指出,企业正加大与云计算服务商的合作,通过训练加速、通信与架构优化等手段明显降低训练成本。他强调:“随着训练效率的提升,所需的算力规模也在下降。”

  此外,在采购高端显卡上遇到困难的情况下,国产算力慢慢的变成为新的选择。蚂蚁集团的彭晋指出,国内企业正在积极采购国产算力,这已经足以支持千亿参数规模的模型训练,未来是否能支撑更大规模仍待验证。

  展望2025年,中国AI行业将迎来一系列新变化。北京智源人工智能研究院的报告预测,AI的发展关键方向包括基础设施的创新、产品应用的深化、AI安全的持续完善等。中国在自研技术与产品方面的不断突破,传递出对未来的信心。

  业内专家也看到了AI应用市场的蓬勃前景,大规模的公司与中小型企业都在大力布局基础设施,积极开发超级应用(SuperAPP)。正如智源科研院长王仲远所言:“我们将见证AI在数字与物理世界之间架起更高的桥梁,推动科学研究的新突破。”

  总体而言,走过2024年,中国AI企业的“算力焦虑”似乎正在逐渐消散,未来的挑战虽然依然严峻,但也充满着机遇。返回搜狐,查看更加多