首页 > 宏观 > 正文

国内先进数据存力容量占比达25% “以存强算”突破算力局限

2024-10-14 15:26:17 21世纪经济报道 21财经APP 倪雨晴

21世纪经济报道记者倪雨晴 深圳报道

数据在AI时代的重要性不言而喻,数据增量也越来越快。根据IDC和华为预测,到2030年,全球每年产生的数据总量达1YB,相比2020年增长23倍。随着生成式AI的发展,数据量继续指数级增长,数据的存储环节也成为算力产业链上的焦点。

在近日举行的2024中国算力大会的先进数据存力论坛上,存力产业的发展受到热议。工业和信息化部信息通信发展司副司长赵策表示,在产业界的共同努力下,我国存力产业呈现稳步增长态势,存力规模不断扩大,技术创新也日益活跃。同时,产业应用持续加快,随着全闪存阵列、固态硬盘的部署应用,全场景的闪存化应用推动我国存力水平不断迈上新的台阶。

根据10月11日最新发布的《中国存力发展报告(2024)》,我国在数据存力规模、存储质量等多维度呈现出快速发展态势,截止至2023年底,我国存力规模达到1200EB,先进存储容量占比达到25%。

以往大家谈论算力概念时,关注点通常在GPU计算能力。事实上,和数据存储能力息息相关的存力、高效联接的网络能力同样关键。当前,不少业内人士认为,随着国内持续推进存力建设,数据存储产业正在成为中国科技新名片。 

先进数据存力加速发展

在华为公司副总裁、数据存储产品线总裁周跃峰看来:“智能时代是数据的黄金时代,AI大模型、具身智能、AI for science等核心AI领域都大量地依赖数据,并且由数据驱动。”

眼下每年的数据量都在迅速增长,《全国数据资源调查报告(2023年)》显示,2023年全国数据生产总量达32.85ZB,同比增长22.44%。

伴随数据规模的爆发式增长,数据存储产业成为支撑数据价值释放、算力发展的关键基石。政策层面对于存力的重视度也越来越高,尤其是近两年来,发展先进数据存力已经成为业内共识。

2023年10月,工业和信息化部等六部门联合发布了《算力基础设施高质量发展行动计划》,明确提出到2025年,我国存力规模目标超过1800EB,先进数据存力容量占比达到30%以上,重点行业核心数据、重要数据容灾备份覆盖率达到100%,加速闪存存储的规模化应用等关键举措。

这一政策导向不仅为存储市场发展指明了目标,也促进了上下游产业链的发展。中国信息通信研究院院长余晓晖表示:“我国数据存储产业取得了前所未有的发展机遇,产业生态逐步成熟,标准体系不断完善。我国数据存力规模质量持续提高,东部地区存力发展保持整体较高水平,中西部地区实现了快速的发展。从行业上看,数据存力正赋能千行百业的数字化转型,金融、医疗等行业的存力正在快速发展。”

整体而言,中国数据存储产业已步入快速发展轨道,算力和存力共同发展已经成为趋势。比如,联通正在建设面向通智超一体化场景的存储。在存算协同的路径上,联通数字科技有限公司云计算研发总监陈学伟就列举了具体的场景:“我们对GPU的利用率提升在两个方面进行了创新,一是算存联动,把数据流动时间预测和训练任务编排联合起来,减少了GPU闲置时间,整体GPU利用率提升了10%。第二是AI赋能存储,我们把磁盘的健康程度、性能、环境这些信息拿到AI里面训练,集成故障预测与状态监控功能,将故障率降低了30%,同时做到计算集群故障后秒级恢复。”

与此同时,为进一步加快先进数据存力产业发展,赵策还提出了三方面建议,其一是加强存算协同布局,其二是强化核心技术创新,要围绕全闪存、多协议互通等技术攻关,其三是构建先进数据存力产业生态。 

以存强算:华为三箭齐发

先进数据存力是数智时代的新质生产力,是驱动智能经济涌现的高性能引擎。华为数据存储产品线副总裁肖德刚谈道:“1GB先进数据存力投入可带来60元社会经济效益,到了2030年能够支撑智能经济超过70万亿元,我们认为这是一个非常有前景的产业。中国现在是一个数据大国,我们的数据总量非常多,同时我们的行业应用、行业数据沉淀也是非常广泛。”

虽然中国是数据大国,但还不是数据强国,和国际上的差距依然存在。“我们的存力和算力比例仅0.42TB/TFlops,国际上领先水平已经到1.11TB/TFlops。对于数据的安全保护也有差距,国际上有些国家87%以上的重要数据都已经做了保护,我们的数据资产保护率是34%,这也是我们面临的一个挑战。”肖德刚表示。

华为认为,未来构筑先进数据存储能力有三个关键方向。一是训练,随着算力集群规模越来越大,算力的利用率越低;二是推理,在生成式AI应用APP终端上,当输入大量文本或者语音时,有时反馈的时间很慢,这是因为长序列导致时延增加、单卡吞吐降低;三是安全,人为攻击导致安全威胁增加。

而存力提升,则有助于解决以上难题,突破当前的算力瓶颈。华为通过“以存强算”,针对性的三箭齐发,促进智算底座的训练、推理、安全全面升级。

比如,通过专业AI存储,将AI集群可用度提升30%。通过长记忆内存型存储使能Long context(长上下文),提升大模型的逻辑思考和推理能力,尤其是慢思考能力,并降低成本。通过网存联动,6层防护帮助企业牢牢构筑数据安全最后一道防线。

周跃峰表示,AI大模型时代,中国的算力基础设施要领先于全球,存储、计算、网络缺一不可,要共同发展,才能为中国提供可持续供应的算力基础设施,在智能时代赢得先机。

以华为为代表的中国科技企业正不断突破,计算、存储和网络技术协同创新,打造中国科技的全新名片。 

21财经客户端下载