产品中心

保险箱

从“保险箱”到“智能工厂”:数据资产化星火之路已被
从“保险箱”到“智能工厂”:数据资产化星火之路已被
来源:米6体育app官网 作者:米6体育app官网登录 【发表时间】2024-02-27 05:53:10 【点击次数】23

  生产要素是人类社会的盐。25万年前,最原始的劳动力率先登上历史舞台;公元前9500年起,土地逐渐成为农业文明的摇篮;肇始于1760年的工业,让资本、技术跻身生产要素的行列;而上世纪40年代迄今的信息技术,不仅催生了互联网、云计算、人工智能等逆天改命的利器,而且推动“数据”日益晋升为生产要素“天团”的C位。

  著名学者伊恩•莫里斯在《文明的度量》中指出,人类正从单要素或双要素主导的时代,进入人力、土地、技术、资本和数据协同作用的多要素时代,伴随生产要素的不断增加和演变,社会文明程度也呈现出加速增长的态势。

  作为冉冉升起的生产要素新星,数据总是被寄予厚望,在近年AI大模型的助推下更化身为烛亮数字新世界的火炬。尘封多年的海量数据化为大模型训练和推理的养料,不曾被关注的历史数据被重新激活和唤醒,在气象预报、金融风控等应用场景已取得丰硕成果。

  值得关注的是,在数据“上位”的进程中,顶层设计的驱动是其欣欣向荣的核心原动力。从2020年明确将数据定义为“第五大生产要素”,到2023年成立国家数据局,再到17部门联合推进“数据要素×”三年行动计划,中国在数据资产化的上脚步愈加坚定,数字经济的新动能锋芒初露。

  当然,建立数据要素市场体系,将数据转化为可量化、可交易、可持续增值的资产,并非短时间内就能达成的目标。在这条充满荆棘的道路上,潜藏着“看不清”、“理不顺”、“用不好”、“流不动”等拦路虎,数据资源化、资产化的终极目标似乎遥不可及。

  其实,数据在数字化初始阶段也曾遭遇过“留不住”的烦恼,数据的最终归宿——存储产品此时扮演了“保险箱”的角色,其迭代进化使数据的完整性、私密性、可用性得到保障;当数据资产化的窗口开启,仅存纳这一初始功能已无法满足时代诉求,“保险箱”要升级为“智能工厂”,对数据进行系统梳理和智能加工,进而灵活满足多样化的数据产品需求。

  谁能在数据资产化的关键蜕变期担当重任?华为给出了答案。近日,华为开创性地发布全新数据湖解决方案,基于GFS(Global File System)全局文件系统构筑的数据编织层,可与下面的数据存储层和和上面的数据服务层协同,实现数据资产的可视、可管、可用,为释放数据资产潜能创造了必要条件。

  解锁漫长的旅途,首先需要一张数据资产的全景地图。然而,在相当长一段时间里,“看不清”数据却是千行百业面临的常态。

  例如:一家世界500强大型跨国企业的全球各分公司产生百万张表格,但真正经过盘点并注册上架的比例不超过10%,导致诸多数据资产很难查到。这一方面由于海量的数据分散在各地,全面统筹梳理的难度极高,另一方面则是人工盘点的工作量大,容易出错且盘点效率低。

  以GFS为引擎的华为数据湖解决方案,成为解开数据枷锁的钥匙。其提供企业数据资产一张图,从全局、、实时三个角度破题:一是通过标准接口实现跨地域、跨站点、跨厂家的统一元数据纳管,全局数据一目了然;二是不同的数据源格式、协议均可无损入湖,让数据维度更立体,帮助用户洞察先机;三是革新传统的元数据全量扫描及上报模式,实现数据秒级更新,促进客户及时应对市场变化。

  再回到前面提到的那家世界500强企业——逾百万张表格“失控”只是数据资产问题的冰山一角,其业务广泛、场景复杂,财务报告数据来自200多个子公司,且要遵循中国、国际、本地3套不同的会计准则,面临的挑战可见一斑。

  据华为分布式存储领域总裁袁远透露,这家公司通过应用“数据资产一张图”对海量表格进行了高效盘点、注册,使公司月度报告生成时间从18天缩短到3天,年度报告生成时间从三周降至一周,大幅提升经营决策效率。

  就一场远行而言,仅手执地图是不够的,还要在千头万绪中做出最合理的路线选择,避免陷入一团乱麻的窘境。

  在数据资产化迈向纵深的过程中,杂乱无序的数据缺少分类分级是“理不顺”的症结所在。相关统计显示:目前国内企业数据分类分级依赖人工的比例超过60%,且自动化分类分级的准确率小于60%,提升自动化水平迫在眉睫。

  在这样的背景下,华为全新数据湖解决方案的“智能数据目录”无疑大有用武之地。给数据自动打标签和分门别类是首要任务,涉及两类应用场景:一是基于安全视角按数据合规等级分级,需要先对敏感和隐私数据进行自动识别,再进行差异化的数据处理;二是从业务视角对数据内容自动分类,倘若要自动化筛选用于模型训练的数据集,就需借助AI手段完成内容识别并标签化处理,提升训练集的数据质量。自动标签大功告成之后,即可促进语义聚类,支撑按需高效检索和可视化呈现。

  以海外某制造企业AI质检场景为例:AI质检工序繁多,每道工序的数据处理规则亦不尽相同。这家企业每天要给500万条原始数据打上工序类别标签,并设定个性化的处理规则。过往一次处理需要消耗数天时间,并存在大量的错删、漏删问题。通过采用华为数据湖解决方案,实现自动化打标签,每次处理时长缩短到约18分钟,部署的服务器数量也减少一半。

  在路上,最精彩的莫过于流动的风景。但要想安全、顺畅地抵达目的地,必须找到快速、便捷、可靠的通道,这也是数据资产化加速落地的不二法门。

  “用不好”与“流不动”是阻碍数据资产化的核心障碍,尤其是关乎数据价值释放的“流不动”问题,长期以来困扰着无数企业,亦是华为数据湖解决方案重点突围的方向。

  “不敢流”突显出“流不动”的底层逻辑——主要体现在企业出于数据安全的考虑,想方设法规避数据流通中的风险,通过增加人工核查、审批环节进行应对,却无法从根本上解决问题。直面“不敢流”的症结,华为数据湖解决方案提出可信数据空间概念,通过合法性认证、安全策略控制、日志留痕等能力实现数据全业务流程的可信、可控和可追溯。

  “流得慢”则是“流不动”的现实困境——不少数据中心仍以快递硬盘的方式实现数据流通,其效率低下不言而喻;而若采用网络专线进行数据传输,相关成本让不少企业难堪重负、望而却步。针对两难困局,华为数据湖解决方案一方面支持面向跨域智能缓存的数据高效访问,另一方面通过数据压缩卡提供2:1无损压缩能力,将传输效率提升100%,降低数据传输的支出。

  以数据资产化对各个行业的渗透进程来看,金融、政府、运营商以及教育科研等领域堪称开路先锋,尽快形成具有示范效应的综合性应用案例,将有助于加快数据生产要素的场景化落地。

  从这个意义上讲,国内某大型股份制银行基于华为数据湖解决方案进行的创新探索,就颇具借鉴价值。该银行主要有两大痛点:一是总行与分行、银行同业之间缺乏安全、高效的数据流通与共享手段,导致新业务系统上线缓慢;二是行业强监管造成数据安全违规的罚单大增且金额不菲。

  通过在总行、分行统一部署华为数据湖解决方案,这家银行取得了三方面的收获:其一,借助可信数据空间让银行的数据从不敢流到放心流,全行数据使用违规次数降低80%;其二,基于全局数据可视、可管达成全行一张图,新业务上线周;其三,GFS技术与华为OceanStor存储相结合,满足多样化业务负载诉求的同时,通过热温冷数据流动节省30%的成本。

  站在更长远的视角,数据资产化的大幕刚刚拉开,GFS从高端试水到普惠应用还有一段路要走。令人欣喜的是,华为正式发布open-GFS开源计划,将GFS的核心能力开放给伙伴ISV和政企用户。

  这一开源的举措正如东风,在春寒料峭的时节,让数据要素新时代的星星之火可以燎原。在GFS的使能与助推之下,越来越多数据产品的开发进程将显著提速,中国全新的数据要素流通生态也将愈发完善,这正是华为的初心与使命。

  每一个崭新生产要素的诞生,都会对人类社会产生巨大而深远的影响,数据也不例外。未来,掌握数据资产化的主动权、抢占数据驱动数字经济的制高点,将成为巨擘博弈的焦点——GFS可能只是春天的响指,遥远的共鸣尚在路上。返回搜狐,查看更多


米6体育app
关闭
上一篇:女星刘雨欣洛杉矶家被偷空!保险柜被炸珠宝被偷损失达 下一篇:一男子盗窃安康3家餐厅保险柜财物?!抓! 897拍