产品中心

<<返回上一页

云原生数据中台技术与趋向解读

发布时间:2024-11-15 05:16:56点击:

数据中台开展至今,大体阅历了4个关键阶段:数据库——数据仓库——大数据平台——数据中台。每次新的改革,都是为了处置上一阶段存在的疑问。

,走向云原生成为数据中台的肯定和肯定。

一、云原生从何而来?

云原生是用于指点如何在云上构建和运转运行的方法论。

咱们以为,“云原生”并不是一个新的概念。回忆云计算史,从团体端运行到企业级运行,都早已开局“上云”。

后来,这些上云的“非原住民”运行,间断了私有化部署的技术架构,把本地软件不加修正地经过ECS迁至云端。而ECS的弊病在于只能承载计算,不可成功存储。只管上云后的运行成功了业务买通,但随着业务扩展,原有的架构“可用性”显著降低。

国际云厂商为了处置数据存储疑问,制造了云磁盘,将其挂靠在云主机上,成功数据备份,且无需更改程序。传统软件上云的“高可用”疑问得以处置。

但是,这种形式引发了另一弊病——老本高。客户把Hadoop不加修正间接部署到ECS节点上,数据经过HDFS存储在云磁盘上,需破费少量老本。因此肯定修正HDFS底层,把数据存到对象存储上。

随着需求不时丰盛,系统肯定依照IaaS、PaaS的技术特点启动重构,以便跟上业务和数据的爆炸性增长。在私有化部署以及上一代传统技术的软件架构运维方法论的基础上,带着“高可用”、“低老本”等属性,“云原生”更新而出。

二、云原生数据中台具有哪些技术因素?

“云原生”概念开展至今,咱们已并不生疏。而为什么要强调“云原生数据中台才是未来”?分级多域数据控制的刚需、云原生技术降本增效的自然特色、国际基础设备自主可控的要求……都将数据中台推向云原生。

因此,咱们将云原生数据中台的技术因素演绎为6点:CI/CD(继续集成继续交付)、容器化、对象体系、存储计算分别、跨云多域数据控制和元数据控制。

1. CI/CD(继续集成继续交付)

CI/CD的实质是提高开发和部署效率。

在业务量渺小的状况下,大数据和云的运维人力老本极高。因此须要经常使用少量的智能化工具和大数据预测算法启动智能化运维。经过版本控制系统和DevOps基础设备,成功智能化测试和继续集成。

一个典型流程是,程序员提交代码到特定的tag,触发测试接口智能化测试脚本口头并发送报告。由此成功测试、颁布和部署智能化。在此基础上构建特定的数据环境,对关键接口和链路启动智能化检测。

2. 容器化

容器化实质上是一种虚构化技术,一台主机可虚构出上千个容器。

单个容器的启动期间更快,占用空间更小,而且可以依据实践运行的大小来弹性调配资源,无需额外洽购主机,放慢研发速度。经常使用容器编排基础设备,对服务和作业启动控制,根除版本天堂,大幅度提高运维和集功效率。

容器化编排与CI/CD是相互联合的。在数据中台畛域,往往几十台机器、上百个进程同时运转,且在这些进程中不只有运转自身的程序,也要运转客户的程序。

因此,底层微服务的进程单一。基于安保合规要求,客户之间的程序须要坚持分隔。因此,数据中台关于容器化的要求高于其余基于云原生的运行。

3. 对象体系

依据现有业务形象出**对象,以规范Restful格调提供API服务,解耦**对象与业务层服务,以应答不同环境、不同业务场景的需求。这一系列正交的**对象就导致了平台对象体系,下层业务可在此基础上构建运行,高效演进。

对象体系的API应该是优雅且向前兼容的,一旦颁布,很难扭转。例如,在WIN32研发时,发生某个单词失误,几十年后都不可修正。因此,须要把对象体系设计得极为详尽和准确。

4. 存储计算分别

因为云具有散布式特点,在云上不可自然将数据存储在ECS中。因此肯定将关键数据、形态型数据存储在对象存储中。少量私有化组件都须要被改写。假设把Hadoop、Spark等惯例开源大数据引擎间接运行于云主机,海量数据带来的存储老本和吞吐压力,很快会压垮客户。

因此,肯定引入两边缓存成功计算存储分别,将数据存储到对象存储上,同时兼容HDFS协定,能够依据业务需求启动弹性扩容,就能大幅度降低老本,提高集群性能。

5. 跨云多域数据控制

云原生数据中台的一大长处在于可以成功跨云多域。

例如,客户在AWS上经常使用数据中台,一旦须要转移到其余平台,云原生数据中台可实如今不修正代码的基础上间接迁徙。关于具有多重业务、庞大数据体量的大型企业来说,为防止数据资产被一个平台所绑定,供应商肯定出现多样化。

因此,在客户与一家供应商协作的同时,也须要经常使用独立的第三方数据中台提供跨云多域的数据控制才干,从而提高基础设备的可控性和安保性。

6. 元数据控制

因为数据量急剧增长,对数据的控制成为一大疑问。

云原生数据中台的元数据控制性能,对数据的结构、目的、标签、权限、高低游血统、消费作业等元消息启动规范化控制,建设智能数据控制体系。同时允许数据清点、安保审计、血统剖析、关键分级等运行,最终成功数据资产化。

例如,某顶级品牌商具有73个业务系统,各自存储在不同的数据库和存储介质中,须要将73个系统所有集中在一个数据中台上启动标签买通。在此需求下,数据控制十分关键,**就是元数据的控制。因此,云原生数据中台肯定具有元数据控制性能。

三、云原生数据中台能为用户处置什么疑问?

具有以上6大技术才干的数据中台是走向云原生后的关键更新。基于这些才干,云原生数据中台终究能为用户处置哪些疑问,带来降本增效?

1. 提高研发效率

经过微服务、CI/CD、对象体系、DevOps等一系列技术,优化迭代速度,增强在云的复杂环境下的控制、智能化运维控制等。提高代码开发、测试、颁布效率,降低迭代老本。

2. 降低运维老本

经过上述的技术也可以成功开发及运维高效协同,有效优化对缺点的照应速度,成功继续集成和交付。使得加快部署运行成为业务流程和企业竞争力的关键组成局部,降低运维老本。

3. 降低存算老本

大数据基础设备的存储计算老本惊人。存算分别和容器化能够更高效地经常使用IaaS资源,降低存储老本。存储和计算节点分别后,可以在不对存储启动扩容的状况下加快参与计算资源。

另一方面,单个容器的启动期间更快,占用空间更小,而且可以依据实践运行的大小来弹性调配资源,无需额外洽购主机。

4. 提高控制效率

控制效率不局限于数据控制,也包含微服务控制、系统控制和API控制,须要智能化设计和框架。经常使用跨云控制、元数据控制等技术,会大幅度提高企业积攒数据资产的效率,降低安保危险,提高供应商的多样化。