您的当前位置:首页正文

DAAS

2023-06-26 来源:个人技术集锦


数据即服务Data as a Service

数据即服务,是继 IaaS、PaaS、SaaS[2]之后又一个新的服务概念。

1、DaaS数据即服务:Data as a Service

DaaS模式是将数据做为一种服务是通过传递有用的信息以帮助他人的活动来实现的。DaaS或称为数据云。

Amazon公司提供了一个这样的服务,称为亚马逊SimpleDB。Google App Engine提供访问 BigTable 的 DataStore API 接口。但是,除了这两款产品,当前这一市场还是一片空白。出露头家的云服务提供商(或者未云服务提供商提供软件的销售商)应该认真对待这种数据即服务,确保它成为其产品的一部分。

内存数据网格(In-memory Data Grid)

内存数据网格并不是新技术,已经出现一段时间了。随着应用程序不断成长,需要适应快速增加的数据以及满足增加更为快速的预期和要求,内存数据网格被用于大型或任务重大的应用程序中,以此缓解 RDBMS 系统的工作量。你可以会将数据网格的这种应用成为分布式缓存(distributed cache)——逐渐过时的 RDBMS 系统中附带的一个pacemaker工具。51CTO.com曾在《2010年数据库市场展望》一文中重点强调过内存数据库应用将在今年广泛流行。

但是,即使使用这种技术仍然不足以解决问题,因为RDBMS 仍会成为的最大的障碍,尤其在具备真正灵活性的云式部署中,在这种部署中,为了能够在任一时刻能够最高效地

处理荷载,将按需增加或减少虚拟接节点(virtual node)。正是在这里,NoSQL 出现了。

NoSQL 的世界

目前,NoSQL 这一用语与它所宣传的数据组织方式一样,都是未明确定义和非结构化的。NoSQL 背后的整体理念是非结构化的、灵活性的数据。高可用性、高扩展性,还有最重要的:分布式的。正如 Eric Breawer 的 CAP 原理中所述,在大多数 NoSQL 系统中,为了获得如此高的可用性,一致性被弱化,这样做的结果是所谓的“最终一致性”(Eventual Consistency)。在过去几年里,也许你已经听说一些比较知名的相关实施,比如Google 的BigTable 和Apache Hadoop。确切来讲,这些实现提高了实际扩展性的门槛并制定了NoSQL标准。但是,当前NoSQL 项目的增加所有带来的超级前缘的解决方案正慢慢地让开发者变得无忧无虑。

但是这些解决方案已经足够了吗?在很多情况下,NoSQL 是非常有用的,但大多数基于磁盘的 NoSQL 系统关注的焦点是大容量和处理量而不是低延迟的快速访问。NoSQL 数据和内存数据网格的交叉地带还存在一个“子物种”,这个方案能够快速、地延迟低访问内存数据。这类系统包括 Amazon 的Dynamo和开源项目 Voldemort 和Infinispan。

数据云:DaaS

现在我们来看看另一个被过度宣传并被赋予过多意义的词汇:云计算。无论是公共还是私人应用,在可扩展、易用性和高度硬件利用率的特种领域,云计算一直很受欢迎。这些特殊要求已经由架构(IaaS)和平台(PaaS)服务实现。这种方式也可应用于数据存储。设想以独立于平台方式连接到一个服务,用于存储和检索数据,与传统的 RDBMS 连接没

有太多不同。不过,现在你无需了解或担心存储数据所用的系统类型,而且获得低延迟、高扩性和高可用性的保证。对于任何云部署,为了同时获得灵活的、按需定制的架构和中间件,这种存储系统的虚拟化都是必须的。另外,具备灵活性、低延迟、分布性等理想特征的技术也能够为这种虚拟化提供帮助。通常这会设计到多种 NoSQL 解决方案。即使只用于内部的私人云应用,这样的解决方案将需要具备多租户(multi-tenancy)、计量(metering)和状态监控等功能。为了能够将数据从不同的应用中隔离开来,多租户是必需的,也许还会用某些形式的名空间(namespacing)。计量对于正确地分摊运行该服务的共用成本是至关重要的。为了实现计量需要记录占用的 CPU 周期、消耗的磁盘和内存空间,甚至还会包括宽带的占用量。

对于应用程序开发者,这意味着什么?

所幸的是,大多数人不再像过于那样多地域数据库进行互动。ORM 工具,如 Hibernate(一种 JPA 标准的实现)已经在 RDBMS 上添加了一个抽象层。我期待使用这类 ORM 工具的插件能够让 RDBMS 更为容易地转换为灵活性的云存储服务。其中一个是刚刚推出的 SimpleJPA 项目,它提供构建在 Amazon SimpleDB 之上的 JPA 功能;另一个是 Infinispa 即将推出的 JPA 接口。虽然更多作为 DaaS 的插件将出现,但我不认为这些工具是万能灵药,能够现实真正的透明迁移。我认为开发者仍然需要对应用程序数据进行长期认证地思考,理解存储方式的内在原因。在我们设计的数据模型中,某些 RDBMS 特有的假设总是时隐时现,这是因为 RDBMS 技术已经根深蒂固地融入了我们有关数据的思维之中。当我们转而思考非 RDBMS 存储时,这些东西常常称为阻碍或者减低效率。

全面理解数据即服务(DaaS)

资源利用率不足,数据蔓延到整个企业IT系统导致管理的复杂程度不断加深,这是每一位CIO都要面对的难题。现实中的困境也促进了技术发展,数据即服务

(Data-as-a-Service,DaaS)通过资源的集中化管理,为提升IT效率以及系统性能指明了方向。因此DaaS在过去的几年中得到了许多CIO的青睐,它包含的主要技术有数据虚拟化、数据集成、SOA、BPM以及PaaS等。

如何在正确的时间将正确的数据传输到正确的位置?如何将困在应用系统中的数据进行虚拟化?如何在数据复杂度以及数据量不断增长的情况下,依然能够支撑多变的业务需求?这些问题都在加速数据即服务的普及。

企业DaaS策略以及基础架构成为CIO和业务部门最为关注的话题之一,这体现在:

•企业数据仓库(EDW)越来越倾向于DaaS策略

•结构化与非结构化数据增长促使了DaaS的发展

•应用孤岛中的数据越来越集中化管理,DaaS基础架构就变得更加重要

•要做企业级的数据分析就必须先推行DaaS策略

在早期市场,DaaS主要关注的行业包括金融服务、电信以及公共部门。而在过去的24个月当中,我们看到如医疗、保险、零售、制造、电子商务以及媒体娱乐等行业也涌现出不少DaaS应用案例。

数据即服务用例

数据即服务的概念源自于交易、产品以及客户数据能够按需提供给用户,而不必去考虑地理位置或者不同的组织部门。此外,PaaS(平台即服务)和SOA的出现使得数据所处的实际平台也变得无关紧要。

数据即服务拥有非常多的用例:

1.提供单一版本的事实(Single version of truth)

2.支持实时商务智能(BI)

3.交易处理的高性能扩展

4.大数据分析

5.跨多个领域的联合视图

6.增强安全性与可访问性

7.云数据、合作伙伴数据以及社交媒体数据的整合

8.移动应用信息的交付

9.企业范围内的搜索

什么是数据即服务?

数据即服务是指与数据相关的任何服务都能够发生在一个集中化的位置,如聚合、数据质量管理、数据清洗等,然后再将数据提供给不同的系统和用户,而无需再考虑这些数据来自于哪些数据源。DaaS解决方案能够提供以下的优势:

•敏捷性。通过数据访问的整合,客户能够更加快速地对其进行移动,而无需再去考虑底层数据的来源。如果客户需要稍微不同的数据结构或者调用特定位置的数据,DaaS通过最小程度的变更能够非常快速满足需求。

•成本效益。服务提供者找数据专家来建好底层架构,表现层可以外包给别人(报表和仪表盘用户界面等),同时使得任何变更需求都能更灵活的满足。

•数据质量。通过服务来控制数据的访问,这对数据质量改进非常有帮助,因为更新点只有一个。当服务彻底测试之后,如果下一次部署不发生变化,那么他们只需要进行回归测试就好了。

•效率、高可用和弹性。这些优势来自于虚拟化,物理服务器资源共享将提升效率,跨多个物理服务器的集群可以提高可用性,动态调整和实时迁移集群节点到不同的物理服务器能够增强弹性。

数据即服务元素

客户需求构建一个DaaS平台,其中所涉及的元素主要包括:

1.数据采集(Data acquisition):来自于任何数据源,如数据仓库、电子邮件、门户、第三方数据源等。

2.数据治理与标准化:手动或者自动整理数据标准。

3.数据聚合:这个有很强的服务与技术驱动的质量控制机制,不是简单地写100个ETL程序。

4.数据服务:通过web服务、抽取和报表等,让终端用户能够更容易地消费数据。

总结

相关领域知识,应用知识,人员与技能,流程和技术平台是DaaS策略的关键需求。DaaS的精髓在于使数据管理更为集中化,让更多的用户无需去注意底层数据的问题,而将注意力完全放在如何使用这些数据。

资源利用率不足,数据蔓延到整个企业IT系统导致管理的复杂程度不断加深,这是每一位CIO都要面对的难题。现实中的困境也促进了技术发展,数据即服务(Data-as-a-Service,DaaS)通过资源的集中化管理,为提升IT效率以及系统性能指明了方向。因此DaaS在过去的几年中得到了许多CIO的青睐,它包含的主要技术有数据虚拟化、数据集成、SOA、BPM以及PaaS等。

如何在正确的时间将正确的数据传输到正确的位置?如何将困在应用系统中的数据进行虚拟化?如何在数据复杂度以及数据量不断增长的情况下,依然能够支撑多变的业务需求?这些问题都在加速数据即服务的普及。

企业DaaS策略以及基础架构成为CIO和业务部门最为关注的话题之一,这体现在:

企业数据仓库(EDW)越来越倾向于DaaS策略结构化与非结构化数据增长促使了

DaaS的发展应用孤岛中的数据越来越集中化管理,DaaS基础架构就变得更加重要要做企业级的数据分析就必须先推行DaaS策略

在早期市场,DaaS主要关注的行业包括金融服务、电信以及公共部门。而在过去的24个月当中,我们看到如医疗、保险、零售、制造、电子商务以及媒体娱乐等行业也涌现出不少DaaS应用案例。

数据即服务用例

数据即服务的概念源自于交易、产品以及客户数据能够按需提供给用户,而不必去考虑地理位置或者不同的组织部门。此外,PaaS(平台即服务)和SOA的出现使得数据所处的实际平台也变得无关紧要。

数据即服务拥有非常多的用例:

提供单一版本的事实(Single version of truth)支持实时商务智能(BI)交易处理的高性能扩展大数据分析跨多个领域的联合视图增强安全性与可访问性云数据、合作伙伴数据以及社交媒体数据的整合移动应用信息的交付企业范围内的搜索

什么是数据即服务?

数据即服务是指与数据相关的任何服务都能够发生在一个集中化的位置,如聚合、数据质量管理、数据清洗等,然后再将数据提供给不同的系统和用户,而无需再考虑这些数据来自于哪些数据源。DaaS解决方案能够提供以下的优势:

敏捷性。通过数据访问的整合,客户能够更加快速地对其进行移动,而无需再去考虑

底层数据的来源。如果客户需要稍微不同的数据结构或者调用特定位置的数据,DaaS通过最小程度的变更能够非常快速满足需求。

成本效益。服务提供者找数据专家来建好底层架构,表现层可以外包给别人(报表和仪表盘用户界面等),同时使得任何变更需求都能更灵活的满足。

数据质量。通过服务来控制数据的访问,这对数据质量改进非常有帮助,因为更新点只有一个。当服务彻底测试之后,如果下一次部署不发生变化,那么他们只需要进行回归测试就好了。

效率、高可用和弹性。这些优势来自于虚拟化,物理服务器资源共享将提升效率,跨多个物理服务器的集群可以提高可用性,动态调整和实时迁移集群节点到不同的物理服务器能够增强弹性。

数据即服务元素

客户需求构建一个DaaS平台,其中所涉及的元素主要包括:

数据采集(Data acquisition):来自于任何数据源,如数据仓库、电子邮件、门户、第三方数据源等。

数据治理与标准化:手动或者自动整理数据标准。

数据聚合:这个有很强的服务与技术驱动的质量控制机制,不是简单地写100个ETL程序。

数据服务:通过web服务、抽取和报表等,让终端用户能够更容易地消费数据。

总结

相关领域知识,应用知识,人员与技能,流程和技术平台是DaaS策略的关键需求。DaaS的精髓在于使数据管理更为集中化,让更多的用户无需去注意底层数据的问题,而将注意力完全放在如何使用这些数据

原文出自【比特网】,转载请保留原文链接:http://cloud.chinabyte.com/tech/201/12571201.shtml

因篇幅问题不能全部显示,请点此查看更多更全内容