CDP中的运营数据库+ 查看更多
CDP中的运营数据库
+ 查看更多
发布日期:2020-12-25 15:07
CDP 中的 Cloudera 运营数据库( OpDB ) 提供了实时、始终可用的可扩展OpDB,它在统一的运营和仓储平台中为传统结构化数据以及新的非结构化数据提供服务。Cloudera提供了一个可运营的数据库,该数据库在统一的开源平台中为传统的结构化数据以及新的非结构化数据提供服务。

运营数据库可帮助您:
使机器学习/人工智能投入运营,以彻底改变医疗保健,公共事业等行业。
• 以网络规模提供实时内容。
• 支持大数据分析,以供运营和离线使用。
• 用作记录的弹性存储。
CDP中的OpDB当前有两种形式可用:作为CDP公共云版本中的完全安全的、半托管产品–CDP Data Hub,以及作为CDP数据中心版本中的完全可自定义产品–与CDH和HDP中已经提供的类似。您可以根据您的部署策略和OpDB的需求来选择尺寸。运营数据库使用诸如Amazon S3之类的对象存储作为Apache HBase的存储层,其中HFile被写入对象存储,而WAL被写入HDFS。
CDP中的操作数据库具有以下组件:
• Apache Phoenix是在Apache HBase之上运行的SQL接口。
• Apache HBase专为实现大规模可伸缩性而设计,因此您可以在一个平台上存储无限量的数据,并满足不断增长的数据服务需求。
• Apache ZooKeeper提供了分布式配置服务,同步服务和命名注册表。
• Apache Knox Gateway提供外围安全性,以便企业可以放心地将访问权限扩展到新用户。
• Apache HDFS用于编写Apache HBase WAL。
• 对象存储区(例如Amazon S3和Microsoft ADLS Gen2)用于存储Apache HBase HFiles。
• 共享数据体验(SDX)用于安全和治理功能。安全和治理策略设置一次,并应用于所有数据和工作负载。
• IDBroker是REST API,是Apache Knox身份验证服务的一部分。它允许经过身份验证和授权的用户将一组凭据或令牌交换为云供应商访问令牌。
可访问性
管理
运营管理
可用性
完整性
应用支持
NoSQL和相关功能
可扩展性
安全
分享到:
推荐精彩博文