数据仓库,数据湖,包括Flink社区提的流批一体,它们到底能解决什么问题?今天将...
希望这些答案有助于您确定如何使用NiFi以及它可以为您的业务需求带来的好处的数据...
旧版 CDH 用户使用 Apache Sentry 中的 Hive 策略,该策略...
为什么CDH甚至最新的CDP中对于Spark SQL CLI或者JDBC/ODB...
近年来,随着IT技术与大数据、机器学习、算法方向的不断发展,越来越多的企业都意识...
Ranger资源映射服务器(Resource Mapping Server:RM...
由LinkedIn主推,Cloudera和RedHat及其他社区贡献者协助出品的...
由Apache Flink提供支持的Cloudera Streaming Ana...
分布式数据处理中的一个常见挑战是从不同的计算节点收集日志,并以一种可以在以后进行...
在文中,我们将研究摄取、搜索和可视化的主题。我们仍将依靠CDP堆栈中可用的标准开...
Cloudera Manager是一个用于管理、配置和监控CDP私有云基础集群和...
Adaptive Query Execution框架(AQE)是Spark 3....
Fayson在CDP7.1.1 的使用过程中,发现在使用Hive SQL 中默认...
本文主要介绍如何在现有的CDP-DC集群上启用TLS。
启动Cloudera Manager管理控制台时,将 显示“ 主页” >“状态”...
在此文中,我们将带您进行基于角色的数据冒险,并附带简短的演示,以向您展示A-Z数...
CDH 集群在业务高峰的时候,偶尔会出现 Hive 查询慢的现象,本文通过分析 ...
很多企业组织已经在大数据解决方案上进行了投资,现在随着实时流分析的需求日益强烈,...
为生产环境配置 CDP Runtime 时,请确保启用 Kerberos 进行用...
Cloudera数据平台(CDP)是Cloudera的最新大数据产品。Apach...
如果您是CDH或HDP用户,则除了从CDH和HDP版本转移到CDP的功能之外,还...
Apache Kafka是一个高性能、高可用性、冗余的流消息平台。 Kafka...
亚马逊最近宣布了其最新的EMR版本6.1.0,支持ACID事务。该基准测试是在E...
Cruise Control是一个Kafka负载平衡组件,可以在大型Kafka集...
Cloudera Manager提供了多种功能来管理集群中的主机。
Cloudera与Dell / EMC保持了长期而成功的合作伙伴关系,为混合云中...
HashTable/SyncTable,详细介绍了它的一些内部实现逻辑,使用它的...
如何在Cloudera Manager中使用SAML配置身份认证
关于YCSB:YCSB是一个开源规范和程序套件,用于评估计算机程序的检索和维护功...
在CDSW中启动一个Session然后运行代码,第一次能够正常运行,在第一次运行...
机器学习最困难的部分实际上不是开始的建模和训练,而是最后一公里:在生产应用程序中...
升级CDP私有云基础包括两个主要步骤,即升级Cloudera Manager和升...
我们将介绍Apache Impala的最新增强功能,许多是性能改进,例如下面所述...
在此文中,我将介绍以下主题。1.对数据科学的需求。2.什么是数据科学?3.它与商...
在开发时遇到查询卡顿(stuck)的情况,感觉比较有代表性,因此记录一下排查过程...
本文直接演示如何在 CDH 集群中打印 Impala 进程的线程堆栈,不再需要编...
CDP 中的 Cloudera 运营数据库( OpDB ) 提供了实时、始终可...
身份验证是任何计算环境的基本安全要求。用户和服务必须先向系统证明其身份(身份验证...
本文描述如何使用多种安全管理工具来保护CDP环境。重点介绍安全管理工具与CDP环...
package是包含了编译的代码和元信息的二进制分发格式,其中元数据包括诸如 p...
Apache Kafka 是一个高性能、高可用性、冗余的流消息平台。
这篇文章介绍了一种架构以及用于隐私的相关组件,旨在为全国范围内的主动联系跟踪解决...
网易大数据平台的底层数据查询引擎,选用了 Impala 作为 OLAP 查询引擎...
Cloudera Data Flow(CDF) 作为 Cloudera 一个独立...
现有的CDH和HDP客户可以立即从此新功能中受益。本文重点介绍了加速CDP之旅到...
在进行故障排除时,我们可能希望深入了解二进制形式的Zookeeper事务日志和快...
自2017年Cloudera Data Science Workbench(CD...