hbase

#hbase#

已有18人关注此标签

内容分类

yauso

HBase mslab.chunksize和G1HeapRegionSize间是否有关系

Hi,声明下背景: HBase 1.2.0-cdh5.7.6jdk:1.8.0_121RS内存设置24G 设置了hbase.hregion.memstore.mslab.chunksize=4MRS使用G1垃圾回收,-XX:G1HeapRegionSize=8M memstore在内存上请求的4M对于G1中region的8M而言,是否属于HumongousObjects?二者之间是否存在这样的关系?

游客uzzphpof6vkha

hbase新加列族时,需要disable表吗

hbase新加列族时,需要disable表吗。我本地试了下,不disable也能新家列族。如果不disable,会导致什么问题。

你们的好朋友

写hbase+接口的时候是否需要单例模式,hbase+连接是否需要关闭?【应用场景:sparkstreaming+从kafka+拿数据存入hbase

写hbase+接口的时候是否需要单例模式,hbase+连接是否需要关闭?【应用场景:sparkstreaming+从kafka+拿数据存入hbase

你们的好朋友

大家好,请教一下hbase数据导出到hive应该用什么组件

大家好,请教一下hbase数据导出到hive应该用什么组件

你们的好朋友

请教大神 HBASE region server 32G内存 GC 类型选择有什么建议? UseParNewGC 还是G1GC ?

请教大神 HBASE region server 32G内存 GC 类型选择有什么建议? UseParNewGC 还是G1GC ?

hbase小能手

我不知道lz4和zstd的cpu 资源使用情况是怎么样的,

我不知道lz4和zstd的cpu 资源使用情况是怎么样的,所以想问问群里有没有人了解过的

hbase小能手

想问下大佬们,阿里弄的CCSMAP是不是已经贡献到社区了呀

想问下大佬们,阿里弄的CCSMAP是不是已经贡献到社区了呀

hbase小能手

想请教一下大佬们,hbase 用一串数字的id开头,拼接date,如果id随机的话,怎么预分区来避免热点,大概一千万id 」

想请教一下大佬们,hbase 用一串数字的id开头,拼接date,如果id随机的话,怎么预分区来避免热点,大概一千万id 」63792956&20190611 这种

hbase小能手

各位大佬,这里有重试了以后,还报这个异常,是不是说明这条数据没有写进hbase

各位大佬,这里有重试了以后,还报这个异常,是不是说明这条数据没有写进hbase

hbase小能手

大佬 Hbase做复杂条件查询 大多是用solr还是es

大佬 Hbase做复杂条件查询 大多是用solr还是es

hbase小能手

hbase indexer都不更新了,有啥替代的没

hbase indexer都不更新了,有啥替代的没

hbase小能手

hbase 2.0.0 安装之后 master ui 显示 nodes with inconsistent version

hbase 2.0.0 安装之后 master ui 显示 nodes with inconsistent version

hbase小能手

如果已经使用solr建好hbase索引了,那使用bulkload往hbase灌数据,索引会同步过去吗?

如果已经使用solr建好hbase索引了,那使用bulkload往hbase灌数据,索引会同步过去吗?

hbase小能手

现在是200万数据要10多秒,太慢了,之前是用Phoenix查rowkey,在用hbase扫,我现在就想问是不是直接用Phoenix查询会比用“Phoenix查rowkey,在用hbase扫”要快点

现在是200万数据要10多秒,太慢了,之前是用Phoenix查rowkey,在用hbase扫,我现在就想问是不是直接用Phoenix查询会比用“Phoenix查rowkey,在用hbase扫”要快点

hbase小能手

为什么打印为空?

为什么打印为空呢

hbase小能手

Hbase+solr+indexer 这种可以认为是hbase某张表在indexer里又存了一份吗

Hbase+solr+indexer 这种可以认为是hbase某张表在indexer里又存了一份吗

小六码奴

hive添加自定义udf出现权限问题,有谁遇到过没?

hive添加自定义udf出现权限问题,有谁遇到过没?

小六码奴

求教下,spark根据时间戳去重,比如某个id假如在最近15min内出现过就认为是重复曝光,然后去掉,有啥好的实现方式不?[感谢]

求教下,spark根据时间戳去重,比如某个id假如在最近15min内出现过就认为是重复曝光,然后去掉,有啥好的实现方式不?我现在想的是搞个map去存他的时间戳,然后来一条就去看下,15min内就去掉,15min外就更新下这个时间戳,但是觉得有点不太优雅[捂脸]

小六码奴

请问各位,hbase的连接是否需要实现单例模式

请问各位,hbase的连接是否需要实现单例模式