JustNote
  • Introduction
  • DesignPattern
    • 七大原则
      • 开闭原则(OCP)
      • 依赖倒置原则(DIP)
      • 单一职责原则(SRP)
      • 接口隔离原则(ISP)
      • 迪米特法则(LoD)
      • 里氏代换原则(LSP)
      • 合成复用原则(CRP)
    • 创建型模式
      • 简单工厂模式
      • 工厂方法模式
      • 抽象工厂模式
      • 建造者模式
      • 单例模式
      • 原型模式
    • 结构型模式
      • 外观模式
      • 装饰模式
      • 适配器模式
      • 享元模式
      • 组合模式
      • 桥接模式
      • 代理模式
    • 行为型模式
      • 模板方法模式
      • 迭代器模式
      • 策略模式
      • 解释器模式
      • 观察者模式
      • 备忘录模式
      • 命令模式
      • 中介者模式
      • 责任链模式
      • 访问者模式
      • 状态模式
  • Java
    • Java Core
      • JVM 如何加载类
      • JVM 垃圾回收
      • JVM G1GC
      • JVM G1GC Q&A
      • JVM 与 Hbase
      • JVM ZGC Overview
      • JVM ZGC 内存管理
      • JVM ZGC 线程
      • JVM ZGC 垃圾回收
      • JVM ZGC 日志分析
      • JVM ZGC 参数调优
    • checkstyle
  • Golang
    • 源码阅读
      • Goroutines
      • Channel
    • gRPC
      • 1、快速开始
      • 2、什么是gRPC
      • 3、gRPC概念梳理
      • 4、基于Golang的gRPC入门
      • 5、gRPC组件ProtocolBuffers介绍
      • 6、gRPC组件Http 2.0
      • 7、错误处理和Debug
      • 8、gRPC身份验证
      • 9、服务注册与发现
      • 10、gRPC与gRPC Gateway
      • 11、gRPC与分布式链路追踪
  • Scala
    • 数据结构与算法
      • 数组
      • 队列
    • 函数式编程
      • 高阶函数
      • 偏函数
    • Immutable Collection
      • List
    • Mutable Collection
      • Array
    • 常见函数操作
      • A
        • aggregate
        • andThen
        • appended
        • appendedAll
      • C
        • chain
        • collect
        • collectFirst
        • combinations
        • compose
        • concat
        • cond
        • condOpt
        • const
        • contains
        • containsSlice
        • copyToArray
        • corresponds
        • count
        • curried
      • D
        • diff
        • distinct
        • distinctBy
        • drop
        • dropRight
        • dropWhile
      • E
        • empty(PartialFunction)
        • empty(collections)
        • endsWith
        • exists
      • F
        • fill
        • filter
        • filterKeys
        • filterNot
        • find
        • findLast
        • flatMap
        • flatten
        • fold
        • foldLeft
        • foldRight
        • forall
        • foreach
        • fromFunction
      • G
        • getOrElse (Map)
        • getOrElse (Option)
        • groupBy
        • groupMap
        • groupMapReduce
        • grouped
      • H
        • head
        • headOption
      • I
        • indexOf
        • indexOfSlice
        • indexWhere
        • indices
        • init
        • inits
        • intersect
        • isDefinedAt (Map)
        • isDefinedAt (Seq)
        • isEmpty
        • isTraversableAgain
      • K
        • keys
      • L
        • last
        • lastIndexOf
        • lastIndexOfSlice
        • lastIndexWhere
        • lastOption
        • length
        • lift
      • M
        • map
        • mapConserve
        • mapValues
        • max
        • maxBy
        • maxByOption
        • maxOption
        • min
        • minBy
        • minByOption
        • minOption
        • mkString
      • N
        • nonEmpty
      • O
        • orElse
      • P
        • padTo
        • par
        • partition
        • partitionMap
        • patch
        • permutations
        • prefixLength
        • prepended
        • prependedAll
        • product
      • R
        • range
        • reduce
        • reduceLeft
        • reduceLeftOption
        • reduceOption
        • reduceRight
        • reduceRightOption
        • reverse
        • reverseIterator
        • reverseMap
        • runWith
      • S
        • sameElements
        • scan
        • scanLeft
        • scanRight
        • search
        • segmentLength
        • size
        • slice
        • sliding
        • sortBy
        • sortWith
        • sorted
        • span
        • splitAt
        • startsWith
        • sum
      • T
        • tabulate
        • tail
        • tails
        • take
        • takeRight
        • takeWhile
        • transpose
        • tupled
      • U
        • unfold
        • union
        • unlift
        • untupled
        • unzip
        • unzip3
        • updated
      • V
        • values
        • view
      • W
        • withFilter
        • withDefault
        • withDefaultValue
      • Z
        • zip
        • zipAll
        • zipWithIndex
      • map
      • flatmap
      • filter
      • reduceLeft
      • foldLeft
    • Futures
      • Method with future as return type
      • Non blocking future result
      • Chain futures using flatMap
      • Chain futures using for comprehension
      • Future Option with for comprehension
      • Future Option with map
      • Composing Futures
      • Future Sequence
      • Future Traverse
      • Future foldLeft
      • Future reduceLeft
      • Future firstCompletedOf
      • Future zip
      • Future zipWith
      • Future andThen
      • Future configure threadpool
      • Future recover
      • Future recoverWith
      • Future fallbackTo
      • Future promise
    • Akka
  • Algorithm
  • Docker
  • Kubernetes
    • 二进制安装kubernetes
      • 00.从零开始
  • Architecture
    • Infrastructure
      • Opentracing
      • Jaeger && ZipKin
      • SkyWalking
      • Consul
      • Envoy
      • Service Mesh
      • Service Mesh: Istio 详解
      • Service Mesh: 基于 Istio 的落地实践(一)
    • CAS
      • CAS Server
      • CAS Service Management
      • CAS 集成LDAP
      • CAS 集成gitlab
      • CAS SSO & SLO
      • CAS Gitbook
    • xCAT
  • Netty
  • DDD
  • Reactive Programming
    • Reactor
      • Publisher
      • Subscriber
      • Subscription
      • Processor
    • WebFlux
  • Gitlab
    • Git Hook
  • CICD
    • Jenkins
      • Kubectl
Powered by GitBook
On this page
  • HBase的G1GC
  • 参数配置
  • 如何调整HBase集群
  • 开始之前: GC and HBase monitoring
  • Step 0:推荐默认值
  • Step 1:确定预期的HBase最大使用率
  • Step 2: 设置堆大小,IHOP和Eden大小
  • Step 3:根据使用上限调整HBase配置
  • Step 4: 配置其他建议的参数以提高GC的性能
  • Run it
  • 其他参考

Was this helpful?

  1. Java
  2. Java Core

JVM 与 Hbase

PreviousJVM G1GC Q&ANextJVM ZGC Overview

Last updated 6 years ago

Was this helpful?

前面我们介绍过,G1GC 是现在比较流行的JVM 垃圾回收。所以,我们就结合G1GC 来讨论下Hadoop的GC。

HBase的G1GC

首先,我们本篇文章的主要依据就是官方的blog。

鉴于已经有官方blog作为资料,并且实验环境并不是很充足,所以我们直接叙述结论。

参数配置

首先看下,我们实际工作中的HBase的参数配置。以及各项参数的实际含义。

参数

含义

-XX:+UseG1GC

显式地要求使用G1 GC

-Xms64G

设置JVM初始堆内存为64G

-Xmx64G

设置JVM最大可用内存为64G

-XX:PermSize=256m

JVM初始分配的非堆内存

-XX:G1NewSizePercent=4

新生代最小值,默认值5%

-XX:MaxGCPauseMillis=200

设置G1收集过程目标时间,默认值200ms,不是硬性条件

-XX:ParallelGCThreads=16

STW期间,并行GC线程数

-XX:MaxTenuringThreshold=4

年龄阈值,默认15(对象被复制的次数)

-XX:+UnlockExperimentalVMOptions

与+UseG1GC 一起使用,来解锁参数,应该是一种安全机制

-XX:+ParallelRefProcEnabled

默认为false,并行的处理Reference对象,如WeakReference,除非在GC log里出现Reference处理时间较长的日志,否则效果不会很明显。

-XX:-ResizePLAB

是否启动动态修改

如何调整HBase集群

开始之前: GC and HBase monitoring

可以使用任何工具跟踪收集 block cache, memstore 和 static index size 这些指标,可以从 RegionServer JMX metrics 中找到。

  • “memStoreSize”

  • “blockCacheSize”

  • “staticIndexSize”

还可以使用官方的 collectd 插件来跟踪一段时间内的G1GC性能,并使用 gc_log_visualizer来了解特定的GC日志。要使用这些内容就要在 RegionServers 上跟踪这些信息。

  • -Xloggc:$GC_LOG_PATH

  • -verbosegc

  • -XX:+PrintGC

  • -XX:+PrintGCDateStamps

  • -XX:+PrintAdaptiveSizePolicy

  • -XX:+PrintGCDetails

  • -XX:+PrintGCApplicationStoppedTime

  • -XX:+PrintTenuringDistribution

还建议使用某种GC日志轮换,例如:

  • -XX:+ UseGCLogFileRotation

  • -XX:NumberOfGCLogFiles = 5

  • -XX:GCLogFileSize = 20M

Step 0:推荐默认值

建议将以下JVM参数和值作为HBase RegionServers的默认值:

  • -XX:+ UseG1GC

  • -XX:+ UnlockExperimentalVMOptions

  • -XX:MaxGCPauseMillis = 50

  • -XX:-OmitStackTraceInFastThrow

  • -XX:ParallelGCThreads = 8+(逻辑处理器-8)

  • -XX:+ ParallelRefProcEnabled

  • -XX:+ PerfDisableSharedMem

  • -XX:-ResizePLAB

Step 1:确定预期的HBase最大使用率

使用上面提到的RegionServer JMX指标,查找整个集群中每个指标的最大值

  • Maximum block cache size.

  • Maximum memstore size.

  • Maximum static index size.

将每个最大值扩展到 110%,以适应最大使用值的轻微增幅。这是该指标的使用上限: 例如最大10 GB记录的memstore→11 GB memstore上限.

理想情况下,在过去一周或一个月内跟踪这些指标,就可以找到该时间段内的最大值。如果不是,在计算 memstore和static index size 上限时要比110% 更高一些。尤其是 Memstore,随着时间的推移,可能会变的更大。

Step 2: 设置堆大小,IHOP和Eden大小

先从比较低的 Eden 大小开始设置:如果不是很确定,8% 的堆的大小就可以。

-XX:G1NewSizePercent = 8
  • 增加Eden大小会增加单个GC pause 时间,但会略微减少GC中花费的总时间。

  • 减小Eden大小会产生相反的效果:GC pause 时间越短,GC中的总体时间略长。

用Step 1中的Eden大小和使用上限确定必要的堆大小:

Heap ≥ (M + B + O + E) ÷ 0.7

  • M = memstore cap, GB

  • B = block cache cap, GB

  • O = static index cap, GB

  • E = Eden size, GB

根据计算的值设置固定堆大小的JVM参数,例如:

-Xms40960m -Xmx40960m

根据使用上限和堆大小在JVM中设置IHOP:

  • IHOP = (memstore cap’s % heap + block cache cap’s % heap + overhead cap’s % heap + 20)

  • -XX:InitiatingHeapOccupancyPercent = IHOP

Step 3:根据使用上限调整HBase配置

根据使用上限和总堆大小,在 HBase 配置中设置 block cache 上限 和 memstore 上限比率:

  • hfile.block.cache.size → block cache cap ÷ heap size

  • hbase.regionserver.global.memstore.size → memstore cap ÷ heap size

Step 4: 配置其他建议的参数以提高GC的性能

  • -XX:MaxTenuringThreshold = 1

  • -XX:G1HeapWastePercent = 10

  • -XX:G1MixedGCCountTarget = 16

  • -XX:G1HeapRegionSize = #M #必须是2的幂,在[1..32]范围内,理想情况下,#是这样的:堆大小÷#MB = 2048个region。

Run it

应用这些配置,然后重启RegionServers,看看他们的表现。

  • 可以如上所述调整Eden大小,以优化较短的单个GC或减少GC中的总时间,如果这样做,请确保Eden +IHOP≤90%。

  • 如果HBase客户端可能有非常突发的流量,可以考虑在IHOP和Eden之外添加堆空间(例如,IHOP + Eden加起来高达80%.

其他参考

HBase 调整G1GC
HBase的G1GC
参数配置
如何调整HBase集群
开始之前: GC and HBase monitoring
Step 0:推荐默认值
Step 1:确定预期的HBase最大使用率
Step 2: 设置堆大小,IHOP和Eden大小
Step 3:根据使用上限调整HBase配置
Step 4: 配置其他建议的参数以提高GC的性能
Run it
其他参考
https://blogs.apache.org/hbase/entry/tuning_g1gc_for_your_hbase
G1GC Fundamentals (HubSpot blog)
Understanding G1GC Logs (Oracle blog)
Tuning HBase Garbage Collection (Intel blog)