當前位置：首頁 > 科技 > 軟件

一招MAX降低10倍，現在它是我的了

來源：責編：時間：2024-05-16 09:10:15 155觀看

導讀一.背景性能優化是一場永無止境的旅程。到家門店系統，作為到家核心基礎服務之一，門店C端接口有著調用量高，性能要求高的特點。C端服務經過演進，核心接口先查詢本地緩存，如果本地緩存沒有命中，再查詢Redis。本地緩存命中率99

一.背景

性能優化是一場永無止境的旅程。

到家門店系統，作為到家核心基礎服務之一，門店C端接口有著調用量高，性能要求高的特點。

C端服務經過演進，核心接口先查詢本地緩存，如果本地緩存沒有命中，再查詢Redis。本地緩存命中率99%，服務性能比較平穩。

隨著門店數據越來越多，本地緩存容量逐漸增大到3G左右。雖然對垃圾回收器和JVM參數都進行調整，由于本地緩存數據量越來越大，本地緩存數據對于應用GC的影響越來越明顯，YGC平均耗時100ms，特別是大促期間調用方接口毛刺感知也越來越明顯。

由于本地緩存在每臺機器上容量是固定的，即便是將機器擴容，對與GC毛刺也沒有明顯效果。

二.初識此物心已驚-OHC初識

本地緩存位于應用程序的內存中，讀取和寫入速度非?？欤梢钥焖夙憫埱?無需額外的網絡通信,但是一般本地緩存存在JVM內，數據量過多會影響GC，造成GC頻率、耗時增加；如果用Redis的話有網絡通信的開銷。

框架	簡介	特點	堆外緩存	性能（一般情況）
Guava Cache	Guava Cache是Google的本地緩存庫，提供了基本的緩存功能。它簡單易用、輕量級，并支持基本的緩存操作。	·支持最大容量限制 ·支持兩種過期刪除策略（插入時間和訪問時間） ·支持簡單的統計功能 ·基于LRU算法實現	不支持	性能中等
Caffeine	Caffeine是一個高性能的本地緩存庫，提供了豐富的功能和配置選項。它支持高并發性能、低延遲和一些高級功能，如緩存過期、異步刷新和緩存統計等。	·提供了豐富的功能和配置選項；高并發性能和低延遲；支持緩存過期、異步刷新和緩存統計等功能； ·基于java8實現的新一代緩存工具，緩存性能接近理論最優。 ·可以看作是Guava Cache的增強版，功能上兩者類似，不同的是Caffeine采用了一種結合LRU、LFU優點的算法：W-TinyLFU，在性能上有明顯的優越性	不支持	性能出色
Ehcache	Encache是一個純Java的進程內緩存框架，具有快速、精干等特點，是Hibernate中默認的CacheProvider。同Caffeine和Guava Cache相比，Encache的功能更加豐富，擴展性更強	·支持多種緩存淘汰算法，包括LRU、LFU和FIFO ·緩存支持堆內存儲、堆外存儲、磁盤存儲（支持持久化）三種 ·支持多種集群方案，解決數據共享問題	支持	性能一般
OHC	OHC（Off-Heap Cache）是一個高性能的堆外緩存庫，專為高并發和低延遲而設計。它使用堆外內存和自定義的數據結構來提供出色的性能	·針對高并發和低延遲進行了優化；使用自定義數據結構和無鎖并發控制；較低的GC開銷； ·在高并發和低延遲的緩存訪問場景下表現出色	支持	性能最佳

通過對本地緩存的調研，堆外緩存可以很好兼顧上面的問題。堆外緩存把數據放在JVM堆外的，緩存數據對GC影響較小，同時它是在機器內存中的，相對與Redis也沒有網絡開銷，最終選擇OHC。

三.習得技能心自安-OHC使用

talk is cheap, show me the code! OCH是騾子是馬我們遛一遛。

1.引入POM

OHC 存儲的是二進制數組，需要實現OHC序列化接口，將緩存數據與二進制數組之間序列化和反序列化。

這里使用的是Protostuff，當然也可以使用kryo、Hession等，通過壓測驗證選擇適合的序列化框架。

<!--OHC相關--><dependency>	<groupId>org.caffinitas.ohc</groupId>	<artifactId>ohc-core</artifactId>	<version>0.7.4</version></dependency><!--OHC 存儲的是二進制數組，所以需要實現OHC序列化接口，將緩存數據與二進制數組之間序列化和反序列化--><!--這里使用的是protostuff，當然也可以使用kryo、Hession等，通過壓測驗證選擇適合的--><dependency>	<groupId>io.protostuff</groupId>	<artifactId>protostuff-core</artifactId>	<version>1.6.0</version></dependency><dependency>	<groupId>io.protostuff</groupId>	<artifactId>protostuff-runtime</artifactId>	<version>1.6.0</version></dependency>

2.創建OHC緩存

OHC緩存創建

OHCache<String, XxxxInfo> basicStoreInfoCache = OHCacheBuilder.<String, XxxxInfo>newBuilder()                    .keySerializer(new OhcStringSerializer()) //key的序列化器                    .valueSerializer(new OhcProtostuffXxxxInfoSerializer()) //value的序列化器                    .segmentCount(512) // 分段數量 默認=2*CPU核數                    .hashTableSize(100000)// 哈希表大小 默認=8192                    .capacity(1024 * 1024 * 1024) //緩存容量 單位B 默認64MB                    .eviction(Eviction.LRU) // 淘汰策略 可選LRU/W_TINY_LFU/NONE                    .timeouts(false) //不使用過期時間，根據業務自己選擇                    .build();

自定義序列化器，這里key-String 序列化器，這里直接復用OCH源碼中測試用例的String序列化器；

value-自定義對象序列化器，這里用Protostuff實現,也可以自己選擇使用kryo、Hession等實現；

//key-String 序列化器，這里直接復用OCH源碼中測試用例的String序列化器public class OhcStringSerializer implements CacheSerializer<String> {    @Override    public int serializedSize(String value) {        return writeUTFLen(value);    }    @Override    public void serialize(String value, ByteBuffer buf) {        // 得到字符串對象UTF-8編碼的字節數組        byte[] bytes = value.getBytes(Charsets.UTF_8);        buf.put((byte) ((bytes.length >>> 8) & 0xFF));        buf.put((byte) ((bytes.length >>> 0) & 0xFF));        buf.put(bytes);    }    @Override    public String deserialize(ByteBuffer buf) {        int length = (((buf.get() & 0xff) << 8) + ((buf.get() & 0xff) << 0));        byte[] bytes = new byte[length];        buf.get(bytes);        return new String(bytes, Charsets.UTF_8);    }    static int writeUTFLen(String str) {        int strlen = str.length();        int utflen = 0;        int c;        for (int i = 0; i < strlen; i++) {            c = str.charAt(i);            if ((c >= 0x0001) && (c <= 0x007F)){                utflen++;}            else if (c > 0x07FF){                utflen += 3;}            else{                utflen += 2;            }        }        if (utflen > 65535) {            throw new RuntimeException("encoded string too long: " + utflen + " bytes");        }        return utflen + 2;    }}//value-自定義對象序列化器，這里用Protostuff實現,可以自己選擇使用kryo、Hession等實現public class OhcProtostuffXxxxInfoSerializer implements CacheSerializer<XxxxInfo> {    /**     * 將緩存數據序列化到 ByteBuffer 中，ByteBuffer是OHC管理的堆外內存區域的映射。     */    @Override    public void serialize(XxxxInfo t, ByteBuffer byteBuffer) {        byteBuffer.put(ProtostuffUtils.serialize(t));    }    /**     * 對堆外緩存的數據進行反序列化     */    @Override    public XxxxInfo deserialize(ByteBuffer byteBuffer) {        byte[] bytes = new byte[byteBuffer.remaining()];        byteBuffer.get(bytes);        return ProtostuffUtils.deserialize(bytes, XxxxInfo.class);    }    /**     * 計算字序列化后占用的空間     */    @Override    public int serializedSize(XxxxInfo t) {        return ProtostuffUtils.serialize(t).length;    }}

為了方便調用和序列化封裝為工具類，同時對代碼通過FastThreadLocal進行優化，提升性能。

public class ProtostuffUtils {    /**     * 避免每次序列化都重新申請Buffer空間，提升性能     */    private static final FastThreadLocal<LinkedBuffer> bufferPool = new FastThreadLocal<LinkedBuffer>() {        @Override        protected LinkedBuffer initialValue() throws Exception {            return LinkedBuffer.allocate(4 * 2 * LinkedBuffer.DEFAULT_BUFFER_SIZE);        }    };    /**     * 緩存Schema     */    private static Map<Class<?>, Schema<?>> schemaCache = new ConcurrentHashMap<>();    /**     * 序列化方法，把指定對象序列化成字節數組     */    @SuppressWarnings("unchecked")    public static <T> byte[] serialize(T obj) {        Class<T> clazz = (Class<T>) obj.getClass();        Schema<T> schema = getSchema(clazz);        byte[] data;        LinkedBuffer linkedBuffer = null;        try {            linkedBuffer = bufferPool.get();            data = ProtostuffIOUtil.toByteArray(obj, schema, linkedBuffer);        } finally {            if (Objects.nonNull(linkedBuffer)) {                linkedBuffer.clear();            }        }        return data;    }    /**     * 反序列化方法，將字節數組反序列化成指定Class類型     */    public static <T> T deserialize(byte[] data, Class<T> clazz) {        Schema<T> schema = getSchema(clazz);        T obj = schema.newMessage();        ProtostuffIOUtil.mergeFrom(data, obj, schema);        return obj;    }    @SuppressWarnings("unchecked")    private static <T> Schema<T> getSchema(Class<T> clazz) {        Schema<T> schema = (Schema<T>) schemaCache.get(clazz);        if (Objects.isNull(schema)) {            schema = RuntimeSchema.getSchema(clazz);            if (Objects.nonNull(schema)) {                schemaCache.put(clazz, schema);            }        }        return schema;    }}

3.壓測及參數調整

通過壓測并逐步調整OHC配置常見參數（segmentCount、hashTableSize、eviction，參數含義見附錄）

MAX對比降低10倍

GC時間對比降低10倍

優化前

優化后

4.OHC緩存狀態監控

OHC緩存的命中次數、內存使用狀態等存儲在OHCacheStats中，可以通過OHCache.stats()獲取。

OHCacheStates信息：

hitCount：緩存命中次數，表示從緩存中成功獲取數據的次數。 missCount：緩存未命中次數，表示嘗試從緩存中獲取數據但未找到的次數。 evictionCount：緩存驅逐次數，表示因為緩存空間不足而從緩存中移除的數據項數量。 expireCount：緩存過期次數，表示因為緩存數據過期而從緩存中移除的數據項數量。 size：緩存當前存儲的數據項數量。 capacity：緩存的最大容量，表示緩存可以存儲的最大數據項數量。 free：緩存剩余空閑容量，表示緩存中未使用的可用空間。 rehashCount：重新哈希次數，表示進行哈希表重新分配的次數。 put(add/replace/fail)：數據項添加/替換/失敗的次數。 removeCount：緩存移除次數，表示從緩存中移除數據項的次數。 segmentSizes(#/min/max/avg)：段大小統計信息，包括段的數量、最小大小、最大大小和平均大小。 totalAllocated：已分配的總內存大小，表示為負數時表示未知。 lruCompactions：LRU 壓縮次數，表示進行 LRU 壓縮的次數。

通過定期采集OHCacheStates信息，來監控本地緩存數據、命中率=[命中次數 / (命中次數 + 未命中次數)]等，并添加相關報警。同時通過緩存狀態信息，來判斷過期策略、段數、容量等設置是否合理，命中率是否符合預期等。

四.剖析根源見真諦-OHC原理

堆外緩存框架（Off-Heap Cache）是將緩存數據存儲在 JVM 堆外的內存區域，而不是存儲在 JVM 堆中。在 OHC（Off-Heap Cache）中，數據也是存儲在堆外的內存區域。

具體來說，OHC 使用 DirectByteBuffer 來分配堆外內存，并將緩存數據存儲在這些 DirectByteBuffer 中。

DirectByteBuffer 在 JVM 堆外的內存區域中分配一塊連續的內存空間，緩存數據被存儲在這個內存區域中。這使得 OHC 在處理大量數據時具有更高的性能和效率，因為它可以避免 JVM 堆的垃圾回收和堆內存限制。

OHC 核心OHCache接口提供了兩種實現：

?OHCacheLinkedImpl：實現為每個條目單獨分配堆外內存，最適合中型和大型條目。

?OHCacheChunkedImpl：實現為每個散列段作為一個整體分配堆外內存，并且適用于小條目。（實驗性的，不推薦,不做關注）

可以看到OHCacheLinkedImpl中包含多個段，每個段用OffHeapLinkedMap來表示。同時，OHCacheLinkedImpl將Java對象序列化成字節數組存儲在堆外，在該過程中需要使用用戶自定義的CacheSerializer。

OHCacheLinkedImpl的主要工作流程如下：

1.計算key的hash值，根據hash值計算段號，確定其所處的OffHeapLinkedMap

2.從OffHeapLinkedMap中獲取該鍵值對的堆外內存地址(指針)

3.對于get操作，從指針所指向的堆外內存讀取byte[]，把byte[]反序列化成對象

4.對于put操作，把對象序列化成byte[]，并寫入指針所指向的堆外內存

可以將OHC理解為一個key-value結果的map,只不過這個map數據存儲是指向堆外內存的內存指針。

指針在堆內，指針指向的緩存數據存儲在堆外。那么OHC最核心的其實就是對堆外內存的地址引用的put和get以及發生在其中內存空間的操作了。

對OHCacheLinkedImpl的put、get本地調試

1.put

put核心操作就是

1.申請堆外內存

2.將申請地址存入map;

3.異常時釋放內存

第2步其實就是map數據更新、擴容等的一些實現這里不在關注，我們重點關注怎么申請和釋放內存的

1.申請內存

通過深入代碼發現是調用的IAllocator接口的JNANativeAllocator實現類，最后調用的是com.sun.jna.Native#malloc實現

2.釋放內存

通過上面可知釋放內存操作的代碼

3.get

4.Q&A

在put操作時，上面看到IAllocator有兩個實現類，JNANativeAllocator和UnsafeAllocator兩個實現類，他們有什么區別？為什么使用JNANativeAllocator?

區別：UnsafeAllocator對內存操作使用的是Unsafe類

為什么使用JNANativeAllocator：Native比Unsafe性能更好，差3倍左右，OHC默認使用JNANativeAllocator；

在日常我們知道通過ByteBuffer#allocateDirect(int capacity)也可以直接申請堆外內存，通過ByteBuffer源碼可以看到內部使用的就是Unsafe類

可以看到，同時DirectByteBuffer內部會調用 Bits.reserveMemory(size, cap);

Bits.reserveMemory方法中，當內存不足時可能會觸發fullgc，多個申請內存的線程同時遇到這種情況時，對于服務來說是不能接受的，所以這也是OHC自己進行堆外內存管理的原因。

如果自己進行實現堆外緩存框架，要考慮上面這種情況。

五.總結

1.OHC使用建議

1.對于OHC的參數配置、序列化器的選擇，沒有固定的推薦?？梢酝ㄟ^壓測逐步調整到最優。

2.由于OHC需要把key和value序列化成字節數組存儲到堆外，因此需要選擇合適的序列化工具。

3.在存儲每個鍵值對時，會調用CacheSerializer#serializedSize計算序列化后的內存空間占用，從而申請堆外內存。另外，在真正寫入堆外時，會調用CacheSerializer#serialize真正進行序列化。因此，務必在這兩個方法中使用相同的序列化方法，防止序列化的大小與計算出來的大小不一致，導致內存存不下或者多申請，浪費內存空間。

2.緩存優化建議

1.當本地緩存影響GC時，可以考慮使用OHC減少本地緩存對GC的影響；

2.區分熱點數據，對緩存數據進行多級拆分，如堆內->堆外->分布式緩存(Reids )等；

3.將較大緩存對象拆分或者按照業務維度將不同熱點數據緩存到不同介質中，減少單一存儲介質壓力；

4.減小緩存對象大小，如緩存JSON字符，可對字段名進行縮寫 ,減少存儲數據量，降低傳輸數據量，同時也能保證數據一定的私密性。

對象：{"paramID":1,"paramName":"John Doe"} 正常JSON字符串：{"paramID":1,"paramName":"John Doe"} 壓縮字段名JSON字符串：{"a":1,"b":"John Doe"}

Hold hold , One more thing....

在使用Guava時，存儲25w個緩存對象數據占用空間485M

使用OHCache時，儲存60w個緩存對象數據占用數據387M

為什么存儲空間差別那么多吶？

Guava 存儲的對象是在堆內存中的，對象在 JVM 堆中存儲時，它們會占用一定的內存空間，并且會包含對象頭、實例數據和對齊填充等信息。對象的大小取決于其成員變量的類型和數量，以及可能存在的對齊需求。同時當對象被頻繁創建和銷毀時，可能會產生內存碎片。

而 OHC 它將對象存儲在 JVM 堆外的直接內存中。由于堆外內存不受 Java 堆內存大小限制，OHC 可以更有效地管理和利用內存。此外，OHC 底層存儲字節數組，存儲字節數組相對于直接存儲對象，可以減少對象的創建和銷毀，在一些場景下，直接操作字節數組可能比操作對象更高效，因為它避免了對象的額外開銷，如對象頭和引用，減少額外的開銷。同時將對象序列化為二進制數組存儲，內存更加緊湊，減少內存碎片的產生。

綜上所述，OHC 在存儲大量對象時能夠更有效地利用內存空間，相對于 Guava 在內存占用方面具有優勢。

另外一個原因，不同序列化框架性能不同，將對象序列化后的占用空間的大小也不同。

參考及附錄

1.OHC常見參數

name	默認值	描述
keySerializer	需要開發者實現	Key序列化實現
valueSerializer	需要開發者實現	Value序列化實現
capacity	64MB	緩存容量單位B
segmentCount	2倍CPU核心數	分段數量
hashTableSize	8192	哈希表的大小
loadFactor	0.75	負載因子
maxEntrySize	capacity/segmentCount	緩存項最大字節限制
throwOOME	false	內存不足是否拋出OOM
hashAlgorighm	MURMUR3	hash算法，可選性MURMUR3、 CRC32, CRC32C （Jdk9以上支持）
unlocked	false	讀寫數據是否加鎖，默認是加鎖
eviction	LRU	驅逐策略，可選項：LRU、W_TINY_LFU、NONE
frequencySketchSize	hashTableSize數量	W_TINY_ LFU frequency sketch 的大小
edenSize	0.2	W_TINY_LFU 驅逐策略下使用

2.JNI faster than Unsafe?

https://mail.openjdk.org/pipermail/hotspot-dev/2015-February/017089.html

3.OHC源碼

https://github.com/snazy/ohc

4.參考文檔

?序列化框架對比

?Java堆外緩存OHC在馬蜂窩推薦引擎的應用

?“堆外緩存”這玩意是真不錯，我要寫進簡歷了。

本文鏈接：http://www.tebozhan.com/showinfo-26-88390-0.html一招MAX降低10倍，現在它是我的了

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： Java EE更名Jakarta EE對程序開發影響，你知道嗎？

下一篇：揭秘 Java 跨系統文件路徑組裝的秘方！

標簽：

熱門焦點

7月安卓手機性價比榜：努比亞+紅魔兩款新機入榜

7月登場的新機有努比亞Z50S Pro和紅魔8S Pro，除了三星之外目前唯二的兩款搭載超頻版驍龍8Gen2處理器的產品，而且努比亞和紅魔也一貫有著不錯的性價比，所以在本次的性價比榜單
Raft算法：保障分布式系統共識的穩健之道

1. 什么是Raft算法？Raft 是英文”Reliable、Replicated、Redundant、And Fault-Tolerant”（“可靠、可復制、可冗余、可容錯”）的首字母縮寫。Raft算法是一種用于在分布式系統
CSS單標簽實現轉轉logo

轉轉品牌升級后更新了全新的Logo，今天我們用純CSS來實現轉轉的新Logo，為了有一定的挑戰性，這里我們只使用一個標簽實現，將最大化的使用CSS能力完成Logo的繪制與動畫效果。新logo
如何通過Python線程池實現異步編程？

線程池的概念和基本原理線程池是一種并發處理機制，它可以在程序啟動時創建一組線程，并將它們置于等待任務的狀態。當任務到達時，線程池中的某個線程會被喚醒并執行任務，執行完任
每天一道面試題-CPU偽共享

前言：了不起：又到了每天一到面試題的時候了！學弟，最近學習的怎么樣啊了不起學弟：最近學習的還不錯，每天都在學習，每天都在進步！了不起：那你最近學習的什么呢？了不起學弟：最近在學習C
重估百度丨大模型，能撐起百度的“今天”嗎?

自象限原創作者｜程心羅輯2023年之前，對于自己的“今天”，百度也很迷茫。“新業務到 2022 年底還是 0，希望 2023 年出來一個 1。”這是2022年底，李彥宏
攜眾多高端產品亮相ChinaJoy，小米帶來一場科技與人文的視聽盛宴

7月28日，全球數字娛樂領域最具知名度與影響力的年度盛會中國國際數碼互動娛樂展覽會（簡稱ChinaJoy）在上海新國際博覽中心盛大開幕。作為全球領先的科
Android 14發布：首批適配機型公布

5月11日消息，谷歌在今天凌晨舉行了I/O大會，本次發布會谷歌帶來了自家的AI語言模型PaLM 2、谷歌Pixel Fold折疊屏、谷歌Pixel 7a手機，同時發布了Androi
OPPO K11樣張首曝：千元機影像“卷”得真不錯！

一直以來，OPPO K系列機型都保持著較為均衡的產品體驗，歷來都是2K價位的明星機型，去年推出的OPPO K10和OPPO K10 Pro兩款機型憑借各自的出色配置，堪稱有

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

一招MAX降低10倍，現在它是我的了

一.背景

二.初識此物心已驚-OHC初識

三.習得技能心自安-OHC使用

1.引入POM

2.創建OHC緩存

3.壓測及參數調整

4.OHC緩存狀態監控

四.剖析根源見真諦-OHC原理

1.put

1.申請內存

2.釋放內存

3.get

4.Q&A

五.總結

1.OHC使用建議

2.緩存優化建議

Hold hold , One more thing....

參考及附錄

1.OHC常見參數

7月安卓手機性價比榜：努比亞+紅魔兩款新機入榜

Raft算法：保障分布式系統共識的穩健之道

CSS單標簽實現轉轉logo

如何通過Python線程池實現異步編程？

每天一道面試題-CPU偽共享

重估百度丨大模型，能撐起百度的“今天”嗎?

攜眾多高端產品亮相ChinaJoy，小米帶來一場科技與人文的視聽盛宴

Android 14發布：首批適配機型公布

OPPO K11樣張首曝：千元機影像“卷”得真不錯！

最新推薦

猜你喜歡

熱門推薦

相關資訊

一招MAX降低10倍，現在它是我的了

一.背景

二.初識此物心已驚-OHC初識

三.習得技能心自安-OHC使用

1.引入POM

2.創建OHC緩存

3.壓測及參數調整

4.OHC緩存狀態監控

四.剖析根源見真諦-OHC原理

1.put

1.申請內存

2.釋放內存

3.get

4.Q&A

五.總結

1.OHC使用建議

2.緩存優化建議

Hold hold , One more thing....

參考及附錄

1.OHC常見參數

最新推薦

猜你喜歡

熱門推薦

相關資訊

一招MAX降低10倍，現在它是我的了