Skip to content

四火的唠叨

一个纯正程序员的啰嗦

Menu
  • 所有文章
  • About Me
  • 关于四火
  • 旅行映像
  • 独立游戏
  • 资源链接
Menu

Java 容器类型复习笔记

Posted on 02/14/201510/03/2024 by 四火

data_structures 最近抽空把 java.lang 下面常用的那些容器类型(数据结构)复习了一下,这些东西是基础,平时使用的时候也可以很容易查得到,有些方法大概知道,但是总是弄混,如果可以记住那些重要方法,并且能够熟练使用的话,还是可以让编码过程变得容易很多。另外一个是实现机制,对于常用数据结构的实现机制,应该说是必须要熟知的。

另外,并发容器我之前整理过,放在这篇文章里。

Queue

  1. add 和 offer 的区别在于达到上限时 add 抛出异常,offer 返回 false;
  2. remove 和 poll 的区别在于,队列为空时前者抛出异常,后者返回空;
  3. element 和 peek 都返回队列头部元素,但是前者失败抛出异常,后者返回空。
boolean add(E e);
boolean offer(E e);

E remove();
E poll();

E element();
E peek();

PriorityQueue,内部实现是一个 Object[] queue 承载的堆。

Deque,双端队列(double-ended queue),在 Queue 基础上,增加了这样几个方法:

void addFirst(E e);
void addLast(E e);

boolean offerFirst(E e);
boolean offerLast(E e);

E removeFirst();
E removeLast();

E pollFirst();
E pollLast();

E getFirst();
E getLast();

E peekFirst();
E peekLast();

boolean removeFirstOccurrence(Object o);
boolean removeLastOccurrence(Object o);

ArrayDequeue:数组实现,扩容策略是容量翻倍。

 

List

boolean add(E e);
boolean remove(Object o);
E get(int index);
E set(int index, E element);
void add(int index, E element);
E remove(int index);

ArrayList,扩容策略是 (oldCapacity * 3)/2 + 1。

LinkedList,它除了实现自 List 接口外,还实现了 Deque 接口。

Vector,实现自 List 接口,内部实现是个数组,线程安全,扩容策略是 (capacityIncrement > 0) ? (oldCapacity + capacityIncrement) : (oldCapacity * 2)。

Stack 是 Vector 的子类,增加了一些栈的方法:

E push(E item)
E pop()
E peek()
boolean empty()

 

Map

boolean containsKey(Object key);
boolean containsValue(Object value);

V get(Object key);
V put(K key, V value);
V remove(Object key);

Set<K> keySet();
Collection<V> values();
Set<Map.Entry<K, V>> entrySet();

SotedMap 接口,key 是有序的 map:

SortedMap<K, V> subMap(K paramK1, K paramK2);
SortedMap<K, V> headMap(K paramK);
SortedMap<K, V> tailMap(K paramK);

K firstKey();
K lastKey();

子接口 NavigableMap,提供了一些根据某个 key 寻找它前面或者后面的 key 的方法。其中 floorKey/celingKey 表示的关系是小于等于/大于等于,lower/higher 表示的关系是严格的小于/大于:

Map.Entry<K,V> floorEntry(K key)
K floorKey(K key)
Map.Entry<K,V> ceilingEntry(K key)
K ceilingKey(K key)

Map.Entry<K,V> lowerEntry(K key)
K lowerKey(K key)
Map.Entry<K,V> higherEntry(K key)
K higherKey(K key)

TreeMap 是 NavigableMap 的直接实现子类,内部实现是一个红黑树。

EnumMap,结构是<K extends Enum<K>, V>,内部是通过一个 K[] keyUniverse 和一个 Object[] vals 来实现的。

HashMap,内部是数组+链表实现的,达到 threshold = capacity * loadFactor 时,扩容策略为:numKeysToBeAdded / loadFactor + 1。

HashTable,实现自 Dictionary 和 Map,方法都是线程安全的。HashTable 的 put 方法,value 不可以为空,这是它和 HashMap 的一个不同;再有二者找桶的 hash 方法不同;最后则是 threshold 计算逻辑相同,但它的扩容策略不同:oldCapacity * 2 + 1。HashTable、HashMap 和 HashSet 经常被放到一起比较。

Properties,是 HashTable 的子类,方法线程安全。

IdentityHashMap,比较 key 不是使用 equals 来比较,而是使用 “==” 来比较,只要地址不等(即不是同一个对象)即可共存,也就是说,key 是可以重复的。

LinkedHashMap,在 HashMap 的基础上,又单独维护了一个双向循环链表。有一个重要参数是 accessOrder,accessOrder 为 true 时,每次调用 get 方法访问行为发生后,会把最近访问的对象移动到头部,而超出容量移除对象时,是从尾部开始的,利用它并且覆写 boolean removeEldestEntry 方法可以实现一个 LRU 的队列。

WeakHashMap,但是 key 是 weak 引用,在不被使用时自动清除,扩容策略:tab.length * 2。原理上看:Entry<K,V> extends WeakReference<K> implements Map.Entry<K,V>,因此 entry 是弱引用的实现类,关键方法是 expungeStaleEntries,它在对这个 map 各种操作的时候都会被调用到,而这个方法里面也是靠监听 key 的 ReferenceQueue 这个队列的状态来确定是否真的没有对象引用了。

 

Set

boolean contains(Object o);
boolean add(E e);
boolean remove(Object o);

SortedSet,接口方法和 SortedMap 类似:

SortedSet<E> subSet(E fromElement, E toElement);
SortedSet<E> headSet(E toElement);
SortedSet<E> tailSet(E fromElement);

E first();
E last();

相应地,NavigableSet 和 NavigableMap 类似,方法就不列出了。

TreeSet 则和 TreeMap 类似,其实内部实现就是一个 TreeMap。

HashSet,尤其注意的是,有两种实现,当构造方法参数小于 3 个时,内部使用 HashMap,否则,使用 LinkedHashMap。

RegularEnumSet 和 JumboEnumSet,前者是普通的枚举 set(用位移来表示各种组合的可能,达到空间占用最小,最大不能超过 64 个枚举值),后者适合数量较大的枚举 set(老老实实地使用对象数组)。

LinkedHashSet,其实和 LinkedHashMap 是一个东西。

BitSet,叫 set 但是没有实现 set 的接口。用比特位来存放某个数是否存在,比如仅仅一个 long,64 位,就可以存放 0~63 的数,内部实际的数据类型是 long[]。

void flip(int bitIndex);
void flip(int fromIndex, int toIndex);

void set(int bitIndex);
void set(int fromIndex, int toIndex, boolean value);

void clear(int bitIndex);

int length();
int size();

其中 size 方法返回实际使用了的比特位数目;length 方法返回逻辑意义上的长度(比如表示的数里面最大是 80,那么加上 0,它的逻辑意义上的长度就是 81)。

扩容策略:Math.max(2 * words.length, wordsRequired)。

Dictionary

Enumeration<K> keys();
Enumeration<V> elements();

V get(Object key);
V put(K key, V value);
V remove(Object key);

已经被废弃了,用 Map 来实现相同功能。

最后这张图来自这个网站,对于从宏观上把握这些容器类型实在是太有帮助了:

full_container_taxonomy

文章未经特殊标明皆为本人原创,未经许可不得用于任何商业用途,转载请保持完整性并注明来源链接 《四火的唠叨》

×Scan to share with WeChat

你可能也喜欢看:

  1. java.util.concurrent 并发包诸类概览
  2. 看 JDK 源码,解几个疑问
  3. 运行时动态增加枚举类型
  4. 排序算法一览(下):归并类、分布类和混合类排序
  5. LeetCode 题目解答——Easy 部分

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

订阅·联系

四火,啰嗦的程序员一枚,现居西雅图

Amazon Google Groovy Hadoop Haskell Java JavaScript LeetCode Oracle Python Spark 互联网 前端 华为 历史 同步 团队 图解笔记 基础设施 工作 工作流 工具 工程师 应用系统 异步 微博 思考 技术 数据库 曼联 测试 生活 程序员 管理 系统设计 缓存 编码 编程范型 英语 西雅图 设计 评审 问题 面试 项目

分类

  • Algorithm and Data Structure (30)
  • Concurrency and Asynchronization (6)
  • System Architecture and Design (43)
  • Distributed System (18)
  • Tools Frameworks and Libs (13)
  • Storage and Data Access (8)
  • Front-end Development (33)
  • Programming Languages and Paradigms (55)
  • Testing and Quality Assurance (4)
  • Network and Communication (6)
  • Authentication and Authorization (6)
  • Automation and Operation Excellence (13)
  • Big Data and Machine Learning (5)
  • Product Design (7)
  • Hiring and Interviews (14)
  • Project and Team Management (14)
  • Engineering Culture (17)
  • Critical Thinking (25)
  • Career Growth (57)
  • Life Experience and Thoughts (45)

推荐文章

  • 谈谈分布式锁
  • 常见分布式系统设计图解(汇总)
  • 系统设计中的快速估算技巧
  • 从链表存在环的问题说起
  • 技术面试中,什么样的问题才是好问题?
  • 从物理时钟到逻辑时钟
  • 近期面试观摩的一些思考
  • RSA 背后的算法
  • 谈谈 Ops(汇总 + 最终篇):工具和实践
  • 不要让业务牵着鼻子走
  • 倔强的程序员
  • 谈谈微信的信息流
  • 评审的艺术——谈谈现实中的代码评审
  • Blog 安全问题小记
  • 求第 K 个数的问题
  • 一些前端框架的比较(下)——Ember.js 和 React
  • 一些前端框架的比较(上)——GWT、AngularJS 和 Backbone.js
  • 工作流系统的设计
  • Spark 的性能调优
  • “残酷” 的事实
  • 七年工作,几个故事
  • 从 Java 和 JavaScript 来学习 Haskell 和 Groovy(汇总)
  • 一道随机数题目的求解
  • 层次
  • Dynamo 的实现技术和去中心化
  • 也谈谈全栈工程师
  • 多重继承的演变
  • 编程范型:工具的选择
  • GWT 初体验
  • java.util.concurrent 并发包诸类概览
  • 从 DCL 的对象安全发布谈起
  • 不同团队的困惑
  • 不适合 Hadoop 解决的问题
  • 留心那些潜在的系统设计问题
  • 再谈大楼扔鸡蛋的问题
  • 几种华丽无比的开发方式
  • 我眼中的工程师文化
  • 观点的碰撞
  • 谈谈盗版软件问题
  • 对几个软件开发传统观点的质疑和反驳
  • MVC 框架的映射和解耦
  • 编程的未来
  • DAO 的演进
  • 致那些自嘲码农的苦逼程序员
  • Java 多线程发展简史
  • 珍爱生命,远离微博
  • 网站性能优化的三重境界
  • OSCache 框架源码解析
  • “ 你不适合做程序员”
  • 画圆画方的故事

近期评论

  • + 1.943624 BTC.NEXT - https://graph.org/Ticket--58146-05-02?hs=9a9c6f8dfe3cdbe0074006e3e640b19b& on 所有文章
  • Anonymous on 闲聊投资:亲自体验和护城河
  • 四火 on 关于近期求职的近况和思考
  • YC on 关于近期求职的近况和思考
  • mafulong on 常见分布式基础设施系统设计图解(四):分布式工作流系统
  • 四火 on 常见分布式基础设施系统设计图解(八):分布式键值存储系统
  • Anonymous on 我裸辞了
  • https://umlcn.com on 资源链接
  • Anonymous on 我裸辞了
  • Dylan on 我裸辞了
© 2025 四火的唠叨 | Powered by Minimalist Blog WordPress Theme