我终于把红黑树撕明白了

今天的文章有点长,大家忍一下。

红黑树是一种常见的自平衡二叉查找树,常用于关联数组、字典,在各种语言的底层实现中被广泛应用,Java 的 TreeMap 和 TreeSet 就是基于红黑树实现的。

本篇分享将为读者讲解红黑树的定义、创建和用途。

一.红黑树的定义

  1. 每个节点或者是黑色,或者是红色。

  2. 根节点是黑色。

  3. 每个叶子节点是黑色。

  4. 如果一个节点是红色的,则它的子节点必须是黑色的

  5. 从任意一个节点到叶子节点,经过的黑色节点是一样的。

这段关于 红黑树 的描述来源于 《算法导论》,你看完这段话可能一脸懵逼。

本文希望能够由浅入深地、渐进式地引导读者了解红黑树,因此我们会先从红黑树的意义说起,为什么我们需要一棵红黑树。

二. 平衡二叉查找树

我们以这样一个数组为例 [42,37,18,12,11,6,5] 构建一棵二叉搜索树,由于数组中任意一点都可以作为二叉搜索树的根节点,因此这棵二叉搜索树并不唯一,我们来看一个极端的例子(以42作为根节点,顺序插入元素)

在这个例子中,二叉搜索树退化成了链表,搜索的时间复杂度为 O(n),失去了作为一棵二叉搜索树的意义。

为了让二叉搜索树不至于太“倾斜”,我们需要构建一棵 平衡二叉搜索树

可以看出,平衡二叉搜索树的搜索时间复杂度为O(logn),避免了因为随机选取根节点构建二叉搜索树而可能造成的退化成链表的情况。下面再抄一段平衡二叉搜索树的官方定义:

平衡二叉查找树:简称平衡二叉树。是由前苏联的数学家 Adelse-Velskil和 Landis 在 1962 年提出的高度平衡的二叉树,根据科学家的英文名也称为 AVL 树。它具有如下几个性质:

性质1. 可以是空树。

性质2 假如不是空树,任何一个结点的左子树与右子树都是平衡二叉树,并且高度之差的绝对值不超过 1

(如果读者还不清楚平衡二叉搜索树的概念,可以点击查阅前文 动画:什么是平衡二叉树,本文不再详细介绍平衡二叉搜索树)

三. 2-3树

经过上面的例子,我们可以知道,构建一棵平衡的二叉搜索树的关键在于选取“正确”的根节点,那么我们如何在每次构建平衡二叉搜索树时都能选取合适的根节点呢,这里就要用到另一种重要的树:2-3树(读作二三树),2-3树和红黑树是等价的,理解2-3树对理解红黑树以及B类树都有很大的帮助。

2-3树的基本概念

所谓2-3树,即满足二叉搜索树的性质,且节点可以存放一个元素或者两个元素,每个节点有两个或三个孩子的树。

  • 性质1:满足二叉搜索树的性质

  • 性质2:节点可以存放一个或两个元素

  • 性质3:每个节点有两个或三个子节点

2-3树本质上也是一棵搜索树,和二叉搜索树的区别在于,2-3的节点可能存放 2 个元素,而且每个节点可能拥有 3 个子节点。

2-3树存在以下两种节点:2-节点(存在两个子节点)和3-节点(存在3个子节点)

2-3树的创建

下面我们来看如何创建一棵2-3树,创建2-3树的规则如下:

规则1. 加入新节点时,不会往空的位置添加节点,而是添加到最后一个叶子节点上

规则2. 四节点可以被分解三个2-节点组成的树,并且分解后新树的根节点需要向上和父节点融合

我们依然使用上面的示例数组[42,37,18,12,11,6,5],依然使用顺序插入的方式来构建2-3树,看看是否会出现退化成链表的情况。

我们可以注意到,在创建2-3树的每一步中,整棵树始终保持平衡。

既然2-3树已经能够保持自平衡,为什么我们还需要一棵红黑树呢,这是因为 2-3树这种每个节点储存1~2个元素以及拆分节点向上融合的性质不便于代码操作,因此我们希望通过一些规则,将2-3树转换成二叉树,且转换后的二叉树依然能保持平衡性。

2-3树和红黑树的等价性

本小节我们以一棵2-3树为例,将其从2-3树转换成为一棵红黑树,从而学习了解2-3树和红黑树的转换规则,并体会2-3树和红黑树之间的等价性。

对于2-3树中的2-节点来说,本身就和二叉搜索树的节点无异,可以直接转换为红黑树的一个黑节点,但是对于3-节点来说,我们需要进行一点小转换:

  1. 将3-节点拆开,成为一棵树,并且3-节点的左元素作为右元素的子树

  1. 将原来的左元素标记为红色(表示红色节点与其父节点在2-3树中曾是平级的关系)

我们来转换一棵复杂点的2-3树,根据上边的两条转换规则,我们将2-节点直接转换为黑色节点,将3-节点拆成一棵子树,并给左元素标上红色,这个过程应该不难理解,另外我们可以注意到,由于红色节点是由3-节点拆分而来,因此所有的红色节点都只会出现在左子树上。

四. 红黑树的性质和复杂度分析

红黑树基本性质分析

在完成了2-3树到红黑树的转换之后,我们重新审视红黑树的五条性质:

(1) 每个节点或者是黑色,或者是红色

这是红黑树的定义,没什么好说的。

(2) 根节点是黑色

根节点要么对应2-3树的2-节点或者3-节点,而这两者的根节点都是黑色的,因而根节点必然是黑色。从上图2-3树节点和红黑树节点对应关系就能很容易看出来

(3) 每个叶子节点是黑色

注意,这里的叶子是指的为空的叶子节点,上图的红黑树的完整形式应该是这样的:

(4) 如果一个节点是红色的,则它的子节点必须是黑色的

由于红黑树的每个节点都由2-3树转换而来,红色节点连接的节点必然是一个2-节点或者3-节点,而无论是2-节点还是3-节点,其根节点都是黑色的,因此红色节点的子节点必然是黑色的

(5) 从任意一个节点到叶子节点,经过的黑色节点是一样多的

这是红黑树最重要的一条性质,也是红黑树的价值所在。由于红黑树是由2-3树转换而来,因此每一个黑色节点必然对应2-3树的某个2-节点或者3-节点,因此红黑树的黑节点也能拥有2-3树的平衡性。

如果对这条性质还不够理解,可以对着上文2-3树和红黑树的转换图再理解理解。

红黑树时间复杂度分析

网上有很多使用数学归纳法来计算红黑树时间复杂度的证明了,这里就不再赘述。

我们可以简单思考一下,对于一棵普通的平衡二叉搜索树来说,它的搜索时间复杂度为O(logn),而作为红黑树,存在着最坏的情况,也就是查找的过程中,经过的节点全都是原来2-3树里的3-节点,导致路径延长两倍,时间复杂度为O(2logn),由于时间复杂度的计算可以忽略系数,因此红黑树的搜索时间复杂度依然是O(logn),当然,由于这个系数的存在,在实际使用中,红黑树会比普通的平衡二叉树(AVL树)搜索效率要低一些。

既然红黑树的效率比AVL树的效率低,那么红黑树的优势体现在哪呢?

事实上,红黑树的优势体现在它的插入和删除操作上,红黑树的插入和删除相较于AVL树的性能会高一些,在后续红黑树的创建章节中,读者应该能够体会到红黑树在调整树平衡操作上的优势。

五. 红黑树的创建

上文中我们讲解了如何由2-3树转换一棵红黑树,下面我们就来看看如何不经过2-3树直接创建一棵红黑树,毕竟我们写代码的时候不能先创建一棵2-3树再转化成红黑树吧。

我们回想一下2-3树的创建规则:

规则1. 加入新节点时,不会往空的位置添加节点,而是添加到最后一个叶子节点上

规则2. 四节点可以被分解三个2-节点组成的树,并且分解后新树的根节点需要向上和父节点融合

简单来说,2-3树的创建分为「融合」和「拆分」两步,为了实现这两步,我们需要在创建二叉树的基础操作上增加另外几个操作,分别是:

  1. 保持根节点黑色

  1. 左旋转

  1. 右旋转

  1. 颜色翻转

保持根节点黑色和左旋转

由于我们往2-3树插入节点时做的都是融合,因此新加入的节点和原位置的节点是平级关系,所以我们往红黑树里增加节点的时候,增加的都是红色节点。

我们插入第一个红色节点42,哦吼,第一步就与红黑树的性质2「根节点是黑色」冲突,为了解决这种冲突,我们将根节点变成黑色。

下面我们继续插入节点37,同样的,新插入的节点都为红色

这里我们要思考一下,如果我们颠倒顺序,先插入 37 再插入 42 呢,是直接把 42 加到 37 的右子树上么,这显然是错误的,因为在前边2-3树转红黑树的过程中,我们已经了解到,所有的红色节点都只会出现在左子树上,因此我们需要进行左旋转,将节点的位置和颜色旋转过来。

上面是两个独立的节点,如果节点拥有左右子树,在旋转后仍然能满足二叉搜索树的性质吗,我们需要推广到一般情形。

我们来看一个例子:

经过以上几步,我们就完成了一般情形下的左旋转,我们可以对应地写几句伪代码,这里把 37 称作node,42 称作 target

function leftRotate(node) { node.right = target.left target.left = node target.color = node.color node.color = RED}function flipColors(node) { node.color = RED node.left.color = BLACK node.right.color = BLACK}function rightRotate(node) { node.left = T1 target.right = node target.color = node.color node.color = RED}function add(node) { //如果右节点为红色,左节点为黑色, 那么进行左旋转, 对应情况2 if(isRed(node.right) && !isRed(node.left)) node = leftRotate(node)
//如果左节点为红色,左节点的左节点也为红色, 那么进行右旋转, 对应情况3 if(isRed(node.left) && isRed(node.left.left)) node = rightRotate(node)
//如果左右节点都为红色, 那么进行颜色翻转, 对应情况4 if(isRed(node.left) && isRed(node.right)) flipColors(node)
}

(0)

相关推荐

  • 堆排序

    堆排序

  • 二叉树

    二叉树是每个节点最多有两个子树的树结构.通常子树被称作"左子树"(left subtree)和"右子树"(right subtree)二叉树的性质(特性)性质1 ...

  • 二叉树的最小深度

    一.需求 给定一个二叉树,找出其最小深度. 最小深度是从根节点到最近叶子节点的最短路径上的节点数量. 说明:叶子节点是指没有子节点的节点. 输入:root = [3,9,20,null,null,15 ...

  • 那些年,面试被虐过的红黑树

    背景 上周,一位同学去面试了,过程大致如下: 面试官:java开发,三年了,熟悉哪些java集合? 同学:ArrayList.HashMap.TreeMap.LinkedList.....(回答了挺多 ...

  • 亲自动手绘图——红黑树,我不信还手撕不清楚

    作者:架构小菜 链接:https://www.jianshu.com/p/2d1a46117e85 前言 红黑树是自平衡的二叉查找树,在许多地方都有实际应用比如JAVA的HashMap,在链表长度大于 ...

  • 《赘婿》苏文兴撞脸“吉吉国王”,出道16年,这回他终于要红了

    由宋轶.郭麒麟主演的<赘婿>正在热播中,该片以穿越的形式来开头,将现代的电商融入到古代的生意中,给这部片子增加了不少看点. 除了内容之外,几大配角也为这部剧增添了不少色彩,其中包括田雨饰演 ...

  • 25 张图演示红黑树

    作者:linzworld 链接:https://www.cnblogs.com/linzworld/p/13720477.html 二叉树 满足以下两个条件的树就是二叉树: 本身是有序树(若将树中每个 ...

  • 第一恶女被雪藏十年,终于靠狗血大戏撕回顶流巅峰...

    又是为漂亮姐姐咣咣撞大墙的一天! 眉毛轻挑,眼线浓重,红唇清晰,眼神犀利,扑面而来一股"恶女风". 前一秒垂眸还楚楚可怜. 后一秒立马邪魅一笑. 戴着墨镜在河边吸烟的样子又美又酷, ...

  • 终于有人把计算机视觉讲明白了

    计算机视觉成为当前人工智能领域最热门的研究方向之一,成为CV算法工程师也是程序员向往的高薪工作方向之一.而掌握与学习计算机视觉原理与技术是成为菁英人才的关键. 那么,什么是计算机视觉呢?其实就是给计算 ...

  • 终于有人把“集合竞价”讲明白了,股民看了...

    终于有人把"集合竞价"讲明白了,股民看了十遍不能眠,太透彻了!   喜欢做短线的高手,是非常看中集合竞价的,这个时间点可以判断各方主力的的情况来研判个股当日的行情,通过夜晚消息面, ...

  • 40头28元/斤,最高涨3元!珠三角虾价终于飘红了!要涨到5月?

    ----- 广告 ----- 这一波上涨很明显,珠三角价格要一直红到5月吗? 文/ 水产前沿 植银素 本周要闻及行情 终于涨了!整个4月,尤其是下旬以来,珠三角虾价一直不太理想,中小虾弧菌问题严重,导 ...

  • 股票高开有讲究,终于有一文讲明白了,慎防高开阴线

    一根破位下行大阴线的出现,打破了原有的上升趋势,使大势急转直下,市场上的投资者由于反应不及,而被套在高位之上,受市场的打击是十分巨大的,人心涣散,由于庄家的出逃,后市股价的走势一蹶不振,逐渐滑落. 从 ...

  • 终于有人把数字化讲明白了

    来源:健荐 今天先不聊中台,开个新坑,来聊点更"虚"的,谈谈:数字化. 第一次听到这个词儿,是在几年前的北京办公室,脑海中仍残留的画面是:当时我正运键如飞的敲着代码,胡MD不知道是 ...