别再问我什么是跳跃表了

数据结构与算法入门 1 5.9K

大家好，我是帅地。

跳跃表的代码可以写不出来，但原理以及应用必须懂，例如 Redis 的有序列表就是用跳跃表实现的，秋招那会还被面试官问过好几次，于是有了这篇文章的到来。

假如我们要用某种数据结构来维护一组有序的 int 型数据的集合，并且希望这个数据结构在插入、删除、查找等操作上能够尽可能着快速，那么，你会用什么样的数据结构呢？

一、数组

一种很简单的方法应该就是采用数组了，在查找方面，用数组存储的话，采用二分法可以在 O(logn) 的时间里找到指定的元素，不过数组在插入、删除这些操作中比较不友好，找到目标位置所需时间为 O(logn) ，进行插入和删除这个动作所需的时间复杂度为 O(n) ，因为都需要移动移动元素，所以最终所需要的时间复杂度为 O(n) 。
例如对于下面这个数组：

插入元素 3

二、链表

另外一种简单的方法应该就是用链表了，链表在插入、删除的支持上就相对友好，当我们找到目标位置之后，插入、删除元素所需的时间复杂度为 O(1) ，注意，我说的是找到目标位置之后，插入、删除的时间复杂度才为 O(1)。

但链表在查找上就不友好了，不能像数组那样采用二分查找的方式，只能一个一个结点遍历，所以加上查找所需的时间，插入、删除所需的总的时间复杂度为O(n)。

假如我们能够提高链表的查找效率，使链表的查找的时间复杂度尽可能接近 O(logn) ，那链表将会是很棒的选择。

三、提高链表的查找速度

那链表的查找速度可以提高吗？

对于下面这个链表

假如我们要查找元素 9，按道理我们需要从头结点开始遍历，一共遍历8个结点才能找到元素9。

那么能否采取某些策略，让我们遍历 5 次以内就找到元素9呢？请大家花一分钟时间想一下如何实现。

由于元素的有序的，我们是可以通过增加一些路径来加快查找速度的。例如

我们可以先通过比较上面一层的元素来确定目标元素所在区间，通过这种方法，我们只需要遍历 5 次就可以找到元素 9 了（红色的线为查找路径，）。

还能继续加快查找速度吗？

答是可以的，再增加一层就行了，这样只需要4次就能找到了。

这就如同我们搭地铁的时候，去某个站点时，有快线和慢线几种路线，通过快线 + 慢线的搭配，我们可以更快着到达某个站点。

当然，还能在增加一层，

基于这种方法，对于具有 n 个元素的链表，我们可以采取 (logn + 1) 层指针路径的形式，就可以实现在 O(logn) 的时间复杂度内，查找到某个目标元素了。

这种数据结构，我们也称之为跳跃表，跳跃表也可以算是链表的一种变形，只是它具有二分查找的功能。

四、插入与删除

上面例子中，9 个结点，一共 4 层，可以说是理想的跳跃表了，不过随着我们对跳跃表进行插入/删除结点的操作，那么跳跃表结点数就会改变，意味着跳跃表的层数也会动态改变。

这里我们面临一个问题，就是新插入的结点应该跨越多少层？

这个问题已经有大牛替我们解决好了，采取的策略是通过抛硬币来决定新插入结点跨越的层数：每次我们要插入一个结点的时候，就来抛硬币，如果抛出来的是正面，则继续抛，直到出现负面为止，统计这个过程中出现正面的次数，这个次数作为结点跨越的层数。

通过这种方法，可以尽可能着接近理想的层数。大家可以想一下为啥会这样呢？

（1）、插入

例如，我们要插入结点 3，4，通过抛硬币知道3，4跨越的层数分别为 0，2 (层数从0开始算)，则插入的过程如下：

插入 3，跨越0层。

插入 4，跨越2层。

（2）、删除

解决了插入之后，我们来看看删除，删除就比较简单了，例如我们要删除4，那我们直接把4及其所跨越的层数删除就行了。

五、小结

跳跃表的插入与删除至此都讲完了，总结下跳跃表的有关性质：

(1). 跳跃表的每一层都是一条有序的链表.

(2). 跳跃表的查找次数近似于层数，时间复杂度为O(logn)，插入、删除也为 O(logn)。

(3). 最底层的链表包含所有元素。

(4). 跳跃表是一种随机化的数据结构(通过抛硬币来决定层数)。

(5). 跳跃表的空间复杂度为 O(n)。

六、跳跃表 vs 二叉查找树

有人可能会说，也可以采用二叉查找树啊，因为查找查找树的插入、删除、查找也是近似 O(logn) 的时间复杂度。

不过，二叉查找树是有可能出现一种极端的情况的，就是如果插入的数据刚好一直有序，那么所有节点会偏向某一边。例如

这种接结构会导致二叉查找树的查找效率变为 O(n),这会使二叉查找树大打折扣。

####七、跳跃表 vs 红黑树

红黑可以说是二叉查找树的一种变形，红黑在查找，插入，删除也是近似O(logn)的时间复杂度，但学过红黑树的都知道，红黑树比跳跃表复杂多了，反正我是被红黑树虐过。在选择一种数据结构时，有时候也是需要考虑学习成本的。

而且红黑树插入，删除结点时，是通过调整结构来保持红黑树的平衡，比起跳跃表直接通过一个随机数来决定跨越几层，在时间复杂度的花销上是要高于跳跃表的。

当然，红黑树并不是一定比跳跃表差，在有些场合红黑树会是更好的选择，所以选择一种数据结构，关键还得看场合。

总上所述，维护一组有序的集合，并且希望在查找、插入、删除等操作上尽可能快，那么跳跃表会是不错的选择。redis 中的数据数据便是采用了跳跃表，当然，ridis也结合了哈希表等数据结构，采用的是一种复合数据结构。

代码如下

package skiplist;

//节点
class Node{
    int value = -1;
    int level;//跨越几层
    Node[] next;//指向下一个节点

    public Node(int value, int level) {
        this.value = value;
        this.level = level;
        this.next = new Node[level];
    }
}
//跳跃表
public class SkipList {
    //允许的最大层数
    int maxLevel = 16;
    //头节点，充当辅助。
    Node head = new Node(-1, 16);
    //当前跳跃表节点的个数
    int size = 0;
    //当前跳跃表的层数,初始化为1层。
    int levelCount = 1;


    public Node find(int value) {
        Node temp = head;
        for (int i = levelCount - 1; i >= 0; i--) {
            while (temp.next[i] != null && temp.next[i].value < value) {
                temp = temp.next[i];
            }
        }
        //判断是否有该元素存在
        if (temp.next[0] != null && temp.next[0].value == value) {
            System.out.println(value + "  查找成功");
            return temp.next[0];
        } else {
            return null;
        }
    }
    // 为了方便，跳跃表在插入的时候，插入的节点在当前跳跃表是不存在的
    //不允许插入重复数值的节点。
    public void insert(int value) {
        int level = getLevel();
        Node newNode = new Node(value, level);
        //update用于记录要插入节点的前驱
        Node[] update = new Node[level];

        Node temp = head;
        for (int i = level - 1; i >= 0; i--) {
            while (temp.next[i] != null && temp.next[i].value < value) {
                temp = temp.next[i];
            }
            update[i] = temp;
        }
        //把插入节点的每一层连接起来
        for (int i = 0; i < level; i++) {
            newNode.next[i] = update[i].next[i];
            update[i].next[i] = newNode;
        }
        //判断是否需要更新跳跃表的层数
        if (level > levelCount) {
            levelCount = level;
        }
        size++;
        System.out.println(value + " 插入成功");
    }

    public void delete(int value) {
        Node[] update = new Node[levelCount];
        Node temp = head;

        for (int i = levelCount - 1; i >= 0; i--) {
            while (temp.next[i] != null && temp.next[i].value < value) {
                temp = temp.next[i];
            }
            update[i] = temp;
        }

        if (temp.next[0] != null && temp.next[0].value == value) {
            size--;
            System.out.println(value + " 删除成功");
            for (int i = levelCount - 1; i >= 0; i--) {
                if (update[i].next[i] != null && update[i].next[i].value == value) {
                    update[i].next[i] = update[i].next[i].next[i];
                }
            }
        }
    }

    //打印所有节点
    public void printAllNode() {
        Node temp = head;
        while (temp.next[0] != null) {
            System.out.println(temp.next[0].value + "  ");
            temp = temp.next[0];
        }
    }

    //模拟抛硬币
    private int getLevel() {
        int level = 1;
        while (true) {
            int t = (int)(Math.random() * 100);
            if (t % 2 == 0) {
                level++;
            } else {
                break;
            }
        }
        System.out.println("当前的level = " + level);
        return level;
    }

    //测试数据
    public static void main(String[] args) {
        SkipList list = new SkipList();
        for (int i = 0; i < 6; i++) {
            list.insert(i);
        }
        list.printAllNode();
        list.delete(4);
        list.printAllNode();
        System.out.println(list.find(3));
        System.out.println(list.size + " " + list.levelCount);
    }
}

如果可以，建议大家写一波代码，目前帅地只更新了 Java 的代码，后续会补上其他语言代码

基础数据结构

发表评论取消回复

后才能评论

No 普通 2021-08-25 10:25 上午

文章里那些数组啥的是图片吗，为啥不显示啊

登录以回复
- 帅地训练营会员 @ No 2021-08-25 8:31 下午
  
  图片挂了，已经更新了
  
  登录以回复
cc 2021-05-21 4:41 下午

插入代码写错了

登录以回复
- shuaidi 训练营会员 @ cc 2021-05-25 12:26 下午
  
  是不是顺便提醒一下哪里错，，我方便查找:no_mouth:
  
  登录以回复
- cc @ shuaidi 2021-05-25 5:21 下午
  
  第一个for循环里的level应该改为levelcount，不然level是1的话，会去遍历整张表，时间复杂度为o(n)
  
  登录以回复
- shuaidi 训练营会员 @ cc 2021-06-16 11:30 下午
  
  这条评论，居然被我不小心忽略了，，，感谢提醒**
  
  登录以回复
林成大 2021-04-21 7:20 上午

模拟抛硬币时要限制level <= maxLevel吧

登录以回复
- shuaidi 训练营会员 @ 林成大 2021-04-21 7:24 上午
  
  可以加上，我文中在这个模拟硬币方面说了个大概，可能没有考虑的太多哦。
  
  登录以回复