Java之解决散列表的冲突用开放定址法和链表法

2024-08-05 14:07:35

1 问题

理想状态下，散列表就是一个包含关键字的固定大小的数组，通过使用散列函数，将关键字映射到数组的不同位置，哈希函数可以将关键字均匀的分散到数组的不同位置，不会出现两个关键字散列值相同（假设关键字数量小于数组的大小）的情况。但是在实际使用中，经常会出现多个关键字散列值相同的情况（被映射到数组的同一个位置），我们将这种情况称为散列冲突。为了解决散列冲突，主要采用下如下两种方式：

2 链表法

分散链表法使用链表解决冲突，将散列值相同的元素都保存到一个链表中。当查询的时候，首先找到元素所在的链表，然后遍历链表查找对应的元素。下面是一个示意图：

3 开放定址法

在散列算法得到一个存储地址之后，如果发生冲突，不是在原处创建一个链表而是按照一定规则寻找周围可用的地址进行插入。

这个规则我么可以是线性探测法、平方探测法、

1）线性探测法

线性探测法中，函数ff是ii的函数，记为：f(i)=i （i为寻址次数）这相当于相继探测每个单元。例子：我们在M=10点散列表中，按顺序插入下列数字{89，18，49，58，69}

按照散列方式(这里直接对数组大小取余)，在插入89和18时，直接插入到散列位置9和位置8。但是插入第三个数49时，散列位置为9，跟已有89冲突，于是开始线性探测，即按照顺序寻找下一个位置。i=1时，探测位置为散列位置M+i，即探测位置0，位置0无冲突，49存入位置0。插入第四个树58时，散列位置M=8，但是位置8已经存在18，发生冲突开始线性探测，i=1时，探测位置为散列位置M+i，位置9已有89存在发生冲突，i=2时，探测位置为0，位置0已有49存在，发生冲突，i=3时，探测位置1，位置1无冲突，58存入位置1。同理，69在探测到第3次后，存入位置2。

2）平方探测法

在线性探测法中，函数f是i的函数，记为：f(i)=i 。而在平方探测法中，我们通常使用的是f(i)=i^2 。还是上面的例子，我们利用平方探测法插入{89，18，49，58，69}

按照散列方式，在插入89和18时，直接插入到散列位置9和位置8。但是插入第三个数49时，散列位置为9，跟已有89冲突，于是开始平方探测，第一次探测i=1,f(i)=i^2=1,所以我们探测位置为位置0（位置9+1）。发现位置0不冲突，那么在位置0插入49。插入第四个数58时，散列位置8，跟已有18冲突，开始平方探测，第一次探测i=1,f(i)=i^2=1探测位置9（位置8+1），发生冲突,第二次探测i=2,f(i)=i^2=4，探测位置2（位置8+4），位置2不冲突，在位置2插入58

4 两种办法对比总结

1) 、链表法

的缺点是使用链表。在新单元分配地址需要时间，不同的语言需要的时间不一致，这会导致算法的速度有些减慢。链表法也是固定定址的一种，它处理冲突简单，且无堆积现象，平均查找长度短；链表中的结点是动态申请的，适合构造表不能确定长度的情况；相对而言，拉链法的指针域可以忽略不计，因此较开放地址法更加节省空间。插入结点应该在链首，删除结点比较方便，只需调整指针而不需要对其他冲突元素作调整。

hashmap解决冲突用的是链表法。

2) 、开放定址法

容易产生堆积问题；不适于大规模的数据存储；散列函数的设计对冲突会有很大的影响；插入时可能会出现多次冲突的现象，删除的元素是多个冲突元素中的一个，需要对后面的元素作处理，实现较复杂；结点规模很大时会浪费很多空间

ML之MLiR：利用多元线性回归法，从大量数据(csv文件)中提取五个因变量(输入运输任务总里程数、运输次数、三种不同的车型，预测需要花费的小时数)来预测一个自变量

ML之MLiR:利用多元线性回归法,从大量数据(csv文件)中提取五个因变量(输入运输任务总里程数.运输次数.三种不同的车型,预测需要花费的小时数)来预测一个自变量输出结果代码设计 from nu ...
学生物的女朋友都能看懂的哈希表总结！

,散列是应用非常广泛的数据结构,在我们的刷题过程中,散列表的出场率特别高.所以我们快来一起把散列表的内些事给整明白吧,文章框架如下. 说散列表之前,我们先设想以下场景. 袁厨穿越回了古代,凭借从现代学 ...
PHP数据结构-散列表查找

散列表查找上篇文章的查找是不是有意犹未尽的感觉呢?因为我们是真真正正地接触到了时间复杂度的优化.从线性查找的 O(n) 直接优化到了折半查找的 O(logN) ,绝对是一个质的飞跃.但是,我们的折半 ...
Hash算法解决冲突的四种方法

Hash算法解决冲突的方法一般有以下几种常用的解决方法 1, 开放定址法: 所谓的开放定址法就是一旦发生了冲突,就去寻找下一个空的散列地址,只要散列表足够大,空的散列地址总能找到,并将记录存入 ...
浅谈哈希算法

张梦瑜,毕艳婷,蔡斐钊,梁皓天指导老师:杨仝 (北京大学计算机系网络所北京) 1 概述哈希表作为一个最基本的数据结构,具有O(1)的查询时间复杂度,在计算机的很多领域都被广泛应用.本文将哈希算 ...
何为共线性, 跟过拟合有啥关联?

何为共线性, 跟过拟合有啥关联? 多变量线性回归中,变量之间由于存在高度相关关系而使回归估计不准确. 共线性会造成冗余,导致过拟合. 解决方法:排除变量的相关性/加入权重正则.
怎样解决提撇对顶冲突？有哪两种巧妙处理方法？再逐类旁通拓展！

怎样解决提撇对顶冲突？有哪两种巧妙处理方法？再逐类旁通拓展！
Java学习——68、列表框JList

之前介绍的单选按钮,复选框一般用在数据项比较少的情况下. 如果可供选择的数据项较多,通常用列表框或组合框,本篇介绍列表框. 1. JList列表框列表框可以显示一组数据项,从中可选择一个或多个. ...
如何解决IP地址发生冲突故障？

我们之前发布了关于交换机如何解决IP地址冲突?这里面是以实例的方式讲解了如何防止交换机冲突,有一些朋友反映这个设置起来有些复杂,有没有其它的一些方法呢?其实是有的,我们今天来看下. 随着网络的广泛应用 ...
当你厌倦了争吵时，解决恋爱关系中冲突的8种方法

想象一下,和你的灵魂伴侣在一起,你们会永远相处下去,没有冲突,这太容易了.不好意思,这是一个幻想,因为无论你选择与谁在一起,你都会遇到问题. 这就是为什么学会一起解决冲突是如此重要. 化学反应不是你们 ...
第八章散列表

自我测试本篇文章的测试用例及调试方法见前言说明散列算法的作用是尽可能快地在数据结构中找到一个值.在之前的章节中,你已经知道如果要在数据结构中获得一个值(使用get方法),需要遍历整个数据结构来找 ...
产品并无好坏，要看解决了什么关系冲突？

说来十分惭愧,作为"关系场"的提出者,我们用了1年多,并没有在行业里说清楚它. 01 产品并无好坏这两年,在一批对行业有情怀的产品人带动之下,各个公司的聚焦点,终于从高周转.做规 ...
解决 ecshop 和 jquery 冲突

ecshop 和 jquery 冲突的问题由来已久.让我等开发人员很是头痛. 网上一搜大多说是和 transport.js 的 Object.prototype.toJSONString 冲突,解决方 ...
Android之jni编译出现no matching function for call to ‘_JNIEnv::GetJava(JNIEnv* &, Java VM**)‘解决办法)‘

Android之jni编译出现no matching function for call to ‘_JNIEnv::GetJava(JNIEnv* &, Java VM**)‘解决办法)‘