Free考研资料 - 免费考研论坛

 找回密码
 注册

求教哈希表查找不成功时的平均查找长度

[复制链接]
zhangaiping1984 发表于 07-10-11 10:23:47 | 显示全部楼层 |阅读模式
例如以下哈希表:
散列函数为hash(f(x))=x MOD 11
地址:0    1    2    3    4    5    6    7    8    9    10
数据:33  1   13   12  34  38  27   22

查找不成功时的平均查找长度
各位高手,这个问题是这样的:   
   
  “在0~16的散列区中,对于关键字序列(Jan,Feb,Mar,Apr,May,June,July,Aug,Sep,Oct,Nov,Dec)以及哈希函数H(x)=小于等于i/2的最大整数,这里i为关键字第一个字母在字母表中的序号。用线性探测开放定址法处理冲突,如何求出查找不成功的平均查找长度?”
瞳中魍魉 发表于 11-12-5 14:38:13 | 显示全部楼层
谢谢,我很喜欢。
goodboybing 发表于 11-12-4 18:03:03 | 显示全部楼层
最近复习了下数据结构中的哈希表,发现在计算等概率情况下查找不成功的平均查找长度时比较迷茫,不知道到底是怎么计算出来的。现在通过查阅资料终于知道如何计算了,所以记录下来以供以后查阅。

   下面看下2010年2010年全国硕士研究生入学统一考试计算机科学与技术学科联考计算机学科专业基础综合试题中一个考哈希表的题。

Question1:

将关键字序列(7、8、30、11、18、9、14)散列存储到散列表中。散列表的存储空间是一个下标从0开始的一维数组,散列函数为:      H(key) = (keyx3) MOD 7,处理冲突采用线性探测再散列法,要求装填(载)因子为0.7。

(1) 请画出所构造的散列表。

(2) 分别计算等概率情况下查找成功和查找不成功的平均查找长度。

Ans:

(1).首先明确一个概念装载因子,装载因子是指所有关键子填充哈希表后饱和的程度,它等于 关键字总数/哈希表的长度。 根据题意,我们可以确定哈希表的长度为 L = 7/0.7 = 10;因此此题需要构建的哈希表是下标为0~9的一维数组。根据散列函数可以得到如下散列函数值表。

H(Key) = (keyx3) MOD 7, 例如key=7时, H(7) = (7x3)%7 = 21%7=0,其他关键字同理。

Key 7 8 30 11 18 9 14
H(Key) 0 3 6 5 5 6 0

(表1)

采用线性探测再散列法处理冲突,所构造的散列表为:

地址 0 1 2 3 4 5 6 7 8 9
关键字 7 14   8   11 30 18 9   

(表2)

下面对散列表的构造方式加以说明,注意表1中的关键字7和14,30和9, 11和18,这三组关键子的H(Key)值相同,这在构建散列表时就会产生冲突,因为他们的地址相同,所以要通过一定的冲突处理方法来解决这个问题。依题,采用线性探测再散列法处理冲突。下面详细介绍如何构建散列表:

       第一个key 7,它的地址是0,因此放到散列表的数组下表为0的位置,这个位置上没有关键字,因此没有冲突可以直接填入;

       第二个key 8,它的地址是3,因此放到散列表的数组下表为3的位置,这个位置上没有关键字,因此没有冲突可以直接填入;

       第三个key 30,它的地址是6,因此放到散列表的数组下表为6的位置,这个位置上没有关键字,因此没有冲突可以直接填入;

       第四个key 11,它的地址是5,因此放到散列表的数组下表为5的位置,这个位置上没有关键字,因此没有冲突可以直接填入;

       第五个key 18,它的地址是5,因此放到散列表的数组下表为5的位置,但这个位置上已经有关键字11,遇到了冲突,此时我们根据线性探测再散列法来处理这个冲突,探测下一个位置6, 6这个位置上已经存在关键字30则继续增加步长1,因此现在的新地址应为7,位置7上没有关键字,放入即可,到此冲突已经解决;

       第六个key 9,它的地址是6,因此放到散列表的数组下表为6的位置,但这个位置上已经有关键字30,遇到了冲突,探测下一个位置7, 7这个位置上已经存在关键字18则继续增加步长1,因此现在的新地址应为8,位置8上没有关键字,放入即可;   

       第七个key 14,它的地址是0,因此放到散列表的数组下表为0的位置,但这个位置上已经有关键字7,遇到了冲突,探测下一个位置1, 位置1上没有关键字,放入即可;   

       到这一步所有关键字均已填入,散列表已经构造完成,如表2所示。

(2)等概率情况下查找成功平均查找长度:

        这一问可以根据第一问的构造过程求解:

        key7一次就填入了表中,因此查找次数为1,同理8, 30, 11查找次数均为1; key18 进行了3次放入操作,探测位置分别是5,6,7 ,因此查找次数为3;key9也是3次;key14 进行了两次探测,因此查找次数为2。次数表如表3所示

Key 7 8 30 11 18 9 14
Count 1 1 1 1 3 3 2

(表3)

        所以ASLsuccess= (1+1+1+1+3+3+2)/ 7 = 12/7。   

        等概率情况下查找不成功的平均查找长度:

        接下来讨论不成功的情况, 看表2,计算查找不成功的次数就直接找关键字到第一个地址上关键字为空的距离即可, 但根据哈希函数地址为MOD7,因此初始只可能在0~6的位置。等概率情况下,查找0~6位置查找失败的查找次数为:

   看地址0,到第一个关键字为空的地址2的距离为3,因此查找不成功的次数为3.      

        地址1, 到第一个关键为空的地址2的距离为2,因此查找不成功的次数为2.

        地址2,  到第一个关键为空的地址2的距离为1,因此查找不成功的次数为1.

        地址3,到第一个关键为空的地址4的距离为2,因此查找不成功的次数为2.

        地址4,到第一个关键为空的地址4的距离为1,因此查找不成功的次数为1.

        地址5,到第一个关键为空的地址2(注意不是地址9,因为初始只可能在0~6之间,因此循环回去)的距离为5,因此查找不成功的次数为5.

        地址6,到第一个关键为空的地址2(注意不是地址9,因为初始只可能在0~6之间,因此循环回去)的距离为4,因此查找不成功的次数为4.

        因此查找不成功的次数表如下表所示

Key 7 8 30 11 18 9 14
Count 3 2 1 2 1 5 4
(表4)
       所以ASLunsuccess= (3+2+1+2+1+5+4)/ 7 = 18/7。
 楼主| zhangaiping1984 发表于 07-11-22 10:18:17 | 显示全部楼层
我看到有些学校的真题答案上,也是说除以表长的啊
 楼主| zhangaiping1984 发表于 07-11-22 10:08:01 | 显示全部楼层
当你MOD11时,第N+1个数MOD后的值可能是0~10。当它是0时就要放在第一个位置,如果第一个位置有纪录,就要处理冲突,在处理冲突时仍然要使用线性探测,这时就不是在0~10之间移动了啊,要在0~表长之间向后移到一个空位置,
 楼主| zhangaiping1984 发表于 07-11-21 15:14:33 | 显示全部楼层
我看的好多都是说 除以表长啊,到底是除仪以表长还是MOD后的值啊?
qinfw 发表于 07-11-19 17:02:39 | 显示全部楼层

回复 #1 zhangaiping1984 的帖子

应该这样做吧:先构造哈希表
   0   1     2    3    4    5   6    7    8     9      10    11    12   13   14   15   16
   apr aug  dec  feb       jan mar may  june  july   sep   oct   nov
    1   2     1    1         1   1    2    4      5     2     5     6
查找不成功:(5+4+3+2+1+9+8+7+6+5+4+3+2+1+1+1+1)/17=63/17
各位看看对不对
haoyuan1984 发表于 07-11-19 09:08:05 | 显示全部楼层
jiushi !jiushi !duo kan shu !
diego66 发表于 07-11-15 14:51:22 | 显示全部楼层
看严蔚敏的课本第261面中间:“分析长度为M的哈西表中添装有N个纪录时查找不成功的平均查找长度这个问题,相当于在这个表中再添加第N+1个纪录时所需比较的次数的期望值。”
比如:当你MOD11时,第N+1个数MOD后的值可能是0~10。当它是0时就要放在第一个位置,如果第一个位置有纪录,就要处理冲突,向后移到一个空位置,记住移动的位置数,就是在0位置上查找不成功的值,然后分别分析在1~10位置上的值,最后相加除以11。(注意:不是除表长M)
cppsoldier2006 发表于 07-11-8 17:11:45 | 显示全部楼层
不是有专门的公式可用吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

联系我们|Free考研资料 ( 苏ICP备05011575号 )

GMT+8, 24-12-23 11:16 , Processed in 0.112637 second(s), 13 queries , Gzip On, Xcache On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表