周立功来讲解哈希表的实现-电子发烧友网

近日周立功教授公开了数年的心血之作《程序设计与数据结构》，电子版已无偿性分享到电子工程师与高校群体下载，经周立功教授授权，特对本书内容进行连载。

>>>>1.1.1 哈希表的实现

1. 初始化

hash_db_init()接口用于哈希表实例的初始化，在定义哈希表结构体类型时，哈希表数组大小、记录长度、关键字长度和哈希函数都需要由用户根据实际情况确定，其函数原型定义如下（hash_db.h）：

int hash_db_init (

hash_db_t *p_hash, //指向哈希表实例的指针

unsigned int size, //哈希表大小

unsigned int key_len, //关键字长度

unsigned int value_len, //记录长度

hash_func_t pfn_hash); //哈希函数

在这里，以学生记录为例，创建一个大小为250组的哈希表：

hash_db_t hash_students;

hash_db_init(

&hash_students,

250, //大小为250

6, //关键字长度为6字节

sizeof(student_t), //记录的长度

(hash_func_t)db_id_to_idx); //哈希函数

在初始化函数的实现中，需要按照size指定的大小分配内存，用于存储哈希表的各个表项（链表头），接着需要完成各个链表头和结构体成员的初始化，初始化函数的实现范例详见程序清单3.63。

程序清单3.63初始化函数范例程序

1 int hash_db_init (hash_db_t *p_hash, unsigned int size, unsigned int key_len,

2 unsigned int value_len, hash_func_t pfn_hash)

3 {

4 int i;

5 if ((p_hash == NULL) || (pfn_hash == NULL)){

6 return NULL;

7 }

8 p_hash -> p_head = (slist_head_t *)malloc(size * sizeof(slist_head_t));

9 if (p_hash -> p_head == NULL) {

10 return -1;

11 }

12 for (i = 0; i < size; i++){

13 slist_init(&p_hash -> p_head[i]);

14 }

15 p_hash -> size = size;

16 p_hash -> key_len = key_len;

17 p_hash -> value_len = value_len;

18 p_hash -> pfn_hash = pfn_hash;

19 return 0;

20 }

2. 添加记录

hash_db_add()接口用于向已经初始化的哈希表中添加一条记录，添加一条记录时，需要指定关键字信息和记录值信息，其函数原型定义（hash_db.h）：

int hash_db_add (hash_db_t *p_hash, void *key, const void *value);

其中，p_hash为指向哈希表实例的指针，key为指向关键字的指针，value为指向记录值的指针。特别地，由于在添加记录时，程序不会修改key和value指针所指向的值，因此，指针都加了const修饰符。以添加一条学生记录为例，使用范例如下：

student_t stu = {

"zhangsan",

'M',

173.3,

};

unsigned char id[6] = {0x20, 0x14, 0x44, 0x70, 0x02, 0x39};

hash_db_add(&hash_students, id, &stu);

在添加记录函数的实现中，首先需要使用哈希函数找到关键字对应的记录在哈希表中的索引，以确定该条记录所在链表的表头，然后分配一个存储记录的结点空间，将关键字、记录等信息存储在该空间中，然后将结点添加到对应链表的头部（由于记录在链表中的具体位置不重要，因此直接添加在链表头部，效率更高）。函数实现的范例详见程序清单3.64。

程序清单3.64添加记录函数范例程序

1 int hash_db_add (hash_db_t *p_hash, const void *key, const void *value)

2 {

3 int idx = p_hash -> pfn_hash(key); //使用哈希函数通过关键字得到哈希值

4 //分配内存，存储链表结点+关键字+记录

5 char *p_mem = (char *)malloc(sizeof(slist_node_t) + p_hash -> key_len + p_hash -> value_len);

6 if (p_mem == NULL) {

7 return -1;

8 }

9 memcpy(p_mem + sizeof(slist_node_t), key, p_hash -> key_len); //存储关键字

10 memcpy(p_mem + sizeof(slist_node_t) + p_hash->key_len, value, p_hash->value_len); //存储记录

11 return slist_add_head(&p_hash -> p_head[idx], (slist_node_t *)p_mem); //将结点加入链表

12 }

程序分配了一个结点的空间，该结点的空间需要存储一个slist_node_t类型链表结点，便于添加结点到链表中，存储长度为p_hash->key_len的关键字，存储长度为p_hash->value_len的记录值，详见图3.26，其内存的大小为：

sizeof(slist_node_t) + p_hash -> key_len + p_hash -> value_len

图3.26 结点存储空间

由于结点空间的首部用于存储结点slist_node_t的值以组织链表。因此需要将结点添加到链表中时，直接将p_mem转换为slist_node_t*类型使用即可，通用链式哈希表的结构示意图详见图3.27。

图3.27 通用的链式哈希表结构示意图

与图3.25中管理学生记录的链式哈希表结构示意图对比发现，它们表达的含义是完全一致的，仅仅是具体类型变为了更加通用的void *类型。

3. 查找记录

hash_db_search()接口通过关键字查找与之对应的记录，查找记录时，需要指定关键字信息，同时还需要使用一个指向记录的指针获取查找到的记录值，其函数原型（hash_db.h）如下：

int hash_db_search(hash_db_t *p_hash,const void *key, void *value);

虽然参数与添加记录是完全一样的，但value表示的含义却不一样，此处的value是输出参数，用于得到查找到的记录值。而添加记录函数中的value是输入参数，提供需要存储的记录值。由于此处的value指向指向的值是需要被改变的（改变为查找到的记录值），因此，其不能增加const修饰符。以查找ID为201444700239的学生记录为例，使用范例如下：

student_t stu;

unsigned char id[6] = {0x20, 0x14, 0x44, 0x70, 0x02, 0x39};

if (hash_db_search(&hash_students, id, &stu) == 0) {

//查找到该学号的学生记录

} else {

//查找失败，未找到该学号的学生记录

}

在该函数的实现中，首先需要使用哈希函数找到关键字对应的记录在哈希表中的索引，以确定该条记录所在链表的表头，然后遍历链表的各个结点，将提供的关键字与结点中存储的关键字比对，直到找到关键字完全一致的记录（查找成功）或链表遍历结束（查找失败）。找到该记录对应的结点后，将结点中存储的value值拷贝到参数value指针指向的空间中即可。函数实现的范例详见程序清单3.65。

程序清单3.65查找记录函数范例程序

1 //寻找结点的上下文（仅内部使用）

2 struct _node_find_ctx {

3 void *key; //查找关键字

4 unsigned int key_len; //关键字长度

5 slist_node_t *p_result; //用于存储查找到的结点

6 };

8 //遍历链表的回调函数，查找指定结点

9 static int __hash_db_node_find (void *p_arg, slist_node_t *p_node)

10 {

11 struct _node_find_ctx *p_info = (struct _node_find_ctx *)p_arg; //用户参数为寻找结点的上下文

12 char *p_mem = (char *)p_node + sizeof(slist_node_t); //关键字存储在结点之后

14 if (memcmp(p_mem, p_info->key, p_info->key_len) == 0) {

15 p_info->p_result = p_node;

16 return -1; //找到该结点，终止遍历

17 }

18 return 0;

19 }

21 int hash_db_search(hash_db_t *p_hash, const void *key, void *value)

22 {

23 int idx = p_hash->pfn_hash(key); //得到关键字对应的哈希表的索引

24 struct _node_find_ctx info = {key, p_hash->key_len, NULL}; //设置遍历链表的上下文信息

25 slist_foreach(&p_hash->p_head[idx], __hash_db_node_find, &info); //遍历，寻找关键字对应结点

27 if (info.p_result != NULL) { //找到对应结点, 将存储的记录值拷贝到用户提供的空间中

28 memcpy(value, (char *)info.p_result+sizeof(slist_node_t)+p_hash->key_len+p_hash->value_len);

29 return 0;

30 }

31 return -1;

32 }

程序中，由于查找结点时需要遍历链表，关键字比对的操作需要在遍历函数的回调函数中完成，因此，需要将用户查找记录使用的关键字信息（关键字及其长度）提供给回调函数，同时，当查找到记录时，需要将查找到的结点反馈给调用遍历函数的主程序。为此，定义了一个内部使用的用于寻找一个结点的上下文结构体：

struct _node_find_ctx {

const void *key; //查找关键字

unsigned int key_len; //关键字长度

slist_node_t *p_result; //用于存储查找到的结点

};

调用遍历函数时，需要提供一个设置好关键字信息的结构体作为回调函数的用户参数。遍历函数结束时，可以通过该结构体中的p_result成员获取遍历结果。

4. 删除记录

该接口用于删除指定关键字对应的记录，可以定义其函数名为：hash_db_del()。删除记录时，需要指定关键字信息。可以定义函数的原型为：

int hash_db_del(hash_db_t *p_hash, const void *key);

以删除学号为201444700239的学生记录为例，使用范例如下：

unsigned char id[6] = {0x20, 0x14, 0x44, 0x70, 0x02, 0x39};

hash_db_del(&hash_students, id);

在该函数的实现中，绝大部分操作与查找记录是相同的，唯一的不同是，当找到关键字对应的结点时，不再需要将记录值提取出来，直接将该结点删除即可。函数实现的范例详见程序清单3.66。

程序清单3.66删除记录函数范例程序

1 int hash_db_del (hash_db_t *p_hash, const void *key)

2 {

3 int idx = p_hash->pfn_hash(key); //得到关键字对应的哈希表的索引

4 struct _node_find_ctx info = {key, p_hash->key_len, NULL}; //设置遍历链表的上下文信息

5 slist_foreach(&p_hash->p_head[idx], __hash_db_node_find, &info); //遍历，寻找关键字对应结点

6 if (info.p_result != NULL) {

7 slist_del(&p_hash->p_head[idx], info.p_result); //从链表中删除该结点

8 free(info.p_result); //释放结点空间

9 return 0;

10 }

11 return -1;

12 }

5. 解初始化

对应于哈希表的初始化，用于当不再使用哈希表时，释放相关的空间。可以定义其函数名为：hash_db_deinit()。需要通过参数指定需要解初始化的哈希表实例，可以定义函数的原型为（hash_db.h）：

int hash_db_deinit (hash_db_t *p_hash);

如不再使用学生信息管理系统，则需使用解初始化函数释放哈希表的相关资源，使用范例如下：

hash_db_deinit(&hash_students);

在该函数的实现中，需要释放程序中分配的所有空间，主要包括添加记录时分配的结点空间，链表头结点数组空间。函数实现详见程序清单3.67。

程序清单3.67解初始化函数范例程序

1 int hash_db_deinit (hash_db_t *p_hash)

2 {

3 int i;

4 slist_node_t *p_node;

5 for (i = 0; i < p_hash->size; i++) { //释放哈希表中各个表项中存储的所有结点

7 while (slist_begin_get(&p_hash->p_head[i]) != slist_end_get(&p_hash->p_head[i])) {

8 p_node = slist_begin_get(&p_hash->p_head[i]);

9 slist_del(&p_hash->p_head[i], p_node); //删除第一个结点

10 free(p_node);

11 }

12 }

13 free(p_hash->p_head); //释放链表头结点数组空间

15 return 0;

16 }

为便于查阅，如程序清单3.29所示展示了hash_db.h文件的内容。

程序清单3.68 hash_db.h文件内容

1 #pragma once;

2 #include "slist.h"

4 typedef unsigned int (*hash_func_t) (const void *key); //哈希函数类型，返回值为整数，参数为关键字

5 struct _hash_db{

6 slist_head_t *p_head; //指向数组首地址

7 unsigned int size; //数组成员数

8 unsigned int value_len; //一条记录的长度

9 unsigned int key_len; //关键字的长度

10 hash_func_t pfn_hash; //哈希函数

11 };

12 typedef struct _hash_db *hash_db_t; //指向哈希表对象的指针类型

14 int hash_db_init (hash_db_t *p_hash, // 哈希表初始化

15 unsigned int size,

16 unsigned int key_len,

17 unsigned int value_len,

18 hash_func_t pfn_hash);

20 int hash_db_add (hash_db_t *p_hash, const void *key,const void *value); //添加记录

21 int hash_db_del (hash_db_t *p_hash, const void *key); //删除记录

22 int hash_db_search(hash_db_t *p_hash, const void *key, void *value); // 查找记录

23 int hash_db_deinit (hash_db_t *p_hash); //解初始化

以使用该链式哈希表管理系统来管理学生记录为例，综合范例程序详见程序清单3.30。

程序清单3.69哈希表综合范例程序

1 #include

2 #include

3 #include "hash_db.h"

5 typedef struct _student{

6 char name[10]; //姓名

7 char sex; //性别

8 float height, weight; //身高、体重

9 } student_t;

11 int db_id_to_idx (unsigned char id[6]) //通过ID得到数组索引

12 {

13 int i;

14 int sum = 0;

15 for (i = 0; i < 6; i++){

16 sum += id[0];

17 }

18 return sum % 250;

19 }

21 int student_info_generate (unsigned char *p_id, student_t *p_student) //随机产生一条学生记录

22 {

23 int i;

24 for (i = 0; i < 6; i++) { // 随机产生一个学号

25 p_id[i] = rand();

26 }

27 for (i = 0; i < 9; i++) { // 随机名字，由 'a' ~ 'z' 组成

28 p_student->name[i] = (rand() % ('z' - 'a')) + 'a';

29 }

30 p_student->name[i]= '\0'; //字符串结束符

31 p_student->sex = (rand() & 0x01) ? 'F' : 'M'; //随机性别

32 p_student->height = (float)rand() / rand();

33 p_student->weight = (float)rand() / rand();

34 return 0;

35 }

37 int main ()

38 {

39 student_t stu;

40 unsigned char id[6];

41 int i;

42 hash_db_t hash_students;

44 hash_db_init(&hash_students, 250, 6, sizeof(student_t), (hash_func_t)db_id_to_idx);

46 for (i = 0; i < 100; i++) { // 添加100个学生的信息

47 student_info_generate(id, &stu); //设置学生的信息，当前一随机数作为测试

48 if (hash_db_search(&hash_students, id, &stu) == 0) { //查找到已经存在该ID的学生记录

49 printf("该ID的记录已经存在！\n");

50 continue;

51 }

52 printf("增加记录：ID : %02x%02x%02x%02x%02x%02x",id[0],id[1],id[2],id[3],id[4],id[5]);

53 printf("信息： %s %c %.2f %.2f\n", stu.name, stu.sex, stu.height, stu.weight);

54 if (hash_db_add(&hash_students, id, &stu) != 0) {

55 printf("添加失败");

56 }

57 }

59 printf("查找ID为：%02x%02x%02x%02x%02x%02x的信息\n",id[0],id[1],id[2],id[3],id[4],id[5]);

60 if (hash_db_search(&hash_students, id, &stu) == 0) {

61 printf("学生信息： %s %c %.2f %.2f\n", stu.name, stu.sex, stu.height, stu.weight);

62 } else {

63 printf("未找到该ID的记录！\r\n");

64 }

65 hash_db_deinit(&hash_students);

66 return 0;

67 }

在这里，首先创建了一个哈希表，然后向其中添加了100个学生信息（以随机数的方式产生的），接着查找了ID对应的学生信息（这里的ID没有特别设置，即查找最后添加的学生记录），最后释放哈希表。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

周立功

周立功

+关注

关注
38

文章
130

浏览量
37066
大数据

大数据

+关注

关注
64

文章
8631

浏览量
136568
哈希表

哈希表

+关注

关注
0

文章
9

浏览量
4704

原文标题：周立功：哈希表的实现，干货！

文章出处：【微信号：Zlgmcu7890，微信公众号：周立功单片机】欢迎添加关注！文章转载请注明出处。

立功科技荣获广州市“工业软件十强企业”称号

热烈祝贺立功科技荣获广州市“工业软件十强企业”称号。

发表于 12-07 09:26 •500次阅读

redis hash底层实现原理

数据结构是如何实现的呢？本文将详细介绍Redis哈希底层的实现原理。在Redis中，每个哈希都是由一个类似于字典（Dictionary）的结构实现

发表于 12-04 16:27 •246次阅读

今天来讲解下LED软模组

今天来讲解下LED软模组（显示效果的LED软模组）迈普光彩小编在整理了一些与之相关的问题来分享给大家，希望能够帮助到大家哟。随着科技的不断发展，LED软模组（显示效果的LED软模组）在各个领域得到

发表于 11-15 10:57 •448次阅读

美蓓亚三美全资收购日立功率半导体

日立表示，就推进日立和日立功率半导体，并提高企业价值的方案，反复进行了协商。经过反复讨论，双方认为，为了确保日立功率半导体在今后有望高速增长的功率半导体市场上实现持续发展，最佳方案便是在美蓓亚三美（将模拟半导体业务定位为核心业务

发表于 11-03 12:06 •512次阅读

周立功CAN232MB配置流程

电子发烧友网站提供《周立功CAN232MB配置流程.pdf》资料免费下载

发表于 10-13 10:28 •0次下载

STM32H7怎么实现一个哈希的数据运算处理？

STM32H7怎么实现一个哈希的数据运算处理

发表于 10-10 06:34

哈希与加密有什么区别？

哈希与加密有什么区别

发表于 10-09 06:29

《SoC底层软件低功耗系统设计与实现》基于Linux专门讲解软件低功耗框架和设计的书籍

和细节都可以参考。内容充实基于Linux，讲解了其涉及低功耗各个框架模块的设计和实现，后面的扩展知识点，低功耗问题定位及优化思路都是干货内容，都是工程实践相关的内容，内容比较充实。从目录也可以看出

发表于 09-08 23:38

Linux系统调用的具体实现原理

文我将基于 ARM 体系结构角度，从 Linux 应用层例子到内核系统调用函数的整个过程来梳理一遍，讲清楚linux系统调用实现原理，这里我们以open系统调用为例来讲解。

发表于 09-05 17:16 •750次阅读

31 哈希表的实现 - 第2节

协议STM32函数运算符循环语句

充八万
发布于 :2023年09月01日 09:24:55

“立功蓝牙OTA”微信小程序介绍

支持ZSB101A芯片出厂自带串口AT指令数传固件且支持OTA固件升级，为了方便用户调试蓝牙数据传输和蓝牙OTA固件升级功能，立功科技发布了“立功蓝牙OTA”微信小程序供用户使用。

发表于 08-31 14:37 •1144次阅读

设计一个计数器来讲解时序逻辑

时序逻辑是Verilog HDL 设计中另一类重要应用。从电路特征上看来，其特点为任意时刻的输出不仅取决于该时刻的输入，而且还和电路原来的状态有关。

发表于 08-14 09:28 •714次阅读

Linux内核分析端口哈希桶

端口哈希桶在inet_csk_get_port函数中的变量声名中有如下几个结构体： struct inet_hashinfo * hinfo = sk- >sk_prot- >h.hashinfo

发表于 07-31 11:03 •420次阅读

设计大规模并行哈希图时的几个重要考虑事项

在 GPU 上使用大规模并行哈希图实现性能最大化

发表于 07-05 16:30 •753次阅读

Dubbo负载均衡策略之一致性哈希

本文主要讲解了一致性哈希算法的原理以及其存在的数据倾斜的问题，然后引出解决数据倾斜问题的方法，最后分析一致性哈希算法在Dubbo中的使用。通过这篇文章，可以了解到一致性哈希算法的原理以

发表于 06-16 15:30 •308次阅读