Cấu trúc dữ liệu Hash Table
Hash Table là gì?
Cấu trúc dữ liệu Hash Table là một cấu trúc dữ liệu lưu giữ dữ liệu theo cách thức liên hợp. Trong Hash Table, dữ liệu được lưu giữ trong định dạng mảng, trong đó các giá trị dữ liệu có giá trị chỉ mục riêng. Việc truy cập dữ liệu trở nên nhanh hơn nếu chúng ta biết chỉ mục của dữ liệu cần tìm.
Do đó, với loại cấu trúc dữ liệu Hash Table này thì các hoạt động chèn và hoạt động tìm kiếm sẽ diễn ra rất nhanh, bất chấp kích cỡ của dữ liệu là bao nhiêu. Hash Table sử dụng mảng như là một kho lưu giữ trung gian và sử dụng kỹ thuật Hash để tạo chỉ mục tại nơi phần tử được chèn vào.
Kỹ thuật Hashing
Hashing là một kỹ thuật để chuyển đổi một dãy các giá trị khóa (key) vào trong một dãy các giá trị chỉ mục (index) của một mảng. Chúng ta đang sử dụng toán tử lấy phần dư để thu được một dãy các giá trị khóa. Giả sử có một HashTable có kích cỡ là 20, và dưới đây là các phần tử cần được lưu giữ. Phần tử trong định dạng (key, value).
(1,20)
(2,70)
(42,80)
(4,25)
(12,44)
(14,32)
(17,11)
(13,78)
(37,98)
Stt | Key | Hash | Chỉ mục mảng |
---|---|---|---|
1 | 1 | 1 % 20 = 1 | 1 |
2 | 2 | 2 % 20 = 2 | 2 |
3 | 42 | 42 % 20 = 2 | 2 |
4 | 4 | 4 % 20 = 4 | 4 |
5 | 12 | 12 % 20 = 12 | 12 |
6 | 14 | 14 % 20 = 14 | 14 |
7 | 17 | 17 % 20 = 17 | 17 |
8 | 13 | 13 % 20 = 13 | 13 |
9 | 37 | 37 % 20 = 17 | 17 |
Kỹ thuật Dò tuyến tính (Linear Probing)
Chúng ta thấy rằng có thể xảy ra trường hợp mà kỹ thuật Hashing được sử dụng để tạo chỉ mục đã tồn tại trong mảng. Trong tình huống này, chúng ta cần tìm kiếm vị trí trống kế tiếp trong mảng bằng việc nhìn vào trong ô tiếp theo cho tới khi chúng ta tìm thấy một ô trống. Kỹ thuật này được gọi là Dò tuyến tính (Linear Probing).
Stt | Key | Hash | Chỉ mục mảng | Sau kỹ thuật Linear Probing, chỉ mục mảng |
---|---|---|---|---|
1 | 1 | 1 % 20 = 1 | 1 | 1 |
2 | 2 | 2 % 20 = 2 | 2 | 2 |
3 | 42 | 42 % 20 = 2 | 2 | 3 |
4 | 4 | 4 % 20 = 4 | 4 | 4 |
5 | 12 | 12 % 20 = 12 | 12 | 12 |
6 | 14 | 14 % 20 = 14 | 14 | 14 |
7 | 17 | 17 % 20 = 17 | 17 | 17 |
8 | 13 | 13 % 20 = 13 | 13 | 13 |
9 | 37 | 37 % 20 = 17 | 17 | 18 |
Các hoạt động cơ bản trên Hash Table
Dưới đây là một số hoạt động cơ bản có thể được thực hiện trên cấu trúc dữ liệu Hash Table.
Hoạt động tìm kiếm: tìm kiếm một phần tử trong cấu trúc dữ liệu HashTable.
Hoạt động chèn: chèn một phần tử vào trong cấu trúc dữ liệu HashTable.
Hoạt động xóa: xóa một phần tử từ cấu trúc dữ liệu HashTable.
Phần tử dữ liệu (DataItem) trong HashTable
Phần tử dữ liệu bao gồm: data và key. Dựa vào key này chúng ta có thể thực hiện các hoạt động tìm kiếm trong cấu trúc dữ liệu HashTable.
struct DataItem { int data; int key; };
Phương thức của cấu trúc dữ liệu Hash Table
Xác định một phương thức để ước lượng Hash Code của key của phần tử dữ liệu.
int hashCode(int key){ return key % SIZE; }
Hoạt động tìm kiếm trong Hash Table
Mỗi khi một phần tử được tìm kiếm: ước lượng giá trị hash code của key đã truyền vào và sau đó xác định vị trí của phần tử bởi sử dụng giá trị hash code đó giống như là chỉ mục trong mảng. Sử dụng kỹ thuật Dò tuyến tính (Linear Probing) để lấy phần tử nếu như không tìm thấy phần tử với giá trị hash code đã ước lượng.
struct DataItem *search(int key){ //lấy giá trị hash int hashIndex = hashCode(key); //di chuyển trong mảng cho tới khi gặp ô trống while(hashArray[hashIndex] != NULL){ if(hashArray[hashIndex]->key == key) return hashArray[hashIndex]; //tới ô tiếp theo ++hashIndex; //bao quanh hash table hashIndex %= SIZE; } return NULL; }
Hoạt động chèn trong Hash Table
Mỗi khi một phần tử được chèn: ước lượng giá trị hash code của key đã truyền và xác định vị trí của phần tử bởi sử dụng giá trị hash code đó giống như là chỉ mục trong mảng. Sử dụng Dò tuyến tính (Linear Probing) cho vị trí trống nếu phần tử được tìm thấy với giá trị hash code đã ước lượng.
void insert(int key,int data){ struct DataItem *item = (struct DataItem*) malloc(sizeof(struct DataItem)); item->data = data; item->key = key; //Lấy giá trị hash int hashIndex = hashCode(key); //di chuyển trong mảng cho tới khi gặp ô trống hoặc bị xóa while(hashArray[hashIndex] != NULL && hashArray[hashIndex]->key != -1){ //tới ô tiếp theo ++hashIndex; //bao quanh hash table hashIndex %= SIZE; } hashArray[hashIndex] = item; }
Hoạt động xóa trong Hash Table
Mỗi khi một phần tử cần được xóa: ước lượng giá trị hash code của key đã truyền vào và sau đó xác định vị trí của phần tử bởi sử dụng giá trị hash code đó giống như là chỉ mục trong mảng. Sử dụng Dò tuyến tính (Linear Probing) để lấy phần tử nếu như không tìm thấy phần tử với giá trị hash code đã ước lượng. Khi tìm thấy, lưu trữ một phần tử giả tại đây để giữ hiệu suất của hash table.
struct DataItem* delete(struct DataItem* item){ int key = item->key; //lấy giá trị hash int hashIndex = hashCode(key); //di chuyển trong mảng cho tới khi gặp ô trống while(hashArray[hashIndex] !=NULL){ if(hashArray[hashIndex]->key == key){ struct DataItem* temp = hashArray[hashIndex]; //gán một phần tử giả tại vị trí bị xóa hashArray[hashIndex] = dummyItem; return temp; } //tới ô tiếp theo ++hashIndex; //bao quanh hash table hashIndex %= SIZE; } return NULL; }
Theo Tutorialspoint
Bài trước: Giải thuật Tìm kiếm nội suy (Interpolation Search)
Bài tiếp: Giải thuật sắp xếp trong cấu trúc dữ liệu & giải thuật
Bạn nên đọc
-
Công thức tính tỉ số thể tích các khối đa diện
-
Công thức tính diện tích tam giác: vuông, thường, cân, đều
-
Trọng tâm là gì? Công thức tính trọng tâm của tam giác
-
Diện tích hình trụ: Diện tích xung quanh hình trụ, diện tích toàn phần hình trụ
-
Công thức tính vận tốc, quãng đường, thời gian chính xác
-
Công thức tính đường chéo hình vuông, đường chéo hình chữ nhật
Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Cũ vẫn chất
-
Hàm MID: Hàm lấy chuỗi ký tự trong Excel
Hôm qua -
Hàm xử lý DATE/TIME trong SQL - Phần 1
Hôm qua -
Stt năng lượng tích cực truyền cảm hứng và sức mạnh cho bạn
Hôm qua -
5 code trái tim đập của thủ khoa Lý có tên, chèn ảnh
Hôm qua 14 -
Cách mở camera trên laptop Windows 7/8/10/11
Hôm qua 3 -
Danh sách DNS tốt, nhanh nhất của Google, VNPT, FPT, Viettel, Singapore
Hôm qua -
Hướng dẫn tải Minecraft miễn phí trên iPhone
Hôm qua 3 -
Cách khóa tài khoản Facebook tạm thời trên điện thoại, máy tính
Hôm qua 2 -
Sửa lỗi micro không hoạt động trong Windows 10
Hôm qua 1 -
Bài tập C++ có giải (code mẫu) về biến, kiểu dữ liệu và toán tử
Hôm qua 1