So sánh hashmap vs treemap trong java

Các entry trong HashMap không được sắp xếp theo thứ tự. Nhưng nếu bạn bị yêu cầu phải sắp xếp thì bạn hoàn toàn có thể làm được.

Sắp xếp HashMap dựa trên các Keys khá là dễ. Chúng ta có 2 cách làm.

Cách 1: Dùng TreeMap (ưu tiên dùng cách này)

Việc bạn cần làm là tạo ra một TreeMap bằng cách sao chép các entries từ HashMap.

TreeMap là một implementation của SortedMap. Vì vậy nó sẽ sắp xếp theo natural ordering hoặc bạn hoàn toàn có thể custom việc sắp xếp theo ý bạn bằng cách dùng Comparator.

Cách 2: Dùng LinkedHashMap

Cách này hơi dài dòng chút. Đầu tiên bạn cần lấy ra một Set các keys. Convert Set đó thành List. Sắp xếp List đó, và rồi add chúng lại LinkedHashMap theo đúng thứ tự đã sắp xếp.

2. Sắp xếp HashMap dựa trên Value

Sắp xếp dựa trên Value khá phức tạp vì không có phương pháp trực tiếp hỗ trợ việc này. Bạn buộc phải viết code cho nó. Đầu tiên bạn phải tạo ra một Comparator để so sánh hai entries dựa trên value. Sau đó lấy Set of entries từ Map, convert Set thành List và dùng phương thức Collections.sort(List) để sắp xếp List các entries bằng value bằng cách truyền vào customized value comparator. Việc này tương tự như Làm thế nào để sắp xếp một ArrayList trong Java?

Cuối cùng, chúng ta tạo ra một LinkedHashMap, đây là một lớp extend từ HashMap và add các entries đã được sắp xếp vào đó. LinkedHashMap sẽ đảm bảo các phần tử được chèn vào theo một thứ tự 😉

Trong 1 số ngôn ngữ lập trình, Map được gọi là Dictionary (như Python hay C#). Trong khuôn khổ bài viết này, mình dùng từ map do thông thạo với C++ và Java.

Các cấu trúc dữ liệu như mảng hay xâu kí tự, khi truy xuất dữ liệu bạn sẽ sử dụng một tham số gọi là chỉ số, ví dụ như arr[1], str[2], … Đối với cấu trúc dữ liệu map, để truy xuất dữ liệu bạn sẽ sử dụng một tham số gọi là key

Cấu trúc dữ liệu kiểu map là một cấu trúc dữ liệu ánh xạ giữa cái gọi là khoá (key) sang giá trị của khoá đó (gọi là value)

Trong cấu trúc dữ liệu này, mỗi một key sẽ nhận một giá trị khác nhau.

So sánh hashmap vs treemap trong java

Ứng dụng

Ứng dụng của map có rất nhiều. Mình đưa ra 1 số bài toán cơ bản nhé:

  • Cho một danh sách các số điện thoại kèm theo tên của chủ thuê bao đó. Yêu cầu đầu vào là một số điện thoại (key), hãy đưa ra tên của chủ thuê bao (value)
  • Cho danh sách thể hiện lịch sử đi muộn của các nhân viên một công ty nào đó. Hãy tìm xem nhân viên (key) nào có số lần đi muộn (value) nhiều nhất?
  • Cho một danh sách các IP kèm theo các domain. Hãy trả ra ip (value) tương ứng domain (key) hoặc ngược lại trong thời gian nhanh nhất?

Với các bài toán này, bạn có thể sử dụng 2 mảng dữ liệu có cùng độ dài. Một mảng bạn lưu danh sách key, một mảng bạn lưu danh sách các value tương ứng với key đó (cùng chỉ số truy cập mảng). Khi bạn cần tìm value của một key nào đó, bạn duyệt mảng key, tìm chỉ số của phần tử trong mảng có giá trị bằng key cần tìm rồi trả ra giá trị tương ứng ở mảng value. Mã giả của đoạn code này như sau:

for (int i=0; i

Với đoạn mã như trên, độ phức tạp thuật toán sẽ là O(N) (do bạn phải duyệt cả mảng keysArray để tìm cái key bạn muốn). Để tăng tốc độ cho đoạn mã này, bạn có thể cải tiến hàm tìm kiếm theo phương pháp tìm kiếm nhị phân (với điều kiện mảng keysArray đã được sắp xếp). Tất nhiên cách làm này sẽ tốn công cài đặt hơn rất nhiều lần so với việc bạn sử dụng map (hay dictionary) thông qua dòng lệnh duy nhất sau:

if (mymap.find(key) != mymap.end()) return mymap[key];else return "notFound";

Không chỉ là dễ cài đặt và sử dụng, việc sử dụng map còn đáp ứng tốc độ chạy chương trình khá cao (có chút khác biệt giữa 1 vài cách cài đặt map của các ngôn ngữ hoặc thư viện, nhưng chắc chắn là ngon hơn mình tự cài rồi :D)

Các loại map và đặc điểm:

Nhìn chung có 2 loại map, dựa vào cách cài đặt của map. Một loại là map được cài đặt dựa trên cây đỏ đen (red-black tree), một loại là map được cài đặt dựa trên bảng băm (hashtable)

Với C++, map là loại map được cài đặt dựa trên cây đỏ đen, còn unordered_map là loại map được cài đặt dựa trên nguyên lý Hash. Với Java, TreeMap là loại map được cài đặt bởi cây, còn HashMap là loại map đc cài đặt bởi bảng băm (hash table)

  1. Tree map: Map được cài bằng cây đỏ đen. Mỗi một node trong cây có một key và một value, trỏ vào 2 node bên trái và bên phải. Giá trị key của node bên trái nhỏ hơn giá trị key ở node cha và nhỏ hơn giá trị key ở node bên phải. Độ phức tạp thuật toán của các phép toán thêm một node, lấy ra giá trị của một key là O(logn)
    So sánh hashmap vs treemap trong java
  2. HashMap

Map được cài đặt dựa trên nguyên lý Hashing – băm. Để hiểu về Hashing, chúng ta cần nắm được 3 khái niệm: Hash function, hash value và bucket.

Hash function, hay còn gọi là hàm băm, là một hàm mà khi ta lấy đầu vào là một giá trị bất kỳ thì ở đầu ra, hash fuction sẽ cho ta một dãy code – được gọi là hash value. Mỗi đầu vào chỉ có duy nhất một hash value.