So sánh hashmap vs treemap trong java
Các entry trong HashMap không được sắp xếp theo thứ tự. Nhưng nếu bạn bị yêu cầu phải sắp xếp thì bạn hoàn toàn có thể làm được. Sắp xếp HashMap dựa trên các Keys khá là dễ. Chúng ta có 2 cách làm. Cách 1: Dùng TreeMap (ưu tiên dùng cách này) Việc bạn cần làm là tạo ra một TreeMap bằng cách sao chép các entries từ HashMap. TreeMap là một implementation của SortedMap. Vì vậy nó sẽ sắp xếp theo natural ordering hoặc bạn hoàn toàn có thể custom việc sắp xếp theo ý bạn bằng cách dùng Comparator. Cách 2: Dùng LinkedHashMap Cách này hơi dài dòng chút. Đầu tiên bạn cần lấy ra một Set các keys. Convert Set đó thành List. Sắp xếp List đó, và rồi add chúng lại LinkedHashMap theo đúng thứ tự đã sắp xếp. 2. Sắp xếp HashMap dựa trên ValueSắp xếp dựa trên Value khá phức tạp vì không có phương pháp trực tiếp hỗ trợ việc này. Bạn buộc phải viết code cho nó. Đầu tiên bạn phải tạo ra một Comparator để so sánh hai entries dựa trên value. Sau đó lấy Set of entries từ Map, convert Set thành List và dùng phương thức Cuối cùng, chúng ta tạo ra một LinkedHashMap, đây là một lớp extend từ HashMap và add các entries đã được sắp xếp vào đó. LinkedHashMap sẽ đảm bảo các phần tử được chèn vào theo một thứ tự 😉 Trong 1 số ngôn ngữ lập trình, Map được gọi là Dictionary (như Python hay C#). Trong khuôn khổ bài viết này, mình dùng từ map do thông thạo với C++ và Java. Các cấu trúc dữ liệu như mảng hay xâu kí tự, khi truy xuất dữ liệu bạn sẽ sử dụng một tham số gọi là chỉ số, ví dụ như arr[1], str[2], … Đối với cấu trúc dữ liệu map, để truy xuất dữ liệu bạn sẽ sử dụng một tham số gọi là key Cấu trúc dữ liệu kiểu map là một cấu trúc dữ liệu ánh xạ giữa cái gọi là khoá (key) sang giá trị của khoá đó (gọi là value) Trong cấu trúc dữ liệu này, mỗi một key sẽ nhận một giá trị khác nhau. Ứng dụngỨng dụng của map có rất nhiều. Mình đưa ra 1 số bài toán cơ bản nhé:
Với các bài toán này, bạn có thể sử dụng 2 mảng dữ liệu có cùng độ dài. Một mảng bạn lưu danh sách key, một mảng bạn lưu danh sách các value tương ứng với key đó (cùng chỉ số truy cập mảng). Khi bạn cần tìm value của một key nào đó, bạn duyệt mảng key, tìm chỉ số của phần tử trong mảng có giá trị bằng key cần tìm rồi trả ra giá trị tương ứng ở mảng value. Mã giả của đoạn code này như sau:
Với đoạn mã như trên, độ phức tạp thuật toán sẽ là O(N) (do bạn phải duyệt cả mảng keysArray để tìm cái key bạn muốn). Để tăng tốc độ cho đoạn mã này, bạn có thể cải tiến hàm tìm kiếm theo phương pháp tìm kiếm nhị phân (với điều kiện mảng keysArray đã được sắp xếp). Tất nhiên cách làm này sẽ tốn công cài đặt hơn rất nhiều lần so với việc bạn sử dụng map (hay dictionary) thông qua dòng lệnh duy nhất sau:
Không chỉ là dễ cài đặt và sử dụng, việc sử dụng map còn đáp ứng tốc độ chạy chương trình khá cao (có chút khác biệt giữa 1 vài cách cài đặt map của các ngôn ngữ hoặc thư viện, nhưng chắc chắn là ngon hơn mình tự cài rồi :D) Các loại map và đặc điểm:Nhìn chung có 2 loại map, dựa vào cách cài đặt của map. Một loại là map được cài đặt dựa trên cây đỏ đen (red-black tree), một loại là map được cài đặt dựa trên bảng băm (hashtable) Với C++, map là loại map được cài đặt dựa trên cây đỏ đen, còn unordered_map là loại map được cài đặt dựa trên nguyên lý Hash. Với Java, TreeMap là loại map được cài đặt bởi cây, còn HashMap là loại map đc cài đặt bởi bảng băm (hash table)
Map được cài đặt dựa trên nguyên lý Hashing – băm. Để hiểu về Hashing, chúng ta cần nắm được 3 khái niệm: Hash function, hash value và bucket. Hash function, hay còn gọi là hàm băm, là một hàm mà khi ta lấy đầu vào là một giá trị bất kỳ thì ở đầu ra, hash fuction sẽ cho ta một dãy code – được gọi là hash value. Mỗi đầu vào chỉ có duy nhất một hash value. |