Cấu trúc dữ liệu cây
Cấu trúc dữ liệu cây là gì ?
Cấu trúc dữ liệu cây biểu diễn các nút (node) được kết nối bởi các cạnh. Chúng ta sẽ tìm hiểu về Cây nhị phân (Binary Tree) và Cây tìm kiếm nhị phân (Binary Search Tree) trong phần này.
Cây nhị phân là một cấu trúc dữ liệu đặc biệt được sử dụng cho mục đích lưu trữ dữ liệu. Một cây nhị phân có một điều kiện đặc biệt là mỗi nút có thể có tối đa hai nút con. Một cây nhị phân tận dụng lợi thế của hai kiểu cấu trúc dữ liệu: một mảng đã sắp thứ tự và một danh sách liên kết (Linked List), do đó việc tìm kiếm sẽ nhanh như trong mảng đã sắp thứ tự và các thao tác chèn và xóa cũng sẽ nhanh bằng trong Linked List.
Các khái niệm cơ bản về cây nhị phân
Dưới đây là một số khái niệm quan trọng liên quan tới cây nhị phân:
Đường: là một dãy các nút cùng với các cạnh của một cây.
Nút gốc (Root): nút trên cùng của cây được gọi là nút gốc. Một cây sẽ chỉ có một nút gốc và một đường xuất phát từ nút gốc tới bất kỳ nút nào khác. Nút gốc là nút duy nhất không có bất kỳ nút cha nào.
Nút cha: bất kỳ nút nào ngoại trừ nút gốc mà có một cạnh hướng lên một nút khác thì được gọi là nút cha.
Nút con: nút ở dưới một nút đã cho được kết nối bởi cạnh dưới của nó được gọi là nút con của nút đó.
Nút lá: nút mà không có bất kỳ nút con nào thì được gọi là nút lá.
Cây con: cây con biểu diễn các con của một nút.
Truy cập: kiểm tra giá trị của một nút khi điều khiển là đang trên một nút đó.
Duyệt: duyệt qua các nút theo một thứ tự nào đó.
Bậc: bậc của một nút biểu diễn số con của một nút. Nếu nút gốc có bậc là 0, thì nút con tiếp theo sẽ có bậc là 1, và nút cháu của nó sẽ có bậc là 2, …
Khóa (Key): biểu diễn một giá trị của một nút dựa trên những gì mà một thao tác tìm kiếm thực hiện trên nút.
Biểu diễn cây tìm kiếm nhị phân
Cây tìm kiếm nhị phân biểu diễn một hành vi đặc biệt. Con bên trái của một nút phải có giá trị nhỏ hơn giá trị của nút cha (của nút con này) và con bên phải của nút phải có giá trị lớn hơn giá trị của nút cha (của nút con này). Hình minh họa:
Chúng ta đang triển khai cây bởi sử dụng đối tượng nút và kết nối chúng thông qua các tham chiếu.
Nút (Node) trong cây tìm kiếm nhị phân
Một nút sẽ có cấu trúc như dưới đây. Nút có phần dữ liệu và phần tham chiếu tới các nút con bên trái và nút con bên phải.
struct node { int data; struct node *leftChild; struct node *rightChild; };
Trong một cây, tất cả các nút chia sẻ cùng một cấu trúc.
Hoạt động cơ bản trên cây tìm kiếm nhị phân
Dưới đây liệt kê các hoạt động cơ bản có thể được thực hiện trên cấu trúc dữ liệu cây tìm kiếm nhị phân:
Chèn: chèn một phần tử vào trong một cây/ tạo một cây.
Tìm kiếm: tìm kiếm một phần tử trong một cây.
Duyệt tiền thứ tự: duyệt một cây theo cách thức duyệt tiền thứ tự (tham khảo chương sau).
Duyệt trung thứ tự: duyệt một cây theo cách thức duyệt trung thứ tự (tham khảo chương sau).
Duyệt hậu thứ tự: duyệt một cây theo cách thức duyệt hậu thứ tự (tham khảo chương sau).
Trong chương này, chúng ta sẽ tìm hiểu chi tiết cách tạo (chèn) cấu trúc cây và cách tìm kiếm một phần tử dữ liệu trên một cây. Chương sau chúng ta sẽ tìm hiểu chi tiết về các cách duyệt cây.
Hoạt động chèn trong cây tìm kiếm nhị phân
Bước chèn đầu tiên sẽ tạo thành cây. Tiếp đó là sẽ chèn từng phần tử vào trong cây. Đầu tiên chúng ta cần xác định vị trí chính xác của nó. Bắt đầu tìm kiếm từ nút gốc, sau đó nếu dữ liệu là nhỏ hơn giá trị khóa, thì tìm kiếm vị trí rỗng trong cây con bên trái và chèn dữ liệu. Nếu không nhỏ hơn, tìm vị trí rỗng trong cây con bên phải và chèn dữ liệu. (Nếu bạn chưa hiểu, bạn có thể đọc lại phần Biểu diễn cây tìm kiếm nhị phân ở trên để biết tại sao lại chèn như vậy và xem hình minh họa)
Giải thuật cho hoạt động chèn
If root là NULL thì tạo nút gốc (root node) returnIf root đã tồn tại thì sau đó so sánh dữ liệu với node.data while tới vị trí chèn đã xác định If dữ liệu là lớn hơn node.data tới cây con bên phải else tới cây con bên trái kết thúc while chèn dữ liệu Kết thúc If
Giải thuật mẫu cho hoạt động chèn
Từ trên ta có thể suy ra giải thuật mẫu cho hoạt động chèn trong cây tìm kiếm nhị phân như sau:
void insert(int data) { struct node *tempNode = (struct node*) malloc(sizeof(struct node)); struct node *current; struct node *parent; tempNode->data = data; tempNode->leftChild = NULL; tempNode->rightChild = NULL; //Nếu cây là trống, chúng ta tạo root node if(root == NULL) { root = tempNode; }else { current = root; parent = NULL; while(1) { parent = current; //tới cây con bên trái if(data < parent->data) { current = current->leftChild; //chèn dữ liệu vào bên trái if(current == NULL) { parent->leftChild = tempNode; return; } } //tới cây con bên phải else { current = current->rightChild; //chèn dữ liệu vào bên phải if(current == NULL) { parent->rightChild = tempNode; return; } } } } }
Để tìm hiểu code đầy đủ của cấu trúc dữ liệu cây trong ngôn ngữ C, mời bạn click chuột vào chương: Duyệt cây trong C.
Hoạt động tìm kiếm trong cây nhị phân
Mỗi khi một phần tử cần tìm kiếm: bắt đầu tìm kiếm từ nút gốc, sau đó nếu dữ liệu là nhỏ hơn giá trị khóa, thì tìm kiếm phần tử trong cây con bên trái; nếu không nhỏ hơn thì tìm kiếm phần tử trong cây con bên phải. (Nếu bạn chưa hiểu, bạn có thể đọc lại phần Biểu diễn cây tìm kiếm nhị phân ở trên để biết tại sao lại tìm kiếm như vậy và xem hình minh họa)
Giải thuật cho hoạt động tìm kiếm
If root.data là bằng với search.data return root else while không tìm thấy dữ liệu If data là lớn hơn node.data tới cây con bên phải else tới cây con bên trái If data được tìm thấy return node kết thúc while return không tìm thấy data Kết thúc if
Giải thuật mẫu cho hoạt động tìm kiếm
Từ trên ta có thể suy ra giải thuật mẫu cho hoạt động tìm kiếm trong cây tìm kiếm nhị phân như sau:
struct node* search(int data) { struct node *current = root; printf("Truy cap phan tu: "); while(current->data != data) { if(current != NULL) printf("%d ",current->data); //tới cây con bên trái if(current->data > data) { current = current->leftChild; } //else tới cây con bên phải else { current = current->rightChild; } //không tìm thấy if(current == NULL) { return NULL; } return current; } }
Để tìm hiểu code đầy đủ của cấu trúc dữ liệu cây trong ngôn ngữ C, mời bạn click chuột vào chương: Duyệt cây trong C.
Bài học Cấu trúc dữ liệu và giải thuật phổ biến tại hoconline.club:
- Giải thuật tiệm cận - Asymptotic Algorithms
- Cấu trúc dữ liệu mảng (Array)
- Danh sách liên kết - Linked List
- Cấu trúc dữ liệu ngăn xếp - Stack
- Cấu trúc dữ liệu hàng đợi - Queue
- Tìm kiếm tuyến tính - Linear Search
- Tìm kiếm nhị phân - Binary Search
- Sắp xếp nổi bọt - Bubble Sort
- Sắp xếp chèn - Insertion Sort