Xử lý bản sao trong SQL



Có một tình huống khi bạn có nhiều bản sao của các bản ghi trong một bảng. Trong khi lấy các bản ghi này, nó là hợp lý hơn khi chỉ lấy một bản ghi duy nhất thay vì lấy cả các bản sao của bản ghi.

Từ khóa DISTINCT trong SQL, đã được trình bày trong các chương trước, được sử dụng kết hợp với lệnh SELECT để loại bỏ tất cả bản sao và chỉ lấy các bản ghi duy nhất.

Cú pháp

Cú pháp cơ bản của từ khóa DISTINCT để loại bỏ các bản sao là như sau:

SELECT DISTINCT cot1, cot2,.....cotN 
FROM ten_bang
WHERE [dieu_kien]

Ví dụ

Bảng SINHVIEN có các bản ghi sau:

+----+---------+-----+-----------+--------+
| ID |  TEN    | TUOI|  KHOAHOC  | HOCPHI |
+----+---------+-----+-----------+---------+
|  1 | Hoang   |  21 | CNTT      | 4000000       |
|  2 | Viet    |  19 | DTVT      | 3000000     |
|  3 | Thanh   |  18 | KTDN      |  4000000      |
|  4 | Nhan    |  19 | CK        |   4500000   |
|  5 | Huong   |  20 | TCNH      |   5000000     |
+----+---------+-----+-----------+---------+

Đầu tiên, chúng ta xem cách truy vấn SELECT trả về bản sao của HOCPHI:

SQL> SELECT HOCPHI FROM SINHVIEN
     ORDER BY HOCPHI;

Trong kết quả thu được, HOCPHI 4000000 xuất hiện hai lần, và là một bản sao từ bảng ban đầu.

+----------+
| HOCPHI   |
+----------+
|  3000000 |
|  4000000 |
|  4000000 |
|  4500000 |
|  5000000 |
+----------+

Bây giờ, sử dụng từ khóa DISTINCT với truy vấn SELECT trên, và xem kết quả:

SQL> SELECT DISTINCT HOCPHI FROM SINHVIEN
     ORDER BY HOCPHI;

Trong kết quả thu được, bạn sẽ không thấy bất kỳ bản sao nào.

+----------+
| HOCPHI   |
+----------+
|  3000000 |
|  4000000 |
|  4500000 |
|  5000000 |
+----------+