JOIN trong SQL Server

Join trong SQL là một lệnh phổ biến. Bạn đã biết về các loại Join trong SQL chưa? Nếu chưa, mời bạn đọc bài viết dưới đây.

Trong cuộc sống, chúng ta lưu trữ dữ liệu ở nhiều bảng logic được liên kết với nhau bằng một giá trị khóa chung trong database quan hệ như SQL Server, Oracle, MySQL… Kết quả, chúng ta liên tục cần lấy dữ liệu từ 2 hoặc nhiều bảng hơn và tập hợp chúng thành kết quả mong muốn dựa trên một số điều kiện. Bạn có thể nhanh chóng đạt được kiểu dữ liệu này trong SQL Server bằng lệnh JOIN trong SQL Server. Bài viết dưới đây sẽ cung cấp cho bạn thông tin đầy đủ về Join on trong SQL Server kèm ví dụ minh họa dễ hiểu.

Mệnh đề hay lệnh Join cho phép lập trình viên truy xuất dữ liệu từ hai hoặc nhiều bảng liên quan thành một nhóm kết quả ý nghĩa. Bạn có thể nối bảng bằng lệnh SELECT và một điều kiện JOIN. Nó chỉ ra cách SQL Server có thể dùng dữ liệu từ một bảng để chọn các hàng từ bảng khác. Nhìn chung, các bảng có liên quan với nhau qua các ràng buộc foreign key.

Dưới đây là 4 loại JOIN trong SQL Server

  • INNER JOIN - hay còn gọi là hình thức kết nối đơn giản
  • LEFT OUTER JOIN - hay LEFT JOIN
  • RIGHT OUTER JOIN - hay RIGHT JOIN
  • FULL OUTER JOIN - hay FULL JOIN

Giờ hãy cùng nhìn vào cú pháp, hình minh họa cũng như các ví dụ để hiểu hơn về JOIN trong SQL Server.

INNER JOIN

Nhiều khả năng bạn đã dùng INNER JOIN trong lệnh nào đó rồi. Đây là loại kết nối phổ biến nhất, trả về tất cả các hàng từ các bảng khi điều kiện kết nối được đáp ứng.

Cú pháp INNER JOIN

SELECT cot
  FROM bang1
  INNER JOIN bang2
  ON bang1.cot = bang2.cot;

Hình ảnh minh họa INNER JOIN
Hình ảnh minh họa INNER JOIN

Kết quả trả về là những bản ghi chung giữa bang1 và bang2.

Ví dụ INNER JOIN

SELECT nhacung.nhacung_id, nhacung.nhacung_ten, donhang.donhang_ngay
FROM nhacung
INNER JOIN donhang
ON nhacung.nhacung_id = donhang.nhacung_id;

Kết quả trả về trong ví dụ trên là hàng thông tin trong bảng “nhà cung” và bảng “đơn hàng” khi giá trị nhacung_id ở 2 bảng bằng nhau.

Hãy cùng xem ví dụ với số liệu cụ thể để hiểu rõ hơn.

Bảng nhacung có 2 trường thông tin là nhacung_id và nhacung_ten.

nhacung_idnhacung_ten
10000IBM
10001Hewlett Packard
10002Microsoft
10003NVIDIA

Bảng donhang gồm 3 trường donhang_id, nhacung_id và donhang_ngay.

donhang_idnhacung_iddonhang_ngay
500125100002003/05/12
500126100012003/05/13
500127100042003/05/14

Nếu chạy lệnh SELECT (có dùng INNER JOIN) dưới đây:

SELECT nhacung.nhacung_id, nhacung.nhacung_ten, donhang.donhang_ngay
FROM nhacung
INNER JOIN donhang
ON nhacung.nhacung_id = donhang.nhacung_id;

Thì đây là bộ kết quả trả về:

nhacung_idtendonhang_ngay
10000IBM2003/05/12
10001Hewlett Packard2003/05/13

Hàng Microsoft và NVIDIA từ bảng nhacung bị bỏ ra do nhacung_id (10002 và 10003) chỉ có trong 1 bảng. Hàng 500127 (donhang_id) từ bảng donhang bị bỏ do nhacung_id 10004 không có trong bảng nhacung.

Cú pháp cũ của INNER JOIN

INNER JOIN có thể được viết lại bằng cú pháp cũ như dưới đây (nhưng khuyến khích nên dùng cú pháp có chứa từ khóa INNER JOIN)

SELECT nhacung.nhacung_id, nhacung.nhacung_ten, donhang.donhang_ngay
  FROM donhang, nhacung
  WHERE nhacung.nhacung_id = donhang.nhacung_id;

LEFT OUTER JOIN

Một số cơ sở dữ liệu dùng LEFT JOIN thay vì LEFT OUTER JOIN. Kiểu kết nối này trả về các hàng nằm ở bảng bên trái trong điều kiện ON và chỉ lấy ở các bảng còn lại những hàng đáp ứng được điều kiện đặt ra

Cú pháp LEFT JOIN

SELECT cot
  FROM bang1
  LEFT [OUTER] JOIN bang2
  ON bang1.cot = bang2.cot;

Minh họa LEFT JOIN với kết quả là vùng màu xanh
Minh họa LEFT JOIN với kết quả là vùng màu xanh

Kết quả trả về gồm bang1 và các bản ghi nằm trong bang2 giao với bang1 (vùng màu xanh trong hình).

Ví dụ LEFT JOIN

SELECT nhacung.nhacung_id, nhacung.nhacung_ten, donhang.donhang_ngay
  FROM nhacung
  LEFT OUTER JOIN donhang
  ON nhacung.nhacung_id = donhang.nhacung_id;

Ví dụ trên sẽ trả về tất cả các hàng từ bảng nhacung và chỉ các hàng nào đáp ứng được yêu cầu trong bảng donhang. Nếu giá trị nhacung_id trong bảng nhacung không tồn tại trong bảng donhang thì tất cả các trường trong donhang sẽ hiển thị thành <null> trong bảng kết quả.

Dưới đây là ví dụ cụ thể. Bảng nhacung gồm nhacung_id và nhacung_ten.

nhacung_idnhacung_ten
10000IBM
10001Hewlett Packard
10002Microsoft
10003NVIDIA

Bảng donhang gồm donhang_id, nhacung_id và donhang_ngay.

donhang_idnhacung_iddonhang_ngay
500125100002003/05/12
500126100012003/05/13

Nếu chạy lệnh SELECT dưới đây:

SELECT nhacung.nhacung_id, nhacung.nhacung_ten, donhang.donhang_ngay
  FROM nhacung
  LEFT OUTER JOIN donhang
  ON nhacung.nhacung_id = donhang.nhacung_id;

Thì kết quả sẽ như thế này:

nhacung_idnhacung_tendonhang_ngay
10000IBM2003/05/12
10001Hewlett Packard2003/05/13
10002Microsoft<null>
10003NVIDIA<null>

Các hàng Microsoft và NVIDIA vẫn nằm trong bộ kết quả do đang dùng LEFT OUTER JOIN (lấy tất cả bảng bên trái). Khi đó, donhang_ngay của các bản ghi này sẽ là giá trị <null>.

RIGHT OUTER JOIN

Một số cơ sở dữ liệu dùng RIGHT JOIN thay vì RIGHT OUTER JOIN. Kiểu kết nối này trả về các hàng nằm ở bảng bên phải trong điều kiện ON và chỉ lấy ở các bảng còn lại những hàng đáp ứng được điều kiện đặt ra

Cú pháp RIGHT JOIN

SELECT cot
 FROM bang1
 RIGHT [OUTER] JOIN bang2
 ON bang1.cot = bang2.cot;

Kết quả trả về gồm bang2 và các bản ghi nằm trong bang1 giao với bang2
Minh họa RIGHT JOIN

Kết quả trả về gồm bang2 và các bản ghi nằm trong bang1 giao với bang2 (vùng màu xanh trong hình).

Ví dụ RIGHT JOIN

SELECT donhang.donhang_id, donhang.donhang_ngay, nhacung.nhacung_ten
 FROM nhacung
 RIGHT OUTER JOIN donhang
 ON nhacung.nhacung_id = donhang.nhacung_id;

Kết quả trả về là tất cả hàng trong bảng donhang và chỉ các hàng đáp ứng được yêu cầu trong bảng nhacung.

Nếu giá trị nhacung_id trong bảng donhang không tồn tại trong bảng nhacung thì tất cả các trường trong nhacung sẽ hiển thị thành <null> trong bảng kết quả.

Dưới đây là ví dụ cụ thể. Bảng nhacung gồm nhacung_id và nhacung_ten.

nhacung_idnhacung_ten
10000Apple
10001Google

Bảng donhang gồm donhang_id, nhacung_id và donhang_ngay.

donhang_idnhcung_iddonhang_ngay
500125100002003/08/12
500126100012003/08/13
500127100022003/08/14

Nếu chạy lệnh SELECT dưới đây:

SELECT donhang.donhang_id, donhang.donhang_ngay, nhacung.nhacung_ten
 FROM nhacung
 RIGHT OUTER JOIN donhang
 ON nhacung.nhacung_id = donhang.nhacung_id;

Thì kết quả sẽ như thế này:

donhang_iddonhang_ngaynhacung_id
5001252003/08/12Apple
5001262003/08/13Google
5001272003/08/14<null>

Hàng 500127 (donhang_id) vẫn nằm trong bảng kết quả vì đang dùng RIGHT OUTER JOIN. Lưu ý nhacung_ten cho bản ghi đó chứa giá trị <null>.

FULL OUTER JOIN

Một số cơ sở dữ liệu dùng FULL JOIN thay vì FULL OUTER JOIN. Kiểu kết nối này trả về tất cả các hàng nằm ở bảng trái và phải và giá trị NULL đặt ở những nơi không đáp ứng được điều kiện.

Cú pháp FULL JOIN

SELECT cot
 FROM bang1
 FULL [OUTER] JOIN bang2
 ON bang1.cot = bang2.cot;

Minh họa FULL JOIN với kết quả là vùng màu xanh
Minh họa FULL JOIN với kết quả là vùng màu xanh

Kết quả trả về gồm tất cả bản ghi từ bang1 và bang2.

Ví dụ FULL JOIN

SELECT nhacung.nhacung_id, nhacung.nhacung_ten, donhang.donhang_ngay
 FROM nhacung
 FULL OUTER JOIN donhang
 ON nhacung.nhacung_id = donhang.nhacung_id;

Ví dụ trên sẽ trả về tất cả các hàng từ bảng nhacung và donhang, còn khi không đáp ứng được điều kiện thì giá trị sẽ được đặt là <null> trong bảng kết quả.

Nếu nhacung_id trong bảng nhacung không nằm trong bảng donhang, hay giá trị nhacung_id trong bảng donhang không nằm trong bảng nhacung thì các trường thông tin sẽ hiển thị <null>.

Dưới đây là ví dụ cụ thể về FULL OUTER JOIN. Bảng nhacung gồm nhacung_id và nhacung_ten.

nhacung_idnhacung_ten
10000IBM
10001Hewlett Packard
10002Microsoft
10003NVIDIA

Bảng donhang gồm donhang_id, nhacung_id và donhang_ngay.

donhang_idnhacung_iddonhang_ngay
500125100002003/08/12
500126100012003/08/13
500127100042003/08/14

Nếu chạy lệnh SELECT dưới đây:

SELECT nhacung.nhacung_id, nhacung.nhacung_ten, donhang.donhang_ngay
 FROM nhacung
 FULL OUTER JOIN donhang
 ON nhacung.nhacung_id = donhang.nhacung_id;

Thì kết quả sẽ như thế này:

nhacung_idnhacung_tendonhang_ngay
10000IBM2003/08/12
10001Hewlett Packard2003/08/13
10002Microsoft<null>
10003NVIDIA<null>
<null><null>2003/08/14

Các hàng Microsoft và NVIDIA vẫn nằm trong bộ kết quả do đang dùng FULL OUTER JOIN. Khi đó donhang_ngay của các bản ghi này chứa giá trị <null>. Hàng cho nhacung_id là 10004 cũng nằm trong bảng kết quả nhưng nhacung_id và nhacung_ten của các bản ghi này chứa giá trị <null>.

Một trong số lợi ích lớn nhất của việc dùng cơ sở dữ liệu quan hệ như MySQL là cấu trúc quan hệ của nó cho phép bạn dễ dàng lưu trữ và try vấn thông tin trên nhiều thiết bị.

Hãy cùng nhau xem xét ví dụ về cách truy xuất dữ liệu từ bảng nhiều database dưới đây nhé!

Việc khởi tạo database mẫu không bắt buộc nhưng nếu muốn, bạn có thể tham khảo lệnh terminal này:

git clone https://github.com/mdizak/sample-select-db.git
cd sample-select-db
sudo mysql < store.sql
sudo mysql sampledb
mysql> SELECT COUNT(*) FROM customers;

Bạn sẽ có kết quả là 2000 hàng trong bảng khách hàng (customers).

Lệnh JOIN mặc định được dùng trong database MySQL được gọi là INNER JOIN. Ở đây, nếu muốn thấy tên khách hàng đầu tiên và cuối cùng, cùng số lượng đơn hàng và ngày tháng cho tất cả đơn lớn hơn 1000$, bạn có thể dùng lệnh SQL sau:

SELECT
c.id, c.first_name, c.last_name, o.amount, o.created_at
FROM
customers c, orders o
WHERE
o.customer_id = c.id AND o.amount >= 1000;

Các lệnh Join khác

NATURAL JOIN

NATURAL JOIN cũng là một khái niệm ít được biết đến khi tìm hiểu về SQL. Đây là một loại JOIN hiếm khi được sử dụng trong các câu lệnh SQL. Tuy nhiên PostgreSQL hỗ trợ nó.

NATURAL JOIN là một biến thể của INNER JOIN. Tuy nhiên, NATURAL JOIN không còn chỉ định điều kiện ON để nối các bảng như INNER JOIN nữa. Thay vào đó, nó sẽ tự liên kết thông qua các cột có cùng tên. Vì thế, chúng ta không nên có cùng tên cột giữa các bảng không có liên kết dữ liệu giữa chúng. Nếu ai đó thêm một cột mới vào một trong các bảng có cùng tên với một cột trong bảng khác, họ có thể phá vỡ mọi liên kết tự nhiên hiện có. Trên thực tế, đây là một lỗi đang chờ xảy ra.

SELECT Name.CustomerID 
   , Name.LastName 
   , City.City 
FROM Name  
NATURAL JOIN City 

Bằng cách sử dụng JOIN, bạn có thể hoàn thành công việc chỉ bằng một truy vấn với bất kỳ tham số tìm kiếm nào. Mặt khác, MySQL có thể đạt được hiệu suất tốt hơn. Chỉ cần sử dụng một truy vấn duy nhất thay vì chạy nhiều truy vấn có thể giảm chi phí. Thay vào đó, sử dụng nhiều truy vấn sẽ dẫn đến nhiều dữ liệu hơn được chuyển giữa MySQL và các ứng dụng (phần mềm). Ngoài ra, nó đòi hỏi nhiều thao tác dữ liệu hơn trong ứng dụng.

Hi vọng bài viết trên giúp bạn hiểu hơn về sức mạnh của cơ sở dữ liệu quan hệ và cách xây dựng truy vấn SQL. Thật sự không quá khó phải không?

Bài trước: ALIAS trong SQL Server

Bài tiếp: Điều kiện BETWEEN trong SQL Server

Thứ Tư, 19/03/2025 15:03
3,941 👨 145.649
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
1 Bình luận
Sắp xếp theo
❖
  • Huy Trần Xuân
    Huy Trần Xuân

    Xin cảm ơn bài viết.

    Thích Phản hồi 07/07/22
    ❖ SQL Server
    Chia sẻ
    Chia sẻ FacebookChia sẻ Twitter
    Đóng