Cách xóa dữ liệu, nội dung trùng lặp trong Excel

Remove các dòng giống nhau trong Excel

Trong khi làm việc với bảng Excel, sẽ có không ít lần bạn gặp phải các trường hợp trùng lặp dữ liệu trong một danh sách, hoặc một bảng dữ liệu. Nếu bảng số liệu với ít dữ liệu sẽ dễ dàng trong việc phát hiện những nội dung bị trùng lặp, như các dòng trùng lặp dữ liệu không đồng bộ.

Tuy nhiên khi xử lý với 1 tài liệu Excel lớn, nhiều số liệu, nội dung thì việc tìm kiếm từng dòng và xóa theo cách thủ công là không khả thi. Vậy tại sao chúng ta không sử dụng ngay tính năng có sẵn của Excel?

Để lọc những dữ liệu trùng lặp, người dùng có thể sử dụng nhiều cách khác nhau, như sử dụng chức năng loại bỏ nội dung trùng lặp Remove Duplicate, đánh dấu nội dung trùng lặp sau đó tiến hành xóa, dùng marco để xóa,… Trong bài viết dưới đây, Quản trị mạng sẽ hướng dẫn bạn đọc 2 cách đơn giản để xóa nội dung trùng lặp trong Excel là tính năng Remove Duplicate và đánh dấu nội dung trùng lặp Hightlight Duplicate.

Dưới đây là bảng thống kê Excel ví dụ để xóa dữ liệu trùng lặp trong bảng.

Bảng thống kê Excel xóa trùng lặp dữ liệu

Cách 1: Remove Duplicate xóa dữ liệu trùng lặp Excel

Tính năng Remove Duplicate có sẵn trên Excel có khả năng giúp bạn phát hiện những dòng trùng lặp trong bảng dữ liệu và tiến hành xóa nhanh chóng.

Bước 1:

Trước hết, chúng ta cần bôi đen vùng nội dung cần xóa trùng lặp, sau đó vào tab Data rồi chọn Remove Duplicates.

Nhấn chọn tab Data

Bước 2:

Xuất hiện giao diện một hộp thoại mới. Tại đây bạn sẽ lựa chọn các trường có trong bảng để tính năng có thể tiến hành lọc và phát hiện những nội dung trùng nhau. Ở đây, tôi sẽ bỏ tích cột STT vì các dòng đều có số khác nhau. Chỉ tích chọn vào Họ và tên và cột Địa chỉ mà thôi.

Sau đó nhấn OK để tiến hành.

Chọn trường để quét dữ liệu

Bước 3:

Ngay sau đó bạn sẽ nhận được thông báo tìm được bao nhiêu giá trị nội dung trùng lặp. Chẳng hạn với bảng thống kê trên sẽ có 2 dòng trùng lặp và sẽ tự động được xóa khỏi bảng Excel.

Thông báo nội dung trùng lặp

Kết quả bảng hoàn chỉnh sau khi xóa nội dung trùng lặp như hình dưới đây. 2 dòng đó đã được xóa khỏi bảng và để lại 2 dòng trống ở cuối bảng. Nếu muốn xóa 2 dòng đó, bạn chỉ cần click chuột phải chọn Delete là xong.

Xóa nội dung trùng lặp trong Excel

Cách 2: Đánh dấu dữ liệu trùng lặp Excel để xóa thủ công

Nếu bạn muốn kiểm tra lại nội dung trùng lặp trong bảng kỹ hơn có thể sử dụng cách đánh dấu dòng Hightlight. Những dòng hay nội dung trong bảng giống nhau sẽ có cùng 1 màu khác biệt. Như vậy người dùng sẽ dễ dàng kiểm tra lại hơn rồi quyết định xóa hay chỉ chỉnh sửa lại.

Bước 1:

Đầu tiên, chúng ta cũng bôi đen vùng nội dung trong bảng cần tiến hành xóa nội dung trùng lặp. Sau đó, nhấp chuột vào tab Home rồi chọn Conditional Formatting. Tiếp đến nhấp chọn tiếp vào Hightlight Cell Rules > Duplicate values…

Nhấn chọn Hightlight Cell Rules

Bước 2:

Xuất hiện hộp thoại nhỏ. Tại đây, phần nội dung trùng lặp sẽ được đánh dấu bằng 1 loại màu khác để người dùng dễ nhận biết. Bạn có thể lựa chọn các màu Hightlight khác nhau có trong bảng, sau đó nhấn OK.

Chọn màu cho dữ liệu trùng lặp

Bước 3:

Kết quả cuối cùng sẽ như trong bảng dưới đây. Những nội dung, dòng trong bảng trùng nhau sẽ bôi đậm bằng màu mà bạn đã chọn ở bước trên. Từ đây, chúng ta có thể tiến hành kiểm tra lại các nội dung để tùy chỉnh nếu muốn. Hoặc có thể tiến hành xóa ngay những dòng trùng lặp đó.

Đánh dấu dữ liệu trùng lặp trong bảng Excel

Như vậy với 2 cách vô cùng đơn giản và sử dụng tính năng có sẵn trên Excel, mà chúng ta có thể dễ dàng phát hiện dòng có nội dung trùng lặp. Trong trường hợp bạn không cần phải xem xét lại các dòng, muốn xóa luôn những giá trị bị trùng thì sử dụng tính năng Remove Duplicate. Nếu muốn kiểm tra lại thì sử dụng cách Hightlight đánh dấu dữ liệu giống nhau sau đó mới xóa.

Chúc các bạn thực hiện thành công!

Thứ Ba, 25/07/2017 21:22
  • 5 ★ 2 👨
  • 53.533