Deepfake là gì?
Công nghệ Deepfake là một loại trí tuệ nhân tạo được sử dụng để tạo ra hình ảnh, video và bản ghi âm giả mạo có sức thuyết phục. Thuật ngữ này mô tả cả công nghệ và nội dung giả mạo kết quả và là từ ghép của deep learning và fake.
Deepfake thường biến đổi nội dung nguồn hiện có từ một người thành một người khác hoặc là nội dung hoàn toàn gốc khi một người được đại diện làm hoặc nói điều gì đó mà họ không thực sự làm.
Mối nguy hiểm lớn nhất do deepfake gây ra là khả năng phát tán thông tin sai lệch giả mạo là đến từ các nguồn đáng tin cậy. Mặc dù deepfake gây ra các mối đe dọa nghiêm trọng, nhưng chúng cũng có những trường hợp sử dụng hợp pháp, chẳng hạn như âm thanh và giải trí trong video game, cũng như các ứng dụng hỗ trợ khách hàng và phản hồi người gọi, chẳng hạn như chuyển tiếp cuộc gọi và dịch vụ lễ tân.
- 6 bước để bắt đầu học lập trình trí tuệ nhân tạo (AI)
- 5 ngôn ngữ lập trình hàng đầu để phát triển AI
- 6 phần mềm chỉnh sửa ảnh sử dụng Trí tuệ nhân tạo để “nâng tầm” hình ảnh của bạn
Deepfake hoạt động như thế nào?
Deepfake không phải là video hoặc hình ảnh được chỉnh sửa bằng photoshop. Trên thực tế, chúng được tạo ra bằng các thuật toán chuyên biệt kết hợp những cảnh quay hiện có và mới. Ví dụ, các đặc điểm khuôn mặt tinh tế của mọi người trong hình ảnh được phân tích thông qua Machine Learning (ML) để thao tác chúng trong bối cảnh của các video khác.
Deepfake sử dụng hai thuật toán để tạo và tinh chỉnh nội dung fake. Trình tạo xây dựng một tập dữ liệu đào tạo dựa trên đầu ra mong muốn, tạo ra nội dung kỹ thuật số fake ban đầu, trong khi trình phân biệt phân tích mức độ chân thực hay giả mạo từ phiên bản ban đầu của nội dung. Quá trình này được lặp lại, cho phép trình tạo cải thiện khả năng tạo nội dung chân thực và trình phân biệt trở nên thành thạo hơn trong việc phát hiện ra các lỗi để trình tạo sửa.
Sự kết hợp của thuật toán tạo và phân biệt tạo ra một GAN (Generative Adversarial Network). GAN sử dụng deep learning để nhận dạng các mẫu trong hình ảnh thực và sau đó sử dụng các mẫu đó để tạo ra ảnh fake. Khi tạo ảnh deepfake, hệ thống GAN sẽ xem ảnh của mục tiêu từ nhiều góc độ để nắm bắt mọi chi tiết và góc nhìn. Khi tạo video deepfake, GAN sẽ xem video từ nhiều góc độ khác nhau và phân tích hành vi, chuyển động và mẫu giọng nói. Sau đó, thông tin này được chạy qua bộ phân biệt nhiều lần để tinh chỉnh độ chân thực của hình ảnh hoặc video cuối cùng.
Video deepfake được tạo theo một trong hai cách. Chúng có thể sử dụng nguồn video gốc của mục tiêu, trong đó người này được yêu cầu nói và làm những điều họ chưa từng làm; hoặc chúng có thể hoán đổi khuôn mặt của người đó vào video của một cá nhân khác, còn được gọi là face swap.
Công nghệ cần thiết để phát triển deepfake
Việc phát triển deepfake đang trở nên dễ dàng, chính xác và phổ biến hơn khi các công nghệ sau được phát triển và cải tiến:
- Công nghệ mạng nơ-ron GAN sử dụng thuật toán tạo và phân biệt để phát triển tất cả nội dung deepfake.
- Mạng nơ-ron tích chập phân tích các mẫu trong dữ liệu trực quan. CNN được sử dụng để nhận dạng khuôn mặt và theo dõi chuyển động.
- Bộ mã hóa tự động là công nghệ mạng nơ-ron xác định các thuộc tính có liên quan của mục tiêu như biểu cảm khuôn mặt và chuyển động cơ thể, sau đó áp đặt những thuộc tính này vào video nguồn.
- Xử lý ngôn ngữ tự nhiên được sử dụng để tạo âm thanh deepfake. Thuật toán NLP phân tích các thuộc tính của giọng nói của mục tiêu, sau đó tạo văn bản gốc bằng các thuộc tính đó.
- Điện toán hiệu suất cao là loại điện toán cung cấp sức mạnh tính toán cần thiết đáng kể mà deepfake yêu cầu.
- Phần mềm chỉnh sửa video không phải lúc nào cũng dựa trên AI, nhưng thường tích hợp các công nghệ AI để tinh chỉnh đầu ra và thực hiện các điều chỉnh giúp cải thiện tính chân thực.
Deepfake thường được sử dụng như thế nào?
Việc sử dụng deepfake rất đa dạng. Những cách sử dụng tích cực và tiêu cực của deepfake bao gồm:
- Nghệ thuật. Deepfake được sử dụng để tạo ra âm nhạc mới bằng cách sử dụng các tác phẩm hiện có của nghệ sĩ.
- Tống tiền và gây tổn hại danh tiếng. Ví dụ về điều này là khi hình ảnh mục tiêu được đưa vào tình huống bất hợp pháp, không phù hợp hoặc thỏa hiệp như nói dối công chúng, tham gia vào các hành vi tình dục hoặc sử dụng ma túy. Những video này được sử dụng để tống tiền nạn nhân, hủy hoại danh tiếng của một người, trả thù hoặc đơn giản là bắt nạt trên mạng.
- Dịch vụ phản hồi cuộc gọi. Các dịch vụ này sử dụng deepfake để cung cấp phản hồi được cá nhân hóa cho những yêu cầu của người gọi liên quan đến chuyển tiếp cuộc gọi và các dịch vụ lễ tân khác.
- Hỗ trợ khách hàng qua điện thoại. Các dịch vụ này sử dụng giọng nói giả cho các tác vụ đơn giản như kiểm tra số dư tài khoản hoặc nộp đơn khiếu nại.
- Giải trí. Phim ảnh và video game Hollywood sao chép và chỉnh sửa giọng nói của diễn viên trong một số cảnh nhất định. Các phương tiện giải trí sử dụng công nghệ này khi một cảnh khó quay, trong quá trình hậu kỳ khi diễn viên không còn ở phim trường để ghi âm giọng nói của họ hoặc để tiết kiệm thời gian cho diễn viên và nhóm sản xuất.
- Các chiến dịch video chi phí thấp. Các nhà tiếp thị sử dụng deepfake có thể cắt giảm chi phí chiến dịch video bằng cách sử dụng các bản ghi kỹ thuật số hiện có cùng với lời thoại trong kịch bản để tạo nội dung mới mà không cần diễn viên trực tiếp.
- Gian lận. Deepfake được sử dụng để mạo danh một cá nhân nhằm lấy thông tin nhận dạng cá nhân, chẳng hạn như tài khoản ngân hàng và số thẻ tín dụng. Đôi khi, điều này có thể bao gồm việc mạo danh giám đốc điều hành của các công ty hoặc nhân viên khác có thông tin xác thực để truy cập dữ liệu nhạy cảm, đây là mối đe dọa an ninh mạng lớn.
- Siêu cá nhân hóa và tính bao hàm. Công nghệ Deepfake tăng cường tính cá nhân hóa thương hiệu bằng cách điều chỉnh các yếu tố như dân tộc và tông màu da để phản ánh tốt hơn các đặc điểm nhân khẩu học đa dạng của khách hàng. Điều này được sử dụng để thúc đẩy tính bao hàm và mở rộng phạm vi tiếp cận chiến dịch.
- Thông tin sai lệch và thao túng chính trị. Các video Deepfake của những chính trị gia hoặc các nguồn đáng tin cậy được sử dụng để tác động đến dư luận.
- Thao túng cổ phiếu. Các tài liệu deepfake giả mạo được sử dụng để tác động đến giá cổ phiếu của công ty. Ví dụ, một video fake về một giám đốc điều hành đưa ra những tuyên bố gây tổn hại về công ty có thể làm giảm giá cổ phiếu. Một video fake về một bước đột phá công nghệ hoặc ra mắt sản phẩm có thể làm tăng giá cổ phiếu của công ty.
- Nhắn tin. Báo cáo "Mối đe dọa ngày càng tăng của Deepfake" từ Bộ An ninh Nội địa Hoa Kỳ đã trích dẫn tin nhắn văn bản là một ứng dụng trong tương lai của công nghệ deepfake. Theo báo cáo, những kẻ đe dọa có thể sử dụng các kỹ thuật deepfake để sao chép phong cách nhắn tin của người dùng.
- Giáo dục. Các nền tảng giáo dục cũng đang sử dụng công nghệ deepfake để phát triển những gia sư AI cung cấp hỗ trợ cá nhân cho học sinh. Ví dụ, Claude, trợ lý AI giáo dục từ Anthropic, trả lời các câu hỏi của học sinh, làm rõ những khái niệm và xác định lỗ hổng trong hiểu biết.
Deepfake có hợp pháp không?
Deepfake nói chung là hợp pháp và cơ quan thực thi pháp luật không thể làm gì nhiều với chúng, mặc dù chúng gây ra những mối đe dọa nghiêm trọng. Deepfake chỉ bất hợp pháp nếu chúng vi phạm các luật hiện hành như khiêu dâm trẻ em, phỉ báng hoặc ngôn từ kích động thù địch.
Ít nhất 40 tiểu bang tại Hoa Kỳ đang chờ ban hành luật nhằm vào việc sử dụng deepfake. Theo một bài báo của Bloomberg Law, 5 tiểu bang đã cấm deepfake nhằm mục đích tác động đến các cuộc bầu cử và 7 tiểu bang đang xem xét ban hành luật vào năm 2024 để áp dụng lệnh cấm. Ít nhất 10 tiểu bang đã ban hành luật khiến nội dung khiêu dâm deepfake không có sự đồng thuận trở thành bất hợp pháp.
Việc thiếu luật chống lại deepfake là do hầu hết mọi người không biết về công nghệ này, cũng như cách sử dụng và mối nguy hiểm của nó. Vì lý do này, nạn nhân không được pháp luật bảo vệ trong hầu hết các trường hợp deepfake.
Tuy nhiên, một số nỗ lực lập pháp gần đây đã được thực hiện, nếu được thông qua, sẽ coi các video deepfake cực kỳ độc hại là bất hợp pháp và bảo đảm những hành động pháp lý chống lại chúng.
Các phương pháp phát hiện deepfake
Có một số biện pháp để phát hiện các cuộc tấn công deepfake. Sau đây là các dấu hiệu có thể có của nội dung deepfake:
- Vị trí khuôn mặt bất thường.
- Chuyển động cơ thể hoặc khuôn mặt không tự nhiên.
- Màu sắc không tự nhiên.
- Video trông lạ khi phóng to hoặc thu nhỏ.
- Âm thanh không nhất quán.
- Những người không chớp mắt.
- Độ lệch nhỏ trong ánh sáng phản chiếu trong mắt của đối tượng.
- Độ lão hóa của da không khớp với độ lão hóa của tóc và mắt.
- Kính không bị chói hoặc góc chói vẫn giữ nguyên bất chấp chuyển động của người đó.
Trong deepfake dạng văn bản, có một số dấu hiệu như:
- Viết sai chính tả.
- Câu không trôi chảy tự nhiên.
- Địa chỉ email nguồn đáng ngờ.
- Cụm từ không khớp với người gửi dự định
- Tin nhắn không theo ngữ cảnh không liên quan đến bất kỳ cuộc thảo luận, sự kiện hoặc vấn đề nào.
Tuy nhiên, AI đang dần khắc phục một số dấu hiệu này, chẳng hạn như với các công cụ hỗ trợ nháy mắt tự nhiên và những bằng chứng sinh trắc học khác.
Cách phòng thủ chống lại deepfake
Các công ty, tổ chức và cơ quan chính phủ, chẳng hạn như Cơ quan Dự án Nghiên cứu Quốc phòng Tiên tiến của Bộ Quốc phòng Hoa Kỳ, đang phát triển công nghệ để xác định và chặn deepfake. Một số công ty mạng xã hội sử dụng công nghệ blockchain để xác minh nguồn video và hình ảnh trước khi cho phép chúng xuất hiện trên nền tảng của họ. Theo cách này, các nguồn đáng tin cậy được thiết lập và ngăn chặn hàng giả. Theo hướng này, Meta và X, trước đây gọi là Twitter, đều đã cấm deepfake độc hại.
Nhiều tổ chức cung cấp phần mềm bảo vệ chống deepfake, bao gồm các công ty sau:
- Adobe cung cấp một hệ thống cho phép người sáng tạo đính kèm chữ ký vào video và ảnh với thông tin chi tiết về tác phẩm của họ.
- Intel FakeCatcher ưu tiên tốc độ và hiệu quả bằng cách phân tích các chi tiết sinh lý tinh tế như sự thay đổi pixel trong lưu lượng máu để đạt được độ chính xác cao trong phát hiện thời gian thực.
- Microsoft cung cấp phần mềm phát hiện deepfake hỗ trợ AI, phân tích video và ảnh để cung cấp điểm tin cậy cho biết phương tiện truyền thông có bị thao túng hay không.
- Operation Minerva sử dụng danh mục các deepfake đã phát hiện trước đó để cho biết liệu video mới có phải chỉ là bản sửa đổi của một bản giả hiện có đã được phát hiện và cung cấp dấu vân tay kỹ thuật số hay không.
- Sensity AI cung cấp nền tảng phát hiện sử dụng deep learning để phát hiện dấu hiệu của phương tiện truyền thông tổng hợp theo cùng cách các công cụ chống phần mềm độc hại tìm kiếm virus signature và phần mềm độc hại. Người dùng sẽ được cảnh báo qua email khi họ xem một video deepfake.
- Sentinel là một tùy chọn dựa trên đám mây cung cấp khả năng phát hiện deepfake theo thời gian thực bằng cách sử dụng nhiều công nghệ khác nhau bao gồm kiểm tra tính nhất quán theo thời gian, phân tích điểm mốc trên khuôn mặt và phát hiện những điểm bất thường.