Bạn đã bao giờ muốn chỉnh sửa tác phẩm DALL-E 3 của mình ngay lập tức nhưng không biết cách thực hiện chưa? Tin vui là OpenAI đã thêm các công cụ chỉnh sửa nội tuyến vào DALL-E 3 trong ChatGPT, cho phép thực hiện những chỉnh sửa đối với tác phẩm của mình mà không cần rời khỏi ứng dụng.
Vấn đề duy nhất là họ không thực hiện những gì OpenAI quảng cáo và rất khó xác định liệu có nhận được những chỉnh sửa như mong muốn hay không. Tuy nhiên, đó vẫn là bước khởi đầu cho những gì sẽ xảy ra trong quá trình chỉnh sửa DALL-E 3 và đây là cách chúng hoạt động.
Công cụ chỉnh sửa của DALL-E 3 là gì?
Chúng đã xuất hiện được một thời gian nhưng OpenAI cuối cùng đã thêm chức năng chỉnh sửa vào DALL-E 3 trong ChatGPT Plus. Trước đó, bạn có thể thử chỉnh sửa các tác phẩm DALL-E 3 của mình nhưng thông thường, việc này sẽ luôn tạo ra một hình ảnh hoàn toàn mới. Ngay cả khi prompt được sử dụng để tạo hình ảnh đã chỉnh sửa cực kỳ giống với prompt đầu tiên, do bản chất của AI tạo ra, kết quả đầu ra có thể khác biệt đáng kể.
Các công cụ chỉnh sửa tích hợp của DALL-E 3 hiện nhằm mục đích khắc phục các sự cố trong cùng một hình ảnh mà không cần tạo prompt mới. Bạn đánh dấu một khu vực trong hình ảnh muốn điều chỉnh, nhắc DALL-E thực hiện một thay đổi cụ thể (chẳng hạn như "xóa phần này" hoặc "thêm tính năng này") và nó sẽ hoạt động.
Ví dụ trên blog chính thức của OpenAI cho thấy DALL-E thêm hoa anh đào vào hình ảnh con mèo theo phong cách Ukiyo-e và mọi thứ hoạt động hoàn hảo. Theo kinh nghiệm, các công cụ chỉnh sửa của DALL-E gặp khó khăn trong việc thêm hình ảnh chi tiết như vậy vào hình ảnh hiện có và phần lớn không thể xử lý các yêu cầu thuộc loại này.
Điều đó không có nghĩa là các công cụ chỉnh sửa không hoạt động. Chúng hoàn toàn có thể loại bỏ các tính năng và thực hiện những thay đổi nhỏ, như chi tiết bên dưới, nhưng tất cả chỉ ở quy mô nhỏ.
Cách sử dụng các công cụ chỉnh sửa của DALL-E 3
Cách tốt nhất để cho thấy công cụ chỉnh sửa của DALL-E 3 có thể làm gì là đưa ra một số ví dụ thích hợp.
Loại bỏ và xóa
Các công cụ chỉnh sửa của DALL-E 3 có thể xóa một số chi tiết nhỏ, nhưng nó chắc chắn sẽ gặp khó khăn. Trong hình ảnh sau đây, tác giả bài viết đã yêu cầu DALL-E tạo ra "Một bàn tay robot cầm một con chip hình vuông trong suốt, phát sáng với dòng chữ 'AI Accelerated' được viết trên đó. Nền có màu xanh đậm, tạo ra bầu không khí tương lai và công nghệ cao".
Bây giờ, văn bản viết là một vấn đề đối với Generative AI, nên không ngạc nhiên khi phần chữ bị sai - vì vậy tác giả đã yêu cầu DALL-E xóa lỗi chính tả. Nó đã thất bại trong lần thử đầu tiên với prompt "vui lòng xóa từ này" nhưng đã thành công ở lần thử thứ hai với prompt "vui lòng xóa từ này khỏi hình ảnh". Vì vậy, bạn có thể phải thử các prompt khác nhau để có kết quả mong muốn. Sau đó, tác giả yêu cầu nó di chuyển các chữ cái AI đến giữa hình vuông, nó hoạt động rất tốt mặc dù vì lý do nào đó khiến PC gặp lỗi.
Tiếp theo, tác giả yêu cầu DALL-E chỉnh sửa hình ảnh một chiếc tivi. DALL-E rất tốt để tạo ra những hình ảnh độc đáo, nhưng nó có một số chi tiết sai hoặc cung cấp văn bản bị biến dạng. Trong trường hợp này, thanh thông tin trên màn hình TV hiển thị dòng chữ AI vô nghĩa nên tác giả muốn xóa nó đi. Lần thử đầu tiên của DALL-E để lại một cái bóng ở thanh thông tin, lần thử thứ hai và thứ ba sạch sẽ hơn nhiều. Không hoàn hảo nhưng đủ tốt cho mục đích sử dụng hình ảnh ban đầu.
Thêm và thay đổi
DALL-E 3 có thể thực hiện một số thay đổi đối với hình ảnh, nhưng một lần nữa, điều đó phụ thuộc vào quy mô của nội dung bạn yêu cầu. Có thể có những bổ sung và thay đổi nhỏ nhưng trong hầu hết các trường hợp, công cụ chỉnh sửa của DALL-E không thể xử lý những gì được yêu cầu.
Tác giả đã yêu cầu DALL-E "tạo hình ảnh cận cảnh 4k 2:1 của mắt người, thật chi tiết", dẫn đến hình ảnh sau:
Khá ổn (trừ lông mi), nhưng tác giả muốn chuyển màu mống mắt sang màu xanh lam, dẫn đến hình ảnh này:
Màu sắc hơi xỉn nhưng không thay đổi, một số chi tiết hơi cong.
Tiếp theo, tác giả yêu cầu DALL-E "tạo hình ảnh theo phong cách đất sét 4k 2:1 về một người mặc bộ đồ liền thân hình con hổ đang trượt tuyết xuống dốc với nền là người tuyết".
Một lần nữa, hình ảnh gốc tốt, sắc nét, màu sắc sống động và phù hợp với prompt. Tuy nhiên, tác giả muốn chuyển người tuyết sang một loại động vật đáng sợ khác.
Thay vì đổi người tuyết lhành một con vật khác, nó lại biến mất hoàn toàn. Tác giả quay lại hình ảnh ban đầu và yêu cầu thêm một người tuyết khác nhưng nó không thực hiện được. Tương tự, kết quả cũng thất bại khi tác giả yêu cầu thêm nhiều cây vào hình ảnh.
Thêm văn bản
Như đã nói, Generative AI thường gặp khó khăn với văn bản và việc thêm văn bản vào hình ảnh thậm chí còn khó khăn hơn. Tác giả đã yêu cầu DALL-E tạo tấm bưu thiếp từ một bờ biển ở Anh, và nó đã ghi lại khung cảnh một cách độc đáo. Sau đó, tác giả muốn thêm dòng chữ "Sunny Beach" vào hình ảnh nhưng công cụ không thể xử lý được.
Nghĩa là, cho đến sau khoảng 6 hoặc 7 prompt qua lại nhắc nhở DALL-E những gì nó cần làm, công cụ đã tạo ra một hình ảnh hoàn toàn mới với văn bản được yêu cầu.
Tiếp theo là thiệp sinh nhật. Lần này, DALL-E đã thêm "Happy Birthday" mà không cần nhắc. Vì vậy, tác giả đã yêu cầu nó thêm ngày sinh nhật vào tấm thiệp. Một lần nữa, DALL-E không thể thêm ngày vào thiệp nhưng sau một vài prompt, nó đã tạo ra một hình ảnh mới có ngày được yêu cầu. Trong trường hợp này, việc tự mình thêm ngày tháng sẽ dễ dàng hơn, đặc biệt nếu muốn giữ lại ảnh gốc.
Các công cụ chỉnh sửa của DALL-E rất hữu ích nhưng cần một chút kiên trì
Các công cụ chỉnh sửa của DALL-E rất hữu ích cho một số tác vụ nhất định nhưng phải mất một thời gian để chỉnh sửa đúng cách. Nó sẽ không hoạt động trong nhiều trường hợp và có lẽ tốt hơn hết nên thực hiện prompt ban đầu và điều chỉnh nó để tạo một hình ảnh mới.
Các công cụ chỉnh sửa của DALL-E có thể sẽ cải thiện theo thời gian, nhưng cho đến lúc đó, tốt hơn hết nên chỉnh sửa hình ảnh của mình bằng công cụ chỉnh sửa hình ảnh thay vì trải qua nhiều vòng trò chuyện tốn thời gian với DALL-E.