OpenAI Dall-E 3 ra mắt: Nền tảng AI tạo sinh mang tính nhảy vọt

OpenAI vừa chính thức trình làng Dall-E 3, thế hệ tiếp theo của nền tảng AI tạo sinh nổi tiếng Dall-E, với điểm nhấn nhằm ở khả năng sáng tạo hình ảnh dựa trên văn bản được cải tiến mạnh mẽ, có thể xử lý "nhiều sắc thái và chi tiết hơn đáng kể" so với Dall-E 2.

OpenAI cho biết: “Các hệ thống chuyển văn bản thành hình ảnh hiện đại có xu hướng bỏ qua từng từ hoặc mô tả vụn vặt, buộc người dùng phải học kỹ thuật nhanh chóng. Tuy nhiên, Dall-E 3 thể hiện bước nhảy vọt về khả năng tạo ra hình ảnh tuân thủ chính xác văn bản bạn cung cấp”.

Nói cách khác, Dall-E 3 có khả năng hiểu bối cảnh tốt hơn, không bỏ qua những từ cụ thể như phiên bản trước. Điều này bao gồm việc tạo các kết xuất thậm chí là những chi tiết nhỏ nhất của lời nhắc văn bản, và đặt khoảng cách thích hợp giữa chúng và các thành phần khác của cảnh, chẳng hạn như mặt trăng phía trên đường phố trong hình ảnh bên dưới. Đặc biệt, Dall-E 3 hứa hẹn sẽ có thể tạo ra bàn tay con người chính xác hơn, một nhiệm vụ mà nhiều trình tạo hình ảnh AI hiện có luôn gặp khó.

OpenAI cho biết thuật toán AI trong DALL-E 3 đã được đào tạo nâng cao để hiểu rõ hơn ý nghĩa của văn bản đầu vào, thay vì chỉ tập trung vào một số từ khóa cụ thể như các phiên bản trước. Điều này cho phép DALL-E 3 có thể xem xét, đánh giá toàn bộ ngữ cảnh đầu vào để tạo ra hình ảnh phù hợp hơn.

Dall-E 3 sẽ được cung cấp cho các khách hàng sử dụng ChatGPT Plus và Enterprise từ tháng 10 thông qua giao diện lập trình ứng dụng (API). Người dùng có thể đưa ra yêu cầu hình ảnh và điều chỉnh lời nhắc thông qua cuộc trò chuyện với ChatGPT. Bằng cách kết hợp các kỹ năng ngôn ngữ của chatbot với trình tạo hình ảnh, ý tưởng mà OpenAI nhắm đến là giúp người dùng tạo ra những hình ảnh chính xác, với khả năng tùy chỉnh cao. Ngay cả với câu lệnh đơn giản, ChatGPT cũng có thể mở rộng thành câu lệnh dài chi tiết để hướng dẫn DALL-E 3.

Khi được gợi ý một ý tưởng, ChatGPT sẽ tự động tạo các lời nhắc chi tiết, phù hợp cho Dall-E 3 để biến ý tưởng của bạn thành hiện thực”. Nếu bạn thích một hình ảnh cụ thể nhưng nó không phù hợp lắm, bạn có thể yêu cầu ChatGPT chỉnh sửa chỉ bằng một vài từ.

Nhìn chung, sự ra mắt của Dall-E 3 đã đánh dấu một bước tiến quan trọng của công nghệ AI sáng tạo hình ảnh, hứa hẹn mở ra nhiều cơ hội mới cho các ứng dụng sáng tạo nội dung trong tương lai.

Tuy nhiên trong thông báo về Dall-E 3, OpenAI thừa nhận mối lo ngại ngày càng tăng xung quanh rủi ro lừa đảo lạm dụng hình ảnh do AI tạo ra. OpenAI cho biết: “Chúng tôi cũng đang nghiên cứu những cách tốt nhất để giúp mọi người xác định thời điểm hình ảnh được tạo bằng AI”. Công ty đang nghiên cứu một công cụ nội bộ để giải mã nghệ thuật do AI tạo ra so với nghệ thuật do con người tạo ra và cho biết họ sẽ sớm chia sẻ nhiều hơn. Hy vọng OpenAI sẽ sớm hồi sinh công cụ phát hiện văn bản do AI tạo ra. Công cụ này đã bị vô hiệu hóa vào tháng 7 do hiệu suất kém.

Thứ Năm, 21/09/2023 13:50
31 👨 562
0 Bình luận
Sắp xếp theo
    ❖ Trí tuệ nhân tạo (AI)