Google có mô hình AI chuyển văn bản thành hình ảnh của riêng mình có tên Imagen, với phiên bản hiện tại là Imagen 2. Ngay cả khi bạn không phải là nhà phát triển hay doanh nghiệp, Imagen 2 rất đáng để thử - nó miễn phí bằng cách sử dụng Google Cloud. Đây là những gì bạn cần biết!
Imagen 2 của Google là gì?
Imagen 2 là mô hình chuyển văn bản thành hình ảnh AI do Google phát triển và phát hành vào ngày 13 tháng 12 năm 2023. Mô hình này bổ sung vào danh sách ngày càng tăng các trình tạo hình ảnh từ văn bản bằng AI, chẳng hạn như DALL-E 2, Midjourney và Stable Diffusion, tất cả đều có thể tạo ngay những hình ảnh tuyệt vời từ phần mô tả văn bản.
Imagen 2 đã có một bước tiến vượt bậc so với phiên bản tiền nhiệm (Imagen) và cung cấp một trình tạo hình ảnh AI đầy đủ chức năng có thể tạo ra các kết quả đầu ra mang tính nghệ thuật và chân thực giống như bất kỳ đối thủ cạnh tranh nào. Nó được lưu trữ trong bộ công cụ Vertex AI của Google mà bạn có thể truy cập bằng tài khoản Google Cloud.
Để so sánh, phiên bản đầu tiên của Imagen, ra mắt từ tháng 5 năm 2022, có bản phát hành beta giới hạn thông qua ứng dụng có tên AI Test Kitchen. Người dùng chỉ có thể thử tạo ra cảnh quan thành phố hoặc các nhân vật trông giống như bước ra từ một bộ phim hoạt hình Pixar.
Imagen 2 tự hào có các tính năng như inpainting và outpainting, cho phép bạn thêm nội dung vào hình ảnh được tạo hoặc mở rộng hình ảnh ra ngoài đường viền. Đây là một tính năng mà DALL-E 2 cũng có, nhưng điều làm nên sự khác biệt của Imagen là tùy chọn sử dụng hình ảnh tham chiếu khi tạo hình ảnh.
Nếu bạn đang tìm kiếm một công cụ biến văn bản thành hình ảnh có thể giải quyết vấn đề về bàn tay do AI tạo ra thì bạn nên khám phá các khả năng của Imagen 2. Kết quả vẫn chưa hoàn hảo nhưng đó là khía cạnh mà Google đặc biệt chú ý khi phát triển công cụ.
Cách tự mình thử nghiệm Imagen 2
Imagen 2 hướng đến các nhà phát triển và doanh nghiệp, nhưng nếu là cá nhân, bạn vẫn có thể dùng thử bằng cách đăng ký tài khoản Google Cloud miễn phí. Nhấp vào nút Start Free ở góc trên cùng bên phải của trang, sau đó làm theo hướng dẫn để thiết lập tài khoản thanh toán.
Bạn sẽ cần thêm thẻ tín dụng để thanh toán nhưng bạn không cần phải lo lắng về các khoản phí trong tương lai. Google tuyên bố rõ ràng rằng bạn sẽ không tự động bị tính phí sau khi thời gian dùng thử miễn phí kết thúc.
Sau khi bạn đã tạo tài khoản, hãy nhấp vào nút Console trên trang chủ Google Cloud, sau đó nhấp vào menu hamburger (ba dòng ngang) ở góc trên cùng bên trái. Trong menu, nhấp vào Vertex AI Vision. Khi ở trên trang này, hãy nhấp vào Studio từ bảng điều khiển bên trái hoặc nhấp vào nút Open Studio ở bên phải.
Google đã đào tạo mô hình Imagen AI như thế nào?
Phía sau hậu trường, Imagen được đào tạo bằng cách sử dụng bộ dữ liệu có sẵn công khai có tên LAION-400M, kết hợp với các bộ dữ liệu nội bộ. Không phải tất cả các công ty AI đều chọn công khai thông tin này; một ví dụ là DALL-E 2.
Việc sử dụng các bộ dữ liệu cũng đã trở thành một chủ đề gây tranh cãi, một phần do hoạt động thu thập hàng triệu hình ảnh từ Internet. Đặc biệt, các nghệ sĩ đã chỉ trích những công ty AI vì không nhận được sự đồng ý của chủ sở hữu hình ảnh hoặc tác phẩm nghệ thuật trước khi sử dụng nó để đào tạo các mô hình AI của mình.
Nếu lo ngại về hình ảnh của mình, bạn có thể tìm hiểu xem hình ảnh của mình có được sử dụng để đào tạo mô hình AI hay không và chọn không tham gia.
Sẽ không lâu nữa trước khi các công ty công nghệ lớn như Google bắt đầu thử nghiệm các mô hình AI. Imagen 2 là một trình tạo AI chuyển văn bản thành hình ảnh khác chắc chắn sẽ rất thú vị khi sử dụng.
Tạo một tài khoản Google Cloud miễn phí để thử và tải xuống ứng dụng AI Test Kitchen của Google để xem nhiều dự án đang được phát triển hơn bất kỳ ai khác.