5 công cụ tạo hình ảnh AI mã nguồn mở tốt nhất

Các mô hình tạo hình ảnh từ văn bản dựa trên AI có ở khắp mọi nơi và ngày càng trở nên dễ dàng truy cập hơn hàng ngày. Mặc dù thật dễ dàng để truy cập một trang web và tạo hình ảnh đang tìm kiếm, nhưng các công cụ chuyển văn bản thành hình ảnh nguồn mở là lựa chọn tốt nhất nếu muốn kiểm soát nhiều hơn quá trình tạo.

Có hàng tá trình tạo hình ảnh AI từ văn bản miễn phí và mã nguồn mở có sẵn trên Internet chuyên về các loại hình ảnh cụ thể. Sau đây là 5 công cụ tạo hình ảnh AI mã nguồn mở tốt nhất mà bạn có thể thử ngay bây giờ.

1. Crayon

Craiyon
Craiyon

Craiyon là một trong những trình tạo hình ảnh AI nguồn mở dễ tiếp cận nhất. Nó dựa trên DALL-E Mini. Dù có thể sao chép kho lưu trữ Github và cài đặt mô hình cục bộ trên máy tính, Craiyon dường như đã bỏ phương pháp này để chuyển sang trang web.

Kho lưu trữ Github chính thức chưa được cập nhật kể từ tháng 6 năm 2022, nhưng model mới nhất vẫn được cung cấp miễn phí trên trang Craiyon chính thức. Không có ứng dụng Android hoặc iOS.

Về chức năng, bạn sẽ thấy tất cả các tùy chọn thông thường từ trình tạo hình ảnh AI. Sau khi nhập lời nhắc và nhận hình ảnh, có thể sử dụng tính năng nâng cao để nhận bản sao có độ phân giải lớn hơn. Có 3 phong cách để lựa chọn: Art, Photo và Drawing. Có thể chọn tùy chọn "None" nếu muốn mô hình quyết định.

2. Stable Diffusion 1.5

Stable Diffusion
Stable Diffusion

Stable Diffusion có lẽ là một trong những mô hình tạo văn bản thành hình ảnh nguồn mở phổ biến nhất. Nó cũng cung cấp năng lượng cho các mô hình khác, bao gồm 3 trình tạo hình ảnh. Nó được phát hành vào năm 2022 và đã có nhiều triển khai kể từ đó.

Chạy mô hình cũng khá dễ dàng. Giao diện người dùng web Stable Diffusion AUTOMATIC1111 đã được thử nghiệm và tất cả các tính năng điều khiển cũng như thông số đều hoạt động tốt. Stable Diffusion cũng có khả năng chống NSFW khá tốt nhờ cơ sở dữ liệu LAION-5B mà mô hình đã đào tạo (mặc dù không hoàn hảo). Mặc dù thời gian tạo sẽ thay đổi tùy theo phần cứng, nhưng bạn có thể mong đợi hình ảnh của mình chi tiết và chân thực ngay cả với những prompt cơ bản.

3. DreamShaper

DreamShaper
DreamShaper

DreamShaper là một mô hình tạo hình ảnh dựa trên Stable Diffusion. Nó được dự định là một giải pháp thay thế nguồn mở cho MidJourney và tập trung vào tính chân thực trong các hình ảnh được tạo ra, mặc dù nó cũng có thể xử lý các phong cách anime và hội họa chỉ với một vài chỉnh sửa.

Mô hình này có khả năng cao hơn Stable Diffusion, cho phép người dùng tự do hơn đối với kết quả đầu ra cuối cùng, từ cải tiến chớp nhoáng cho đến nới lỏng các hạn chế NSFW. Việc chạy mô hình cũng dễ dàng, với phiên bản được đào tạo trước, có thể tải xuống trực tuyến để truy cập cục bộ và một loạt các trang web, bao gồm Sinkin.ai, RandomSeed và Mage.space (yêu cầu đăng ký cơ bản) cho phép chạy mô hình với khả năng tăng tốc GPU.

4. InvokeAI

Invoke AI
Invoke AI

Invoke AI là một mô hình tạo hình ảnh dựa trên AI khác dựa trên Stable Diffusion, với phiên bản XL dựa trên Stable Diffusion XL. Nó cũng có giao diện người dùng dòng lệnh và web riêng, nghĩa là người dùng sẽ không phải gặp khó khăn với những thứ như giao diện người dùng web Stable Diffusion.

Mô hình tập trung vào việc cho phép người dùng tạo hình ảnh dựa trên tài sản trí tuệ của họ với quy trình làm việc tùy chỉnh. InvokeAI là một trong những mô hình tạo hình ảnh AI nguồn mở tốt nhất để đào tạo các mô hình tùy chỉnh và làm việc với sở hữu trí tuệ.

Kho lưu trữ Github chính thức của nó liệt kê hai phương pháp cài đặt: Cài đặt qua trình cài đặt của InvokeAI hoặc sử dụng PyPI nếu cảm thấy thoải mái với Terminal và Python, cũng như cần kiểm soát nhiều hơn đối với các gói được cài đặt cùng với mô hình.

Tuy nhiên, việc kiểm soát bổ sung có một số hạn chế, đáng chú ý nhất là các yêu cầu phần cứng chặt chẽ hơn. InvokeAI khuyến nghị GPU chuyên dụng có bộ nhớ ít nhất 4GB, khuyến nghị từ 6 đến 8GB để chạy biến thể XL. Yêu cầu VRAM áp dụng cho cả GPU AMD và Nvidia. Cũng sẽ cần ít nhất 12GB RAM và 12GB dung lượng ổ trống cho mô hình, các dependency của nó và Python.

5. Openjourney

Openjourney
Openjourney

Openjourney là mô hình tạo hình ảnh AI mã nguồn mở, miễn phí dựa trên Stable Diffusion. Nếu bạn thắc mắc tại sao mô hình này được gọi là Openjourney thì đó là vì nó đã được đào tạo về các hình ảnh Midjourney và có thể bắt chước phong cách trong các hình ảnh mà nó tạo ra.

PromptHero, công ty đứng sau Openjourney, cho phép thử nghiệm mô hình này cùng với các mô hình khác, bao gồm Stable Diffusion (phiên bản 1.5 và 2), DreamShaper và Realistic Vision. Khi đăng ký, bạn nhận được 25 credit miễn phí (một tín dụng cho mỗi hình ảnh được tạo), sau đó phải đăng ký cấp đăng ký Pro, có giá $9/tháng và cho phép truy cập 300 credit mỗi tháng với các tính năng độc quyền khác.

Thứ Hai, 29/04/2024 11:29
51 👨 464
0 Bình luận
Sắp xếp theo