Sự khác biệt giữa Midjourney v5 và v4

Midjourney là công ty hàng đầu trong lĩnh vực nghệ thuật sáng tạo AI. Với mỗi phiên bản mới, Midjourney ngày càng làm mờ ranh giới giữa thực tế và giả tưởng. Nhờ sự phát triển không ngừng trong các thuật toán nhằm tăng cường tính chân thực và phạm vi động, cùng với nhiều đặc điểm và tính năng khác, Midjourney tiếp tục khiến người dùng kinh ngạc sau mỗi bản cập nhật mới.

Midjourney v5 hiện đã chính thức ra mắt

Midjourney v5
Midjourney v5

Midjourney v5 được phát hành ở dạng beta vào ngày 16 tháng 3 năm 2023. Bạn có thể truy cập dịch vụ này thông qua Discord, một nền tảng trò chuyện thoại và video phổ biến với các game thủ. Sau đó, bạn sẽ có thể truy cập máy chủ Midjourney trong Discord và bắt đầu tạo những tác phẩm nghệ thuật AI.

Người dùng Midjourney hiện tại có thể truy cập v5 bằng cách nhập /Settings rồi nhấp vào MJ version 5 trong menu như hình bên dưới.

Cách truy cập Midjourney v5
Cách truy cập Midjourney v5

Điều đáng chú ý là nếu bạn là người mới và chưa từng sử dụng Midjourney trước đây, bạn sẽ được dùng thử miễn phí, giới hạn 25 lần tạo hình ảnh. Hãy sử dụng một cách khôn ngoan vì bạn rất dễ dàng dùng hết chỉ trong vài phút.

Nếu bạn muốn tiếp tục với Midjourney trên cơ sở đăng ký, thì có 3 cấp độ. Truy cập trang tài khoản của Midjourney để mua gói. Bài viết đề xuất gói Standard cho những người dùng nghiêm túc có ý định sử dụng nền tảng thường xuyên.

Midjourney v5 so với Midjourney v4 có những thay đổi gì?

Cải tiến tính năng nhận được nhiều tiếng vang nhất là về bàn tay.

Hãy xem cách v4 xử lý các bàn tay trong một tình huống ảnh chân dung bằng cách sử dụng nội dung "a portrait of an old man with folded hands on lap" (bức chân dung của một ông già với hai bàn tay khoanh lại trên đùi):

Cách Midjourney v4 tạo ra kết quả từ nội dung đã cho
Cách Midjourney v4 tạo ra kết quả từ nội dung đã cho

Đây là cách Midjourney v5 cho ra kết quả từ cùng một nội dung:

Ví dụ về cách xử lý bàn tay trong Midjourney v5
Ví dụ về cách xử lý bàn tay trong Midjourney v5

Phải mất 4 lần trong v5 để đạt được kết quả bàn tay đang gập lại trông giống như thật (hình dưới cùng bên phải). Trớ trêu thay, bạn sẽ thường thấy những cải tiến đối với bàn tay trong những hình ảnh được tạo từ nội dung không được đề cập cụ thể đến nó. Bây giờ, hãy so sánh lời nhắc "full-length portrait of an old man" (chân dung toàn thân của một ông già) giữa Midjourney v4 và v5.

Midjourney v4:

Chân dung đầy đủ của một ông già trong Midjourney v4
Chân dung đầy đủ của một ông già trong Midjourney v4

Midjourney v5:

Chân dung đầy đủ của một ông già trong Midjourney v5
Chân dung đầy đủ của một ông già trong Midjourney v5

Trong những trường hợp như thế này, các bàn tay trong Midjourney v5 trông tự nhiên hơn nhiều với v4.

Có một số khác biệt lớn nữa giữa Midjourney v4 và Midjourney v5:

Tạo những hình ảnh người thực tế và độc đáo từ đầu

Một trong những điểm hấp dẫn chính đối với người dùng Midjourney là khả năng tạo các cá nhân trông rất thực dựa trên nội dung văn bản đơn thuần. Đối với các loại yêu cầu này, sự khác biệt giữa Midjourney v4 và v5 là khá lớn. Đây là một so sánh trực tiếp khác, sử dụng lời nhắc "the artist in her studio" (người nghệ sĩ trong phòng làm việc).

Midjourney v4:

Kết quả trong Midjourney v4
Kết quả trong Midjourney v4

Midjourney v5:

Kết quả trong Midjourney v5
Kết quả trong Midjourney v5

Tạo hình ảnh người nổi tiếng

Tương tự, Midjourney v5 vượt trội so với phiên bản tiền nhiệm v4 về mặt này. Ví dụ tiếp theo với nội dung "a color portrait of Tom Cruise, studio strobe lighting" (một bức chân dung màu của Tom Cruise, ánh sáng nhấp nháy trong studio).

Midjourney v4:

Hình ảnh Tom Cruise trong Midjourney v4
Hình ảnh Tom Cruise trong Midjourney v4

Midjourney v5:

Hình ảnh Tom Cruise trong Midjourney v5
Hình ảnh Tom Cruise trong Midjourney v5

Độ phân giải và tốc độ nâng cấp

Hai thay đổi đáng chú ý nữa giữa Midjourney v4 và v5 là tăng cường độ phân giải và thời gian xử lý nâng cấp nhanh hơn. Việc tăng độ phân giải có thể được nhìn thấy ở cả chi tiết (đặc biệt là vải) và kích thước file. Đây là hai trong số những hình ảnh Tom được tạo trước đó.

Midjourney v4:

Hình ảnh Tom toàn màn hình trong Midjourney v4
Hình ảnh Tom toàn màn hình trong Midjourney v4

Kích thước file PNG là 1,22 MB.

Midjourney v5:

Hình ảnh Tom toàn màn hình trong Midjourney v5
Hình ảnh Tom toàn màn hình trong Midjourney v5

Kích thước file PNG là 1,30 MB.

Việc tăng tốc độ nâng cấp của Midjourney v5 là do Midjourney dường như tạo ra các phiên bản nâng cấp đồng thời với việc xử lý lời nhắc ban đầu. Vì vậy, khi bạn nhấp vào một trong các hình ảnh để nâng cấp, kết quả thường xuất hiện ngay lập tức nếu bạn không có quá nhiều công việc trong hàng đợi. Trong tất cả các phiên bản trước, bạn phải đợi lời nhắc nâng cấp được xử lý từ đầu.

Riêng thay đổi này có thể giúp một số người dùng Midjourney v5 tiết kiệm hàng giờ mỗi tháng cho các nhiệm vụ nâng cấp.

Vật dụng hàng ngày

Các đối tượng cũng được tăng cường tính chân thực, nếu đó là mục tiêu. Hãy xem hai kết xuất của "một quả bóng rổ".

Midjourney v4:

Yêu cầu tạo hình ảnh bóng rổ trong Midjourney v4
Yêu cầu tạo hình ảnh bóng rổ trong Midjourney v4

Midjourney v5:

Yêu cầu tạo hình ảnh bóng rổ trong Midjourney v5
Yêu cầu tạo hình ảnh bóng rổ trong Midjourney v5

Các đồ vật hàng ngày thực sự giống như "gót chân Achilles" đôi khi đối với Midjourney, tương tự như bàn tay. Cả hai phiên bản đều không làm quá tốt với một nội dung đơn giản như "cái búa".

Midjourney v4:

Phiên bản cái búa trong Midjourney v4
Phiên bản cái búa trong Midjourney v4

Midjourney v5:

Phiên bản cái búa trong Midjourney v5
Phiên bản cái búa trong Midjourney v5

Việc đánh giá phiên bản nào tốt hơn trong trường hợp này mang tính chủ quan, tùy thuộc vào mục tiêu của người tạo. Nhưng Midjourney v5 sẽ tỏa sáng hơn v4 khi bạn áp dụng các lời nhắc chi tiết hơn. Chi tiết sẽ đề cập trong phần tiếp theo.

Lời nhắc phức tạp

Kết quả tốt nhất trong Midjourney thường được tạo khi người dùng nhập nội dung chi tiết và được soạn thảo cẩn thận. Ngoài việc thêm trọng số và các công cụ sửa đổi nối thêm để giúp xây dựng hình ảnh, việc bao gồm nhiều mô tả được phân tách bằng dấu phẩy dường như là một phương pháp hay nhất mà nhiều người dùng Midjourney có kinh nghiệm sẽ thực hiện.

Midjourney v5 xử lý những nội dung này thậm chí còn tốt hơn so với các phiên bản trước. Nội dung sau sẽ được sử dụng để kiểm tra từng phiên bản, "A lone man facing a lake, birds flying overhead, a mountain glistens against the sky in the distance, a partly cloudy sky, a fishing boat in the middle of the lake, in the style of Marc Chagall" (Một người đàn ông đơn độc đối mặt với hồ nước, những chú chim bay trên đầu, ngọn núi lấp lánh trên bầu trời phía xa, bầu trời có mây, một chiếc thuyền đánh cá giữa hồ, theo phong cách của Marc Chagall).

Midjourney v4:

Kết quả của Midjourney v4
Kết quả của Midjourney v4

Midjourney v5:

Kết quả của Midjourney v5
Kết quả của Midjourney v5

Trong ví dụ này, Midjourney v4 không làm tốt công việc của mình. Trên thực tế, v4 tỏa sáng trong việc tạo ra các cảnh quan sáng tạo và xử lý những truy vấn trừu tượng. Nhưng Midjourney v5 làm tốt hơn nhiều ở cả các chi tiết liên quan và bắt chước phong cách của họa sĩ nổi tiếng.

Lời nhắc phức tạp trong v5 có thể được đưa vào sử dụng để tạo nền chân dung với Midjourney.

Midjourney v4 so với Midjourney v5: Tống cựu nghinh tân

Midjourney v5 vượt trội so với v4 về trải nghiệm hình ảnh tổng thể. Phiên bản v5 mới có thể dễ dàng được coi là một vũ trụ khác, cả về độ chân thực và chi tiết.

Một trong những yếu tố quan trọng là sự gia tăng phạm vi động trong rất nhiều trong hình ảnh của Midjourney v5. Sự khác biệt giữa Midjourney v5 và v4 giống như chụp ảnh phong cảnh núi non bằng một máy ảnh cũ và một máy ảnh "xịn" giá $10.000. Hai phiên bản cách xa nhau quá!

Midjourney đang được cải thiện qua mỗi phiên bản với những bước tiến lớn. Rất có thể Midjourney và các công ty tương tự sẽ cách mạng hóa hoàn toàn cách chúng ta sáng tạo và tương tác với nghệ thuật nếu những phiên bản tiếp theo cũng tuyệt vời như v5.

Thứ Năm, 23/03/2023 17:00
51 👨 472
0 Bình luận
Sắp xếp theo
    ❖ Trí tuệ nhân tạo (AI)