Sau tất cả những đồn đoán và tuyên bố về khả năng của GPT-4, phiên bản thứ tư được mong đợi nhiều của họ mô hình ngôn ngữ GPT đã ra mắt vào ngày 14 tháng 3 năm 2023.
GPT-4 không đi kèm với một số tính năng được đồn đại nhiều trong thời gian qua. Tuy nhiên, mô hình mới nhất cải thiện đáng kể so với GPT-3.5 và các phiên bản tiền nhiệm của nó. Vậy GPT-4 khác với GPT-3.5 như thế nào? Cùng Quantrimang.com tìm hiểu qua bài viết sau đây nhé!
1. Sự sáng tạo
Một trong những lợi thế rõ rệt nhất của mô hình GPT-4 so với GPT-3.5 là khả năng đưa ra các câu trả lời sáng tạo hơn cho những truy vấn. Tuy nhiên, GPT-3.5 cũng rất sáng tạo. Có một danh sách dài những điều sáng tạo mà bạn có thể thực hiện với ChatGPT sử dụng mô hình này.
Tuy nhiên, GPT-4 còn được nâng tầm hơn nữa. Mặc dù lợi thế sáng tạo của GPT-4 có thể không rõ ràng khi cố gắng giải quyết các vấn đề cơ bản, nhưng sự khác biệt về khả năng sáng tạo giữa cả hai mô hình trở nên rõ ràng khi nhiệm vụ trở nên khó hơn và đòi hỏi mức độ sáng tạo cao hơn.
Ví dụ, nếu bạn yêu cầu cả hai phiên bản hoàn thành một nhiệm vụ sáng tạo như viết một bài thơ bằng cả tiếng Anh và tiếng Pháp, thì ChatGPT đi kèm GPT-4 mới nhất sẽ mang lại kết quả tốt hơn. Phản hồi của GPT-4 sẽ sử dụng cả hai ngôn ngữ trên mỗi dòng, trong khi, GPT-3.5 sẽ luân phiên giữa cả hai ngôn ngữ, mỗi dòng sử dụng một ngôn ngữ lần lượt.
2. Đầu vào hình ảnh
GPT-3.5 chỉ có thể chấp nhận lời nhắc văn bản, trong khi GPT-4 là đa phương thức và có thể chấp nhận cả đầu vào văn bản và hình ảnh. Từ một hình ảnh của một bài toán viết tay đến các meme Reddit, GPT-4 có thể hiểu và mô tả hầu hết mọi hình ảnh. Không giống như GPT-3, GPT-4 vừa là ngôn ngữ vừa là mô hình trực quan.
Trong buổi phát trực tiếp thông báo về GPT-4, một kỹ sư OpenAI đã cung cấp cho mô hình một ảnh chụp màn hình của máy chủ Discord. GPT-4 có thể mô tả mọi chi tiết trên đó, bao gồm tên của những người dùng trực tuyến vào thời điểm đó. Một hình ảnh mockup vẽ tay của một trang web cũng được cung cấp cho mô hình với các hướng dẫn để biến nó thành một trang web và thật ngạc nhiên, GPT-4 đã cung cấp một code hoạt động cho một trang web phù hợp với hình ảnh.
3. Phản hồi an toàn hơn
Mặc dù GPT-4 không hoàn hảo nhưng các biện pháp mà nó áp dụng để đảm bảo phản hồi an toàn hơn là một bản nâng cấp đáng hoan nghênh so với mô hình GPT-3.5. Với GPT-3.5, OpenAI đã thực hiện một cách tiếp cận an toàn dựa trên sự kiểm duyệt. Nói cách khác, một số biện pháp an toàn đã được xem xét kỹ hơn. OpenAI theo dõi những gì người dùng đã làm và các câu hỏi họ hỏi, xác định các lỗi và cố gắng khắc phục chúng.
Với GPT-4, hầu hết các biện pháp an toàn đã được đưa vào hệ thống. Để hình dung sự khác biệt, nó giống như việc xây dựng một ngôi nhà bằng những vật liệu chắc chắn ngay từ đầu so với việc sử dụng bất cứ thứ gì sau đó để sửa chữa mọi thứ khi lỗi xuất hiện. Theo báo cáo kỹ thuật GPT-4 của OpenAI [PDF], GPT-4 chỉ tạo ra 0,73% phản hồi độc hại, ít hơn nhiều so với 6,48% phản hồi độc hại của GPT-3.5.
4. Tính thực tế của phản hồi
Một trong những sai sót của GPT-3.5 là xu hướng tạo ra thông tin vô nghĩa và không trung thực một cách tự tin. Điều này được gọi là "ảo giác AI" và có thể gây mất lòng tin vào thông tin do AI tạo ra.
Trong GPT-4, ảo giác AI vẫn là một vấn đề. Tuy nhiên, theo báo cáo kỹ thuật của GPT-4, mô hình mới có khả năng gây ảo giác thấp hơn từ 19% đến 29% so với mô hình GPT-3.5. Phản hồi từ mô hình GPT-4 trên ChatGPT cũng thực tế hơn đáng kể.
5. Cửa sổ ngữ cảnh
Một điểm khác biệt ít được nói đến giữa GPT-4 và GPT-3.5 là cửa sổ ngữ cảnh và kích thước ngữ cảnh. Cửa sổ ngữ cảnh là lượng dữ liệu mà một mô hình có thể giữ lại ở "bộ nhớ" của nó trong phiên trò chuyện và trong bao lâu. GPT-4 có kích thước ngữ cảnh và cửa sổ tốt hơn đáng kể so với phiên bản trước đó.
Về mặt thực tế, điều này nghĩa là GPT-4 có thể nhớ ngữ cảnh của cuộc trò chuyện, cũng như các hướng dẫn được đưa ra trong cuộc trò chuyện, lâu hơn.
Một vấn đề với GPT-3.5 là mô hình có xu hướng lạc đề hoặc không tuân theo hướng dẫn bạn muốn tiến hành trong quá trình trò chuyện. Ví dụ, bạn có thể yêu cầu mô hình gọi bạn bằng tên riêng và nó sẽ làm như vậy trong một thời gian nhưng sau đó không thực hiện theo các hướng dẫn đó nữa. Mặc dù sự cố này vẫn tồn tại với GPT-4, nhưng giảm đi do có cửa sổ ngữ cảnh tốt hơn.
Một vấn đề khác là giới hạn về khối lượng văn bản mà bạn có thể sử dụng trong lời nhắc cùng một lúc. Tóm tắt văn bản dài bằng GPT-3 thường chia văn bản thành nhiều phần và tóm tắt chúng từng chút một. Sự cải thiện về độ dài ngữ cảnh trong mô hình GPT-4 có nghĩa là bạn có thể dán toàn bộ file PDF một lần và có được tóm tắt mà không cần chia thành nhiều phần.
Không còn nghi ngờ gì nữa, GPT-4 là một bước tiến đáng kể so với phiên bản tiền nhiệm. Mặc dù vẫn còn gặp phải một số hạn chế như trong GPT-3.5, nhưng những cải tiến đáng kể trong một số lĩnh vực và việc bổ sung các chức năng mới khiến mô hình này trở thành một bước tiến mới thú vị trong quá trình theo đuổi những mô hình ngôn ngữ AI thực sự thông minh.