OpenAI công bố GPT-4.1 - "mô hình thông minh nhất cho các tác vụ phức tạp"

OpenAI đã chính thức giới thiệu ba mô hình mới: GPT-4.1, GPT-4.1 mini và GPT-4.1 nano. Những mô hình này đi kèm với khả năng xử lý ngữ cảnh cực lớn lên tới 1 triệu token và giới hạn kiến thức được cập nhật đến tháng 6 năm 2024.

Công ty cho biết các mô hình này vượt trội hơn so với GPT-4o và GPT-4o mini vốn vừa được cập nhật gần đây nhưng đã ra mắt vào tháng 7 năm ngoái. Hiện tại GPT-4.1 chỉ khả dụng thông qua API, vì vậy bạn sẽ chưa thể sử dụng nó trực tiếp trong ChatGPT.

OpenAI lưu ý rằng GPT-4.1 sẽ chỉ có sẵn thông qua API. Trong ChatGPT, nhiều cải tiến về khả năng tuân thủ hướng dẫn, lập trình và trí thông minh đã được tích hợp dần vào phiên bản mới nhất của GPT-4o, và công ty sẽ tiếp tục bổ sung thêm trong các bản phát hành tương lai.

Các số liệu benchmark cho thấy những cải tiến đáng chú ý mà GPT-4.1 mang lại. Mô hình này đạt 54.6% trên SWE-bench Verified, tăng 21.4 điểm so với GPT-4o. Mô hình này đạt 38.3% trên MultiChallenge - một tiêu chuẩn đánh giá khả năng tuân thủ hướng dẫn, và thiết lập kỷ lục mới về khả năng hiểu video dài với điểm số 72.0% trên benchmark Video-MME, nơi các mô hình phân tích video dài tới một giờ mà không có phụ đề.

OpenAI cũng đã hợp tác với các đối tác alpha để kiểm tra hiệu suất của GPT-4.1 trong các trường hợp sử dụng thực tế.

  • Thomson Reuters đã thử nghiệm GPT-4.1 với trợ lý AI pháp lý CoCounsel. So với GPT-4o, GPT-4.1 ghi nhận mức tăng 17% về độ chính xác trong đánh giá đa tài liệu. Loại công việc này phụ thuộc nhiều vào khả năng theo dõi ngữ cảnh xuyên suốt nhiều nguồn và xác định các mối quan hệ phức tạp như các điều khoản mâu thuẫn hoặc các phụ thuộc ẩn, và GPT-4.1 đã thể hiện hiệu suất mạnh mẽ một cách nhất quán.
  • Carlyle đã sử dụng GPT-4.1 để trích xuất dữ liệu tài chính từ các tài liệu dài và phức tạp, bao gồm các file Excel và PDF. Theo các benchmark nội bộ của công ty, mô hình này hoạt động tốt hơn 50% so với các mô hình trước đó trong việc truy xuất tài liệu. Đây là mô hình đầu tiên xử lý một cách đáng tin cậy các vấn đề như tìm kiếm "kim trong đống rơm", mất thông tin ở giữa tài liệu và các lập luận yêu cầu kết nối thông tin xuyên suốt nhiều file.

Hiệu suất là một chuyện, nhưng tốc độ cũng quan trọng không kém. OpenAI cho biết GPT-4.1 trả về token đầu tiên trong khoảng 15 giây khi xử lý 128.000 token và lên tới 30 giây ở mức đầy đủ một triệu token. GPT-4.1 mini và nano thậm chí còn nhanh hơn.

GPT-4.1 nano thường phản hồi trong vòng chưa đầy 5 giây cho các prompt với 128.000 token đầu vào. Prompt caching có thể giúp giảm độ trễ hơn nữa đồng thời tiết kiệm chi phí.

Khả năng hiểu hình ảnh cũng có bước tiến đáng kể. Đặc biệt, GPT-4.1 mini vượt trội GPT-4o trên nhiều benchmark thị giác khác nhau.

  • Trên MMMU (bao gồm biểu đồ, sơ đồ và bản đồ), GPT-4.1 mini đạt 73%. Con số này cao hơn GPT-4.5 và vượt xa 56% của GPT-4o mini.
  • Trên MathVista (kiểm tra khả năng giải quyết các bài toán hình ảnh), cả GPT-4.1 và GPT-4.1 mini đều đạt 57%, bỏ xa 37% của GPT-4o mini.
  • Trên CharXiv-Reasoning, nơi các mô hình trả lời câu hỏi dựa trên biểu đồ khoa học, GPT-4.1 tiếp tục dẫn đầu.
  • Trên Video-MME (video dài không phụ đề), GPT-4.1 đạt 72%, cải thiện đáng kể so với 65% của GPT-4o.

Về giá cả:

  • GPT-4.1 có giá 2 USD cho mỗi 1 triệu token đầu vào và 8 USD cho đầu ra.
  • GPT-4.1 mini được định giá 0.40 USD cho đầu vào và 1.60 USD cho đầu ra.
  • GPT-4.1 nano có giá 0.10 USD đầu vào và 0.40 USD đầu ra.

Sử dụng prompt caching hoặc Batch API có thể giúp giảm thêm các chi phí này, điều rất tốt cho các ứng dụng quy mô lớn. OpenAI cũng đang chuẩn bị ngừng hỗ trợ GPT-4.5 Preview vào ngày 14 tháng 7 năm 2025, với lý do GPT-4.1 có hiệu suất tốt hơn, độ trễ thấp hơn và chi phí thấp hơn.

Thứ Tư, 16/04/2025 10:35
31 👨 100
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
❖
    ❖ Chuyện công nghệ
    Chia sẻ
    Chia sẻ FacebookChia sẻ Twitter
    Đóng