OpenAI vừa công bố sẽ tích hợp một phiên bản nâng cấp của GPT-5 vào công cụ lập trình AI Codex. Mẫu mới này mang tên GPT-5-Codex, được thiết kế để quản lý “thời gian suy nghĩ” một cách linh hoạt hơn, có thể kéo dài từ vài giây cho đến tận 7 giờ cho một nhiệm vụ lập trình. Nhờ đó, hiệu suất xử lý của Codex trên các bài kiểm thử lập trình tự động (agentic coding benchmarks) được cải thiện rõ rệt.
Hiện tại, GPT-5-Codex đang được triển khai trong các sản phẩm Codex, có thể truy cập qua terminal, IDE, GitHub, hoặc ChatGPT. Người dùng thuộc các gói ChatGPT Plus, Pro, Business, Edu và Enterprise đều sẽ được trải nghiệm trước. OpenAI cũng cho biết họ sẽ sớm cung cấp GPT-5-Codex cho khách hàng sử dụng API trong thời gian tới.
Cạnh tranh trong thị trường công cụ AI lập trình
Bản nâng cấp này nằm trong chiến lược giúp Codex cạnh tranh trực tiếp với các đối thủ như Claude Code, Cursor của Anysphere, hay GitHub Copilot của Microsoft. Thị trường AI cho lập trình đang ngày càng “nóng” bởi nhu cầu lớn từ phía người dùng. Chẳng hạn, Cursor đã đạt doanh thu định kỳ hàng năm (ARR) hơn 500 triệu USD vào đầu năm 2025, trong khi Windsurf – một công cụ tương tự – từng vướng vào thương vụ thâu tóm hỗn loạn khiến đội ngũ phát triển bị chia rẽ giữa Google và Cognition.
Hiệu suất vượt trội của GPT-5-Codex
OpenAI khẳng định GPT-5-Codex vượt trội hơn GPT-5 ở nhiều bài kiểm thử, đặc biệt là:
- SWE-bench Verified: đánh giá khả năng lập trình tác vụ tự động.
- Code refactoring benchmarks: đo hiệu quả tái cấu trúc mã nguồn từ các kho dữ liệu lớn.
Ngoài ra, GPT-5-Codex còn được huấn luyện chuyên sâu cho nhiệm vụ code review. Khi so sánh với lập trình viên nhiều kinh nghiệm, mô hình này được đánh giá là đưa ra ít nhận xét sai hơn, đồng thời bổ sung nhiều ý kiến “có tác động lớn” hơn.

“Bí quyết” đằng sau hiệu suất mới
Trong buổi họp báo, ông Alexander Embiricos, Trưởng nhóm sản phẩm Codex tại OpenAI, cho biết sự cải thiện chủ yếu đến từ khả năng “tư duy động” (dynamic thinking) của GPT-5-Codex.
Cơ chế này tương tự router của GPT-5 trên ChatGPT – vốn điều hướng truy vấn đến các mô hình phù hợp theo độ phức tạp – nhưng GPT-5-Codex không dùng router. Thay vào đó, nó có thể tự điều chỉnh thời gian xử lý theo thời gian thực.
Ví dụ, thay vì định sẵn ngay từ đầu sẽ xử lý trong 10 phút, GPT-5-Codex có thể nhận thấy sau 5 phút rằng cần thêm một giờ nữa để giải quyết triệt để. Trong một số trường hợp, Embiricos cho biết ông từng thấy mô hình này làm việc liên tục tới 7 tiếng cho một tác vụ lập trình.