OpenAI vừa công bố Chương trình Tiên phong (Pioneers Program) – một nỗ lực nhằm thúc đẩy ứng dụng AI vào các tình huống thực tế. Chương trình này tập trung cải thiện cách đánh giá mô hình AI, trong bối cảnh các nhà phát triển và doanh nghiệp ngày càng phụ thuộc vào các thang benchmark (tiêu chuẩn đánh giá) để lựa chọn và tối ưu mô hình phù hợp.
Động thái này được đưa ra sau khi Meta bị cáo buộc thao túng benchmark LMArena để nâng thứ hạng cho mô hình Llama 4 của họ. Pioneers Program hướng đến hợp tác với các công ty, cùng các nhà nghiên cứu OpenAI phát triển các tiêu chuẩn đánh giá phản ánh thách thức thực tế, thay vì chỉ chạy đua điểm số trên bảng xếp hạng.
Theo OpenAI, các công ty được chọn sẽ nhận hỗ trợ trực tiếp từ đội ngũ nghiên cứu của họ, tập trung vào hai mục tiêu chính:
- Tạo benchmark theo từng chuyên ngành: Xây dựng phương pháp đánh giá riêng cho từng lĩnh vực (luật, tài chính, y tế, bảo hiểm, kế toán).
- Huấn luyện mô hình tinh chỉnh: Phát triển các mô hình AI chuyên sâu xử lý ba trường hợp sử dụng quan trọng nhất của doanh nghiệp.
OpenAI nhấn mạnh hiện không có tiêu chuẩn chung để đo lường hiệu suất AI ở nhiều lĩnh vực trên, dẫn đến khó khăn trong việc đánh giá công bằng hoặc cải thiện mô hình. Bằng cách hợp tác trực tiếp, công ty kỳ vọng có thể xác định rõ "thế nào là hiệu quả" trong từng ngành và công bố các tiêu chí này để cộng đồng áp dụng.
Về khía cạnh tinh chỉnh mô hình, các công ty tham gia sẽ được hỗ trợ đào tạo phiên bản AI tùy biến bằng Reinforcement Fine-Tuning (RFT) – phương pháp OpenAI dùng để tạo ra mô hình "chuyên gia" xuất sắc trong nhóm tác vụ hẹp. Những mô hình này được cam kết sẵn sàng triển khai ở quy mô sản xuất.
Về lộ trình triển khai, giai đoạn đầu sẽ chủ yếu tập trung vào nhóm startup được lựa chọn dựa trên tác động thực tế của sản phẩm. OpenAI đang ưu tiên tìm kiếm các đội ngũ giải quyết vấn đề cụ thể, nơi AI chuyên sâu có thể tạo khác biệt rõ rệt. Song song với đó là mở rộng sang doanh nghiệp lớn và lĩnh vực phức tạp hơn trong tương lai.