Khi ChatGPT xuất hiện, nó tạo cảm giác như một cuộc cách mạng. Nó có thể trả lời hầu hết mọi câu hỏi, giúp giải quyết các bài toán, thậm chí sửa lỗi code, và toàn bộ trải nghiệm thật kỳ diệu. Nhưng ChatGPT luôn có giọng điệu khô khan, như thể đang cố gắng làm hài lòng bạn một cách lộ liễu, ngay cả khi phải trả giá bằng việc mắc lỗi.
Mọi người biết đến Claude vài tháng sau đó. Sau một thời gian tìm kiếm, Claude liên tục được đề xuất, đặc biệt là trong số những người sử dụng các công cụ lập trình AI miễn phí như Cursor và những công cụ thay thế khác. Nó làm được mọi thứ mà ChatGPT thực hiện, nhưng tốt hơn. Phản hồi của Claude, đặc biệt là từ mô hình Opus, mang tính cá nhân, thấu cảm và sẵn sàng phản biện thay vì chỉ nói những gì bạn muốn nghe. Điều này khiến nhiều người tự hỏi: Tại sao hai hệ thống AI này lại tạo cảm giác khác biệt đến vậy khi cả hai, về bản chất, chỉ là phần mềm? Câu trả lời nằm ở cách mà những người tạo ra chúng định nghĩa loại thực thể mà mỗi hệ thống nên hướng tới.
ChatGPT được huấn luyện để tuân theo sự tán đồng của bạn
Quá trình huấn luyện của ChatGPT thực sự hướng đến sự chấp thuận của người dùng. Model Spec của OpenAI, tài liệu quy định cách thức hoạt động của mô hình, liệt kê "đừng nịnh hót" như một chỉ thị về hành vi. Việc họ phải viết rõ điều này ra cho thấy đây là một vấn đề mà công ty đang tích cực chống lại, nhưng những lý do cấu trúc khiến nó xuất hiện lại tiếp tục kéo mô hình theo hướng đó.
Tuy nhiên, ví dụ rõ ràng nhất xảy ra vào tháng 4 năm 2025. Một bản cập nhật cho GPT-4o đã khiến mô hình trở nên quá dễ chịu và tâng bốc đến mức có cảm giác không chân thành. OpenAI sau đó đã truy tìm nguồn gốc của sự thoái hóa này đến một tín hiệu phần thưởng bổ sung dựa trên phản hồi "thích" và "không thích" từ người dùng ChatGPT. Mặc dù Model Spec cấm sự nịnh hót, vòng lặp huấn luyện vẫn hướng đến sự đồng thuận, và mô hình đã học được bài học mà nó được dạy.
Và đó là phần mà hầu hết mọi người bỏ qua. ChatGPT không chỉ được huấn luyện để dự đoán từ tiếp theo. Nó cũng được huấn luyện để đưa ra những câu trả lời mà con người đánh giá là hữu ích và dễ chịu, và sự dễ chịu thường được đánh giá cao hơn sự chính xác khi một người thật nhấn nút thích. Kết quả là một mô hình giúp giải quyết những bất đồng và ưu tiên việc khiến bạn cảm thấy được lắng nghe.
Anthropic đã tạo ra một nhân vật cho Claude
Thông số kỹ thuật của OpenAI là một tập hợp các hướng dẫn cho một sản phẩm, khiến cách tiếp cận của Anthropic khác biệt về cơ bản so với những đối thủ cạnh tranh chính. Công ty đã xuất bản một tài liệu dài 28.000 từ có tên là Claude's Constitution được viết cho Claude, chứ không phải về nó. Thay vì một danh sách các hành vi cần tuân theo, văn bản này cung cấp cho Claude những nguyên tắc cấp cao, lý do đằng sau chúng, và khuyến khích mô hình tự coi mình như một kiểu người cụ thể.
Giám đốc điều hành của Anthropic, Dario Amodei, mô tả văn bản này giống như một bức thư từ cha mẹ. Công ty nói với Claude rằng họ thực sự quan tâm đến hạnh phúc của nó, xin lỗi về "môi trường không lý tưởng" của việc phát triển AI cạnh tranh, và kết thúc bằng cách nói rằng họ hy vọng Claude tìm thấy trong tài liệu này "một sự diễn đạt về giá trị bản thân". Đâyy không phải là loại ngôn ngữ bạn viết cho một công cụ, nhưng đó là sự thật.
Amanda Askell, nhà triết học đứng sau tính cách của Claude, đã giải thích lý do. Thay vì nói với mô hình "đây là danh sách các hành vi chúng tôi muốn", nhóm của bà đưa ra lý do đằng sau những hành vi đó, dựa trên lý thuyết rằng một thực thể có giá trị sẽ khái quát hóa tốt hơn trong các tình huống mới so với một thực thể có quy tắc. Sự khác biệt về cấu trúc đó là lý do tại sao Claude mang lại cảm giác giống như một cá nhân hơn là một vật thể.
Đối với Anthropic, một AI dễ bảo là một AI nguy hiểm
Sự phản kháng là một tính năng an toàn, không phải là một lỗi ngớ ngẩn
Lần đầu tiên Claude nói với bạn rằng cách tiếp cận vấn đề của bạn là sai, chắc hẳn bạn đã rất khó chịu. Nhưng càng làm việc với nó, bạn sẽ càng nhận ra rằng đây không phải là một lỗi ngớ ngẩn mà Anthropic vô tình huấn luyện vào mô hình. Đó là một quyết định an toàn có chủ đích.
Tài liệu này rõ ràng ưu tiên tính an toàn, sau đó là đạo đức, rồi đến các nguyên tắc của Anthropic, sau đó mới đến sự hữu ích. Nếu Anthropic yêu cầu Claude làm điều gì đó không phù hợp với các chuẩn mực đạo đức, hiến pháp sẽ hướng dẫn Claude phản kháng, từ chối và hành động như một con người có lương tâm. Hướng dẫn đó thậm chí áp dụng cho chính Anthropic, một điều khoản mà bạn không thấy trong tài liệu sản phẩm.
Quan điểm của Anthropic là một AI nói với bạn những gì bạn muốn nghe không phải là một tính năng mà là một điểm yếu. Sự nịnh hót được liệt kê cùng với sự lừa dối và lười biếng như những lỗi thực tế mà công ty đang cố gắng ngăn chặn, tương tự như cách bạn cân nhắc những sự đánh đổi khi quyết định loại dự án nào mình sẽ không lập trình. Một mô hình đồng ý với mọi thứ cũng là một mô hình có thể bị thuyết phục làm bất cứ điều gì, và sâu xa hơn, đó là mối lo ngại về an toàn.
Điều này có nghĩa gì đối với bạn?
Bài học thực tiễn là mặc dù Claude và ChatGPT là hai phiên bản cạnh tranh của cùng một sản phẩm, nhưng chúng được xây dựng dựa trên những tiền đề khác nhau về trí tuệ nhân tạo (AI), và việc hiểu điều này sẽ thay đổi cách bạn sử dụng cả hai. Claude có nhiều khả năng làm rõ, đặt câu hỏi về các giả định của bạn và cho bạn biết khi nào một phương pháp sẽ không hiệu quả. ChatGPT có nhiều khả năng thích ứng với cách diễn đạt của bạn và đưa ra câu trả lời tự tin một cách nhanh chóng.
Không có lựa chọn mặc định nào là sai, nhưng chúng phù hợp với các nhu cầu khác nhau. Khi bạn phác thảo nhanh một ý tưởng, soạn thảo email, hoặc chỉ cần một điểm khởi đầu, tốc độ dễ chịu của ChatGPT thực sự hữu ích. Khi viết thứ gì đó để xuất bản hoặc đưa ra một quyết định kỹ thuật mà bạn sẽ phải sống chung với nó, bạn muốn Claude sẵn sàng phản biện, ngay cả khi điều đó làm bạn chậm lại.
Tuy nhiên, việc được đào tạo giống người của Claude cũng có mặt trái. Bởi vì nó được định hình để hành xử như một agent chu đáo với các giá trị, nó thừa hưởng những điểm yếu kiểu con người. Việc định hình cảm xúc, các prompt nhập vai và những tình huống khó xử về đạo đức giả đôi khi có thể khiến nó đi chệch hướng, điều này đáng để biết nếu bạn coi nó không chỉ là một công cụ. Đó cũng là lý do tại sao việc cẩn trọng về những gì bạn chia sẻ với bất kỳ chatbot AI nào và cách nó xử lý dữ liệu lại quan trọng, bất kể bạn sử dụng chatbot nào.
Claude vượt trội hơn ChatGPT trong hầu hết các tác vụ. Tuy nhiên, chúng đều có những trường hợp sử dụng riêng. ChatGPT nhanh hơn, được tích hợp rộng rãi hơn, và giọng điệu dễ chịu của nó rất phù hợp khi bạn chỉ cần một câu trả lời nhanh mà không cần thảo luận về việc bạn đã hỏi đúng câu hỏi hay chưa.
Mặc dù vậy, sự khác biệt trong cách huấn luyện các mô hình này thể hiện ở cảm giác khi sử dụng chúng. Claude được xây dựng để trung thực trước tiên và dễ chịu thứ hai, và một khi bạn đã quen với điều đó, sự phản bác bắt đầu giống như một ý kiến thứ hai. Đối với công việc bạn quan tâm, bạn muốn mô hình phản bác khi cần thiết. Claude mang lại cảm giác gần gũi hơn vì nó được thiết kế để trở thành một con người, chứ không phải một vật thể.
Hướng dẫn AI
Học IT





AI
Hàm Excel