ChatGPT, Bing AI và Google Bard là một số cái tên dễ nhận biết nhất trong thế giới trí tuệ nhân tạo tiêu dùng. Cả 3 sản phẩm đều có một điểm chung - chúng đều là sản phẩm Generative AI.
Nhưng chính xác thì Generative AI là gì và điều gì đã khơi dậy niềm đam mê gần đây với lĩnh vực này?
Generative AI là gì?
Generative AI, viết tắt của "Generative Artificial Intelligence", là một loại hệ thống AI có thể tạo nội dung độc đáo hoặc nguyên bản như văn bản, âm thanh, video hoặc hình ảnh theo yêu cầu. Không giống như một số hệ thống AI truyền thống được thiết kế cho các nhiệm vụ như phân loại hoặc phân tích dữ liệu, các mô hình Generative AI quan tâm nhiều hơn đến việc tạo ra những kết quả đầu ra mới hoặc sáng tạo dựa trên các hướng dẫn mà chúng được cung cấp.
Mặc dù Generative AI có vẻ giống như một công nghệ mới, nhưng nó thực sự đã tồn tại hàng thập kỷ. Một số phiên bản và các hình thức đã xuất hiện ít nhất là vào đầu những năm 1960. Trí tuệ nhân tạo là một lĩnh vực rộng lớn và Generative AI chỉ là một phần phụ.
Một trong những khía cạnh hấp dẫn nhất của việc sử dụng công cụ Generative AI như ChatGPT hoặc Bard AI của Google là khả năng của những công cụ này tạo nội dung phù hợp với yêu cầu của bạn. Bạn yêu cầu ChatGPT viết một bài thơ theo phong cách của William Shakespeare, và bạn sẽ nhận được một thứ gì đó rất giống với tác phẩm của Shakespeare. Bạn yêu cầu nó tạo một bài phát biểu theo phong cách của Donald Trump, và bạn sẽ nhận được thứ gì đó mô phỏng giọng điệu của cựu tổng thống Mỹ một cách ấn tượng. Vậy làm thế nào mà trí tuệ nhân tạo có thể tạo ra một kỳ tích hấp dẫn như vậy?
Cách thức hoạt động của Generative AI
Cơ chế hoạt động của một mô hình Generative AI liên quan đến sự tương tác phức tạp của nhiều kỹ thuật và thuật toán Deep Learning khác nhau. Các chi tiết chính xác về cách thức hoạt động của một mô hình Generative AI phụ thuộc vào mục tiêu của nó và kiến trúc cơ bản. Chẳng hạn, một mô hình Generative AI để tạo các đoạn âm thanh sẽ có cơ chế hoạt động khác với cơ chế dùng để tạo video hoặc văn bản.
Tuy nhiên, về cốt lõi, hầu hết, nếu không muốn nói là tất cả, các mô hình Generative AI hoạt động tương tự ở cấp độ cơ bản. Chúng học hỏi từ một lượng lớn dữ liệu, nắm bắt các mẫu và kiểu dữ liệu, sau đó sử dụng những mẫu đã nắm bắt này để tái tạo các mẫu giống với những gì đã học được trong dữ liệu đào tạo của mình.
Bạn có thể coi các công cụ Generative AI như một nhà soạn nhạc. Hãy tưởng tượng nhà soạn nhạc này đã nghe vô số bài hát và nghiên cứu về hòa âm, giai điệu, nhịp điệu và cấu trúc của một số thể loại âm nhạc. Nói cách khác, nhà soạn nhạc này có kiến thức sâu rộng về nhiều thể loại âm nhạc. Với kiến thức này, nhà soạn nhạc có thể tạo ra những bản nhạc nguyên bản hoặc độc đáo lấy cảm hứng từ những gì đã học được.
Vì vậy, nếu họ đã học được nhiều về nhạc pop, bạn có thể yêu cầu họ sáng tác một bài hát pop và họ sẽ không gặp vấn đề gì khi làm như vậy. Âm nhạc được sáng tác sau đó sẽ thể hiện sự hiểu biết của nhà soạn nhạc về nhạc pop dựa trên những gì họ đã học được. Tương tự, sản phẩm của Generative AI hiện sự hiểu biết của mô hình AI về các khái niệm cơ bản học được từ dữ liệu đào tạo của nó.
Vì vậy, nếu bạn muốn tạo một mô hình Generative AI tạo hình ảnh ô tô, bạn phải cung cấp cho mô hình một tập dữ liệu khổng lồ về hình ảnh ô tô. Để tạo ra một mô hình ấn tượng, bạn cần cung cấp cho nó hình ảnh của nhiều thương hiệu và kiểu xe ô tô mà bạn có thể nghĩ ra. Nếu được đào tạo đầy đủ, thuật toán sẽ tìm hiểu xem mỗi thương hiệu hoặc mẫu ô tô trông như thế nào và có thể tạo hình ảnh của hầu hết mọi ô tô mà bạn có thể nghĩ ra theo yêu cầu.
Các mô hình Generative AI phổ biến
Có hàng trăm mô hình Generative AI hiện đang được phát triển hoặc triển khai trên thị trường AI tiêu dùng. Một số mô hình phổ biến bạn nên biết bao gồm:
1. Generative Pre-Trained Transformer (GPT)
GPT, được phát triển bởi OpenAI, là một trong những cái tên dễ nhận biết nhất trong không gian Generative AI. Mức độ phổ biến phụ thuộc vào hiệu quả của nó với vai trò một mô hình AI đàm thoại và sự thành công lan truyền của chatbot ChatGPT, sử dụng GPT làm công nghệ cơ bản. Nó là một mô hình ngôn ngữ lớn được thiết kế để tạo văn bản giống con người khi được nhắc. Điển hình của bất kỳ mô hình Generative AI nào, tất cả các phiên bản của mô hình GPT đã được đào tạo trên một lượng lớn dữ liệu văn bản đa dạng.
2. Pathways Language Model (PaLM)
PaLM là một mô hình Generative AI mạnh mẽ có khả năng thực hiện nhiều tác vụ như viết sáng tạo, tạo code, dịch ngôn ngữ và một số tác vụ ngôn ngữ tự nhiên dựa trên văn bản khác. Giống như GPT, PaLM được đào tạo trên một kho dữ liệu văn bản lớn có nguồn gốc từ nhiều nguồn khác nhau trên web. Đây là mô hình AI cung cấp năng lượng cho Bard AI của Google.
3. Music Language Model (MusicLM)
MusicLM là một mô hình Generative AI khác của Google. Nó được thiết kế để tạo nhạc "độ trung thực cao" từ lời nhắc văn bản đơn giản. Được đào tạo qua hàng nghìn bản nhạc thuộc nhiều thể loại khác nhau, mô hình thế hệ mới có thể tạo ra âm nhạc độc đáo bằng cách sử dụng các mô tả đơn giản về âm nhạc bạn cần làm đầu vào.
4. DALL-E
DALL-E là mô hình tạo hình ảnh AI của OpenAI được thiết kế để tạo nhiều kiểu hình ảnh độc đáo từ lời nhắc văn bản. Đây là một triển khai đa phương thức của mô hình GPT, được đào tạo dựa trên nhiều cặp văn bản-hình ảnh từ nhiều nguồn khác nhau trên Internet.
Ngoài các mô hình Generative AI, bạn cũng sẽ tìm thấy các sản phẩm Generative AI như Midjourney, công cụ tạo hình ảnh DALL-E, công cụ tạo hình ảnh Stable Diffusion, Hugging Chat và một số sản phẩm AI ấn tượng khác được hỗ trợ bởi các mô hình Generative AI.
Tại sao Generative AI lại bùng nổ về mức độ phổ biến?
Vào ngày 30 tháng 11 năm 2022, Giám đốc điều hành OpenAI Sam Altman đã thông báo về việc ra mắt ChatGPT trong một tweet.
5 ngày sau, ChatGPT đã thu hút được một triệu người dùng đầu tiên; một tốc độ chưa từng có đối với bất kỳ ứng dụng nào, biến ChatGPT trở thành ứng dụng phát triển nhanh nhất mọi thời đại. Mặc dù ChatGPT không phải là sản phẩm Generative AI đầu tiên, nhưng sự xuất hiện của nó trong bối cảnh sản phẩm AI đã đưa Generative AI vào nhận thức của công chúng nhiều hơn bất kỳ sản phẩm công nghệ nào khác trước đó.
Mặc dù ChatGPT là mũi nhọn trong việc thúc đẩy sự cường điệu xung quanh Generative AI, nhưng nó không làm được điều đó một mình. Năm 2022 sẽ được ghi nhớ là năm mà các công cụ Generative AI trở thành xu hướng. Từ các chatbot AI đàm thoại đến các trình tạo code và nghệ thuật, nửa cuối năm 2022 là lần đầu tiên nhiều công cụ AI có cả sức hấp dẫn đại chúng và mục đích sử dụng thực tế hàng ngày được tung ra thị trường. Với những công cụ này, công nghệ nền tảng của nó đã trở nên phổ biến (Generative AI).
Các công cụ Generative AI như Bing AI, Google Bard, DALL-E, ChatGPT và Midjourney đã liên tục đan xen vào kết cấu cuộc sống hàng ngày của chúng ta, liên tục giới thiệu cho chúng ta những sáng tạo đáng chú ý của chúng. Cho dù đó là những bài viết hấp dẫn do ChatGPT tạo ra hay những hình ảnh sống động như thật đáng kinh ngạc do Midjourney vẽ nên, Generative AI đã trở thành người bạn đồng hành luôn hiện diện cùng chúng ta ngày này qua ngày khác. Đây là nguồn gốc cho sự phổ biến gần đây của Generative AI.