Llama 2 là gì? Sử dụng Llama 2 như thế nào?

Từ GPT-4 của OpenAI đến PalM 2 của Google, các mô hình ngôn ngữ lớn đang thống trị tiêu đề công nghệ. Mỗi mô hình mới hứa hẹn sẽ tốt và mạnh hơn mô hình trước đó, đôi khi vượt qua bất kỳ đối thủ cạnh tranh hiện có nào.

Tuy nhiên, số lượng các mô hình hiện có không làm chậm sự xuất hiện của những mô hình mới. Giờ đây, công ty mẹ của Facebook, Meta, đã phát hành Llama 2, một mô hình ngôn ngữ mới mạnh mẽ. Nhưng Llama 2 có gì độc đáo? Llama 2 khác với GPT-4, PaLM 2Claude 2 như thế nào và tại sao bạn nên quan tâm tới nó?

Llama 2 là gì?

Lạc đà không bướu

Llama 2, một mô hình ngôn ngữ lớn, là sản phẩm của một liên minh giữa Meta và Microsoft, hai gã khổng lồ công nghệ cạnh tranh đi đầu trong nghiên cứu Trí tuệ nhân tạo (AI). Nó là sự kế thừa cho mô hình ngôn ngữ Llama 1 của Meta, được phát hành vào quý đầu tiên của năm 2023.

Có thể nói rằng Meta tương đương với PaLM 2 của Google, OpenAI GPT-4 và Claude 2 của Anthropic. Nó đã được đào tạo trên một bộ dữ liệu khổng lồ gồm dữ liệu Internet có sẵn công khai, tận hưởng lợi thế của một bộ dữ liệu mới và đa dạng hơn so với bộ dữ liệu được sử dụng để đào tạo Llama 1. Llama 2 được đào tạo với lượng dữ liệu nhiều hơn 40% so với phiên bản tiền nhiệm và có độ dài ngữ cảnh gấp đôi (4k).

Nếu trước đây bạn đã có cơ hội tương tác với Llama 1 nhưng không quá ấn tượng với kết quả đầu ra của nó, thì Llama 2 vượt trội so với phiên bản tiền nhiệm và có thể chính là thứ bạn cần. Nhưng Llama 2 cạnh tranh với các đối thủ khác như thế nào?

Làm thế nào để Llama 2 vượt trội hơn các đối thủ cạnh tranh?

ChatGPT, Bing AI và Bard

Thứ nhất, Llama 2 là một dự án mã nguồn mở. Điều này có nghĩa là Meta đang xuất bản toàn bộ mô hình để bất kỳ ai cũng có thể sử dụng để xây dựng các mô hình hoặc ứng dụng mới. Nếu bạn so sánh Llama 2 với các mô hình ngôn ngữ nguồn mở lớn khác như Falcon hoặc MBT, bạn sẽ thấy nó vượt trội hơn chúng ở một số chỉ số. Có thể nói Llama 2 là một trong những mô hình ngôn ngữ lớn nguồn mở mạnh mẽ nhất trên thị trường hiện nay.

Tuy nhiên, Llama 2 mất lợi thế khi phải đối mặt với những đối thủ như GPT của OpenAI và dòng mô hình AI PalM của Google. Khi xử lý các tác vụ đòi hỏi sự sáng tạo, Llama 2 có đôi chỗ khác biệt. Tùy thuộc vào biến thể mà bạn thử nghiệm, bạn có thể không nhận được đầu ra tương tự như khi nhận được từ các mô hình Anthropic và OpenAI.

Llama 2 chủ yếu chỉ là một “mô hình cơ bản” chứ không phải là một tùy chọn được “tinh chỉnh”. Các mô hình nền tảng là những mô hình ngôn ngữ lớn được xây dựng có tính đến khả năng thích ứng trong tương lai. Chúng không được tinh chỉnh cho bất kỳ lĩnh vực cụ thể nào mà được xây dựng để có thể giải quyết một loạt các nhiệm vụ, mặc dù, đôi khi, với khả năng hạn chế.

Mặt khác, mô hình tinh chỉnh là một mô hình nền tảng được điều chỉnh để tăng hiệu quả của nó trong một lĩnh vực cụ thể. Nó giống như sử dụng một mô hình nền tảng như GPT và tinh chỉnh nó thành ChatGPT để công chúng có thể sử dụng.

Cách sử dụng Llama 2 ngay bây giờ

Mặc dù Llama 2 không khả dụng trên nền tảng công khai như ChatGPT, nhưng bạn vẫn có thể sở hữu mô hình bằng cách tải xuống bản sao và chạy cục bộ hoặc sử dụng quyền truy cập thông qua phiên bản lưu trữ trên đám mây Hugging Face.

Để truy cập Llama trên Hugging Face, chỉ cần mở liên kết Hugging Face tương ứng bên dưới và bắt đầu viết lời nhắc cho chatbot AI.

  1. 7B parameters Llama-2 chat
  2. 13B parameters Llama-2 chat
  3. 70B parameters Llama-2 chat

Các mô hình Llama ở trên đã được tinh chỉnh cho những ứng dụng hội thoại, vì vậy đây là mô hình gần nhất với ChatGPT mà bạn sẽ nhận được cho Llama-2. Không chắc chắn nên thử phiên bản nào? Bài viết đề nghị tùy chọn 3, 70B parameters Llama-2 chat. Bạn vẫn có thể thử với cả 3 mô hình để xem cái nào phù hợp nhất với nhu cầu riêng của mình.

Bài viết đã sử dụng 70B parameters Llama-2 chat của Meta và kết quả thật ấn tượng. Để kiểm tra tính sáng tạo và khiếu hài hước của mô hình, tác giả đã cho nó bài kiểm tra tính sáng tạo và tính châm biếm đặc trưng. Tác giả đã yêu cầu mô hình AI mô phỏng cuộc trò chuyện giữa hai người đang tranh luận về giá trị của việc đi vào vũ trụ và đây là kết quả.

Kết quả 1

Tiếp theo:

Kết quả 2

Và cuối cùng:

Kết quả 3

Nó không hiểu đúng tất cả các chi tiết trong hướng dẫn của chúng tôi, nhưng sự hài hước thật ấn tượng.

Mặt khác, nếu có chuyên môn kỹ thuật để chạy mô hình Llama cục bộ trên máy của mình, bạn có thể yêu cầu quyền truy cập vào mô hình bằng biểu mẫu của Meta. Sau khi cung cấp tên, email, vị trí và tên tổ chức, Meta sẽ xem xét đơn đăng ký của bạn, sau đó quyền truy cập sẽ bị từ chối hoặc cấp trong khoảng thời gian từ vài giờ đến 2 ngày.

Thứ Hai, 24/07/2023 08:18
51 👨 1.786
0 Bình luận
Sắp xếp theo
    ❖ Trí tuệ nhân tạo (AI)