Apple phát triển phương pháp đột phá để chạy LLM trên iPhone

Việc sở hữu Apple GPT ngay trong tầm tay có thể trở thành hiện thực sớm hơn bạn nghĩ. Các nhà nghiên cứu AI của Apple cho biết họ đã đạt được bước đột phá quan trọng trong việc triển khai các mô hình ngôn ngữ lớn (LLM) trên iPhone và những thiết bị Apple khác có bộ nhớ hạn chế bằng cách phát minh ra một kỹ thuật sử dụng bộ nhớ flash cải tiến.

Siri trên iPhone
Siri trên iPhone

LLM và hạn chế về bộ nhớ

Các chatbot dựa trên LLM như ChatGPT và Claude cực kỳ tốn dữ liệu và bộ nhớ, thường cần lượng bộ nhớ lớn để hoạt động, đây là một thách thức đối với các thiết bị như iPhone có dung lượng bộ nhớ hạn chế. Để giải quyết vấn đề này, các nhà nghiên cứu của Apple đã phát triển một kỹ thuật mới sử dụng bộ nhớ flash – chính bộ nhớ lưu trữ ứng dụng và ảnh của bạn – để lưu trữ dữ liệu của mô hình AI.

Lưu trữ AI trên bộ nhớ Flash

Trong một bài nghiên cứu mới có tiêu đề "LLM in a flash: Efficient Large Language Model Inference with Limited Memory" (Tạm dịch là: LLM trên flash: Suy luận mô hình ngôn ngữ lớn hiệu quả với bộ nhớ hạn chế", các tác giả lưu ý rằng bộ nhớ flash có nhiều trong các thiết bị di động hơn RAM thường được sử dụng để chạy LLM. Phương pháp của họ đã khéo léo vượt qua giới hạn bằng cách sử dụng hai kỹ thuật chính giúp giảm thiểu việc truyền dữ liệu và tối đa hóa thông lượng bộ nhớ flash:

  1. Windowing: Hãy coi đây như một phương pháp tái chế. Thay vì load dữ liệu mới mỗi lần, mô hình AI sẽ sử dụng lại một số dữ liệu đã được xử lý. Điều này làm giảm nhu cầu tìm nạp bộ nhớ liên tục, giúp quá trình nhanh và mượt mà hơn.
  2. Row-Column Bundling: Kỹ thuật này giống như đọc một cuốn sách theo từng đoạn lớn hơn thay vì đọc từng từ một. Bằng cách nhóm dữ liệu hiệu quả hơn, dữ liệu có thể được đọc nhanh hơn từ bộ nhớ flash, tăng tốc khả năng hiểu và tạo ngôn ngữ của AI.

Theo nghiên cứu, sự kết hợp của các phương pháp này cho phép các mô hình AI chạy được dung lượng gấp đôi bộ nhớ khả dụng của iPhone. Điều này có nghĩa là tốc độ tăng gấp 4-5 lần trên bộ xử lý (CPU) tiêu chuẩn và nhanh hơn ấn tượng 20-25 lần trên bộ xử lý đồ họa (GPU). Các tác giả viết: “Bước đột phá này đặc biệt quan trọng để triển khai LLM tiên tiến trong môi trường hạn chế về tài nguyên, từ đó mở rộng khả năng ứng dụng và mức độ tiếp cận của chúng”.

AI nhanh hơn trên iPhone

Bước đột phá về hiệu quả của AI mở ra những khả năng mới cho iPhone trong tương lai, chẳng hạn như khả năng Siri tiên tiến hơn, dịch ngôn ngữ theo thời gian thực và các tính năng phức tạp do AI điều khiển trong chụp ảnh và thực tế tăng cường. Công nghệ này cũng tạo tiền đề cho iPhone chạy các trợ lý AI và chatbot phức tạp trên thiết bị, điều mà Apple được cho là đang nghiên cứu.

Công việc của Apple về Generative AI cuối cùng có thể được tích hợp vào trợ lý giọng nói ‌Siri‌ của họ. Apple vào tháng 2 năm 2023 đã tổ chức hội nghị thượng đỉnh về AI và giới thiệu tóm tắt cho nhân viên về công việc trên mô hình ngôn ngữ lớn của mình. Theo Bloomberg, Apple đang hướng tới một phiên bản Siri thông minh hơn được tích hợp sâu với AI. Apple đang có kế hoạch cập nhật cách ‌Siri‌ tương tác với ứng dụng Messages, cho phép người dùng đưa ra các câu hỏi phức tạp và tự động hoàn thành câu hiệu quả hơn. Ngoài ra, Apple còn được đồn đại là đang có kế hoạch bổ sung AI vào càng nhiều ứng dụng của Apple càng tốt.

Apple GPT

Apple được cho là đang phát triển mô hình Generative AI của riêng mình có tên là "Ajax". Được thiết kế để cạnh tranh với GPT-3 và GPT-4 của OpenAI, Ajax hoạt động trên 200 tỷ tham số, cho thấy mức độ phức tạp, cũng như khả năng hiểu và tạo ngôn ngữ cao. Được biết đến với tên gọi nội bộ là "Apple GPT", Ajax đặt mục tiêu thống nhất hoạt động phát triển Machine Learning trên toàn Apple, đề xuất một chiến lược lớn để tích hợp AI sâu hơn vào hệ sinh thái của Apple.

Theo các báo cáo mới nhất, Ajax được coi là có khả năng cao hơn ChatGPT 3.5 thế hệ trước. Tuy nhiên, người ta cũng gợi ý rằng các mô hình mới hơn của OpenAI có thể đã vượt quá khả năng của Ajax kể từ tháng 9 năm 2023.

Cả The Information và nhà phân tích Jeff Pu đều khẳng định rằng Apple sẽ có một số loại tính năng Generative AI có sẵn trên ‌iPhone‌ và iPad vào khoảng cuối năm 2024, đó là thời điểm iOS 18 ra mắt. Pu cho biết vào tháng 10 rằng Apple đang xây dựng vài trăm máy chủ AI vào năm 2023 và nhiều hơn nữa vào năm 2024. Apple được cho là sẽ cung cấp sự kết hợp giữa AI dựa trên đám mây và AI với khả năng xử lý trên thiết bị.

Thứ Bảy, 23/12/2023 08:09
51 👨 293
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ