Google phát hành framework học máy TensorFlow dành riêng cho dữ liệu đồ họa

Google mới đây đã chính thức giới thiệu Neural Structured Learning (NSL), một framework học máy (trí tuệ nhân tạo) nguồn mở, sử dụng phương pháp Neural Graph Learning để đào tạo các mạng thần kinh (neural networks) dựa trên một lượng đa dạng các biểu đồ và dữ liệu có cấu trúc khác nhau.

Đặc biệt, NSL được xây dựng nhằm cho khả năng tương thích tuyệt vời với TensorFlow - một thư viện phần mềm mã nguồn mở dành cho máy học trong nhiều loại hình tác vụ nhận thức và hiểu ngôn ngữ - và đặc biệt được thiết để cả những nhà thực hành học máy dạn dày kinh nghiệm lẫn non kinh nghiệm đều có thể sử dụng được. Về cơ bản, NSL có thể tạo ra các mô hình mẫu cho thị giác máy tính (computer vision), triển khai NLP, và chạy dự đoán từ các bộ dữ liệu đồ họa như hồ sơ y tế (medical records) hay biểu đồ tri thức (knowledge graphs).

Neural Structured Learning là một framework học máy nguồn mởNeural Structured Learning là một framework học máy nguồn mở

“Việc tận dụng các tín hiệu có cấu trúc cụ thể trong quá trình đào tạo cho phép các nhà phát triển thu về những mô hình với độ chính xác tối ưu hơn, đặc biệt là khi lượng dữ liệu đã được gắn nhãn là tương đối nhỏ. Đào tạo dựa trên các tín hiệu có cấu trúc cũng giúp tạo ra những mô hình mạnh mẽ hơn. Những kỹ thuật đào tạo dạng này đã được sử dụng rộng rãi trong nội bộ Google nhằm cải thiện hiệu suất của các mô hình theo hướng tích cực và nhanh chóng hơn”, nhóm kỹ sư của TensorFlow cho biết trong một bài đăng trên blog.

NSL có thể đào tạo các mô hình học máy thông qua phương pháp học tập có giám sát toàn diện (supervised learning), bán giám sát (semi-supervised learning) hoặc không giám sát (unsupervised learning), từ đó tạo ra các mô hình sử dụng tín hiệu đồ họa (graphical signal) nhằm chuẩn hóa quá trình đào tạo, trong một số trường hợp có ít hơn 5 dòng code.

Cấu trúc vận hành của framework Neural Structured LearningCấu trúc vận hành của framework Neural Structured Learning

Ngoài ra, framework mới này cũng được tích hợp sẵn một số công cụ có thể giúp các nhà phát triển tự cấu trúc dữ liệu và API tạo ra những mô hình mẫu đào tạo đối nghịch với số dòng code tối thiểu.

Trước đó vào tháng 4, Google Cloud cũng đã giới thiệu một vài giải pháp đào tạo đối với dữ liệu có cấu trúc, chẳng hạn như các sheet được liên kết trong BigQuery và AutoML Tables.

Trong một tin tức khác liên quan đến lĩnh vực trí tuệ nhân tạo, tuần trước Google AI (trước đây gọi là Google Research) cũng đã phát hành công cụ nguồn mở SM3 - một trình tối ưu hóa dành riêng cho các mô hình đào tạo ngôn ngữ quy mô lớn như BERT của Google và OpenAI của GPT2.

Trang công cụ nguồn mở SM3 trên GithubTrang công cụ nguồn mở SM3 trên Github

Bạn có thể tham khảo thêm thông tin về framework học máy NSL tại các địa chỉ sau:

  • https://www.tensorflow.org/neural_structured_learning/
  • https://medium.com/tensorflow/introducing-neural-structured-learning-in-tensorflow-5a802efd7afd
Thứ Hai, 16/09/2019 17:17
55 👨 549