XML, JSON và YAML đều là những ngôn ngữ tập trung vào dữ liệu. Vậy bạn có thể dùng chúng như thế nào? Hãy cùng Quantrimang.com tìm hiểu nhé!
Ngôn ngữ chuỗi dữ liệu đại diện cho dữ liệu có cấu trúc ở định dạng có thể lưu trữ, truyền tải và tái tạo sau này. Những ngôn ngữ này là cần thiết vì chúng chuyển đổi dữ liệu sang một định dạng chuẩn mà bạn có thể dùng trên các ngôn ngữ và nền tảng khác nhau.
XML, JSON và YAML là ngôn ngữ chuỗi dữ liệu phổ biến nhất được sử dụng hiện nay. Bài viết này sẽ cho bạn những kiến thức cơ bản và sự khác biệt nổi bật giữa chúng.
XML là gì?
XML (eXtensible Markup Language) là ngôn ngữ xác định hướng dẫn cho mã hóa tài liệu theo cách mà cả người và máy đều có thể hiểu được. Ngôn ngữ đánh dấu này tương tự như HTML nhưng không có sẵn tag. Thay vào đó, nó cho phép bạn tạo tag tùy biến theo nhu cầu. Chúng được gọi là các tag tự xác định.
Ngôn ngữ đánh dấu này có khả năng tự mô tả, khiến nó trở nên linh hoạt và phổ biến trong việc sắp xếp và cấu trúc dữ liệu trên Internet. Dữ liệu đã chia sẻ bằng XML hoạt động trên nhiều nền tảng, đồng thời phù hợp với các mục đích sử dụng khác nhau. Điều này khiến XML trở thành công cụ cần thiết trong việc xây dựng hệ thống mạng, chuyển đổi và lưu trữ dữ liệu ở nhiều lĩnh vực khác nhau.
Cách viết XML
Trong XML, bạn dùng tag để bao bọc dữ liệu, giống như ở HTML. Bạn có hai kiểu tag:
- Tag bình thường có một thẻ mở (ví dụ: <person>) và tag đóng tương ứng (ví dụ: </person>).
- Tag tự đóng, như <br />.
Bạn có thể thấy hữu ích khi sử dụng một trình chỉnh sửa XML online để ghi và định dạng tài liệu. Những công cụ chỉnh sửa như thế này dễ truy cập, hỗ trợ cộng tác chỉnh sửa và tích hợp tính năng xác thực.
Đây là ví dụ minh họa về một file XML. Tag <person> bao gồm dữ liệu về một cá nhân riêng lẻ, dùng tag được lồng vào để đại diện cho tên và tuổi của chúng.
<?xml version="1.0" encoding="UTF-8"?>
<person>
<name>John</name>
<age>30</age>
</person>
Ưu điểm của XML
Sau đây là một số lợi ích khi dùng XML:
- XML là được Java hỗ trợ rất tốt.
- Bạn có thể xác định cấu trúc hợp lệ của tài liệu XML bằng Schema hoặc DTD. Điều này đảm bảo tài liệu đó chính xác ở cấp độ ngữ nghĩa.
- Bạn có thể dùng XML để chuyển đổi dữ liệu giữa các định dạng khác nhau, như chuyển đổi truy vấn database sang tài liệu XML.
JSON là gì?
JSON là chữ viết tắt của JavaScript Object Notation. Nó là một định dạng gọn nhẹ để lưu trữ và chuyển đổi dữ liệu. Ban đầu được thiết kế cho JavaScript, JSON đã trở nên phổ biến nhờ cấu trúc đơn giản của nó. Tuy nhiên, kể từ sau đó, nhiều lĩnh vực đã áp dụng ngôn ngữ này, khiến nó trở thành cách thông dụng nhất cho chuyển đổi dữ liệu trên Internet.
Bạn cũng có thể dùng file JSON để chia sẻ dữ liệu giữa server web & trang web, cho file cấu hình và ở những tình huống mà bạn cần sắp xếp & truyền dữ liệu. Tương tự như một từ điển trong Python, dữ liệu JSON bao gồm danh sách và từ điển lồng nhau, khiến nó giống như một cấu trúc dữ liệu khóa - giá trị.
Cách viết JSON
Đây là ví dụ về một file dữ liệu JSON đơn giản:
{
"name": "John",
"age": 30,
"city": "New York"
}
JSON dùng cú pháp vay mượn từ JavaScript để trình bày kiểu dữ liệu cơ bản như số nguyên, chuỗi và boolean. Nó cũng hỗ trợ mảng, dùng dấu ngoặc vuông và các đối tượng, bằng cặp khóa-giá trị giữa các dấu ngoặc nhọn.
Hầu hết ngôn ngữ lập trình đều hỗ trợ cho JSON. Bạn có thể đọc và ghi dữ liệu JSON với Node.js, làm điều tương tự với Rust và dùng JSON với Go.
Ưu điểm của JSON
Dưới đây là một số ưu điểm của JSON:
- JSON ngắn gọn và súc tích, khiến việc phân tích và tạo dữ liệu nhanh hơn. Nó hỗ trợ một phạm vi các kiểu dữ liệu nhỏ nhưng hữu ích như chuỗi, số, boolean, mảng và đối tượng.
- Phần lớn ngôn ngữ lập trình đều hỗ trợ JSON cùng các hàm và thư viện trợ giúp.
- JSON thường hoạt động như một định dạng chuyển đổi dữ liệu trong API, cho phép server gửi dữ liệu tới trang web hoặc ứng dụng.
YAML là gì?
YAML ( YAML Ain't Markup Language ) là một ngôn ngữ đánh dấu được sử dụng rộng rãi trong file cấu hình cho các công cụ/chương trình/ứng dụng DevOps. Nó nổi tiếng bởi tính đơn giản hơn hẳn so với XML và JSON. Nó sử dụng thụt lề và dòng mới để phân tách dữ liệu thay cho biểu tượng và dấu ngoặc nhọn. Bạn cũng có thể sử dụng ngôn ngữ này với các ngôn ngữ khác, chẳng hạn như Go.
Tuy nhiên, nó không phải ngôn ngữ thân thiện với người mới bắt dầu. Điều này có thể sinh dẫn tới lỗi xác thực, ví dụ bạn không thể thụt lề dữ liệu chính xác.
Cách viết YAML
Ví dụ về file YAML:
Employees:
- name: Alice Johnson
Department: Marketing
country: Canada
- name: Carlos Rodriguez
Department: Finance
country: Spain
Tài liệu YAML này chứa một danh sách nhân viên, từng thành phần đều có những thuộc tính sau:
- Name: Tên nhân viên (ví dụ: Alice Johnson, Carlos Rodriguez).
- Department: Bộ phận nhân viên làm việc (ví dụ: phòng tiếp thị, tài chính).
- Country: Quốc gia mà nhân viên làm việc (ví dụ: Canada, Tây Ban Nha).
Ưu điểm của YAML
- YAML là ngôn ngữ chuỗi dữ liệu đơn giản nhất được sử dụng hiện nay.
- Khác JSON, YAML hỗ trợ bình luận.
- YAML cũng bao gồm hỗ trợ cho các cấu trúc dữ liệu phức tạp hơn như anchor và alias.
YAML, XML và JSON đều là các định dạng trao đổi dữ liệu với điểm mạnh và cách sử dụng riêng. Lựa chọn giữa những định dạng này phụ thuộc vào yêu cầu cụ thể của dự án.
YAML vượt trội về cấu hình và khả năng đọc, XML cung cấp khả năng mở rộng và xác thực, còn JSON có lợi thế về tính hiệu quả và được hỗ trợ rộng rãi trong lập trình web hiện đại. Hiểu điểm mạnh và đặc điểm của từng định dạng sẽ giúp bạn chọn được ngôn ngữ phù hợp nhất.