Hàm str() trong Python

Str trong Python là gì? Cách dùng str Python như thế nào? Hãy cùng Quantrimang.com tìm hiểu nhé!

Python là ngôn ngữ lập trình nhất định bạn cần biết nếu muốn trở thành một chuyên gia trong ngành. Sở dĩ như vậy bởi Python hiện được dùng trong rất nhiều ứng dụng, phần mềm, web và nhiều hơn thế nữa. Thực tế, học Python không khó. Bạn chỉ cần nắm vững các hàm cơ bản và str() là một trong số đó.

Trong Python, hàm str() sẽ đưa đối tượng được chọn về dạng chuỗi.

Cú pháp của hàm str() trong Python

Hàm str() trong Python có cú pháp là:

str(object, encoding='utf-8', errors='strict')

Tham số của hàm str()

Hàm str() có 3 tham số:

  • Đối tượng: Là đối tượng có thể hiển thị theo dạng chuỗi. Nếu không được cung cấp, kết quả trả về là một chuỗi trống.
  • encoding: Encoding của một đối tượng. Nếu không được cung cấp, encoding mặc định là UTF-8.
  • errors: Phản hồi khi encoding bị lỗi. Giá trị mặc định là 'strict'
Hàm str() trong Python trả về dạng chuỗi của một đối tượng
Hàm str() trong Python trả về dạng chuỗi của một đối tượng

Giá trị trả về của hàm str()

Hàm str() trả về một chuỗi được coi là đại diện không chính thức hoặc có thể in được của một đối tượng.

Ví dụ 1: Chuyển đổi đối tượng thành chuỗi bằng str()

Nếu 2 tham số encodingerrors không được cung cấp, hàm str() gọi method __str__() nội bộ của một đối tượng.

Nếu không thể tìm thấy method __str__(), nó sẽ gọi hàm repr(obj) để thay thế.

Ví dụ:

tentrang = str('Quantrimang.com')
print(tentrang)

Khi chạy chương trình, kết quả chúng ta thu được là:

Quantrimang.com

Lưu ý: Biến kết quả sẽ chứa một chuỗi.

Ví dụ 2: Hàm str() hoạt động như thế nào với các bytes?

Nếu tham số encodingerrors được cung cấp, tham số đầu tiên - đối tượng - sẽ phải là một đối tượng dạng bytes (bytes hoặc bytearray).

Nếu đối tượng dạng bytes hoặc bytearray, hàm str() sẽ gọi method bytes.decode(ecoding, errors).

Bên cạnh đó, nó sẽ lấy đối tượng bytes trong buffer trước khi gọi method decode().

Lỗi trong chuỗi

Khi dùng hàm str() trong Python, bạn có thể gặp phải 6 kiểu lỗi sau.

  • strict (mặc định): Gây lỗi UnicodeDecodeError.
  • Ignore: Bỏ qua Unicode chưa được mã hóa.
  • Replace: Thay thế unicode chưa được mã hóa bằng dấu chấm hỏi.
  • xmlcharrefreplace: Chèn tham chiếu ký tự XML thay cho Unicode không thể mã hóa.
  • Namereplace: Chèn chuỗi thoát \N{…} thay cho một Unicode không thể mã hóa.

Ví dụ:

a = bytes("ŽString", encoding = 'utf-8')
s = str(a, encoding = "ascii", errors ="ignore")
print(s)

Kết quả

String

Ở ví dụ trên, ký tự Ž sẽ gây lỗi bởi nó không thể được giải mã bằng ASCII. Thế nhưng nó bị bỏ qua bởi các lỗi được thiết lập dưới dạng ignore.

Ví dụ

# str() xử lý đối tượng dạng bytes
b = bytes('Quantrimöng', encoding='utf-8')

print(str(b, encoding='ascii', errors='ignore'))

Kết quả trả về là:

Quantrimng

Ở đây, ký tự ö không thể decode bằng ASCII. Vì thế, nó sẽ gây ra lỗi. Tuy nhiên, chúng ta đã đặt tham số errors = 'ignore' nên Python sẽ bỏ qua ký tự không thể decode bằng hàm str().

Các ngoại lệ của str() trong Python

Hiện có 6 kiểu lỗi phát sinh từ hàm này:

  • strict (default): Nó sinh lỗi UnicodeDecodeError.
  • Ignore: Nó bỏ qua Unicode unencodable.
  • Replace: Nó thay thế Unicode không thể mã hóa bằng dấu hỏi.
  • xmlcharrefreplace: Nó chèn tham chiếu ký tự XML thay vì Unicode không thể mã hóa.
  • backslashreplace: Chèn một chuỗi \uNNNN Espace thay vì Unicode không thể mã hóa.
  • Namereplace: Chèn một chuỗi thoát \N{…} thay vì Unicode không thể mã hóa.

Ví dụ:

# Python program to demonstrate
# str()

a = bytes("ŽString", encoding = 'utf-8')
s = str(a, encoding = "ascii", errors ="ignore")
print(s)

Kết quả:

String

Ở ví dụ trên, ký tự Z sẽ sinh lỗi vì nó không thể được giải mã bởi ASCII. Thế nhưng nó sẽ bị bỏ qua vì lỗi được đặt dưới dạng ignore.

Thứ Năm, 19/09/2024 06:03
48 👨 31.795
0 Bình luận
Sắp xếp theo
    ❖ Học Python