Hàm str() trong Python
str trong Python được dùng như thế nào? Cách dùng lệnh str trong Python có khó không? Hãy cùng nhau tìm hiểu nhé!
Chuỗi là một kiểu lập trình cơ bản. Chúng là một chuỗi các ký tự chữ cái, số hoặc ký hiệu. Chuỗi Python thường được sử dụng khi xử lý văn bản, dữ liệu có cấu trúc hoặc dữ liệu từ các nguồn bên ngoài.
Vì vậy, nếu bạn muốn bắt đầu lập trình bằng Python, bạn cần biết cách xử lý chúng. Chuỗi không thể thay đổi, nghĩa là sau khi tạo, chúng không thể bị sửa đổi. Tuy nhiên, chúng có thể được thao tác bằng nhiều phương pháp khác nhau. Hãy cùng tìm hiểu về chuỗi hay lệnh str trong Python nhé!
Chuỗi trong Python là gì?
Chuỗi Python có thể được định nghĩa theo nhiều cách khác nhau: dấu ngoặc đơn hoặc dấu ngoặc kép, nhưng cũng có thể là 3 dấu ngoặc. Sử dụng ba dấu ngoặc đơn hoặc ba dấu ngoặc kép cho phép tính đến ngắt dòng khi hiển thị chuỗi.
Bạn có thể gán một chuỗi Python cho một biến để tối ưu hóa mã của mình và tránh quá tải nó bằng các chuỗi dài sẽ lặp lại trong toàn bộ mã. Chỉ cần hiển thị một chuỗi Python bằng hàm print().
Cảnh báo: nếu bạn muốn hiển thị một chuỗi chứa dấu ngoặc đơn hoặc dấu ngoặc kép, SyntaxError sẽ được trả về.
Python là ngôn ngữ lập trình nhất định bạn cần biết nếu muốn trở thành một chuyên gia trong ngành. Sở dĩ như vậy bởi Python hiện được dùng trong rất nhiều ứng dụng, phần mềm, web và nhiều hơn thế nữa. Thực tế, học Python không khó. Bạn chỉ cần nắm vững các hàm cơ bản và str() là một trong số đó.
Trong Python, hàm str() sẽ đưa đối tượng được chọn về dạng chuỗi.
Cú pháp của hàm str() trong Python
Hàm str() trong Python có cú pháp là:
str(object, encoding='utf-8', errors='strict')
Tham số của hàm str()
Hàm str() có 3 tham số:
- Đối tượng: Là đối tượng có thể hiển thị theo dạng chuỗi. Nếu không được cung cấp, kết quả trả về là một chuỗi trống.
- encoding: Encoding của một đối tượng. Nếu không được cung cấp, encoding mặc định là UTF-8.
- errors: Phản hồi khi encoding bị lỗi. Giá trị mặc định là 'strict'

Giá trị trả về của hàm str()
Hàm str() trả về một chuỗi được coi là đại diện không chính thức hoặc có thể in được của một đối tượng.
Ví dụ 1: Chuyển đổi đối tượng thành chuỗi bằng str()
Nếu 2 tham số encoding và errors không được cung cấp, hàm str() gọi method __str__() nội bộ của một đối tượng.
Nếu không thể tìm thấy method __str__(), nó sẽ gọi hàm repr(obj) để thay thế.
Ví dụ:
tentrang = str('Quantrimang.com')
print(tentrang)
Khi chạy chương trình, kết quả chúng ta thu được là:
Quantrimang.com
Lưu ý: Biến kết quả sẽ chứa một chuỗi.
Ví dụ 2: Hàm str() hoạt động như thế nào với các bytes?
Nếu tham số encoding và errors được cung cấp, tham số đầu tiên - đối tượng - sẽ phải là một đối tượng dạng bytes (bytes hoặc bytearray).
Nếu đối tượng dạng bytes hoặc bytearray, hàm str() sẽ gọi method bytes.decode(ecoding, errors).
Bên cạnh đó, nó sẽ lấy đối tượng bytes trong buffer trước khi gọi method decode().
Lỗi trong chuỗi
Khi dùng hàm str() trong Python, bạn có thể gặp phải 6 kiểu lỗi sau.
- strict (mặc định): Gây lỗi UnicodeDecodeError.
- Ignore: Bỏ qua Unicode chưa được mã hóa.
- Replace: Thay thế unicode chưa được mã hóa bằng dấu chấm hỏi.
- xmlcharrefreplace: Chèn tham chiếu ký tự XML thay cho Unicode không thể mã hóa.
- Namereplace: Chèn chuỗi thoát \N{…} thay cho một Unicode không thể mã hóa.
Ví dụ:
a = bytes("ŽString", encoding = 'utf-8')
s = str(a, encoding = "ascii", errors ="ignore")
print(s)
Kết quả
String
Ở ví dụ trên, ký tự Ž sẽ gây lỗi bởi nó không thể được giải mã bằng ASCII. Thế nhưng nó bị bỏ qua bởi các lỗi được thiết lập dưới dạng ignore.
Ví dụ
# str() xử lý đối tượng dạng bytes
b = bytes('Quantrimöng', encoding='utf-8')
print(str(b, encoding='ascii', errors='ignore'))
Kết quả trả về là:
Quantrimng
Ở đây, ký tự ö không thể decode bằng ASCII. Vì thế, nó sẽ gây ra lỗi. Tuy nhiên, chúng ta đã đặt tham số errors = 'ignore' nên Python sẽ bỏ qua ký tự không thể decode bằng hàm str().
Các ngoại lệ của str() trong Python
Hiện có 6 kiểu lỗi phát sinh từ hàm này:
- strict (default): Nó sinh lỗi UnicodeDecodeError.
- Ignore: Nó bỏ qua Unicode unencodable.
- Replace: Nó thay thế Unicode không thể mã hóa bằng dấu hỏi.
- xmlcharrefreplace: Nó chèn tham chiếu ký tự XML thay vì Unicode không thể mã hóa.
- backslashreplace: Chèn một chuỗi \uNNNN Espace thay vì Unicode không thể mã hóa.
- Namereplace: Chèn một chuỗi thoát \N{…} thay vì Unicode không thể mã hóa.
Ví dụ:
# Python program to demonstrate
# str()
a = bytes("ŽString", encoding = 'utf-8')
s = str(a, encoding = "ascii", errors ="ignore")
print(s)
Kết quả:
String
Ở ví dụ trên, ký tự Z sẽ sinh lỗi vì nó không thể được giải mã bởi ASCII. Thế nhưng nó sẽ bị bỏ qua vì lỗi được đặt dưới dạng ignore.
Bạn nên đọc
Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:


Cũ vẫn chất
-
Cách sao chép hoặc tạo bản sao toàn bộ trang tính trong Google Sheets
Hôm qua -
Dynamic System Updates là gì?
Hôm qua -
4 cách kiểm tra lịch sử giao dịch BIDV trên điện thoại, máy tính
Hôm qua -
Các cách làm, tùy chỉnh trong bài sẽ giúp tăng tốc Windows 10 của bạn "nhanh như gió"
Hôm qua 6 -
Hàm COUNTIFS, cách dùng hàm đếm ô theo nhiều điều kiện trong Excel
Hôm qua -
PING là gì? Test PING như thế nào?
Hôm qua -
Cách chặn từ khóa và Hashtag trên Twitter
Hôm qua -
Sạc không dây là gì? Nó nhanh hơn hay chậm hơn sạc dây? Danh sách smartphone Android hỗ trợ sạc không dây
Hôm qua -
Cách dùng Terabox lưu trữ với 1TB miễn phí
Hôm qua 5 -
Điểm ưu tiên, điểm khuyến khích, khu vực ưu tiên khi xét tuyển năm 2022
Hôm qua