Thuật toán YouTube hoạt động như thế nào?

Với số lượng video trên YouTube cực kỳ lớn (lên đến hàng tỉ giờ phát trực tuyến), số lượng người xem cực kì nhiều (hơn một tỷ người sử dụng YouTube), hầu như mọi quốc gia, mọi giới tính, lứa tuổi từ trẻ nhỏ thanh niên đến các cụ già cũng có thể dễ dàng sử dụng Youtube, nhưng bạn đã bao giờ thắc mắc thuật toán YouTube hoạt động như thế nào chưa? Thực tế là các thuật toán của YouTube giúp quản lý phân phối những video gợi ý khi bạn truy cập và sử dụng nhằm làm sao giữ chân người dùng lâu nhất có thể. Không quá khi nói rằng đây là một minh chứng cho kỹ nghệ phần mềm tiên tiến của YouTube. Hãy cùng khám phá xem cách thức hoạt động của thuật toán này nhé.

Thuật toán YouTube

Câu trả lời ngắn gọn: Không ai biết chi tiết thuật toán này như thế nào, thậm chí là cả YouTube, ở một mức độ nào đó. Thuật toán của YouTube sử dụng tính năng học máy (machine learning) để đề xuất video cho người dùng, điều đó có nghĩa là không có một quy tắc cụ thể nào được thuật toán sử dụng để chúng ta có thể đi sâu vào nghiên cứu. Bên cạnh đó, Google cũng sẽ không cho chúng ta biết, vì điều đó sẽ dẫn đến những người khai thác trái phép.

Những gì chúng ta có thể biết

Thuật toán của YouTube sử dụng tính năng học máy (machine learning)

Khi bạn đào tạo một mô hình học máy, bạn sẽ cung cấp cho nó một loạt các dữ liệu, thông tin đầu vào và sau đó xếp hạng cho các kết quả đầu ra được chúng đề xuất theo mức độ hợp lý và chính xác của kết quả. Dưới đây là một ví dụ rất đơn giản.

Giả sử bạn muốn huấn luyện cho AI để nó phân biệt được sự khác nhau giữa hình ảnh của mèo và chó. Về cơ bản, bạn sẽ cung cấp cho AI một loạt các hình ảnh của chó và mèo, bắt đầu cho AI lựa chọn, và sau đó ghi điểm cho AI là đúng nếu câu trả lời nó đưa ra là chính xác. Càng nhiều lần chọn chính xác thì kết quả đưa ra càng tốt. Kết quả cuối cùng là bạn có một cỗ máy có thể xác định được chó và mèo. Khóa đào tạo này sử dụng số liệu mà theo đó kết quả sẽ được đánh giá; trong ví dụ này sẽ là phần trăm của các hình ảnh thực sự là con mèo đc máy nhận diện.

Số liệu YouTube sử dụng sở đây là thời gian xem, tức là thời lượng mà người dùng dành cho video đó. Khá là hợp lý bởi vì YouTube không muốn mọi người bỏ nhiều thời gian cho việc tìm kiếm video để xem, điều này vô hình chung làm giảm thời lượng xem video của họ.

Tuy nhiên, không phải chỉ mỗi thống kê “thời gian bạn xem một video” thuật toán này còn làm được nhiều điều hơn thế. Thuật toán đưa vào tài khoản nhiều yếu tố khác nhau và xếp hạng chúng như sau: Tỷ lệ giữ chân người xem, số lần nhấp chuột, mức độ tương tác của người xem và một số yếu tố “hậu trường” khác mà chúng ta chưa từng biết đến. Sau đó, YouTube sẽ tiến hành điều chỉnh các yếu tố này cho ứng với tiểu sử hoạt động của bạn để có thể đề xuất các video mà nhiều khả năng bạn sẽ nhấp vào hơn.

Những điều bạn rút ra được từ thuật toán này

Nếu bạn là một người dùng YouTube đầy tham vọng, có hai điều chính bạn cần phải làm đó là thúc đẩy thời lượng xem trung bình trên các video của mình và tối đa hóa tỷ lệ nhấp chuột vào các video của bạn. Có thể tham khảo kim tự tháp ngược sau đây để hiểu rõ hơn:

Kim tự tháp ngược

YouTube sẽ đề xuất video của bạn với một nhóm người có khả năng sẽ phù hợp với các video đó trên màn hình chính và trong các tab được đề xuất. Ví dụ trong tài khoản của bạn, bạn các video của bạn có được gần 750 nghìn lần được hiển thị. Nghe thì có vẻ khá ấn tượng, nhưng chỉ một phần nhỏ người dùng thực sự nhấp vào các video của bạn. Số liệu này được gọi là tỷ lệ nhấp chuột của bạn (click-through rate) và được tính bằng phần trăm (bạn có thể thấy trong ví dụ trên, tài khoản YouTube này có tỷ lệ nhấp chuột là 4,0%). Chỉ số lượt xem (Views figure) hiển thị số lượng người thực sự đã nhấp vào video. Sau khi ai đó nhấp vào video, YouTube sẽ bắt đầu tính lượng thời gian mà những người đó đã xem video.

Bạn có thể thấy lý do tại sao rất nhiều YouTuber sử dụng mẹo chèn tiêu đề và hình thu nhỏ của clickbait (Clickbait thường để chỉ những bài viết khơi gợi sự tò mò để người dùng click vào và sẽ được chuyển đến những nội dung không thực sự cung cấp nhiều thông tin cho người xem) trên các video để kiểm được những lượt view, những số lần click chuột. Điều này nhiều khi gây khó chịu cho người dùng.

Một số trường hợp điển hình

Chúng ta hãy cùng xem xét hai kênh YouTube lớn có các cách tiếp cận khác nhau để giải quyết thuật toán. Đầu tiên Primitive Technology, một kênh được điều hành bởi một anh chàng chuyên đi vào những khu vực đồi núi, rừng rậm hoang dã và tự mình làm mọi thứ mà không cần bất kì công cụ hiện đại nào. Tất cả các video của anh ta đều rất dài nhưng vẫn luôn giữ được mức độ tương tác rất tốt trong suốt thời lượng đó. Có nghĩa là các video của anh có thời lượng xem trung bình rất cao, và điều này đồng nghĩa với việc các video này sẽ có nhiều khả năng “lọt vào mắt xanh” của thuật toán YouTube hơn.

kênh Primitive Technology

Điều đáng ngạc nhiên là kênh Primitive Technology có tới hơn 8 triệu lượt người đăng ký - một kỳ tích bởi anh ấy chỉ post lên 1 video mỗi tháng. Có thể là do khoảng thời gian dài giữa mỗi lần các video mới đc upload đã tạo ra cảm giác mới mẻ, háo hức hơn cho người dùng. Video của anh ấy dường như mang tính biểu tượng nên bất cứ khi nào chúng hiển thị trong các danh mục đề xuất xem, có khả năng nhiều người sẽ nhấp vào chúng, do vậy anh ấy cũng có thể có tỷ lệ nhấp chuột vào video khá cao.

Kênh YouTube thứ hai có một cách tiếp cận hơi không được đúng đắn cho lắm. Đó là BCC Trolling, một kênh tổng hợp các khoảnh khắc hài hước trong game Fortnite. Kênh này chuyên lấy clip từ các streamer Fortnite nổi tiếng và sau đó chỉnh sửa chúng thành các video để đăng hàng ngày. Trong năm qua, kênh này đã nắm vững nguyên tắc hoạt động thuật toán và qua đó thu về được lượt người đăng ký lên tới 7,3 triệu. Để tối đa hóa thời gian xem, họ đặt các banner quảng cáo ở giữa video, buộc những người xem video phải xem quảng cáo đó trong một khoản thời gian hoặc là sẽ phải mất thời gian tắt các quảng cáo đó đi. Về cơ bản, điều này sẽ góp phần khiến thời gian xem của họ cao hơn.

BCC Trolling

Ngoài ra kênh này cũng rất xuất sắc trong việc sử dụng thủ thuật Clickbait. Họ thường chèn từ *NEW* ở hầu như tất cả các tiêu đề video và luôn sử dụng những hình thu nhỏ cho video đầy màu sắc thường được tạo tùy chỉnh và rất dễ gây hiểu lầm.

Một bài học chúng ta có thể rút ra từ BCC: Nếu bạn định sử dụng clickbait, hãy làm điều đó một cách tinh tế, bởi nó có thể làm cho mọi người tức giận và phản tác dụng.

Tổng kết

Tóm lại bạn nên nắm được cách thức hoạt động của thuật toán để đưa ra những chiến lược phù hợp sao cho kênh YouTube của bình có thể thu về được nhiều thời gian xem và tỷ lệ nhấp chuột. Tuy nhiên, đường trở thành “con rối” cho các thuật toán này mà khiến cho các nội dung của mình trở nên kém hấp dẫn trong mắt người xem, đây là cách phát triển không bền vững.

Xem thêm:

Thứ Năm, 13/09/2018 08:52
44 👨 1.504