Các nhà phát triển trình chỉnh sửa video nguồn mở Kdenlive đã đưa tính năng AI vào bản phát hành mới của năm 2023, với việc bổ sung công cụ chuyển giọng nói thành văn bản Whisper của OpenAI. Điều này và một số tính năng cốt lõi mới khác làm cho phiên bản 23.04 mới phát hành của Kdenlive rất đáng mong đợi.
Kdenlive 23.04 đã chính thức phát hành
Kdenlive đã công bố một số tính năng mới được háo hức mong đợi trong bản phát hành mới nhất của phần mềm này. Đây là một năm đáng nhớ đối với các nhà phát triển - 23.04 là bản phát hành lớn đầu tiên kể từ chiến dịch gây quỹ thành công của họ vào đầu năm 2022.
Các nhà phát triển đã có một số mục tiêu tự định hướng đầy tham vọng để đạt được với bản phát hành này, bao gồm Nested Timelines, tính năng chuyển lời nói thành văn bản được cải thiện, bản dịch tiếng Anh nhanh chóng, cùng một loạt các bản sửa lỗi và cải tiến code thông thường.
Các tính năng mới đáng trải nghiệm trong Kdenlive 23.04
Có rất nhiều điều thú vị với phiên bản này. Đáng mong đợi nhất là thông báo về Nested Timelines và việc bổ sung công cụ OpenAI Whisper.
Nested Timelines
Nested Timelines không có gì mới, những editor đã sử dụng Nested Sequences trong Premiere Pro được một thời gian. Giờ đây, với phiên bản 23.04, người dùng Kdenlive có thể hợp lý hóa công việc của họ theo cách tương tự.
Về cơ bản, Nested Timeline cho phép một editor làm việc trên dự án theo các phần nhỏ (được gọi là sequence) thay vì một timeline dài, thường là không hợp lý. Trước khi Nested Timelines xuất hiện, editor có thể chỉnh sửa một sequence cụ thể, hoàn thiện bằng cách hiển thị nó ra, sau đó nhập sequence hiện đã hoàn thành trở lại dự án của họ. Nhưng có một lưu ý nhỏ, sau khi sequence đó được kết xuất và nhập lại, không thể chỉnh sửa nó được nữa.
Nested Timeline khắc phục được điều đó. Việc hoàn thiện và sau đó nhập lại từng sequence riêng lẻ không còn cần thiết nữa. Có thể tạo các timeline riêng biệt cho từng sequence, với một timeline chính bao gồm những sequence đó chứ không phải các clip riêng lẻ.
Mỗi sequence không chỉ có thể chỉnh sửa được trong nested timeline của riêng chúng mà bất kỳ thay đổi nào được thực hiện đối với chúng sẽ tự động phản ánh trong toàn bộ dự án chính.
Chuyển giọng nói thành văn bản OpenAI Whisper
Whisper là một công cụ chuyển giọng nói thành văn bản được tạo bởi OpenAI, nhóm chịu trách nhiệm về ChatGPT. Miễn phí và được cung cấp bởi các mạng nơ-ron nhân tạo và Deep Learning, dự án hứa hẹn một hệ thống xử lý ngôn ngữ tự nhiên và chính xác hơn để sử dụng trong các ứng dụng chuyển lời nói thành văn bản. Các nhà phát triển của Kdenlive đã thêm nó vào 23.04 để hỗ trợ tính năng phụ đề tự động.
Trong khi Kdenlive có sẵn một công cụ phụ đề hiện có, thì trong VOSK, việc bổ sung giao thức chuyển giọng nói thành văn bản Whisper hứa hẹn một sự cải tiến quan trọng. Một trong những ưu điểm chính của Whisper là độ chính xác tăng lên và khả năng chuyển âm thanh sang văn bản bằng tiếng Anh một cách nhanh chóng.
Nếu một editor phải xử lý một cảnh có ngôn ngữ nước ngoài cần phụ đề, thì về mặt lý thuyết, Whisper sẽ có thể thực hiện điều đó nhanh chóng. Các nhà phát triển đã nỗ lực để làm cho Whisper dễ cấu hình bằng cách tải xuống các file cần thiết thông qua màn hình cấu hình.
Timer
Hiệu ứng Timer mới có lẽ ít được nhấn mạnh nhất trong phiên bản 23.04. Đó là một tính năng hữu ích trông có vẻ đơn giản, nhưng trên thực tế, cho đến nay vẫn là một quy trình thủ công hơi phức tạp.
Tất nhiên, giống như hầu hết các NLE, Kdenlive bao gồm khả năng xem tiem code của dự án, nhưng nó không thể tùy chỉnh và chỉ đồng bộ với toàn bộ dự án. Tạo bộ hẹn giờ tự động và được đồng bộ với một clip hoặc một track là quá trình chuyên sâu bao gồm nhiều bước khác nhau.
Với bản cập nhật mới này, Timer có thể được thêm giống như bất kỳ hiệu ứng nào khác bằng thao tác kéo thả, có thể được chỉnh sửa nhanh chóng và dễ dàng thông qua Effect/Composition Stack bên cạnh.
Các tham số có thể điều chỉnh bao gồm phông chữ, kích thước, màu sắc, vị trí và bất kỳ thứ gì khác mà người dùng mong đợi.
Ngoài các tính năng mới, Kdenlive 23.04 cũng bao gồm những bản sửa lỗi và cải tiến thông thường cho bản phát hành năm 2023. Chúng bao gồm cải thiện hiệu suất của clip trong timeline, nhập tốt hơn các clip có kích thước file lớn, chức năng xử lý phụ đề được cải thiện và một loạt những hiệu ứng chuyển tiếp mới để editor sửa sử dụng.
Các nhà phát triển đã lưu ý trong thông báo rằng họ đang lên kế hoạch thay đổi quy trình làm việc với hiệu ứng, đồng thời hướng tới cải thiện hỗ trợ GPU trong bản phát hành tiếp theo.