PDF là xương sống của việc chia sẻ tài liệu học thuật và chuyên nghiệp. Mặc dù cực kỳ linh hoạt nhưng các file PDF có thể khó điều hướng và xử lý, đặc biệt là các file lớn hơn hoặc nhiều tài liệu. Đó là lúc Trí tuệ nhân tạo (AI) có thể can thiệp và nâng cao năng suất xử lý tài liệu PDF của bạn.
1. Tóm tắt file PDF bằng AI
Đôi khi, bạn chỉ cần những điểm nổi bật của bức tranh lớn từ một tài liệu PDF dài mà không cần sa lầy vào chi tiết hoặc muốn có một cách nhanh chóng để tìm hiểu xem tài liệu có đáng đọc hay không.
Bạn có thể yêu cầu ChatGPT đọc file PDF miễn phí, nhưng các lựa chọn thay thế như Microsoft Copilot và Gemini AI còn cung cấp nhiều thứ hơn thế.
Gemini AI, với plugin Google Workspace, có thể truy cập Google Drive và các file PDF trong đó. Để tóm tắt một tài liệu PDF, chỉ cần truy cập Gemini, sau đó yêu cầu nó truy cập tài liệu và cung cấp bản tóm tắt.
Để tính năng này hoạt động bình thường, nên đặt tên mô tả duy nhất cho file PDF. Sau đó, một prompt như thế này có thể khiến Gemini tóm tắt tài liệu PDF:
Give me a full summary of the "Diabetes Mellitus.pdf" document on my Google Drive.
Gemini cung cấp bản tóm tắt ngắn gọn và được tổ chức tốt về tài liệu PDF bao gồm hầu hết các chủ đề có trong tài liệu gốc.
Mẹo: Việc đặt tên tài liệu trong dấu ngoặc kép sẽ giúp tránh nhầm lẫn.
Microsoft Copilot (có thể truy cập trong Microsoft Edge), tiện lợi hơn Gemini một chút. Nó có thể truy cập trực tiếp vào các file PDF, vì vậy không cần phải upload chúng lên và mở AI trong một tab khác. Copilot thậm chí còn gợi ý prompt tóm tắt, giúp dễ dàng bắt đầu.
Khi sử dụng prompt của riêng mình, việc nhập @This page vào hộp prompt sẽ đặt ngữ cảnh của Copilot thành file PDF đang mở. Có thể tìm nạp bản tóm tắt bằng prompt như thế này:
Give me a full summary of @This page.
Cụm từ của prompt cũng ảnh hưởng đến bản tóm tắt PDF. Vì vậy, việc thử nghiệm các kỹ thuật viết prompt là rất quan trọng!
2. Tương tác với file PDF
Bạn có thể muốn tiến xa hơn việc trích xuất thông tin cơ bản từ một file PDF và hiểu được ý nghĩa của nó. Giao diện trò chuyện được hỗ trợ bởi AI cho phép tương tác với các file PDF như thể chúng là những trợ lý hiểu biết. Bạn có thể đặt câu hỏi về nội dung của file PDF bằng ngôn ngữ tự nhiên. AI sẽ phân tích truy vấn, ngữ cảnh hóa truy vấn đó dựa trên tài liệu và đưa ra câu trả lời có liên quan.
Có rất nhiều công cụ AI trả lời các câu hỏi từ file PDF. Hầu hết trong số này đều được hỗ trợ bởi ChatGPT, nhưng các nhà phát triển đã đào tạo chúng cách làm việc với các file PDF. Nếu thích gắn bó với những tên tuổi lớn, Gemini và Copilot là lựa chọn phù hợp.
Gemini của Google sử dụng quy trình tương tự như trước: Load file PDF từ Google Drive và đặt câu hỏi về file đó. Một bất tiện nhỏ là Gemini AI đôi khi cần một số thao tác thêm để truy cập các file. Nếu prompt không chính xác, nó sẽ trả lời rằng không thể truy cập các file PDF do lo ngại về bảo mật và quyền riêng tư.
Mẹo ở đây là khuyến khích Gemini truy cập bản PDF trước, sau đó trả lời các câu hỏi của bạn. Bắt đầu bằng cách đặt một câu hỏi về file PDF để nhắc Gemini tương tác với nội dung Drive. Sau đó, tiếp tục với nhiều câu hỏi hơn. Một prompt như thế này có thể bắt đầu cuộc trò chuyện:
What does the file 'Diabetes Mellitus.pdf' in my Google Drive say about treating DM patients who also have cardiovascular disorders?
Sau khi nhận được câu trả lời, hãy tiếp tục trả lời các câu hỏi còn lại, lần lượt từng câu một.
Phương pháp đàm thoại của Microsoft Copilot là một lợi thế lớn khi tương tác với file PDF. Hãy nhớ gắn thẻ file PDF bằng cách sử dụng @This page để hạn chế các câu trả lời cho nội dung của tài liệu. Tác giả bài viết đã đặt câu hỏi tương tự từ Copilot với prompt bên dưới:
What's the best pharmacological therapy for DM patients with cardiovascular disorders according to @This page?
3. Nhận thông tin chi tiết quan trọng từ nhiều file PDF bằng AI
Khi nghiên cứu kéo dài sang nhiều hơn một file PDF, giới hạn một file của Gemini và Copilot có thể cản trở tiến trình. NotebookLM của Google - một trong những laptop AI tốt nhất - có thể giúp ích. Người dùng có thể upload hoặc viết ghi chú của mình và NotebookLM sẽ phản hồi dựa trên chúng. Điều tuyệt vời nhất là cũng có thể upload các file PDF.
NotebookLM cho phép chọn các ghi chú cụ thể cho mỗi cuộc thảo luận, mang đến khả năng nghiên cứu vô tận. Ví dụ, có thể so sánh các báo cáo của công ty từ nhiều năm khác nhau hoặc tham khảo chéo các bài báo khoa học và có được thông tin chi tiết tức thì về các tài liệu. NotebookLM cũng đưa ra bản tóm tắt của từng file PDF ngay lập tức.
Ví dụ, tác giả đã upload hai bài giảng PDF về hai căn bệnh khác nhau lên NotebookLM. Sau đó hỏi một câu hỏi cần có ngữ cảnh từ cả hai file để trả lời:
What’s the difference in pharmacotherapy between stable ischemic heart disease and acute coronary syndrome?
NotebookLM cũng cung cấp các trích dẫn cho bất kỳ thông tin nào được trình bày. Bạn có thể nhấp vào từng trích dẫn để kiểm tra kỹ xem thông tin đó có thực sự đến từ file PDF hay không. Các câu hỏi gợi ý là một phần thưởng vì chúng không chỉ loại bỏ nỗi lo về việc viết prompt có chính xác không mà còn cung cấp thêm thông tin chi tiết nếu chưa nghĩ ra câu hỏi trước đó.
4. Tạo câu đố từ file PDF bằng AI
Dù cho mục đích là đào tạo, đánh giá nhân viên hay giáo dục, AI đều có thể giúp bạn học hỏi từ các file PDF. Các công cụ AI có thể phân tích nội dung của file PDF và xây dựng những câu đố hoặc kiểm tra kiến thức phù hợp dựa trên thông tin trong đó.
Copilot hoạt động tốt hơn Gemini trong việc tạo ra các câu đố – các câu hỏi do Gemini đặt ra quá rõ ràng. Một prompt đơn giản như bên dưới sẽ tạo ra một bài kiểm tra hữu ích trong Copilot:
"Create a multiple-choice quiz about @This page."
Mặc dù các câu hỏi có thể dễ mắc lỗi nhưng chúng rất tuyệt vời khi cần xem xét nhanh. Thật không may, Copilot đã quên đưa ra câu trả lời cho các câu hỏi và khi được yêu cầu đưa ra câu trả lời, nó quyết định không hợp tác. Đảm bảo yêu cầu nó đưa cả câu trả lời vào prompt ban đầu.
NotebookLM thậm chí còn là một công cụ mạnh mẽ hơn để tạo các câu đố. Khả năng sử dụng nhiều file PDF của NotebookLM cho phép nó tạo ra các câu đố bao gồm nhiều chủ đề khác nhau để đánh giá kỹ lưỡng. Hãy thử prompt này:
"Create a multiple-choice quiz from the three sources. It should have 10 questions. Provide the answers too."
Những đề xuất này về cách làm việc với file PDF có sự trợ giúp của AI chỉ là bước khởi đầu. Khi công nghệ AI phát triển, cách chúng ta tương tác với file PDF chắc chắn sẽ còn trở nên phức tạp hơn. Hãy nhớ rằng, AI ở đây để hỗ trợ chứ không phải để thay thế tư duy phản biện của bạn. Luôn xác minh thông tin và tham khảo ý kiến của các chuyên gia con người, đặc biệt trong các lĩnh vực nhạy cảm.