Bạn phụ thuộc vào email và không thể làm việc mà không có nó. Tuy nhiên hầu như đa số người dùng (trừ các chuyên gia CNTT) vẫn cảm nhận về email như một điều gì khó hiểu và đôi khi có phần kỳ diệu. Bạn chỉ cần viết một thông điệp trên máy tính, kích Send và sau đó ít phút, nó xuất hiện trong hộp thư của người nhận bất kể họ ở đâu. Thật tuyệt!
Email có vẻ như vô hình. Bề ngoài bạn không thể biết được rằng sự phân phối email quả thực là một hệ thống phức tạp với rất nhiều thao tác cần phải thực hiện. Đó thưc sự là một câu chuyện thú vị? Tuy nhiên nếu bạn phải đứng ra chịu trách nhiệm về vấn đề phân phối email hoặc quản lý công việc nặng nhọc như các quản trị viên email thì bạn cần phải biết được những vấn đề tối thiểu về công nghệ này.
Trong bài này chúng tôi sẽ tập trung giới thiệu cho bạn các công nghệ của email. Chúng tôi sẽ không đi sâu vào vấn đề quản lý mail cũng như các chính sách công ty hay các vấn đề có liên quan đến hành vi con người. Bài này cũng không nhắm đến các vấn đề chính trong cuộc chiến chống spam, mặc dù cuộc chiến spam đang dần trở thành một công việc quan trọng đối với các quản trị viên email ngày nay. Có rất nhiều các bài khác với chủ đề nêu trên đã được chúng tôi đưa ra trước đây bạn hoàn còn có thể tham khảo.
Bài này cũng dự tính sẽ không đi sâu vào chuyên môn kỹ thuật: với những kiến thức ABC, không có nghĩa là toàn bộ từ A đến Z. Các quản trị viên có lẽ đã hiểu rằng nếu giải thích khái niệm đầy đủ có thể tốn đến 40 trang giấy dày đặc các định nghĩa kỹ thuật; hầu như trong số đó lại quá khó hiểu cho đại đa số người dùng. Mặc dù vậy nếu email là quan trọng đối với doanh nghiệp thì bạn phải làm sao cho các nhân viên trong công ty của mình có những kiến thức nhất định về email cùng với một số người có trách nhiệm quan trọng với nó. Bài này sẽ giới thiệu những cơ sở nền tảng công nghệ vì vậy bạn sẽ có được hiểu biết về quá trình làm việc của nó như thế nào và những gì có thể diễn ra.
Email đến được hộp thư của người nhận như thế nào?
Có lẽ nền tảng đầu tiên là email không được quản lý bởi một loại máy chủ hay công nghệ nào. Nó là một gói giao thức được phục vụ bởi các tiến trình riêng biệt. Chúng ta sẽ xem xét đến các tiến trình này sau khi hiểu qua về vấn đề tổng quan.
Bạn đã từng viết thư trong máy khách email của bạn – các ứng dụng phần mềm có thể sử dụng trên desktop để giúp soạn thảo và tổ chức thư tín, như chương trình Microsoft Outlook, Apple Mail hoặc Thunderbird. Các chuyên gia Email gọi các ứng dụng máy khách đó là mail user agent (MUA).
MUA có thể không phải là một ứng dụng desktop; nó có thể là một ứng dụng "Web mail" chạy trên máy chủ Web và máy chủ này cho phép bạn điều khiển bằng cách sử dụng trình duyệt. Web mail client, dù thông qua Gmail, Yahoo hay front end công ty đến hệ thống khác, đều được xử lý theo cùng một cách với tư cách MUA của desktop client trong phần còn lại của tiến trình truyền tải email.
Khi bạn kích vào nút Send, thư tín sẽ không suất hiện trên màn hình và thiết lập một chuỗi các sự tiện chuyển mail. Sau khi kích vào nút Send, thư được truyền tải đến outgoing mail server (máy chủ mail gửi) của bạn, máy chủ mail này có thể được đặt tên dạng như mail.tencongty.com. Máy chủ mail – trước đây được gọi là một tác nhân truyền tải mail (MTA) – chấp thuận thư, vì bạn đang ở trong một mạng tin cậy hoặc vì bạn đã cung cấp username và password (thông thường được lưu trong các file cấu hình của MUA). Tiến trình mạng này được hoàn thành bằng sử dụng giao thức truyền tải mail đơn giản - Simple Mail Transfer Protocol (SMTP), và tiến trình bảo đảm người gửi là tin cậy được gọi là SMTP chứng thực.
Khi thư của bạn trong hàng đợi, máy chủ mail cần gửi nó đi. Máy chủ mail lên lạc với máy chủ mail của người nhận và tuyền tải thư bằng giao thức SMTP. Nhưng với hàng triệu máy chủ mail, thì đâu là máy chủ mail mà nó cần phải liên lạc? Máy chủ mail của bạn sẽ tìm kiếm trên máy chủ DNS (máy chủ tên miền), các máy chủ này được hiểu như một kiểu danh mục thẻ thư viện của Internet, để tìm ra ai đã ký để chấp nhận mail cho miền của người nhận. DNS cho máy chủ mail của bạn các bản ghi trao đổi mail (MX) đã được đăng ký cho miền đó. Từ đó trao cho máy chủ mail của bạn một máy chủ để liên lạc và nó bắt đầu truyền tải trên đó.
Thư tín được gửi trên Internet thông qua TCP/IP (Transmission Control Protocol/Internet Protocol).
Quá trình truyền thông giữa máy chủ tới máy chủ có phần khác đôi chút so với những gì nó thực hiện khi trao đổi với client MUA, mặc dù cả hai đều sử dụng SMTP. Một điểm khác nữa đó là giữa các thiết lập của quản trị viên và chương trình mã đã thiết lập từ trước, mỗi máy chủ mail sẽ thừa nhận rằng thư tín đã bị định dạng sai (giống như việc từ chối của bưu điện đối với một lá thư thiếu địa chỉ phố đầy đủ), vì nó không đúng với nguyên tắc trong hành động gửi spam hoặc virus.
Chủ yếu là để chống spam nên hầu hết các máy chủ mail đều xử lý thư qua một tiến trình gồm nhiều bước nhỏ trước khi chúng chấp nhận dữ liệu, lại càng không lưu nó và chuyển tiếp đến người dùng. Các bước này sẽ được chúng tôi giới thiệu sơ qua bên dưới.
Lưu ý rằng, chúng tôi đang đơn giản hóa hết mức quá trình truyền thông ở đây.
Hãy biết rằng có rất nhiều bước trong một quá trình và mỗi một bước lại được quản lý bởi các chuẩn. Ví dụ RFC 2821 đưa ra chuẩn SMTP, chuẩn này gồm có cách gửi mail trên mạng. RFC 2822 đưa ra định dạng cơ bản cho thông báo email, gồm có các header (To:, Cc:, Subject: …). Các quản trị viên email của bạn có thể sẽ hiểu được rất kỹ về các vấn đề này.
Khi thư tín đến được máy chủ mail đích thì máy chủ này sẽ chịu trách nhiệm cho việc phân phối đến người nhận (như mail.tencongtykhachhang.com), nó chuẩn bị để phân phối đến từng cá nhân đang đợi thư của bạn. Ở đây cũng có nhiều lựa chọn cho quản trị viên mail, trong cách mail sẽ được lưu như thế nào và được chuyển tiếp ra sao đến người dùng. Mỗi tổ chức (hoặc các quản trị viên email của nó) quyết định xem phương pháp nào là tốt nhất với những nhu cầu của họ. Hầu hết, giao thức chính đã sử dụng trong tổ chức của chúng tôi là Internet Message Access Protocol (IMAP), giao thức này cho phép giữ tất cả các thư trên máy chủ mail đến, được phân loại một cách gọn gàng thành các thư mục của người dùng. Ngày nay các công ty thường sử dụng Post Office Protocol (POP3). Sử dụng POP3 e-mail, lệnh “Tải thư mới” trong MUA của bạn cho phép ứng dụng có thể download tất cả các thư tín về máy tính. Trong bất kỳ hoàn cảnh nào, các thư tín email sử dụng POP3 sau đó đều được xóa trên máy chủ mail.
Người nhận chuyển qua một lệnh “Tải thư mới” trên MUA của chính họ… và có được thư mà bạn đã gửi. Điều kỳ diệu là thư tín của bạn có thể du lịch vòng quanh thế giới thông qua 5 hoặc 6 máy tính đơn lẻ. Tuy nhiên trong nhiều trường hợp, thư của bạn đến được máy tính của người nhận trong vòng một hoặc hai phút. Tất cả những công việc đó được thực hiện rất nhanh khi hệ thống làm việc. Vậy điều gì sẽ xảy ra khi hệ thống gặp vấn đề?
Email có thể bị giữ chậm hoặc bị mất liên lạc ra sao?
Sự cường điệu hóa trước kia nói rằng Inernet như một “xa lộ điện tử”. Mặc dù vậy trong trường hợp này, một mạng các xa lộ cũng tương tự như các đường xa lộ khác nhau trong thực tế. Nếu bạn không bắt gặp một phương tiện nào đó trên đường đến văn phòng làm việc của mình thì có thể chỉ mất khoảng 20 phút để đến được văn phòng làm việc. Nhưng nếu đường có quá nhiều xe ca, bạn có thể mất đến 5 phút để có thể vượt qua mỗi một ngã ba hay ngã tư nào đó. Cấu trúc động cơ tốt cũng không thể giúp ích được bạn trong trường hợp này. Khi đó thời gian bạn tốn cho việc đến văn phòng sẽ mất hơn 20 phút là điều chắc chắn.
Hiểu tương tự như vậy đối với “xa lộ email”. Máy chủ email nhanh, nhưng các thư tín lại rất nhiều và đang đầy ắp ở hàng đợi. Lưu lượng Internet có thể yêu cầu các thư được định tuyến lại thông qua những đường dẫn không rành mạch. Đôi khi vấn đề có thể do các máy chủ mất kết nối với Internet, giắc cáp mạng bị rút, thay đổi các thiết lập MUA, hay gửi một file PowerPoint lên đến 10MB. Đây là vấn đề chung đối với máy chủ mail của bạn. Giống như đối với dịch vụ bưu chính, các thư từ có thể chuyển từ một địa điểm này sang một địa điểm khác trước khi chúng được phân phối. Các thư điện tử này được quản lý từ máy đến máy dưới mô hình “lưu và chuyển tiếp” liên quan đến nhiều máy tính, vì vậy tốc độ phân phối có thể thay đổi rất nhanh.
Điều này cũng có nghĩa rằng các thư tín “được đi du lịch” qua các máy tính có thể biết hoặc không biết người nhận và người gửi. Mô hình lưu và chuyển tiếp là một mô hình quan trọng trong phương pháp truyền tải email, vì nó cho phép các tuyến thứ cấp có thể thay đổi đường dẫn và tạo lại các kết nối khi có vấn đề nào đó xuất hiện.
Đó hoàn toàn là những thứ chưa đụng chạm gì đến các vấn đề gây khó chịu như spam và virus. Thêm vào đó là việc tiêu tốn một số lượng lớn về băng thông; virus, spam và Trojan horses có thể gây ra tốn rất nhiều thời gian và mọi nỗ lựu của các nhà quản trị mạng trong việc xây dựng bẫy để ngăn chặn những rủi ro không mong muốn lọt vào trong hộp thư của người dùng. Mọi gateway đều cần đến thời gian, giống như một cao tốc nhưng tốc độ lại chậm. Trước kia, các mail Server không được quan tâm nhiều về mặt kỹ thuật. Nhưng trong thế giới hiện tại, khả năng phân phối mail có thể bị tổn hại bởi các vấn đề kỹ thuật khác như các máy chủ tên miền (DNS) không đúng, việc điều chỉnh thiếu thận trọng các tham số timeout và định dạng mail khác thường.
Sau đó gánh nặng chuyển sang giải quyết các vấn đề spam, tấn công giả mạo và virus. Sẽ không có thứ như vậy khi thực hiện bảo vệ bằng bộ lọc spam. Tuy các bộ lọc này sẽ ngày càng được cải thiện nhưng bạn vẫn có thể phải lưu ý vì không ít thư thực sự lại bị đưa vào thư mục spam, và trong tình huống như vậy nếu không kiểm tra thư mục spam bạn sẽ cho rằng thư đó bị thất lạc.
Các rào cản khác đến từ việc thất bại máy khách và chủ email không được cấu hình (có thể như chính bạn) theo các nguyên tắc; thường chung hơn, mail này bị loại ra bởi các máy chủ mail của người nhận. Nếu điều đó xảy ra, thư sẽ bị giữ chậm hoặc bị mất. Điều đó có nghĩa rằng các công ty phải ép buộc công nghệ mail dựa trên các chuẩn (như khi bảo đảm rằng các địa chỉ mail bám chặt với RFC), và rằng người dùng phải có các hành vi thực hiện với email một cách đúng đắn.Một số lý do khác bao gồm việc không tương thích giữa các máy chủ mail của người nhận và người gửi. Trong trường hợp này thư sẽ bị giữ chậm lại hoặc bị mất. Do đó các công ty thường phải ép công nghệ mail dựa trên các chuẩn chung và người dùng lưu ý trong việc sử dụng địa chỉ email một cách đúng đắn và cần thiết.
Sự khác nhau giữa các giao thức IMAP/POP và tại sao cần phải quan tâm đến chúng?
Như đã đề cập từ trước, email có thể sử dụng rất nhiều giao thức Internet, các giao thức này là phương thức chuẩn công nghiệp cho việc truyền tải dữ liệu. Tối thiểu, bạn cũng phải có giao thức được sử dụng bởi các máy chủ mail vào– còn được gọi là “máy chủ người nhận”, thường là POP3 và IMAP. Các máy chủ mail đi (outgoing) - những máy chủ có nhiệm vụ gửi mail đến một hòm thư nào đó - sử dụng SMTP. Một công ty có thể có một máy chủ thẩm định riêng (LDAP) và có lẽ cả việc cung cấp các thành phần khác như lịch biểu (thường liên quan đến cơ sở dữ liệu SQL), Web mail (sử dụng các trình duyệt Web, với nó các giao thức tương đương là HTTP và IMAP), và kho lưu trữ tập trung của cấu hình máy khách (ACAP).
Mỗi một giao thức phục vụ cho một nhu cầu khác nhau hoàn toàn. Ví dụ, POP3 được thiết kế để hỗ trợ cho các máy khách đã ngắt kết nối và nhẹ tải. IMAP cung cấp kho lưu trữ máy chủ của các thư mục mail. LDAP cung cấp sự thẩm định không chỉ cho các hệ thống mail mà còn chon các ứng dụng khác. Mỗi một giao thức liên quan đến một vấn đề riêng.
Tuy nhiên hầu hết các giao thức này đều quan trọng, và nó tuỳ thuộc vào giao thức nào hợp với bạn. Có thể công ty của bạn cho là IMAP thiết thực hơn POP3 vì ngày nay IMAP thường được sử dụng phổ biến hơn POP3, mặc dù vậy cả hai đều có những ưu nhược điểm riêng. Chính vì vậy chúng ta hãy xem xét một chút về những ưu nhược điểm này.
IMAP phổ biến hơn vì mail vẫn nằm trong máy chủ. Hầu hết các máy khách mail (MUA) đều cho phép người dùng có thể đồng bộ dữ liệu với ổ cứng cục bộ - sự cần thiết khi di động, như trên các chuyến bay chẳng hạn – tuy nhiên, vị trí chính của các thư tín là trên máy chủ. IMAP cho phép việc quản trị trở lên dễ dàng hơn đối với các nhà quản lý CNTT vì chỉ có một máy tính để backup và nó cũng dễ dàng kiểm soát lượng không gian ổ tiêu tốn bằng việc hạn chế kích thước mailbox. Người dùng hiểu rõ giá trị khả năng truy cập mail của họ từ bất kỳ máy tính nào đang sử dụng MUA nào đó phù hợp, và vì IMAP có thể lưu trạng thái thư tín (như xem một thư đã được đọc hoặc được reply hay chưa) và giữ các thư đã được gửi đi.
IMAP (riêng SSL IMAP, có bổ sung thêm các tính năng mới) cũng có thể kích hoạt sử dụng băng tần một cách hiệu quả. Thay vì download các thư đến hòm thư của người dùng, mặc định IMAP gửi header của thư (người gửi, người nhận và dòng tiêu đề,…). Chỉ có các thư đã được chọn gửi đến hộp thư và máy khách mới có thể lấy về phần văn bản mà không lấy về các file đính kèm.
Tuy vậy, IMAP cũng có nhược điểm. Nếu một công ty giữ tất cả các mail trên một máy chủ, trong trường hợp không backup kịp thời cộng với số lượng email có thể là rất lớn, điển hình như các đính kèm hoặc các ảnh nhúng; nhiều công ty giải quyết vấn đề này bằng cách tạo các nguyên tắc về không gian đĩa (như tối đa là 100MB), điều đó sẽ làm khó chịu cho người dùng, nhất là những người thực sự cần đến nhiều nhu cầu.
Rõ ràng, IMAP email không thể truy cập mà không có kết nối Internet hoặc việc đồng bộ với một máy tính cục bộ nào đó. Nhiều tranh luận giữa các chuyên gia về POP email chỉ là một khía cạnh của IMAP. Vì các thư được tải về vào một máy tính riêng, nên kích thước hộp thư bị hạn chế bởi không gian đĩa có sẵn của người dùng, và các thư có thể được xem vào bất kỳ lúc nào khi đã tải về – tuy vậy nó chỉ có thể xem từ trên chính máy đã tải về nếu người dùng không có thiết lập cụ thể lưu lại mail đã tải trên máy chủ. Nó cũng cho người dùng một cảm giác về sự riêng tư, POP3 được sử dụng rộng rãi cho các kết nối dial-up và nó làm việc với một máy khách email cũ hơn (do người dùng giữ).
Lọc spam được tiến hành như thế nào?
Email có thể được lọc tại bất kỳ điểm nào trong tiến trình gửi thư. Nó không giống như những gì xảy ra bên đầu gửi ra (có thể vì những kẻ tấn công spam biết về những gì chúng đang thực hiện). Email nhận có thể được kiểm tra trên máy chủ (các công ty nên thực hiện như vậy).
Tại mức máy chủ mail, thư có thể được kiểm tra bởi các thiết bị hoặc phần mềm chuyên dụng (phần mềm có các công cụ chống virus), hoặc với tính năng được xây dựng bên trong bản thân máy chủ email (thông qua một số tùy chỉnh yêu cầu hoặc các tiện ích add-on).
Khi các bộ lọc máy chủ làm việc, không cần thiết phải cài đặt một bộ lọc trình khách. Tuy nhiên nếu không có công ty nào cài đặt bộ lọc trình chủ hoặc họ thực hiện không chu đáo trong việc duy trì phần mềm thì điều đó có thể làm cho các cá nhân đăng ký đối với ISP thương mại ngày càng giảm quyền điều khiển.
Tuy nhiên may thay hầu hết các ứng dụng email client, cả web mail và các ứng dụng desktop đều có kiểu lọc spam; ngoài ra bạn cũng có thể mua các add-on để chọn lọc thư tín và phân loại vào trong một thư mục hoặc ngược lại đánh dấu chúng là đã được kiểm tra cẩn thận. Dưới đây là một số phương pháp đã sử dụng:
- Bộ lọc header kiểm ta các header của thư – chủ đề, địa chỉ gửi đến, địa chỉ gửi đi, chuỗi relay của các máy chủ - để xem xem chúng có bị giả mạo hay không. Một số chương trình chống spam có thể phát hiện các header giả mạo, dựa vào đó để phân biệt spam. Lọc ngôn ngữ để loại ra các thư không phải ngôn ngữ bạn thường sử dụng.
- Ngoài ra còn có lọc nội dung, đây là phương thức kém hiệu quả nhất. Ngoài ra còn có phương pháp lọc điều khoản cho phép, cách thức này yêu cầu người gửi thẩm định chính bản thân họ.
Quả thực có rất nhiều vấn đề về email mà chúng ta cần phải thảo luận thêm trong tổng quan vắn tắt này. Trong bài viết này một số chủ đề không được đề cập đến ở đây như lưu trữ mail, mã hóa và quản trị mail. Chính vì đó mà chúng tôi sẽ đưa đến cho các bạn trong thời gian sớm nhất có thể, mong các bạn đón đọc.