Cách hoạt động của bộ lọc thư rác, các yếu tố kích hoạt spam, cần tránh
Mỗi ngày, hàng tỷ email rác bị chặn trước khi kịp xuất hiện trong hộp thư đến. Để làm được điều này, các nhà cung cấp dịch vụ email như Gmail, Outlook, Microsoft 365… sử dụng nhiều lớp bộ lọc khác nhau, từ phân tích nội dung, kiểm tra tiêu đề, danh sách đen IP đến công nghệ machine learning. Vậy bộ lọc spam hoạt động như thế nào và những yếu tố nào khiến email bị đánh dấu là spam? Cùng Bizfly tìm hiểu ngay sau đây.
Cách hoạt động của bộ lọc thư rác
Hầu hết các nhà cung cấp dịch vụ email (ESP) và nhà cung cấp dịch vụ Internet (ISP) không chỉ sử dụng một loại bộ lọc duy nhất. Thay vào đó, họ kết hợp nhiều công nghệ lọc khác nhau để tạo thành một hàng rào bảo vệ, ngăn chặn email chứa phần mềm độc hại tiếp cận người nhận.
Hệ thống lọc thư rác hoạt động theo cơ chế nhiều lớp, tương tự như một củ hành, với từng lớp đảm bảo mức độ bảo vệ khác nhau. Khi mỗi lớp được kiểm tra, số lượng email bị loại bỏ ngày càng nhiều, chỉ còn lại một số ít có thể đến được hộp thư đến của người dùng.
Quá trình lọc thư rác diễn ra theo các bước sau:
- Lọc nội dung: Hệ thống phân tích từ khóa trong email để xác định dấu hiệu của thư rác.
- Lọc tiêu đề: Kiểm tra siêu dữ liệu của email để phát hiện các dấu hiệu bất thường.
- Lọc danh sách đen: Hệ thống đối chiếu địa chỉ IP của người gửi với danh sách đen (DNSBL) để xác định xem IP đó có bị chặn hay không.
- Lọc theo quy tắc: Các quy tắc do người dùng thiết lập trong ứng dụng email sẽ được áp dụng để tự động phân loại thư.
- Lọc thử thách - phản hồi: Một số hệ thống yêu cầu người gửi xác minh danh tính trước khi email có thể được chuyển đến hộp thư đến.

Ngày nay, các thuật toán máy học (ML) đóng vai trò quan trọng trong việc phân loại email. Hệ thống sẽ được "huấn luyện" bằng cách phân tích các email hợp lệ và thư rác từ đó nhận diện các đặc điểm khác biệt giữa hai nhóm. Sau khi triển khai, bộ lọc sử dụng phương pháp phân loại để xác định email nào là thư rác và email nào là hợp lệ.
Bộ lọc thư rác của các nhà cung cấp dịch vụ email hoạt động thế nào?
Các dịch vụ email như Gmail, Google Workspace, Microsoft 365 (trước đây là Office 365), Outlook, Yahoo!, AOL, Hotmail… không tiết lộ chính xác cách thức họ chặn thư rác. Nếu thông tin này bị lộ, kẻ gửi thư rác có thể dễ dàng tìm cách vượt qua bộ lọc.
Dưới đây là một số nguyên tắc hoạt động chung:
- Gmail sử dụng thuật toán máy học, kết hợp với phản hồi của người dùng và báo cáo thư rác để cải thiện khả năng phát hiện. Bộ lọc kiểm tra địa chỉ IP của người gửi, các giao thức xác thực, cũng như tên miền chính và tên miền phụ của email hàng loạt.
- Microsoft 365 tích hợp bộ lọc chống spam Exchange Online Protection (EOP), sử dụng các công nghệ như lọc kết nối (dựa trên danh sách IP cho phép, danh sách chặn và danh sách an toàn) và lọc nội dung. EOP phân loại email theo các cấp độ như Thư rác, Thư rác có độ tin cậy cao, Lừa đảo, Lừa đảo có độ tin cậy cao và Email hàng loạt. Người dùng có thể kích hoạt bộ lọc nâng cao để giảm tối đa thư rác lọt vào hộp thư đến.
- Outlook có bộ lọc Thư rác (Junk Email Filter) nhưng mặc định không bật tính năng lọc tự động. Người dùng có thể tùy chỉnh mức độ bảo vệ: Thấp, Cao hoặc chỉ nhận email từ danh sách an toàn. Danh sách này đảm bảo email từ các địa chỉ đã được phê duyệt sẽ không bị chặn.
- Yahoo! và AOL sử dụng bộ lọc thư rác tiêu chuẩn, cho phép người dùng tự động phân loại email không mong muốn.

Những yếu tố kích hoạt bộ lọc thư rác
Các bộ lọc thư rác có nhiều cơ chế phát hiện khác nhau, nhưng nhìn chung, chúng sẽ đánh dấu một email là spam nếu phát hiện các yếu tố sau:
- Sử dụng từ ngữ mang tính spam như “miễn phí”, “kiếm tiền”, “trúng thưởng” hoặc các từ có nội dung nhạy cảm.
- Cụm từ quảng cáo quá mức như “tăng gấp đôi thu nhập”, “kiếm $$$ trong một ngày”, “tiền thưởng hấp dẫn”...
- Lạm dụng dấu câu như dấu chấm than (!!!), dấu hỏi (???).
- Chứa quá nhiều liên kết và nút kêu gọi hành động (CTA).
- Email có quá nhiều hình ảnh, chiếm hơn 40% nội dung.
- Sử dụng chữ IN HOA TOÀN BỘ.
- Lạm dụng ký hiệu như $$, %%...
- Địa chỉ URL hiển thị một trang nhưng dẫn đến một trang khác.
- Có lịch sử gửi thư rác hoặc có danh tiếng kém.
- Tỷ lệ tương tác thấp (ít người mở và đọc email).
- Lỗi mã HTML hoặc cấu trúc email không đúng chuẩn.
- Gửi email đến quá nhiều người nhận cùng lúc.
- Không có liên kết hủy đăng ký hoặc không có sự cho phép gửi email thương mại.
- Thiếu các giao thức xác thực email như SPF, DKIM, DMARC.
Bộ lọc spam ngày càng tinh vi với sự kết hợp của nhiều công nghệ tiên tiến, giúp bảo vệ người dùng khỏi thư rác và các mối đe dọa an ninh mạng. Tuy nhiên, để tối ưu hiệu quả gửi email, người dùng và doanh nghiệp cần tuân thủ các nguyên tắc như sử dụng nội dung rõ ràng, tránh từ khóa nhạy cảm, đảm bảo xác thực email và duy trì danh tiếng gửi tốt. Việc hiểu rõ cách hoạt động của bộ lọc spam sẽ giúp email đến tay người nhận một cách hiệu quả hơn. Đón đọc thêm các bài viết về Email Marketing được Bizfly cập nhật mỗi ngày tại đây
Bài viết nổi bật

[Không thể bỏ qua] 100+ thống kê về Email Marketing năm 2025
Bài viết cùng tác giả
Xem tất cả