html5-img
1 / 22

XÂY DỰNG HỆ THỐNG QUÉT THƯ RÁC TRÊN MÔI TRƯỜNG PHÂN TÁN

XÂY DỰNG HỆ THỐNG QUÉT THƯ RÁC TRÊN MÔI TRƯỜNG PHÂN TÁN. Nhóm thực hiện: Trần Kinh Lý – 0612252 Phạm Quốc Mỹ – 0612271. Giáo viên hướng dẫn: GVC. Cao Đăng Tân ThS. Đào Anh Tuấn. Nội dung. Tổng quan về luận văn . . 1. Tổng quan về thư rác. 2.

sage
Download Presentation

XÂY DỰNG HỆ THỐNG QUÉT THƯ RÁC TRÊN MÔI TRƯỜNG PHÂN TÁN

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. XÂY DỰNG HỆ THỐNG QUÉT THƯ RÁC TRÊN MÔI TRƯỜNG PHÂN TÁN Nhóm thực hiện: Trần Kinh Lý – 0612252 Phạm Quốc Mỹ – 0612271 Giáo viên hướng dẫn: GVC.Cao Đăng Tân ThS. Đào Anh Tuấn

  2. Nội dung • Tổngquanvềluậnvăn. 1 Tổngquanvềthưrác 2 Cáckỹthuậtquétthưrácsửdụngtronghệthống 3 Hệthốngthửnghiệm 4 Cáckếtquảđạtđược 5 Hướngpháttriển 6

  3. Tổngquanvềluậnvăn • Mục đích chọn luận văn • Thư rác là một trong những thách thức lớn nhất hiện nay. • Đa số các phần mềm chống thư rác là dựa trên header của thư hoặc địa chỉ từ người gửi => luận văn dựa vào nội dung của thư => tốc độ quét thư chậm => quét thư trên môi trường song song Vì những lý do trên đề tài “Xây dựng hệ thống quét thư rác trên môi trường phân tán” được hình thành.

  4. Tổngquanvềthưrác • Địnhnghĩathưrác: thư rác là thư điện tử không theo mong muốn của người nhận và trong số đó các thư điện tử quảng cáo, thương mại chiếm đa số

  5. Tổngquanvềthưrác • Các đặc tính của thư rác: • Thư rác mang tính tương đối. • Tính bất biến trong một thư rác.

  6. Cáckỹthuậtlọcthưrác • Blacklisting: danhsáchđịachỉkhông tin cậy. • Whitelisting: danhsáchđịachỉ tin cậy. • Heuristic filtering: dựavàotậpluật. • Challenge/ Response: xácthựcngườidùng. • Throttling: khốngchếsốlượng email đượcgửi. • Address obfuscation: thayđổiđịnhdạngchốngthuthập email. • Collaborative filtering: nhómngườidùng tin cậy.

  7. Các kỹ thuật quét thư rác sử dụng trong hệ thống xây dựng • Kỹ thuật thống kê • Kỹ thuật so khớp

  8. Các kỹ thuật quét thư rác sử dụng trong hệ thống xây dựng • Kỹ thuật thống kê Tậpdữliệu lịchsử Thưđiệntử Bộtáchtừ Huấnluyện Máyphântích Là spam ? Sai Gửitớingườidùng Ngườidùng phảnhồi Đúng Đánhdấu Bộlọcxác địnhđúng? Không PHÂN LOẠI HUẤN LUYỆN

  9. Các kỹ thuật quét thư rác sử dụng trong hệ thống xây dựng • Kỹ thuật thống kê

  10. Kiểmtrađộchínhxáccủabộlọcthưrác

  11. Các kỹ thuật quét thư rác sử dụng trong hệ thống xây dựng • Kỹ thuật so khớp • Điều kiện • Tỉ số độ dài nội dung hai thư (đã tách từ) cần so khớp xấp xỉ 1,1. • Ngưỡng độ tương tự khi phân loại là thư rác là 0,7. Nội dung thư rác đã lưu Nội dung thư cần phân loại độ tương tự

  12. Hệ thống thử nghiệm • Mô hình hệ thống

  13. Hệ thống thử nghiệm • Mô hình xửlýtrêndữliệuriêngcủamỗingườidùng

  14. Hệ thống thử nghiệm • Quá trình quétthưrác Kỹthuật thốngkê Là Spam ? Kỹthuật sokhớp Sai Đúng Ngườidùng

  15. Hệ thống thử nghiệm • Kết quả thử nghiệm trên phân tán

  16. Hệ thống thử nghiệm • Kết quả thử nghiệm trên phân tán

  17. Cáckếtquảđạtđược • Lý thuyết • Tìm hiểu được khá chi tiết về đặc điểm của thư rác và các kỹ thuật phát hiện thư rác đã có. • Mô tả khá đầy đủ về cơ sở lý thuyết của kỹ thuật quét thư rác thống kê và so khớp dùng trong hệ thống thử nghiệm.

  18. Cáckếtquảđạtđược • Ứng dụng • Nhóm đã xây dựng thử nghiệm thành công hệ thống quét thư rác trên môi trường phân tán, ứng dụng kỹ thuật so khớp và kỹ thuật thống kê. • Với hệ thống thực nghiệm mà nhóm xây dựng đã đạt được tính chính xác xấp xỉ 94% sau khi thực nghiệm.

  19. Cáckếtquảđạtđược • Đánh giá • Ưu điểm • Khả năng thích nghi (học) cao với sự tiến hóa của thư rác rất nhanh. • Thể hiện tính cá nhân hóa mạnh mẽ do mỗi người dùng có thể có một tập dữ liệu riêng. Chính điều này làm cho độ chính xác đối với từng người dùng tăng lên đáng kể. • Khuyết điểm • Phải mất một khoảng thời gian đầu huấn luyện cho bộ lọc.

  20. Hướngpháttriển • Kết hợp hệ thống thực nghiệm mà nhóm xây dựng với các hệ thống quét thư rác khác (như Spam Assassin, Spam Fighter, …). • Cài đặt kho dữ liệu chung kết hợp với kho dữ liệu cá nhân. • Nâng khả năng lọc thư rác loại nội dung là hình ảnh, ký tự lạ, …. • Xây dựng hoặc cải tiến “front mail server” để tăng tốc độ chuyển tiếp mail vào hệ thống quét. • Lọccác token làtừghépdựavàoviệcnóxuấthiệnnhiềulầntrongthôngđiệp.

  21. Mô hình hệ thống cải tiến

  22. Cảm ơn đã lắng nghe! Nhóm thực hiện: Trần Kinh Lý – 0612252 Phạm Quốc Mỹ – 0612271 Giáo viên hướng dẫn: GVC. Cao Đăng Tân ThS. Đào Anh Tuấn

More Related