1 / 23

Hoàng Hải Hưng

Hoàng Hải Hưng. Nguyễn Hồng Điệp. Nội dung. Giới thiệu. 1. Mô hình T- Lex. 2. Các điểm yếu của T- Lex. 3. Phương pháp tấn công. 4. Giới thiệu. 1. Mô hình T- Lex. 2. Các điểm yếu của T- Lex. 3. Phương pháp tấn công. 4. Giới thiệu. Tấn công. Không có chủ ý. Có chủ ý.

cricket
Download Presentation

Hoàng Hải Hưng

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. HoàngHảiHưng NguyễnHồngĐiệp

  2. Nội dung Giớithiệu 1 Môhình T-Lex 2 Cácđiểmyếucủa T-Lex 3 Phươngpháptấncông 4

  3. Giớithiệu 1 Môhình T-Lex 2 Cácđiểmyếucủa T-Lex 3 Phươngpháptấncông 4

  4. Giớithiệu Tấncông Khôngcóchủ ý Cóchủ ý • Lỗiđườngtruyền • Mấtmátthông tin khinén • Đổidịnhdạng • … • Dựatrêncácthuộctínhthốngkê

  5. Giớithiệu 1 Môhình T-Lex 2 Cácđiểmyếucủa T-Lex 3 Phươngpháptấncông 4

  6. Hệthốngẩndữliệu T-Lex • T-Lex (Tyrannosaurus Lex) làhệthốngẩndữliệudựatrênmôhìnhthaythếtừvựng • Vấnđềcơbảnlàphảigiữnguyên ý nghĩacủacâu

  7. Hệthốngẩndữliệu T-Lex (10011011010)2 Chuỗivănbảncầnnhúng Chuỗinhịphân Nén Huffman Nhúngvàovănbản

  8. Hệthốngẩndữliệu T-Lex little (101)2 Ho Chi Minh city is a little Ho Chi Minh city is a great little town

  9. Giớithiệu 1 Môhình T-Lex 2 Cácđiểmyếucủa T-Lex 3 Phươngpháptấncông 4

  10. Tấncônghệthống ADL text cấpđộtừ • Yếuđiểm pp ADL cấpđộtừ. • Môhìnhhóangônngữbằngthốngkê (n-grams) • Tấncông

  11. Yếuđiểm pp ADL vănbảndựatrênthaythếtừđồngnghĩa. • Vănbảnsaukhithaythếtừđồngnghĩa. • Khôngphùhợpvớicáchsửdụngngônngữ (tiếngAnh) thôngthường. Vídụ: • soon afterwards dispatched • soon subsequently dispatched • Khôngphùhợpvớithểloạivàcphongcáchtácgiảtrongvănbản.

  12. Giớithiệu 1 Môhình T-Lex 2 Cácđiểmyếucủa T-Lex 3 Phươngpháptấncông 4

  13. Môhìnhhóangônngữ N-Grams • Mộtmôhìnhngônngữlàmộtmôhìnhthốngkêướclượngxácsuấtcủachuỗicáctừđộdài n (n-gram). Nguồn ([1]) • Ex: P(thirớt) = p(rớt /thi) * p(thi)

  14. P(W) = ? • P(w) = r(w)/N • R(w) sốlầnxuấthiệncủa n-grams w. • N sốlượng N-gram chotrongvănbảnhuấnluyện.

  15. Stanford Research Institute Language Modeling (SRILM) Toolkit [3] • Thamsố • Loại n-gram đượcsửdụng. • Loạigiảithuật discounting đượcsửdụng. Good-Turing, absolute, Witten-Bell, vàKneser-Ney - chỉnhsửa. • Tùychọnmộttừđiểnxácđịnhtrước. • Loạibỏcáctừkhôngphổbiến (stop-word) hay làxemchúngnhư token xácđịnh. • Cóloạibỏtrườnghợpđặcbiệttrongvănbảnnhập. (ảnh: http://www.speech.sri.com/images/logo_sri.gif)

  16. Huấnluyệnmôhìnhngônngữthốngkê • Thaythếgiátrịđượcgáncho 3 thamsốquantrọngcủa SRILM đểlấy 8 môhìnhngônngữkhácnhau. 3 thamsốđólà: • Từvựng : đóng hay mở. • Model order: bìnhthườnghoặcbỏ qua • Cắtbỏtầnsố n-gram : cóhoặcloạibỏ n-grams xuấthiện 1 lần.

  17. Vector đặctrưngcủacâu • Thốngkêtừ (sốlượngtừ, cáctừkhôngthuộctừđiển, cáctừxácsuấtbằng 0). • Chiềudàingữcảnh n-gram nhỏnhất , vàlớnnhất. • Cácthốngkêvềướclượngxácsuấtcho n-gram trongcâu (mean, min, max) • Cácthốngkêmôhìnhchoxácsuấtcủa n-gram trongcâu (min, max). • Tổngxácsuấtcủacâu.

  18. Vídụ • Manfred Bender scored from a header in the 80th minute, four transactions after coming on. • Kếtquả - vector đặctrưngchocâutrên • Word statistics (Number of words (12), Out Of Vocabulary (OOV) words (2), Zero probability words (0) ) • Mimimum n-gram context length matchihg the model (1), and maximum (3) respectively • Statistics of model probability estimations for n-grams in the sentence (mean, min, max) (0.165, 0,0.827586)

  19. Cáchthứctấncông • Mụctiêutấncông. • Phânlớpcâucóẩndữliệu/ khôngẩndữliệu • Phươngpháp :Họcmáy SVM (support vector machine). • Sửdụngthưviệnlibsvm (nguồn[2])

  20. Kếtquảđạtđược • Kếtquả: • Độchínhxáckhiphânvàolớp : • Códữliệumậtlà 84.9% • Khôngẩndữliệu 38.6% , • Độphủ (recall) caonhưngđộchínhxác(precision) thấp.

  21. Tàiliệuthamkhảo • [1] Cuneyt M. Taskiran, UmutTopkara, MercanTopkara, and Edward J. Delp, "Attacks on Lexical Natural Language Steganography Systems , " Proceedings- Spie The International Society For Optical Engineering, Vol. 6072, 2006 • [2] Thưviệnlibsvm, http://www.csie.ntu.edu.tw/~cjlin/libsvm/ • [3] Stanford Research Institue Language Model Toolkit, • http://www.speech.sri.com/projects/srilm/ • [4] Stanford Log-linear Part-Of-Speech Tagger, http://nlp.stanford.edu/software/tagger.shtml

  22. Thank You !

More Related