1 / 8

ĐỀ TÀI NGHIÊN CỨU KỸ THUẬT KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG RA QUYẾT ĐỊNH

LUẬN VĂN TỐT NGHIỆP. ĐỀ TÀI NGHIÊN CỨU KỸ THUẬT KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG RA QUYẾT ĐỊNH. Chuyên ngành: Công nghệ phần mềm Khóa: 2008 - 2012 Họ và tên sinh viên: Nguyễn Huy Mạnh Giảng viên hướng dẫn: TS. Trương Ngọc Châu. Chương 1 ) Lý thuyết khai phá dữ liệu. 1) Khái niệm

shaw
Download Presentation

ĐỀ TÀI NGHIÊN CỨU KỸ THUẬT KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG RA QUYẾT ĐỊNH

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. LUẬN VĂN TỐT NGHIỆP ĐỀ TÀI NGHIÊN CỨU KỸ THUẬT KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG RA QUYẾT ĐỊNH • Chuyên ngành: Công nghệ phần mềm • Khóa: 2008 - 2012 • Họ và tên sinh viên: Nguyễn Huy Mạnh • Giảng viên hướng dẫn: TS.Trương Ngọc Châu

  2. Chương1) Lýthuyếtkhaiphádữliệu 1) Khái niệm Định nghĩa khai phá dữ liệu : khai phá dữ liệu là một tập hợp các kỹ thuật được sử dụng để tự động khai thác và tìm ra các mối quan hệ lẫn nhau của dữ liệu trong một tập hợp dữ liệu khổng lồ và phức tạp. Quá trình phát hiện tri thức thường tuân theo các bước sau : B1: Hìnhthànhvàđịnhnghĩabàitoán B2: Thu thập và tiền xử lý dữ liệu B3: Khaiphádữliệuvàrútracác tri thức B4: Sửdụngcác tri thứcpháthiệnđược

  3. Làm sạch Tích hợp 0.08;0.67;1.00;0.57;3.48;… 8;67;100;57;348;… Biến đổi Rút gọn 2) Tiền xử lý dữ liệu

  4. Chương 2) Khai phá dữ liệu bằng cây quyết định • Câyquyếtđịnh • Câyquyếtđịnhlàmộtphươngpháprấtmạnhvàphổbiếnchocảhainhiệmvụcủakhaiphádữliệulàphânloạivàdựbáo. Mặtkhác, câyquyếtđịnhcòncóthểchuyển sang dạngbiểudiễntươngđươngdướidạng tri thứclàcácluậtnếu - thì (If-Then). • Cây quyết định là cấu trúc biễu diễn dưới dạng cây. • Mỗinút trong biễu diễn một thuộc tính, • nhánh biễu diễn giá trị có thể có của thuộc tính, • Mỗi lá biểu diễn các lớp quyết định • Gốclà đỉnh trên cùng của cây • Cây quyết định có thể được dùng để phân lớp bằng cách xuất phát từ gốc của cây và di chuyển theo các nhánh cho đến khi gặp nút lá. Trên cơ sở phân lớp này chúng ta có thể chuyển đổi về các luật quyết định.

  5. Bài toán: quyết định có đợi 1 bàn ở quán ăn không, dựa trên cácthông tin sau: 1. Lựa chọn khác: có quán ăn nào khác gần đó không? 2. Quán rượu: có khu vực phục vụ đồ uống gần đó không? 3. Fri/Sat: hôm nay là thứ sáu hay thứ bảy? 4. Đói: chúng ta đã đói chưa? 5. Khách hàng: số khách trong quán (không có, vài người,đầy) 6. Giá cả: khoảng giá ($,$$,$$$) 7. Mưa: ngoài trời có mưa không? 8. Đặt chỗ: chúng ta đã đặt trước chưa? 9. Loại: loại quán ăn (Pháp, Ý, Thái, quán ăn nhanh) 10. Thời gian đợi: 0-10, 10-30, 30-60, >60

  6. Các mẫu được miêu tả dưới dạng các giá trị thuộc tính (logic, rời rạc, liên tục)

  7. 3 ) Tàiliệuthamkhảo • 1. Đỗ Phúc, Giáo trình Khai thác dữ liệu, ĐHQG TPHCM, 2005 • 2. Hồ Tú Bảo, Introduction to knowledge discovery and data mining, IOIT, 2001. • 3. Morgan Kaufman, Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, 2002 • 5. Jiawei Han and Micheline Kamber, Data Mining Concepts and Techniques, University of Illinois, Morgan Kaufmann Publishers, 2002

More Related