1 / 1

GİRİŞ

GİRİŞ

illias
Download Presentation

GİRİŞ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. GİRİŞ • Veri kaynaklarının arttığı ve erişiminin kolaylaştığı günümüzde, elde edilen verilerin işlenmesi ve kullanışlı bilgiye ulaşılması önem kazanmıştır. Bu doğrultuda hazırlanan soru cevaplama sistemi, eldeki soru havuzu içerisinden metin madenciliği teknikleri kullanılarak doğru cevabın bulunabilmesini sağlamaktadır. • ÖN İŞLEME • Elde edilen ham verinin kullanılabilecek duruma getirilmesi için ön işleme aşamalarından geçirilmesi gerekmektedir. Ham veri içerisindeki boş, gereksiz, yanlış vs. veriler temizlenir ve kullanılacak teknikler doğrultusunda veriler belirli formatlama işlemlerine tabi tutulur. • VEKTÖR UZAY MODELİ • Vektör uzay modelinde her nesne, vektör yapısında tanımlanmaktadır. Nesnelerin sahip olduğu farklı özellikler, vektör uzayının eksenlerini oluşturmakta ve her nesne kendi özelliklerine göre vektör uzayında belli bir konuma sahip olmaktadır. AĞIRLIĞIN HESAPLANMASI Vektörlerin eksenlerini oluşturan sözcüklerin yani anahtar kelimelerin seçiminde kullanılan formüller: D, toplam cevap sayısı dfi, sözcüğün geçtiği cevap sayısı IDFi, sözcügün birim ağırlık değeri tfi, sözcüğün cevap içindeki sayısı Wi, toplam ağırlık değeri (3) (2) ÖRNEK: “Türliye’nin başkenti neresidir?” sorusuna cevap aranan örnekte, 4 cevaptan oluşan cevap havuzundan, kosinüs benzerliği kullanılarak en yakın cevap bulunmaktadır. Tablo 1’de cevap havuzu, Tablo 2’de de cevap havuzunda bulunan sözcüklerin ağırlıkları görülmektedir. Metin Madenciliği ile Soru Cevaplama SistemiSevinç İlhan, Nevcihan Duru, Şenol Karagöz, Merve Sağır Mühendislik Fakültesi Bilgisayar Mühendisliği Bölümü Kocaeli Üniversitesi Tablo 2: Sözcük ağırlıkları. Tablo 1: Cevap Metinleri. Şekil 1: Cevap Vektörleri. S•C1 / ||S|| * ||C1|| = ((1*0.1249) * (1*0.1249) + ((1*0.1249) * (1*0.1249)) / ((1*0.1249) + (1*0.1249)) * ((1*0.1249) + (1*0.1249) + (1*0.1249)) = 0.0312 / ( 0.1766 * 0.2163 ) = 0.8168 S•C2 / ||S|| * ||C2|| = 0.0312 / ( 0.1766 * 0.5644 ) = 0.313 S•C3 / ||S|| * ||C3|| = 0.1596 S•C4 / ||S|| * ||C4|| = 0.0 Yukarıda gösterilen çözüm adımlarında görüldüğü üzere, soru ile cevap metni arasında ortak kelime bulunmadığında sonuç sıfır çıkmakta ve uygun cevap olmayacağı anlaşılmaktadır. Diğer çözümlerde de ağırlık değeri yüksek olan sözcükler ile ayırt edicilik yönünden daha net sonuçlar alınmıştır. SONUÇ Hazırlanan sistem sorulan soruya havuzdaki cevaplardan uygun olanını getirebilmektedir. Fakat anahtar sözcüklerin dinamik olarak elde edilmeye çalışılması performans yönünden, güçlü anahtar sözcüklerin elde edilememesi ve birbirine yakın cevapların varlığı doğru cevabın bulunması yönünden sıkıntılar oluşturabilmektedir. Hazırlanan soru cevaplama sisteminde kullanılan nesne yapıları, soru ve bunlara sunulan cevaplardır. Metin madenciliği tekniği olan vektör uzay modelinin kullanımı ile bu nesneler vektör uzay modelinde tanımlanmış ve hesaplamalar bu vektörel yapılar üzerinden gerçekleştirilmiştir. Kullanılacak vektörlerin hazırlanması aşamasında en önemli husus; vektörlerin eksenlerini oluşturulacak anahtar kelimelerin belirlenmesidir. Soru ve cevapların değişken olması nedeniyle sistem içerisinde anahtar kelimelerin belirlenebilmesi için dinamik bir yapı oluşturulmuştur. Oluşturulan yapıda dikkat edilen nokta, soru ve cevap metinlerinde en az geçen sözcüklerin seçilmesidir. Bu şekilde belirlenen sözcüklere yüksek ağırlık değerleri atanmış ve böylece benzerlik hesaplarında etkili olmaları sağlanmıştır. BENZERLİĞİN HESAPLANMASI Vektör uzay modelinin sağladığı vektörel yapı kullanılarak, kosinüs açı formülü ile vektörler arasındaki açı değeri, dolayısıyla da vektörler arasındaki benzerlik değerleri hesaplanmaktadır. Kullanılan kosinüs açı formülü: (1)

More Related