60 likes | 257 Views
정보검색 Search Engine 프로젝트. 2006190709 박성현 2006190714 정재우 2006190725 윤상열. 설계 목적. 일반적 기능을 갖춘 검색 엔진 개발 주어진 문서들을 수집 , 분석하여 불필요한 정보를 제거하고 필요한 문서만 추출하여 사용자에게 제공하는 Search Engine 프로그램을 제작 주어진 출력기 ( Nounexractor ) 외에 더욱 더 효율적인 프로그램 구동을 위하여 새로운 자료구조 (binary search tree) 이용함. 설계 내용. Main.
E N D
정보검색 Search Engine 프로젝트 2006190709 박성현 2006190714 정재우 2006190725 윤상열
설계 목적 일반적 기능을 갖춘 검색 엔진 개발 주어진 문서들을 수집, 분석하여 불필요한 정보를 제거하고 필요한 문서만 추출하여 사용자에게 제공하는 Search Engine 프로그램을 제작 주어진 출력기(Nounexractor)외에 더욱 더 효율적인 프로그램 구동을 위하여 새로운 자료구조(binary search tree)이용함
설계 내용 Main FindFile DB 설정 FindFile TraceDB DB 종료 디렉토리 탐색 Read dir() : 파일 하나씩 읽기 폴더일 경우 : FindFile 파일인 경우 : OpenFile
설계 내용 TraceDB Doc를 모두 검색하여 Key값 추출 Trace Doc Doc_db에서 파일명 가져오기 Join_db에서 key값(index) 가져오기 Join에서 가져온 index_db의 key값들로 for문 실행 for{index_db에서 추출한 데이터를 출력}
설계 내용 OpenFile BST. Add : 추출한 term의 횟수까지 저장시키기 위해 별도의 자료 구조 생성 Doc_db에 파일명 입력 Trace Doc BST를 검색하여 index_db에 저장 DB입력 Jion배열에 키값을 저장
DB의 속성 Doc_db Join_db Index_db Key 파일명(파일 경로) Key count Index key[배열] Key Index Data