1 / 6

Research Meeting

Research Meeting. 2009-07-27 Jaeseok Myung. Summary. 연구 Supporting realtime access to large RDF data using open-source 기타 가을학기 수업 조교 학부 DB, 웹정보시스템 , 고급컴퓨터공학세미나 수업 수강신청 ( 분산관련 2 과목 , 논문연구 2 과목 ). Big Picture. SPARQL Algebra. Rule. Data Input. Query Mgr. RDF OWL. Converter.

vin
Download Presentation

Research Meeting

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Research Meeting 2009-07-27 JaeseokMyung

  2. Summary • 연구 • Supporting realtime access to large RDF data using open-source • 기타 • 가을학기 수업 조교 • 학부 DB, 웹정보시스템, 고급컴퓨터공학세미나 • 수업 • 수강신청 (분산관련 2과목, 논문연구 2과목) Center for E-Business Technology

  3. Big Picture SPARQL Algebra Rule Data Input Query Mgr. RDFOWL Converter Parser Planner Optimizer SPARQL Indexer RDB Executor Visualizer Metadata Hadoop Index Statistics HDFS MR Center for E-Business Technology

  4. 진행상황 • Data • LUBM 온톨로지(OWL) => 트리플 변환 후 HDFS에 저장 • Query • SPARQL => 쿼리 플랜 생성 (Jena 프레임워크) • Triple Pattern 처리 MR 구현 • SELECT ?xWHERE { ?x rdf:typeub:UndergraduateStudent .} • (project (?x) (bgp (triple ?x <rdf:type> <UndergraduateStudent>))) Center for E-Business Technology

  5. 예정사항 • 테스트를 위한 인터페이스 통합 (목) • Jena 표준 인터페이스와 연동 • Web 인터페이스를 통한 테스트서버 구축 • Operator에 대한 MR 구현검토 (다음 주) • A triple pattern => Bagic Graph Pattern • Projection, Filter Constraints • 구현 범위 및 일정 확정 Center for E-Business Technology

  6. 구현 범위 및 의의 • SPARQL Algebra의 연산자에 대한 MR식 접근 • 필요한가? • 어떤 연산자를 MR로 구현하는게 좋을까? • Ex) projection과 같이 vertical partition에 대한 연산은 중앙 처리 방식이 더 좋을 수 있지만, BGP 처리와 같이 horizontal partitioning된 데이터에 대한 처리는 MR이 더 좋을 것 같다. • 가능한가? • MR은 제약적인 프로그래밍 모델이므로.. 각 연산자의 구현가능여부에 대해 고민할 필요 있음 • 경쟁력? • Virtuous RDF, YARS2, DARQ, HIVE등과 기반 기술 및 성능 비교 • 주요 contribution을 결정하고 부각시킬 필요 Center for E-Business Technology

More Related