slide1
Download
Skip this Video
Download Presentation
Data Flow

Loading in 2 Seconds...

play fullscreen
1 / 1

Data Flow - PowerPoint PPT Presentation


  • 145 Views
  • Uploaded on

결과. 화합물 리스트. Storage Element. AMGA 기술 개발. 당뇨병 신약후보물질탐색 데이터챌린지. WISDOM Production Environment 개선. DrugScreener-G. 단백질 도킹 소프트웨어. 그리드 사이트 1. 모니터링 통계자료. 파라미터 설정 목표 단백질 구조 탐색 화합물 선택. Computing Element. 사용자 인터페이스. 그리드 사이트 2. Computing Element. 화합물 데이터베이스. Storage Element.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Data Flow ' - albina


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1

결과

화합물 리스트

Storage

Element

AMGA 기술 개발

당뇨병 신약후보물질탐색 데이터챌린지

WISDOM Production Environment 개선

DrugScreener-G

단백질 도킹 소프트웨어

그리드

사이트 1

모니터링 통계자료

파라미터 설정

목표 단백질 구조 탐색

화합물 선택

Computing

Element

사용자 인터페이스

그리드

사이트 2

Computing

Element

화합물 데이터베이스

Storage

Element

단백질 도킹 소프트웨어

결과

대규모 가상 신약 물질 탐색 e-Science 환경 구축

Data Flow

그리드 컴퓨팅을 이용한 대규모 가상 신약 물질 탐색

  • 대규모 단백질-화합물 도킹 계산을 이용한 대규모 가상 신약 물질 탐색
    • 단백질-화합물 도킹 계산

 화합물(Compound)이 목표 단백질에 어떻게

결합하여 단백질의 활성을 억제할 수 있는지

컴퓨터 계산을 통해 예측

    • 신약 후보 물질 데이터베이스에 축적된 대량의 화합물 정보를 모두 이용한 신약 물질 탐색은 매우 유용하나 계산량이 막대함.
    • EGEE등의 그리드 인프라를 이용하여 대규모 대용량 처리 계산(High-throughput Computation)을 할 경우 계산 시간과 비용을 획기적으로 단축할 수 있음.
  • DrugScreener-G
    • 그리드 컴퓨팅을 이용한 대규모 가상 신약 물질 탐색을 일반 사용자들도 쉽게 사용할 수 있도록 하는 e-Science 통합 환경
  • EGEE 그리드 인프라를 이용한 대용량 가상 신약 물질 탐색 실험 수행
    • 목표 단백질 : 인간 아밀라아제 억제제 (3차원 단백질 모델은 Protein DataBase의 refined 1u2y모델)
    • 308310개의화합물 정보를 이용.
  • 결과
    • 총 38 CPU years 상당의 계산 수행, 23.5 GB의 데이터 생성 (2008년 8월, 2.4일 동안 수행)
  • 이전 데이터챌린지와의 수행 성능 비교
  • AMGA (EGEE 공식 메타데이터 서비스)

- 그리드 상에 분산되여 저장된 파일에 대한 메타데이터 서비스 제공 (gLite 미들웨어에 포함되어 있음)

  • 공동개발 : CERN(스위스),INFN(이탈리아),KISTI(한국)
  • AMGA 2.0 (KISTI 주도 개발)
  • OGF표준 WS-DAIR,SQL 지원
  • Threaded MPM 모델 지원
  • DB 연결 풀링 지원
  • 가상 스크리닝을 위한
  • Large-Scale 작업 지원
  • 목표
    • 효율적인 작업 배포
    • 높은 동시 처리량
  • 주요 개선 사항
    • Task pull model 적용
    • 입력 및 결과파일의 저장매체로서 AMGA를 활용
    • 효율적인 RB와 CE를 선택하기 위한 동적 학습 모듈 구현
    • WN로부터 직접 모니터링 정보를 수집

Laboratoire de Physique Corpusculaire

de Clermont-Ferrand/CNRS/IN2P3

European Organization for

Nuclear Research

ad