결과
Download
1 / 1

Data Flow - PowerPoint PPT Presentation


  • 145 Views
  • Uploaded on

결과. 화합물 리스트. Storage Element. AMGA 기술 개발. 당뇨병 신약후보물질탐색 데이터챌린지. WISDOM Production Environment 개선. DrugScreener-G. 단백질 도킹 소프트웨어. 그리드 사이트 1. 모니터링 통계자료. 파라미터 설정 목표 단백질 구조 탐색 화합물 선택. Computing Element. 사용자 인터페이스. 그리드 사이트 2. Computing Element. 화합물 데이터베이스. Storage Element.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Data Flow' - albina


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Data flow

결과

화합물 리스트

Storage

Element

AMGA 기술 개발

당뇨병 신약후보물질탐색 데이터챌린지

WISDOM Production Environment 개선

DrugScreener-G

단백질 도킹 소프트웨어

그리드

사이트 1

모니터링 통계자료

파라미터 설정

목표 단백질 구조 탐색

화합물 선택

Computing

Element

사용자 인터페이스

그리드

사이트 2

Computing

Element

화합물 데이터베이스

Storage

Element

단백질 도킹 소프트웨어

결과

대규모 가상 신약 물질 탐색 e-Science 환경 구축

Data Flow

그리드 컴퓨팅을 이용한 대규모 가상 신약 물질 탐색

  • 대규모 단백질-화합물 도킹 계산을 이용한 대규모 가상 신약 물질 탐색

    • 단백질-화합물 도킹 계산

       화합물(Compound)이 목표 단백질에 어떻게

      결합하여 단백질의 활성을 억제할 수 있는지

      컴퓨터 계산을 통해 예측

    • 신약 후보 물질 데이터베이스에 축적된 대량의 화합물 정보를 모두 이용한 신약 물질 탐색은 매우 유용하나 계산량이 막대함.

    • EGEE등의 그리드 인프라를 이용하여 대규모 대용량 처리 계산(High-throughput Computation)을 할 경우 계산 시간과 비용을 획기적으로 단축할 수 있음.

  • DrugScreener-G

    • 그리드 컴퓨팅을 이용한 대규모 가상 신약 물질 탐색을 일반 사용자들도 쉽게 사용할 수 있도록 하는 e-Science 통합 환경

  • EGEE 그리드 인프라를 이용한 대용량 가상 신약 물질 탐색 실험 수행

    • 목표 단백질 : 인간 아밀라아제 억제제 (3차원 단백질 모델은 Protein DataBase의 refined 1u2y모델)

    • 308310개의화합물 정보를 이용.

  • 결과

    • 총 38 CPU years 상당의 계산 수행, 23.5 GB의 데이터 생성 (2008년 8월, 2.4일 동안 수행)

  • 이전 데이터챌린지와의 수행 성능 비교

  • AMGA (EGEE 공식 메타데이터 서비스)

    - 그리드 상에 분산되여 저장된 파일에 대한 메타데이터 서비스 제공 (gLite 미들웨어에 포함되어 있음)

  • 공동개발 : CERN(스위스),INFN(이탈리아),KISTI(한국)

  • AMGA 2.0 (KISTI 주도 개발)

  • OGF표준 WS-DAIR,SQL 지원

  • Threaded MPM 모델 지원

  • DB 연결 풀링 지원

  • 가상 스크리닝을 위한

  • Large-Scale 작업 지원

  • 목표

    • 효율적인 작업 배포

    • 높은 동시 처리량

  • 주요 개선 사항

    • Task pull model 적용

    • 입력 및 결과파일의 저장매체로서 AMGA를 활용

    • 효율적인 RB와 CE를 선택하기 위한 동적 학습 모듈 구현

    • WN로부터 직접 모니터링 정보를 수집

Laboratoire de Physique Corpusculaire

de Clermont-Ferrand/CNRS/IN2P3

European Organization for

Nuclear Research