1 / 50

휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science. 2005-12-03 Biocom OB 세미나 93 ’ 김형용 http://biohackers.net/wiki/HgpAndComputer. 순서. 생물학 백그라운드 Genome 의 구조 서열결정작업 HGP 이후의 이야기들 컴퓨터과학의 기여. Genome. 게놈 ? 지놈 ? 유전자 (gene), 유전체 (genome). Great 3 books. 우주 – 생명 - 인간.

semah
Download Presentation

휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 휴먼게놈프로젝트와 컴퓨터Human genome project and Computer science 2005-12-03 Biocom OB 세미나 93’김형용 http://biohackers.net/wiki/HgpAndComputer http://biohackers.net

  2. 순서 • 생물학 백그라운드 • Genome의 구조 • 서열결정작업 • HGP 이후의 이야기들 • 컴퓨터과학의 기여

  3. Genome • 게놈? 지놈? • 유전자(gene), 유전체(genome)

  4. Great 3 books • 우주 –생명 - 인간

  5. Central Dogma of Molecular Biology

  6. Protein structure • 20 Amino acids • Sequence specifies conformation • RNase

  7. Life • DNA’s common method of producing more DNA • Review the life

  8. Evolution • Self replicator

  9. Chromosome 1 cM ~= 1 Mbps

  10. Gene structure

  11. Junk DNA • 전체 Genome의 5%만이 단백질이 되는 영역. 그렇다면 나머지는? • Repetitive sequence • LINE (>300bps) • SINE (300bps), Alu (30000~50000개) • Microsatelite

  12. Human genome • 3~4x1014 cells (~=245) • > 200 cell type • 3x109 bps (3Gbps = 3Gbyte) • 20000~25000 Genes • 98% unknown functional DNA • 0.1% difference with you • Information theory : 30Mbyte

  13. Human genome project • DOE, NHGRI 에서 시작. 2003년 공식 완료. 13년. 7개국 참여 • 95%나 되는 Junk DNA 를 꼭 그 많은 돈을 들여서 해야만 했는가? • 목적 • Human DNA 에서 모든 Gene의 동정 • 30억 염기서열의 결정 • Database에 결과의 저장 • 이를 분석할 수 있는 도구의 향상 • 관련 윤리적 문제의 연구

  14. History • PCR • RFLP • Genetic marker • BAC • Shotgun sequencing • Whole genome shotgun

  15. Gel Electrophoresis • 젤(그물막)에 전하를 띤 물질을 통과시킴으로, 분리하는 방법. 작을수록 멀리~ • DNA, Protein

  16. PCR • Polymerase Chain Reaction

  17. Genetic marker • Polymorphic allele locus

  18. Genetic map

  19. Cloning • 무지 작은 저 분자를 하나씩 직접 읽을 수 없다. • 따라서, “동일” 한 것들 여러 개를 갖고 실험

  20. Gene cloning • Gene cloning 과정 • Genome상에서 원하는 영역을 정한다. • 원하는 영역을 뽑아낼 수 있는 PrimerDesign을 한다. • PCR로 해당영역의 major band를 확인하고, 추출한다. • CloningVector에 삽입한다. • Selection의 과정을 통해, 해당 유전자가 삽입된 벡터가 들어있는 클론을 선발한다. • Cloning vector • Plasmid : • Cosmid : 30 kb • BAC : 350 kb • YAC : 2 Mb 이상 • PAC : 300 kb

  21. DNA sequencing

  22. DNA sequencing

  23. DNA sequencing • Frederic Sanger • DNA, Protein • 유효길이 • 700-800bp

  24. Shotgun sequencing 게놈을 읽기 위해 유전학자들은 먼저 게놈을 수천조각으로 부순 뒤, 아무렇게나 잘라졌을 이 조각들을 가지고 시작할 수 밖에 없다. 재조립하기 위해 파괴하는 것, 그것이 분자생물학자들의 저주받을 운명이고 직업적 강박관념이다. -- 다니엘코엥, 휴먼게놈을 찾아서

  25. Genome sequencing • Clone by clone method • Genetic marker에 따라 BAC 선발 후 shotgun • Whole genome shotgun • 무작정 shotgun • Repeat 로 인한 조립에의 어려움. • 컴퓨터만 믿는다.

  26. Current status (since 2003) • Human Chromosome 4 Completed, April 2005. • Human Chromosome 2 Completed, April 2005. • Human Chromosome X Completed, March 2005. • Human Chromosome 16 Completed, December 2004. • Human Gene Count Estimates Changed to 20,000 to 25,000, October 2004. • Human Chromosome 5 Completed, September 2004. • Human Chromosome 9 Completed, May 2004. • Human Chromosome 10 Completed, May 2004. • Human Chromosome 19 Completed, March 2004. • Human Chromosome 13 Completed, March 2004. • Human Chromosome 6 Completed, October 2003. • Human Chromosome 7 Completed, July 2003. • Human Chromosome Y Completed, June 2003. • Human Genome Project Completion: 1990-2003 (April 2003)

  27. Genome browser • UCSC Genome browser • NCBI Genome browser • Ensembl • VistaBrowser

  28. Genetic disease – before HGP

  29. Genetic disease – after HGP

  30. Comparative genomics • Synteny (Gene order), Gene duplication, Gene fusion

  31. Comparative genomics

  32. SNP • Single Nucleotide Polymorphism • 종간 다양성  종내 다양성 • 염기변화  유전자내  아미노산변화  구조변화

  33. Haplotype

  34. HapMap • 일본, 영국, 중국, 캐나다, 미국, 나이지리아 • Project의 목표는 MinorAllele의 빈도가 최소 5% 이상이고 평균 간격이 5 kilobase 인 60만개 SNPs을 genotype 하는 것

  35. Transcriptome, Proteome • EST • DNA chip • Proteomics

  36. EST • Expression Sequence Tag

  37. Transformational grammar • Regular grammar : computer program • Context free grammar : DNA • Palindrome, “다시 합창합시다” • Context sensitive grammar • Unrestricted Grammar : 자연어

  38. Sequence alignment

  39. Smith-Waterman algorithm

  40. BLAST • Unknown sequence Known sequence Database

  41. Object oriented programming • Computer programming paradigm • 생명현상의 모델링

  42. 마치며… • Rosetta stone • Programming

More Related