본문 바로가기
Academia/Genomics

GWAS란 무엇인가? GWAS 아이디어, SNP 및 Linkage Disequilibrium 정의

by 바이오해커 2023. 6. 16.

GWAS(Genome-Wide Association Studies)

GWAS라는 것은 genetic variant(유전적 변이)와 관심이 있는 trait(질병)사이의 관계가 존재하는데, 어떤 유전자에 존재하는지 찾는 실험기법, 즉 디자인을 말한다. GWAS에서 원하는 것은 관심 있는 연구집단에서 trait(질병), 즉 phenotype의 차이를 설명해주는 genetic variant가 무엇인지를 찾는 것이다. 

 

Study Designs

GWAS에서 어떤 스터디 디자인을 사용할 것인가 고려를 할 때 과거에는 family data썼지만, 최근에는 case-control, cohort기반으로 사용한다.

 

DNA Variation

GWAS를 수행하기로 결정했다면, 유전체 마커를 어떻게 써야할지 생각해야 한다. 왜냐면 variation이 존재해야 하기 때문에, 즉 마커로 쓸 수 있으려면 사람과 사람 사이에 어느정도 차이가 있어야 한다. 모든 사람들이 해당 마커에 대해 똑같은 변이를 갖고 있다면 아무나 잡아서 분석해도 다 똑같으니 분석할 가치가 없는 것이다. 실제 사람-사람 유전형은 99.9%가 유사하고 차이가 나는 비율은 0.1%정도된다. 전체 30억게의 염기쌍이 있고 거기서 0.2%가 차이가 난다. 사람-사이 차이 나는 variation을 allele이라고 표현한다. 대표적으로 혈액형 A, B, O가 존재한다. A형은 AA or AO이고 B형은 BB or BO,O는 OO 그리고 AB는 AB

특정한 유전체 마커가 그 마커에 올 수 있는 유전형이 2개 이상 존재하면 polymorphic(다형성의)이라고 한다.

 

Genetic Markers

genetic marker로 쓸 수 있으려면 해당 마커가 genome상에 어디 있는지 알아야 한다. 특정한 사람에 대한 유전형이 무엇인지 알 수 있어야, 즉 allele이 조재해야 하고, 두개 이상의 allele이 존재해야지 적절한 genetic marker가 될 수 있다. 샘플들끼리 거의 99%는 유사하기 때문에 유사한 곳은 굳이 고려할 필요가 없다.

 

Single Nucleotide Polymorphism

 

한 사람이 한 쌍의 염색체가 있는데 거기에 이중나선으로 상보적인 결합을 하고 있다. 이 때 쌍이 있으면 사람들간의 차이가 있는 쌍이 존재하는데 이를 SNP(single Nucleotide Polymorphism)이라고 한다. 예를 들어, 어떤 사람은 특정 위치에 C-G를 가지고 어떤 사람은 T-A를 가진다면 전체 인구에서 C-G와 T-A의 비율이 어떻게 되는지 파악해보게 되는데, 둘 중 하나는 0.5보다 크고 하나는 0.5보다 작다. 작은 것의 비율이 1%미만이면 rare variant, 1~5%면 less common, 5%이상이면 common하다고 말한다. 

 

Linkage Disequilibrium Block (LD Bock)

우리는 부모로부터 한 쌍씩 유전자를 물려받게 되는데, 생식 세포는 분열되면서 같은 세포 내에서도 끊임없이 유전형의 재배열이 일어난다. 이때 서로 거리가 가까운 유전자 위치는 유전형이 섞이지 않고 덩어리째 이동하게 되는데 이를 LD Block이라 한다.이런 LD Block의 존재로 전장유전체분석을 하지 않고도 LD Block의 대표적인 마커 하나만을 이용해서 질병과 연관되어 있는 유전체부위를 파악할 수 있다. 

 

Baisc Ideas for GWAS

전장유전체분석(cost가 높으므로)을 하는게 아니라 LD 블락별로 대표할 수 있는 tagging SNP을 뽑아서 그걸 활용해서 chip이 디자인되고 분석을 수행해 질병관련 유전자 선별하는 것이 GWAS의 가장 기본적인 아이디어다. 

반응형