미국 국립보건원(NIH) 산하 국립인간유전체연구원(NHGRI) 연구팀이 처음으로 인간 염색체의 종단(end-to-end) DNA 염기서열을 분석해 내는데 성공했다.
이는 인간 염색체를 염기별로 정확하게 시퀀싱하는 것이 이제 가능하게 됐으며, 연구자들이 완전한 인간 유전체 서열을 생성할 수 있게 됐음을 보여주는 성과다.
이 연구 결과는 과학저널 ‘네이처’(Nature) 14일 자에 발표됐다.
NHGRI 원장인 에릭 그린(Eric Green) 박사는 “이 성과는 유전체학 연구에서 새로운 시대의 시작을 알린다”며, “완전한 염색체 및 게놈 서열을 생성하는 능력은 커다란 기술적 위업으로서, 유전체 기능에 대한 포괄적인 이해를 확보하고 의료분야에서 유전체 정보를 사용하는 데 도움을 준다”고 평가했다.
인간 유전체 참조 서열(human genome reference sequence)은 이제 거의 20년 가까운 개선을 거쳐 지금까지 생성된 것 중 가장 정확하고 완전한 척추동물 유전체 서열로 자리매김했다.
그러나 아직 알려지지 않은 수백 개의 빈 공간(gap) 혹은 누락된 DNA 서열들이 존재해 이에 대한 분석이 새로운 과제가 되고 있다.
이런 빈 공간들은 대부분 서열화하기가 예외적으로 어려운 반복적인 DNA 세그먼트를 담고 있다. 특히 이런 반복 세그먼트들에는 인체 건강 및 질병과 관련된 유전자와 다른 기능적 요소들이 포함돼 있는 것으로 알려진다.
인간 게놈, 60억 개 염기로 구성돼
약 60억 개의 염기로 구성된 인간 유전체는 엄청나게 길어서 DNA 시퀀싱 기계들이 모든 염기들을 한 번에 읽을 수가 없다.
이 때문에 연구팀은 게놈들을 더 작은 조각으로 잘라낸 다음 각각의 조각을 분석해 한 번에 수백 개의 염기서열을 생성하는 방법을 썼다. 이런 짧은 DNA 염기서열들은 나중에 다시 합쳐야 한다.
논문 시니어 저자인 NHGRI 아담 필리피(Adam Phillippy) 박사는 이 문제를 퍼즐 풀기에 비유했다.
그는 “조각그림 맞추기 퍼즐에서 작은 조각들 특히 푸른 하늘과 같은 부분들은 어느 곳에 맞춰야 하는지 고유한 단서가 없기 때문에 난해하다”며, “마찬가지로 인간 유전체를 시퀀싱할 때도 조각들이 너무 작아서 지금까지는 가장 맞추기 어려운 부분들을 한데 합칠 방법이 없었다”고 말했다.
동일한 X 염색체 시퀀싱
논문 저자인 필리피 박사와 캘리포니아(산타크루즈)대 캐런 미가(Karen Miga) 박사는 X와 Y 염색체를 포함한 24개의 인간 염색체 가운데 X 염색체 서열을 먼저 완성하기로 결정했다.
주요 성염색체인 X 염색체는 혈우병과 만성 육아종 및 듀켄 근이영양증을 포함한 무수한 질병과 관련돼 있는 것으로 알려진다.
인간에게는 부계와 모계에서 전해진 두 세트의 염색체가 있다. 예를 들면 여성은 생물학적으로 두 개의 X 염색체를 물려받는데, 하나는 아버지, 다른 하나는 어머니로부터 온 것이다.
그러나 이들 두 개의 X 염색체는 동일하지 않고, DNA 염기서열 분석을 하면 많은 차이점이 나타날 수 있다.
이번 연구에서 연구팀은 정상적인 인체 세포로부터 얻은 X 염색체를 시퀀싱하지 않고 대신 두 개의 동일한 X 염색체를 가진 특별한 유형의 세포를 사용했다.
이런 세포는 X 염색체 하나만을 가진 남성 세포보다 염기분석에 사용할 수 있는 더 많은 DNA를 얻을 수 있다. 아울러 전형적인 여성 세포에 있는 두 개의 X 염색체를 분석할 때 발생하는 서열 차이도 피할 수 있다.
염색체 동원체에서 300만개 반복 DNA 염기 발견
연구팀은 이번 분석에서 긴 DNA 세그먼트를 시퀀싱할 수 있는 새로운 기술을 활용했다. 작은 DNA 조각을 만들어 분석하는 대신, DNA 분자를 크게 손상시키지 않기 위해 두 개의 다른 기기로 큰 DNA 분자를 분석했다. 각각의 기기는 이전의 도구로는 달성할 수 없는 매우 긴 DNA 서열들을 생성했다.
필리피 박사팀은 이런 방식으로 인간 X염색체를 분석한 뒤 새로 개발된 컴퓨터 프로그램을 사용해 생성된 서열의 많은 세그먼트들을 조립했다.
미가 박사팀은 X염색체에 빈 공간으로 남아있는 가장 큰 염기서열 갭을 메우기 위한 작업을 수행했다. 동원체(centromere)라고 불리는 염색체 중간 부분에서는 약 300만개의 반복되는 DNA 염기가 발견됐다.
이같이 고도로 반복되는 DNA 서열 조립의 정확성을 비판적으로 평가할 수 있는 ‘표준 잣대’는 없다. 때문에 미가 박사팀은 생성된 시열의 유효성을 확인하기 위해 몇 가지 확인 단계를 거쳤다.
미가 박사는 “전에는 우리 게놈에서 실제로 이런 서열들을 본 적이 전혀 없으며, 우리가 한 예측이 올바른지 테스트할 도구도 많지 않았다”고 말하고, “이것이 바로 최종 산물을 평가하고 품질을 보장할 수 있는 전문가가 중요한 이유”라고 강조했다.
“2020년에 완전한 인간 유전체 서열 완성”
이 같은 연구 노력은 NHGRI가 일부 연구비를 지원하는 T2T(Telomere-to-Telomere) 컨소시엄의 광범위한 계획 가운데 일부다. 이 컨소시엄은 인간 유전체의 완전한 참조 서열 생성을 목표로 하고 있다.
T2T 컨소시엄은 2020년에 이 같은 목표를 달성한다는 계획 아래 나머지 인간 염색체 분석을 위한 노력을 펼치고 있다.
필리피 박사는 “새로 발견된 염기서열에서 무엇을 찾아낼지 아직 모르지만, 이제 완전한 유전체 서열의 시대로서 우리는 이를 진심으로 수용하고 있다”고 말했다.
앞으로 수행해야 할 과업도 적지 않다. 예를 들면 1번과 9번 염색체는 X염색체보다 훨씬 큰 반복적 DNA 세그먼트를 가지고 있다는 것.
미가 박사는 “우리 유전체에서 기록되지 않은 미지의 부분들이 개인마다 매우 다르다는 것을 알고 있으나, 이런 차이가 인간 생물학과 질병에 어떤 영향을 미치는지를 알아내는 것이 중요하다”고 강조했다.
필리피와 미가 박사는 시퀀싱 방법을 향상시키면 인간 유전학과 유전체학에 새로운 기회가 계속 창출될 것이라고 보고 있다.
- 김병희 객원기자
- hanbit7@gmail.com
- 저작권자 2020-07-15 ⓒ ScienceTimes
관련기사