본문내용
1. 생물학실험1
1.1. BLAST
BLAST는 생물정보학에서 사용되는 프로그램이다. BLAST는 2개 이상의 핵산 서열이나 아미노산 서열이 서로 얼마나 비슷한지 비교하는데 사용된다. 또한 뉴클레오타이드 서열이나 아미노산 서열이 서열 데이터베이스에 저장된 서열과 일치하는지 비교하고 통계적 유의성을 계산하는 용도로도 사용된다. 특히 유전체학의 발달로 인해 서열 데이터베이스에 축적된 유전체의 수와 정보의 양이 폭발적으로 증가하고 있기 때문에 BLAST의 유용성은 날로 높아지고 있다. BLAST에는 megablast, discontiguous megablast, blastn, blastp, PSI-BLAST, PHI-BLAST, DELTA-BLAST와 같은 다양한 프로그램이 있다. 이들은 각각 특정 목적에 맞게 개발되어 사용된다. 예를 들어 megablast는 질의어와 매우 유사한 뉴클레오타이드 서열을 찾는데 유용하고, discontiguous megablast는 일치하지 않는 염기가 많이 존재해도 의미 있는 결과를 보여준다. 또한 blastn은 DNA 염기서열을 질의어로 하고, blastp는 단백질 서열을 질의어로 하여 데이터베이스를 검색한다. 이처럼 BLAST는 다양한 유전자 및 단백질 서열 간 유사성 비교에 널리 사용되는 핵심적인 생물정보학 도구이다.
1.2. BLOSUM
BLOSUM을 이용하여 단백질 서열들 간 서열 유사도 비교 분석을 할 수 있다. BLOSUM은 블록처럼 틈이 없는 서열 정렬에서 아미노산들의 치환의 정도를 표로 정리한 것이다. BLOSUM을 만드는 데 쓰이는 서열 정렬은 사용된 서열들의 퍼센트 동일성에 따라, 단어의 끝에 숫자를 붙인다. 예를 들면, BLOSUM60은 60%의 서열 동일성을 가진 다중 서열 정렬에서 아미노산들의 치환을 계산해 내서 만들었다. BLOSUM80과 BLOSUM45를 비교하면, BLOSUM45는 진화적 거리가 먼 단백질 친족을 찾을 때 사용하면 더 좋은 결과를 가져오지만, BLOSUM80은 매우 비슷한 단백질들을 찾는 데 효용성이 있다. BLOSUM 점수 행렬에서 양의 수는 두 아미노산이 서로 잘 바뀔 수 있는 경우를 의미하며, 음의 수는 두 아미노산이 서로 잘 바뀌지 않는 경우를 의미한다.
1.3. Multiple sequence alignment
다중 서열 정렬(Multiple sequence alignment)은 계통 발생수를 만드는데 이용될 수 있다. 동일성은 비교하고자 하는 염기 서열의 각 위치에서 동일한 서열을 가지는 것을 의미하며, 유사성은 유사한 서열을 가지는 염기 서열들을 비교하는 것을 나타낸다. 유사성을 기반으로 분석을 하면 비교하고자 하는 염기 서열들의 공통 조상을 추론하는데 도움이 될 수 있다. 점진적 정렬 방식은 계층적 검색을 사용하며, 가장 유사한 쌍을 시작으로 가장 다른 염기까지 진행하는 쌍방향 정렬을 결합하여 최종 결과를 만든다. 그러나 서열을 추가하면서 발생하는 오류가 최종 결과로 나타날 수 있으며, 특히 진화적으로 먼 관계의 염기들을 비교할 때 문제점이 나타날 수 있다. 따라서 최근 사용되는 방식은 가장 가까운 염기들의 계통 발생 거리를 기반으로 보조 가중치를 주어 발생할 수 있는 오류를 최소화한다. 히든 마르코프 모델은 가능한 일치, 불일치, 갭의 모든 조합을 할당하는 확률론적 모델로, 전 지역 정렬과 특정 지역 정렬을 모두 생성할 수 있으며, 생물학적 의미에 대해 평가할 수 있는 가능한 선형 배열을 생성할 수 있다. 그러나 진화적 거리가 먼 염기들의 정렬 시 문제가 발생할 수 있다. 반복적 정렬 방법은 초기 정렬된 염기들을 재 정렬하면서 새로운 염기들을 추가하여 다중 서열 정렬을 수행하므로, 점진적 정렬 방법의 오류를 줄여 정렬된 결과의 질을 향상시킬 수 있다. 컨센서스 방법은 여러 다중 정렬 결과에서 최적의 다중 정렬을 찾는 방법으로, M-COFFEE와 MergeAlign이 많이 사용된다.
2. 원생생물 관찰
2.1. 원생생물의 구조와 기능
원생생물은 식물, 동물, 균류와 함께 진핵생물에 속한다. 진핵생물은 원핵생물과 달리 세포 내에...