유전자 코드의 주요 속성과 그 의미. 유전자 코드: 설명, 특성, 연구 이력

이전에 우리는 뉴클레오타이드가 지구상의 생명체 형성에 중요한 특징을 가지고 있음을 강조했습니다. 용액에 하나의 폴리뉴클레오타이드 사슬이 존재하는 경우 관련 뉴클레오타이드의 보완 화합물을 기반으로 두 번째(평행) 사슬 형성 과정이 자발적으로 발생합니다. . 두 사슬에서 같은 수의 뉴클레오티드와 그들의 화학적 관계는 그러한 반응을 구현하는 데 없어서는 안 될 조건입니다. 그러나 단백질 합성 과정에서 mRNA의 정보가 단백질 구조로 구현될 때 상보성의 원리를 준수하는 것은 의문의 여지가 없습니다. 이것은 mRNA와 합성된 단백질에서 단량체의 수가 다를 뿐만 아니라 특히 중요한 것은 그들 사이에 구조적 유사성이 없다는 사실 때문입니다(한편에는 뉴클레오티드, 다른 한편에는 아미노산). . 이 경우 폴리뉴클레오타이드에서 폴리펩타이드 구조로 정보를 정확하게 번역하기 위한 새로운 원칙을 만들 필요가 있음이 분명합니다. 진화 과정에서 그러한 원리가 만들어졌고 유전 암호가 그 기초에 놓였습니다.

유전자 코드는 단백질의 아미노산에 해당하는 코돈을 형성하는 DNA 또는 RNA의 뉴클레오티드 서열의 특정 교대를 기반으로 핵산 분자에 유전 정보를 기록하는 시스템입니다.

유전자 코드에는 몇 가지 속성이 있습니다.

    삼중성.

    축퇴 또는 중복.

    모호하지 않음.

    극성.

    겹치지 않음.

    소형화.

    다재.

일부 저자는 코드에 포함된 뉴클레오티드의 화학적 특징 또는 신체 단백질의 개별 아미노산 발생 빈도 등과 관련된 코드의 다른 속성도 제공한다는 점에 유의해야 합니다. 그러나 이러한 속성은 위에서 따르므로 여기에서 고려할 것입니다.

ㅏ. 삼중성. 복잡하게 조직된 많은 시스템과 마찬가지로 유전자 코드는 가장 작은 구조 및 가장 작은 기능 단위를 가지고 있습니다. 삼중항은 유전자 코드의 가장 작은 구조 단위입니다. 그것은 세 개의 뉴클레오티드로 구성됩니다. 코돈은 유전자 코드의 가장 작은 기능적 단위입니다. 일반적으로 mRNA 삼중항을 코돈이라고 합니다. 유전자 코드에서 코돈은 여러 기능을 수행합니다. 첫째, 주요 기능은 하나의 아미노산을 암호화한다는 것입니다. 둘째, 코돈은 아미노산을 암호화하지 않을 수 있지만 이 경우 다른 기능을 갖습니다(아래 참조). 정의에서 알 수 있듯이 삼중 항은 다음을 특징 짓는 개념입니다. 초등학교 구조 단위유전자 코드(3개의 뉴클레오티드). 코돈의 특징 기본 의미 단위게놈 - 3개의 뉴클레오티드가 하나의 아미노산의 폴리펩타이드 사슬에 대한 부착을 결정합니다.

기본 구조 단위는 먼저 이론적으로 해독된 후 실험적으로 그 존재가 확인되었습니다. 실제로, 20개의 아미노산은 하나 또는 두 개의 뉴클레오티드로 암호화될 수 없습니다. 후자는 4개에 불과합니다. 4개의 뉴클레오티드 중 3개는 4 3 = 64개의 변이체를 제공하며 이는 살아있는 유기체에 존재하는 아미노산의 수보다 많습니다(표 1 참조).

표 64에 제시된 뉴클레오티드의 조합은 두 가지 특징을 갖는다. 첫째, 삼중항의 64가지 변이 중 61개만이 코돈이며 모든 아미노산을 암호화합니다. 감지 코돈. 세 개의 삼중 항은 인코딩하지 않습니다

1 번 테이블.

메신저 RNA 코돈 및 해당 아미노산

코돈의 기초

무의미한 말

무의미한 말

무의미한 말

만났다

샤프트

아미노산 a는 번역의 끝을 나타내는 정지 신호입니다. 이렇게 세쌍둥이가 있다 UAA, UAG, UGA, "무의미한"(말도 안되는 코돈)이라고도합니다. 삼중항의 한 뉴클레오티드가 다른 뉴클레오티드로 교체되는 것과 관련된 돌연변이의 결과로 의미 없는 코돈이 센스 코돈에서 발생할 수 있습니다. 이러한 유형의 돌연변이를 넌센스 돌연변이. 이러한 중지 신호가 유전자 내부(정보 부분)에 형성되면 이 곳에서 단백질 합성 중에 프로세스가 지속적으로 중단됩니다. 단백질의 첫 번째(중지 신호 전) 부분만 합성됩니다. 그러한 병리학을 가진 사람은 단백질 부족을 경험할 것이며 이러한 부족과 관련된 증상을 경험할 것입니다. 예를 들어, 이러한 종류의 돌연변이는 헤모글로빈 베타 사슬을 암호화하는 유전자에서 발견되었습니다. 짧은 비활성 헤모글로빈 사슬이 합성되어 빠르게 파괴됩니다. 결과적으로 베타 사슬이 없는 헤모글로빈 분자가 형성됩니다. 그러한 분자가 그 역할을 완전히 수행하지 못할 것임이 분명합니다. 용혈성 빈혈의 유형에 따라 발생하는 심각한 질병이 있습니다 (베타 제로 지중해 빈혈, 그리스어 "Talas"-이 질병이 처음 발견 된 지중해).

정지 코돈의 작용 메커니즘은 센스 코돈의 작용 메커니즘과 다릅니다. 이것은 아미노산을 암호화하는 모든 코돈에 대해 상응하는 tRNA가 발견되었다는 사실로부터 따른다. 말도 안되는 코돈에 대한 tRNA는 발견되지 않았습니다. 따라서 tRNA는 단백질 합성을 멈추는 과정에 관여하지 않는다.

코돈8월 (때때로 박테리아에서 GUG)는 아미노산 메티오닌과 발린을 암호화할 뿐만 아니라브로드캐스트 개시자 .

비. 축퇴 또는 중복.

64개의 세쌍둥이 중 61개가 20개의 아미노산을 코딩합니다. 아미노산 수에 비해 삼중항 수의 이러한 3배 초과는 정보 전달에 두 가지 코딩 옵션이 사용될 수 있음을 시사합니다. 첫째, 64개의 코돈 모두가 20개의 아미노산을 코딩하는 데 관여할 수 있는 것은 아니며, 단지 20개만 코딩할 수 있고, 둘째, 아미노산은 여러 코돈에 의해 코딩될 수 있습니다. 연구에 따르면 자연은 후자의 옵션을 사용했습니다.

그의 취향은 분명하다. 64개의 삼중항 변이체 중 20개만 아미노산 코딩에 관여했다면 44개의 삼중항(64개 중)은 비암호화 상태로 남을 것입니다. 무의미(넌센스 코돈). 이전에 우리는 돌연변이의 결과로 코딩 삼중 항이 말도 안되는 코돈으로 변형되는 것이 세포의 생명에 얼마나 위험한지 지적했습니다. 이것은 RNA 중합 효소의 정상적인 작동을 크게 방해하여 궁극적으로 질병의 발병으로 이어집니다. 현재 우리 게놈에는 3개의 넌센스 코돈이 있으며, 이제 넌센스 코돈의 수가 약 15배 증가하면 어떤 일이 일어날지 상상해 보십시오. 그러한 상황에서 정상적인 코돈에서 넌센스 코돈으로의 전이가 측정할 수 없을 정도로 높아질 것이 분명합니다.

하나의 아미노산이 여러 삼중항에 의해 암호화되는 코드를 축퇴 또는 중복이라고 합니다. 거의 모든 아미노산에는 여러 개의 코돈이 있습니다. 따라서 아미노산 류신은 UUA, UUG, CUU, CUC, CUA, CUG의 6개의 삼중항으로 암호화될 수 있습니다. 발린은 4개의 삼중항체, 페닐알라닌은 2개의 삼중항으로 암호화됩니다. 트립토판과 메티오닌하나의 코돈으로 인코딩됩니다. 동일한 정보를 다른 문자로 기록하는 것과 관련된 속성을 호출합니다. 퇴화.

하나의 아미노산에 할당된 코돈의 수는 단백질에서 아미노산의 발생 빈도와 잘 관련됩니다.

그리고 이것은 우연이 아닐 가능성이 큽니다. 단백질에서 아미노산의 발생 빈도가 높을수록 이 아미노산의 코돈이 게놈에 더 자주 존재할수록 돌연변이 유발 요인에 의한 손상 가능성이 높아집니다. 따라서 변이된 코돈이 고도로 퇴화된 경우 동일한 아미노산을 코딩할 가능성이 더 높다는 것이 분명합니다. 이러한 위치에서 유전자 코드의 퇴화는 인간 게놈을 손상으로부터 보호하는 메커니즘입니다.

축퇴라는 용어는 분자 유전학에서 다른 의미로도 사용된다는 점에 유의해야 합니다. 코돈에 있는 정보의 주요 부분이 처음 두 개의 뉴클레오티드에 있기 때문에 코돈의 세 번째 위치에 있는 염기는 거의 중요하지 않은 것으로 판명되었습니다. 이러한 현상을 "3루의 축퇴"라고 합니다. 후자의 기능은 돌연변이의 영향을 최소화합니다. 예를 들어, 적혈구의 주요 기능은 폐에서 조직으로 산소를 운반하고 조직에서 폐로 이산화탄소를 운반하는 것으로 알려져 있습니다. 이 기능은 적혈구의 전체 세포질을 채우는 호흡 색소 - 헤모글로빈에 의해 수행됩니다. 그것은 해당 유전자에 의해 암호화되는 단백질 부분 인 글로빈으로 구성됩니다. 단백질 외에도 헤모글로빈에는 철분을 포함하는 헴이 포함되어 있습니다. 글로빈 유전자의 돌연변이는 다양한 헤모글로빈 변이의 출현으로 이어집니다. 대부분의 경우 돌연변이는 다음과 관련이 있습니다. 한 뉴클레오티드가 다른 뉴클레오티드로 치환되고 유전자에서 새로운 코돈이 나타나는 것, 헤모글로빈 폴리펩타이드 사슬에서 새로운 아미노산을 암호화할 수 있습니다. 삼중 항에서는 돌연변이의 결과로 첫 번째, 두 번째 또는 세 번째의 모든 뉴클레오티드가 교체 될 수 있습니다. 수백 개의 돌연변이가 글로빈 유전자의 무결성에 영향을 미치는 것으로 알려져 있습니다. 가까운 400 그 중 유전자에서 단일 뉴클레오티드의 교체 및 폴리펩티드에서 상응하는 아미노산 치환과 관련된다. 이 중 만 100 치환은 헤모글로빈의 불안정성과 경증에서 중증에 이르는 다양한 종류의 질병을 유발합니다. 300개(약 64%)의 치환 돌연변이는 헤모글로빈 기능에 영향을 미치지 않으며 병리를 유발하지 않습니다. 그 이유 중 하나는 세린, 류신, 프롤린, 아르기닌 및 일부 다른 아미노산을 암호화하는 삼중항에서 세 번째 뉴클레오티드의 교체가 동의어 코돈의 출현으로 이어질 때 위에서 언급한 "제3 염기의 축퇴"입니다. 동일한 아미노산을 암호화합니다. 표현형으로, 그러한 돌연변이는 그 자체로 나타나지 않을 것입니다. 대조적으로, 경우의 100%에서 삼중항의 첫 번째 또는 두 번째 뉴클레오티드의 교체는 새로운 헤모글로빈 변형의 출현으로 이어집니다. 그러나이 경우에도 심각한 표현형 장애가 없을 수 있습니다. 그 이유는 헤모글로빈의 아미노산이 물리화학적 특성 면에서 첫 번째와 유사한 다른 아미노산으로 대체되기 때문입니다. 예를 들어, 친수성 특성을 가진 아미노산이 다른 아미노산으로 대체되었지만 특성은 동일합니다.

헤모글로빈은 헴의 철 포르피린 그룹(산소와 이산화탄소 분자가 결합됨)과 단백질인 글로빈으로 구성됩니다. 성인 헤모글로빈(HbA)에는 두 개의 동일한- 사슬과 두 개-쇠사슬. 분자-사슬에는 141개의 아미노산 잔기가 포함되어 있으며,- 체인 - 146,- 그리고-사슬은 많은 아미노산 잔기가 다릅니다. 각 글로빈 사슬의 아미노산 서열은 자체 유전자에 의해 암호화됩니다. 유전자 인코딩- 사슬은 16번 염색체의 단완에 위치하며,-유전자 - 11번 염색체의 짧은 팔에 있습니다. 유전자 인코딩의 변화- 첫 번째 또는 두 번째 뉴클레오티드의 헤모글로빈 사슬은 거의 항상 단백질에 새로운 아미노산의 출현, 헤모글로빈 기능의 파괴 및 환자에게 심각한 결과를 초래합니다. 예를 들어, CAU(히스티딘) 삼중항 중 하나에서 "C"를 "U"로 바꾸면 다른 아미노산인 티로신을 암호화하는 새로운 UAU 삼중항이 나타납니다. 표현형적으로 이것은 심각한 질병으로 나타납니다.. A 위치 63에서 유사한 교체- 히스티딘 폴리펩타이드의 티로신 사슬은 헤모글로빈을 불안정하게 만들 것입니다. 질병 메트헤모글로빈혈증이 발생합니다. 돌연변이의 결과로 6번째 위치에서 글루탐산이 발린으로 변경됨사슬은 심각한 질병인 겸상 적혈구 빈혈의 원인입니다. 슬픈 목록을 계속하지 말자. 우리는 처음 두 개의 뉴클레오티드를 교체할 때 아미노산이 이전 것과 물리화학적 특성이 유사하게 나타날 수 있다는 점만 주목합니다. 따라서, 글루탐산(GAA)을 인코딩하는 삼중항 중 하나에서 두 번째 뉴클레오티드의 대체는"Y"의 -사슬은 발린을 암호화하는 새로운 삼중항(GUA)의 출현을 유도하고, 첫 번째 뉴클레오티드를 "A"로 대체하여 아미노산 라이신을 암호화하는 AAA 삼중항을 형성합니다. 글루타민산과 라이신은 물리화학적 특성이 유사하며 둘 다 친수성입니다. 발린은 소수성 아미노산입니다. 따라서 친수성 글루탐산을 소수성 발린으로 대체하면 헤모글로빈의 특성이 크게 바뀌어 궁극적으로 겸상 적혈구 빈혈이 발생하는 반면 친수성 글루탐산을 친수성 라이신으로 대체하면 헤모글로빈의 기능이 덜 변합니다. 환자 가벼운 형태의 빈혈이 발생합니다. 세 번째 염기가 교체된 결과 새로운 삼중항은 이전 것과 동일한 아미노산을 암호화할 수 있습니다. 예를 들어, 우라실이 CAH 삼중항에서 시토신으로 대체되고 CAC 삼중항이 발생하면 실제로 사람의 표현형 변화가 감지되지 않습니다. 이것은 이해할 수 있습니다. 왜냐하면 두 삼중 항은 동일한 아미노산인 히스티딘을 암호화합니다.

결론적으로 유전암호의 축퇴와 일반적인 생물학적 위치에서 세 번째 염기의 축퇴는 DNA와 RNA의 고유한 구조에서 진화에 통합되는 보호 메커니즘이라는 점을 강조하는 것이 적절하다.

V. 모호하지 않음.

각 세쌍둥이(무의미한 것을 제외하고)는 오직 하나의 아미노산만을 암호화합니다. 따라서, 코돈-아미노산의 방향에서는 유전자 코드가 모호하지 않고, 아미노산-코돈-의 방향에서는 모호하다(퇴화).

모호하지 않은

코돈 아미노산

타락하다

그리고 이 경우 유전자 코드의 명확성이 필요합니다. 또 다른 변형에서, 동일한 코돈의 번역 중에 서로 다른 아미노산이 단백질 사슬에 삽입되어 결과적으로 서로 다른 기본 구조와 서로 다른 기능을 가진 단백질이 형성됩니다. 세포의 신진대사는 "하나의 유전자 - 여러 개의 폴리펩티드" 작동 모드로 전환됩니다. 그러한 상황에서는 유전자의 조절 기능이 완전히 상실될 것이 분명합니다.

G. 극성

DNA와 mRNA로부터 정보를 읽는 것은 한 방향으로만 일어난다. 극성은 고차 구조(2차, 3차 등)를 정의하는 데 필수적입니다. 앞에서 우리는 낮은 차수의 구조가 높은 차수의 구조를 결정한다는 사실에 대해 이야기했습니다. 단백질의 3차 구조와 고차 구조는 합성된 RNA 사슬이 DNA 분자에서 멀어지거나 폴리펩타이드 사슬이 리보솜에서 멀어지자마자 즉시 형성됩니다. RNA 또는 폴리펩타이드의 자유 말단이 3차 구조를 획득하는 동안 사슬의 다른 말단은 여전히 ​​DNA(RNA가 전사되는 경우) 또는 리보솜(폴리펩티드가 전사되는 경우)에서 합성을 계속합니다.

따라서 (RNA와 단백질의 합성에서) 정보를 읽는 단방향 과정은 합성된 물질에서 뉴클레오티드 또는 아미노산의 서열을 결정하는 것뿐만 아니라 2차, 3차 등의 엄격한 결정을 위해 필수적입니다. 구조.

e. 겹치지 않음.

코드는 겹칠 수도 있고 겹치지 않을 수도 있습니다. 대부분의 유기체에서 코드는 겹치지 않습니다. 일부 파지에서 중복 코드가 발견되었습니다.

겹치지 않는 코드의 본질은 한 코돈의 뉴클레오티드가 동시에 다른 코돈의 뉴클레오티드가 될 수 없다는 것입니다. 코드가 겹치는 경우 7개의 뉴클레오티드 서열(GCUGCUG)은 겹치지 않는 코드의 경우와 같이 2개의 아미노산(알라닌-알라닌)(그림 33, A)이 아니라 3개(1개의 뉴클레오티드인 경우)를 암호화할 수 있습니다. 공통)(그림 33, B) 또는 5개(2개의 뉴클레오티드가 공통인 경우)(그림 33, C 참조). 마지막 두 경우에서 뉴클레오티드의 돌연변이는 2, 3 등의 순서로 위반됩니다. 아미노산.

그러나 하나의 뉴클레오티드의 돌연변이는 항상 폴리펩티드에 하나의 아미노산이 포함되는 것을 방해한다는 것이 밝혀졌습니다. 이것은 코드가 겹치지 않는다는 사실에 찬성하는 중요한 주장입니다.

이를 그림 34에서 설명하겠습니다. 굵은 선은 겹치지 않는 코드와 겹치는 코드의 경우 아미노산을 인코딩하는 트리플릿을 보여줍니다. 실험은 유전자 코드가 겹치지 않는다는 것을 분명하게 보여주었습니다. 실험의 세부사항으로 들어가지 않고, 뉴클레오타이드 서열에서 세 번째 뉴클레오타이드를 교체하면(그림 34 참조)~에 (별표로 표시) 다른 다음:

1. 겹치지 않는 코드를 사용하면 이 서열에 의해 제어되는 단백질은 하나(첫 번째) 아미노산(별표 표시)을 대체합니다.

2. 옵션 A에 중복 코드가 있는 경우 두 개(첫 번째 및 두 번째) 아미노산(별표 표시)에서 대체가 발생합니다. 옵션 B에서 대체는 3개의 아미노산(별표로 표시됨)에 영향을 미칩니다.

그러나 수많은 실험에서 DNA의 한 뉴클레오티드가 끊어지면 단백질은 항상 하나의 아미노산에만 영향을 미치며 이는 중첩되지 않는 코드에 일반적입니다.

ГЦУГЦУГ ГЦУГЦУГ ГЦУГЦУГ

HCC HCC HCC UHC CUG HCC CUG UGC HCC CUG

*** *** *** *** *** ***

Alanine - Alanine Ala - Cys - Lei Ala - Lei - Lei - Ala - Lei

ABC

겹치지 않는 코드 겹치는 코드

쌀. 34. 게놈에 겹치지 않는 코드의 존재를 설명하는 도식(텍스트 내 설명).

유전 코드의 겹치지 않는 것은 다른 속성과 관련이 있습니다. 정보 읽기는 특정 지점에서 시작됩니다. 즉, 시작 신호입니다. mRNA에서 이러한 개시 신호는 AUG 메티오닌을 암호화하는 코돈이다.

사람은 여전히 ​​일반적인 규칙에서 벗어나 중복되는 소수의 유전자를 가지고 있음에 유의해야합니다.

e. 소형화.

코돈 사이에는 문장 부호가 없습니다. 즉, 삼중항은 예를 들어 하나의 무의미한 뉴클레오티드에 의해 서로 분리되지 않습니다. 유전자 코드에 "구두점"이 없다는 것이 실험에서 입증되었습니다.

그리고. 다재.

코드는 지구에 사는 모든 유기체에 대해 동일합니다. 유전자 코드의 보편성에 대한 직접적인 증거는 DNA 서열을 상응하는 단백질 서열과 비교함으로써 얻어졌다. 모든 박테리아 및 진핵 게놈에서 동일한 코드 값 세트가 사용된다는 것이 밝혀졌습니다. 예외가 있지만 많지는 않습니다.

유전 암호의 보편성에 대한 첫 번째 예외는 일부 동물 종의 미토콘드리아에서 발견되었습니다. 이것은 아미노산 트립토판을 암호화하는 UGG 코돈과 동일하게 읽는 터미네이터 코돈 UGA와 관련이 있습니다. 보편성에서 다른 드문 편차도 발견되었습니다.

MZ. 유전암호는 코돈을 형성하는 DNA 또는 RNA에서 뉴클레오티드 서열의 특정 교대를 기반으로 핵산 분자에 유전 정보를 기록하는 시스템으로,

단백질의 아미노산에 해당합니다.유전자 코드에는 몇 가지 속성이 있습니다.

다른 유기체의 유전자 코드에는 다음과 같은 몇 가지 공통된 특성이 있습니다.
1) 삼중성. 유전 정보를 포함한 모든 정보를 기록하기 위해 특정 암호가 사용되며 그 요소는 문자 또는 기호입니다. 이러한 기호의 모음이 알파벳을 구성합니다. 개별 메시지는 코드 그룹 또는 코돈이라는 문자 조합으로 작성됩니다. 두 문자로만 구성된 알파벳이 알려져 있습니다. 이것이 모스 부호입니다. DNA에는 4개의 문자가 있습니다. 질소 염기 이름의 첫 글자(A, G, T, C)는 유전자 알파벳이 4자로만 구성되어 있음을 의미합니다. 코드 그룹, 한마디로 유전자 코드란 무엇입니까? 20개의 염기성 아미노산이 알려져 있으며 그 내용은 유전자 코드로 작성되어야 합니다. 즉, 4개의 문자는 20개의 코드 단어를 제공해야 합니다. 단어가 하나의 문자로 구성되어 있다고 가정하면 4개의 코드 그룹만 얻게 됩니다. 단어가 두 개의 문자로 구성된 경우 그러한 그룹은 16개뿐이며 이는 20개의 아미노산을 인코딩하기에 분명히 충분하지 않습니다. 따라서 코드 워드에는 64(43)개의 조합을 제공하는 적어도 3개의 뉴클레오티드가 있어야 합니다. 이 삼중 항 조합의 수는 모든 아미노산을 암호화하기에 충분합니다. 따라서 유전자 코드의 코돈은 뉴클레오티드의 삼중항입니다.
2) 축퇴(중복) - 한편으로는 중복 삼중항, 즉 동의어를 포함하고 다른 한편으로는 "무의미한" 삼중항을 포함한다는 사실로 구성된 유전자 코드의 속성입니다. 코드는 64개의 조합을 포함하고 20개의 아미노산만 암호화되기 때문에 일부 아미노산은 여러 삼중항(아르기닌, 세린, 류신 - 6개; 발린, 프롤린, 알라닌, 글리신, 트레오닌 - 4개; 이소류신 - 3개; 페닐알라닌, 티로신, 히스티딘, 라이신 , 아스파라긴, 글루타민, 시스테인, 아스파르트산 및 글루탐산 - 2개; 메티오닌 및 트립토판 - 1개의 삼중항). 일부 코드 그룹(UAA, UAG, UGA)은 의미론적 부하를 전혀 전달하지 않습니다. 즉, "무의미한" 삼중 항입니다. "무의미한" 또는 말도 안되는 코돈은 사슬 종결자(유전 텍스트의 문장 부호) 역할을 하며 단백질 사슬 합성의 끝을 알리는 신호 역할을 합니다. 이러한 코드 중복성은 유전 정보 전송의 신뢰성을 높이는 데 매우 중요합니다.
3) 겹치지 않음. 코드 트리플릿은 절대 겹치지 않습니다. 즉, 항상 함께 브로드캐스트됩니다. DNA 분자에서 정보를 읽을 때 한 삼중항의 질소 염기를 다른 삼중항의 염기와 함께 사용하는 것은 불가능합니다.
4) 독창성. 동일한 삼중 항이 하나 이상의 산에 해당하는 경우는 없습니다.
5) 유전자 내에 분리 문자가 없음. 유전자 코드는 쉼표 없이 특정 위치부터 읽습니다.
6) 다양성. 다른 유형의 살아있는 유기체(바이러스, 박테리아, 식물, 균류 및 동물)에서 동일한 삼중항이 동일한 아미노산을 암호화합니다.
7) 종 특이성. DNA 사슬에 있는 질소 염기의 수와 순서는 유기체마다 다릅니다.

모든 살아있는 유기체에는 특별한 단백질 세트가 있습니다. DNA 분자의 특정 뉴클레오티드 화합물과 그 서열이 유전자 코드를 형성합니다. 그것은 단백질의 구조에 대한 정보를 전달합니다. 유전학에서는 어떤 개념이 채택되었습니다. 그녀에 따르면 하나의 유전자는 하나의 효소(폴리펩티드)에 해당합니다. 핵산과 단백질에 대한 연구는 상당히 오랜 기간 진행되어 왔다고 해야 할까요. 이 기사에서 더 나아가 유전자 코드와 그 특성에 대해 자세히 살펴볼 것입니다. 연구의 간략한 연대기 또한 제공됩니다.

술어

유전암호는 뉴클레오티드 서열을 이용하여 아미노산 단백질 서열을 암호화하는 방식이다. 이 정보 형성 방법은 모든 살아있는 유기체의 특징입니다. 단백질은 분자량이 큰 천연 유기 물질입니다. 이 화합물은 살아있는 유기체에도 존재합니다. 그들은 정식이라고 불리는 20 가지 유형의 아미노산으로 구성됩니다. 아미노산은 사슬로 배열되고 엄격하게 정해진 순서로 연결됩니다. 그것은 단백질의 구조와 생물학적 특성을 결정합니다. 또한 단백질에는 여러 개의 아미노산 사슬이 있습니다.

DNA와 RNA

디옥시리보핵산은 거대분자입니다. 그녀는 유전 정보의 전송, 저장 및 구현을 담당합니다. DNA는 4개의 질소 염기를 사용합니다. 여기에는 아데닌, 구아닌, 시토신, 티민이 포함됩니다. RNA는 티민을 포함하는 것을 제외하고 동일한 뉴클레오티드로 구성됩니다. 대신 우라실(U)을 포함하는 뉴클레오티드가 존재합니다. RNA 및 DNA 분자는 뉴클레오티드 사슬입니다. 이 구조 덕분에 "유전자 알파벳"이라는 시퀀스가 ​​형성됩니다.

정보의 구현

유전자에 의해 암호화된 단백질의 합성은 DNA 주형(전사)에 mRNA를 결합함으로써 실현됩니다. 또한 유전자 코드가 아미노산 서열로 전달됩니다. 즉, mRNA에서 폴리펩타이드 사슬의 합성이 일어난다. 모든 아미노산을 암호화하고 단백질 서열의 끝을 알리기 위해서는 3개의 뉴클레오티드로 충분합니다. 이 사슬을 삼중선이라고 합니다.

연구 이력

단백질과 핵산에 대한 연구는 오랫동안 수행되어 왔습니다. 20세기 중반에 유전 암호의 본질에 대한 최초의 아이디어가 마침내 나타났습니다. 1953년에 일부 단백질이 아미노산 서열로 구성되어 있다는 사실이 밝혀졌습니다. 사실, 그 당시 그들은 아직 정확한 수를 결정할 수 없었고 이것에 대해 많은 논쟁이 있었습니다. 1953년에 Watson과 Crick은 두 개의 논문을 발표했습니다. 첫 번째는 DNA의 2차 구조를 선언했고, 두 번째는 매트릭스 합성을 통한 허용 가능한 복제에 대해 말했습니다. 또한 특정 염기서열이 유전 정보를 전달하는 코드라는 사실에 중점을 두었습니다. 미국과 소련의 물리학자 Georgy Gamov는 코딩 가설을 인정하고 이를 테스트할 방법을 찾았습니다. 1954년에 그의 작업이 출판되었으며, 그 동안 그는 아미노산 측쇄와 다이아몬드 모양의 "구멍" 사이의 대응 관계를 설정하고 이를 코딩 메커니즘으로 사용하자는 제안을 내놓았습니다. 그런 다음 마름모꼴이라고 불렀습니다. Gamow는 자신의 작업을 설명하면서 유전 코드가 삼중항일 수 있음을 인정했습니다. 물리학 자의 작업은 진실에 가까운 것으로 간주되는 첫 번째 작업 중 하나였습니다.

분류

몇 년 후, 겹치는 것과 겹치지 않는 두 가지 유형을 나타내는 다양한 유전자 코드 모델이 제안되었습니다. 첫 번째는 여러 코돈의 구성에서 하나의 뉴클레오티드의 발생을 기반으로 합니다. 삼각형, 순차 및 메이저-마이너 유전자 코드가 여기에 속합니다. 두 번째 모델은 두 가지 유형을 가정합니다. 겹치지 않는 코드에는 조합 및 "쉼표 없는 코드"가 포함됩니다. 첫 번째 변형은 뉴클레오티드 삼중항에 의한 아미노산의 암호화를 기반으로 하며 그 구성이 주된 것입니다. "쉼표 없음"에 따르면 특정 삼중항은 아미노산에 해당하지만 나머지는 그렇지 않습니다. 이 경우 중요한 세 쌍둥이가 순차적으로 배열되면 다른 읽기 프레임에 있는 다른 세 쌍둥이는 불필요한 것으로 판명될 것이라고 믿었습니다. 과학자들은 이러한 요구 사항을 충족하는 뉴클레오티드 서열을 선택하는 것이 가능하며 정확히 20개의 삼중항이 있다고 믿었습니다.

Gamow 등은 이 모델에 의문을 제기했지만 향후 5년 동안 가장 정확한 것으로 간주되었습니다. 20세기 후반에 "쉼표 없는 코드"의 몇 가지 단점을 감지할 수 있는 새로운 데이터가 나타났습니다. 코돈은 시험관내에서 단백질 합성을 유도할 수 있는 것으로 밝혀졌다. 1965년에 가까워지면서 그들은 64쌍둥이의 원리를 모두 이해했습니다. 그 결과, 일부 코돈의 중복성이 발견되었다. 즉, 아미노산의 서열은 여러 삼중항에 의해 암호화됩니다.

고유 한 특징

유전자 코드의 속성은 다음과 같습니다.

변형

1979년 인체의 미토콘드리아 유전자를 연구하던 중 유전자 코드가 표준에서 벗어난 것이 처음으로 발견되었습니다. 많은 대체 미토콘드리아 코드를 포함하여 더 유사한 변이체가 확인되었습니다. 여기에는 마이코플라즈마에서 트립토판의 정의로 사용되는 정지 코돈 UGA의 해독이 포함됩니다. 고세균 및 박테리아의 GUG 및 UUG는 종종 시작 변종으로 사용됩니다. 때때로 유전자는 해당 종에서 일반적으로 사용하는 것과 다른 시작 코돈의 단백질을 암호화합니다. 또한 일부 단백질에서는 비표준 아미노산인 셀레노시스테인(selenocysteine)과 피롤리신(pyrrolysine)이 리보솜에 의해 삽입된다. 그녀는 정지 코돈을 읽습니다. mRNA에서 발견되는 서열에 따라 다릅니다. 현재 셀레노시스테인은 21번째, 단백질에 존재하는 22번째 아미노산인 피롤리잔으로 간주됩니다.

유전자 코드의 일반적인 특징

그러나 모든 예외는 드뭅니다. 살아있는 유기체에서 일반적으로 유전자 코드에는 여러 가지 공통된 특징이 있습니다. 여기에는 3개의 뉴클레오티드(처음 2개는 결정 뉴클레오티드에 속함)를 포함하는 코돈의 구성, tRNA 및 리보솜에 의한 코돈의 아미노산 서열로의 전달이 포함됩니다.

민법의 기원을 설명하는 일련의 기사는 우리가 거의 흔적을 남기지 않는 사건에 대한 조사라고 할 수 있습니다. 그러나이 기사를 이해하려면 단백질 합성의 분자 메커니즘을 이해하기 위해 약간의 노력이 필요합니다. 이 기사는 유전자 코드의 기원에 관한 일련의 자동 간행물에 대한 소개 기사이며 이 주제에 대해 알기 시작하기에 가장 좋은 곳입니다.
대개 유전자 코드(GC)는 DNA 또는 RNA의 1차 구조에 단백질을 암호화하는 방법(규칙)으로 정의됩니다. 문헌에서는 이것이 유전자의 3개 뉴클레오티드 서열과 합성된 단백질의 1개 아미노산 또는 단백질 합성의 종점의 일대일 대응이라고 가장 자주 기록됩니다. 그러나 이 정의에는 두 가지 오류가 있습니다. 이것은 예외 없이 모든 살아있는 유기체의 단백질의 일부인 20개의 소위 표준 아미노산을 의미합니다. 이 아미노산은 단백질 단량체입니다. 오류는 다음과 같습니다.

1) 정식 아미노산은 20 개가 아니라 19 개뿐입니다. 아미노산은 아미노 그룹 -NH 2와 카르 복실 그룹 - COOH를 동시에 포함하는 물질이라고 할 수 있습니다. 사실 단백질 단량체 인 프롤린은 아미노기 대신 이미노기를 포함하고 있기 때문에 아미노산이 아니므로 프롤린을 이미노산이라고 부르는 것이 더 정확합니다. 그러나 앞으로는 HA에 관한 모든 기사에서 편의상 표시된 뉘앙스를 암시하는 약 20 개의 아미노산을 쓸 것입니다. 아미노산 구조는 그림에 나와 있습니다. 1.

쌀. 1. 표준 아미노산의 구조. 아미노산은 그림에서 검은색으로 표시된 상수 부분과 빨간색으로 표시된 변수(또는 라디칼)를 가지고 있습니다.

2) 코돈에 대한 아미노산의 대응이 항상 명확한 것은 아니다. 고유성 위반 사례에 대해서는 아래를 참조하십시오.

HA의 발생은 암호화된 단백질 합성의 발생을 의미한다. 이 사건은 최초의 살아있는 유기체의 진화적 형성을 위한 핵심 사건 중 하나입니다.

HA의 구조는 Fig. 2.



쌀. 2. 유전자 코드원형으로. 내부 원은 코돈의 첫 글자, 두 번째원 - 코돈의 두 번째 문자, 세 번째 원 - 코돈의 세 번째 문자, 네 번째 원 - 세 글자 약어로 된 아미노산 지정; P - 극성 아미노산, NP - 비극성 아미노산. 대칭의 명확성을 위해 선택한 기호 순서가 중요합니다. U-C-A-G.

이제 HA의 주요 속성에 대한 설명을 진행하겠습니다.

1. 삼중성.각 아미노산은 3개의 뉴클레오티드 서열로 암호화됩니다.

2. 유전 간 구두점의 존재.유전자간 문장 부호에는 번역이 시작되거나 끝나는 핵산 서열이 포함됩니다.

어떤 코돈으로도 시작할 수 없으며 엄격하게 정의된 코돈으로만 - 시작. 시작 코돈은 번역을 시작하는 AUG 삼중항입니다. 이 경우, 이 삼중항은 메티오닌 또는 다른 아미노산인 포르밀메티오닌(원핵생물에서)을 암호화하며 이는 단백질 합성 초기에만 활성화될 수 있습니다. 폴리펩티드를 암호화하는 각 유전자의 끝에는 3개 중 적어도 하나가 있습니다. 종료 코돈, 또는 브레이크 등: UAA, UAG, UGA. 그들은 번역(소위 리보솜에서 단백질 합성)을 종료합니다.

3. 조밀함 또는 유전자 내 문장 부호가 없음.유전자 내에서 각 뉴클레오티드는 중요한 코돈의 일부입니다.

4. 겹치지 않음.코돈은 서로 중첩되지 않으며, 각각 고유한 정렬된 뉴클레오티드 세트를 가지며, 이는 유사한 인접 코돈 세트와 중첩되지 않습니다.

5. 퇴화.아미노산-코돈 방향의 역 대응은 모호하다. 이 속성을 퇴행성이라고 합니다. 시리즈하나의 아미노산을 암호화하는 코돈의 집합, 즉 하나의 그룹 등가 코돈. 코돈을 XYZ로 생각하십시오. XY가 "의미"(즉, 아미노산)를 정의하면 코돈을 강한. 코돈의 의미를 결정하기 위해 특정 Z가 필요한 경우 그러한 코돈을 약한.

코드의 축퇴는 코돈-안티코돈 쌍의 모호성과 밀접한 관련이 있습니다(안티코돈은 메신저 RNA의 코돈과 상보적으로 쌍을 이룰 수 있는 tRNA의 3개 뉴클레오티드 시퀀스를 의미합니다(자세한 내용은 다음 두 기사 참조). 코드 축퇴를 보장하기 위한 분자 메커니즘그리고 Lagerquist의 법칙. 대칭과 Rumer 관계의 물리화학적 실증). tRNA당 하나의 안티코돈은 mRNA당 1~3개의 코돈을 인식할 수 있습니다.

6.모호하지 않음.각 triplet은 하나의 아미노산만 암호화하거나 번역 종결자입니다.

세 가지 알려진 예외가 있습니다.

첫 번째. 원핵생물에서 첫 번째 위치(대문자)는 포르밀메티오닌을 암호화하고 다른 모든 메티오닌은 암호화합니다 유전자의 시작 부분에서 포르밀메티오닌은 일반적인 AUG 메티오닌 코돈과 GUG 발린 코돈 또는 UUG에 의해 암호화됩니다 유전자 내에서 각각 발린과 류신을 암호화하는 류신 코돈.

많은 단백질에서 포르밀메티오닌이 절단되거나 포르밀기가 제거되어 포르밀메티오닌이 일반 메티오닌으로 전환됩니다.

두번째. 1986년에 여러 연구자 그룹이 mRNA에서 UGA 종결 코돈이 셀레노시스테인을 암호화할 수 있다는 사실을 한 번에 발견했습니다(그림 3 참조).

쌀. 3. 21번째 아미노산의 구조 - 셀레노시스테인.

~에 대장균(이것은 Escherichia coli의 라틴어 이름입니다.) selenocysteyl-tRNA는 번역 중에 mRNA에서 UGA 코돈을 인식하지만 특정 상황에서만 e: UGA 코돈을 의미 있는 것으로 인식하기 위해 45개 뉴클레오티드 길이의 시퀀스, UGA 코돈이 중요합니다.

고려한 예는 필요한 경우 살아있는 유기체가 표준 유전자 코드의 의미를 변경할 수 있음을 보여줍니다. 이 경우 유전자에 포함된 유전 정보는 보다 복잡한 방식으로 암호화됩니다. 코돈의 의미는 특정 긴 뉴클레오타이드 서열과 몇 가지 고도로 특이적인 단백질 인자의 참여로 e의 맥락에서 결정됩니다. 셀레노시스테인 tRNA가 세 가지 생명 분야(고세균, 진정세균 및 진핵생물) 모두의 대표자에서 발견되는 것이 중요합니다. 다른 글에서 다루겠습니다.) 아마도 셀레노시스테인은 예외 없이 모든 살아있는 유기체에서 발견됩니다. 그러나 각각의 개별 유기체에서 셀레노시스테인은 수십 개의 단백질에서만 발견됩니다. 그것은 일반적인 시스테인이 유사한 위치에서 기능할 수 있는 많은 상동체에서 효소의 활성 부위의 일부입니다.

최근까지 UGA 코돈은 셀레노시스테인 또는 말단으로 읽을 수 있다고 믿었지만 최근에는 섬모에서 Euplotes시스테인 또는 셀레노시스테인에 대한 UGA 코돈 코드. 센티미터. " 유전자 코드모순 허용"

세 번째 예외. 일부 원핵생물(5종의 고세균과 1종의 진정세균 - Wikipedia에 대한 정보는 매우 구식임)에는 특별한 산인 피롤리신이 있습니다(그림 4). 표준 코드에서 번역 종결자 역할을 하는 UAG 삼중항으로 인코딩됩니다. 이 경우 셀레노시스테인을 코딩하는 경우와 마찬가지로 UAG를 피롤리신 코돈으로 읽는 것은 mRNA의 특수한 구조로 인해 발생한다고 가정합니다. 피롤리신 tRNA는 안티코돈 CTA를 포함하고 클래스 2 APCase에 의해 아미노아실화됩니다(APCase 분류에 대해서는 "Codases가 어떻게 유전자 코드 ").

UAG는 정지 코돈으로 거의 사용되지 않으며, 사용되는 경우 다른 정지 코돈이 뒤따르는 경우가 많습니다.

쌀. 4. 피롤리신의 22번째 아미노산 구조.

7. 다재.지난 세기의 60 년대 중반에 민법의 해독이 완료된 후 오랫동안 코드는 모든 유기체에서 동일하다고 믿었으며 이는 지구상의 모든 생명의 기원의 통일성을 나타냅니다.

GC가 보편적인 이유를 이해해 봅시다. 사실 신체에서 적어도 하나의 코딩 규칙이 변경되면 단백질의 상당 부분 구조가 변경된다는 사실로 이어질 것입니다. 그러한 변화는 너무 극적이어서 거의 항상 치명적일 수 있습니다. 단 하나의 코돈의 의미 변화가 평균적으로 모든 아미노산 서열의 1/64에 영향을 미칠 수 있기 때문입니다.

여기에서 한 가지 매우 중요한 생각이 나옵니다. HA는 35억 년 전에 형성된 이후로 거의 변하지 않았습니다. 따라서 그 구조는 그 발생의 흔적을 담고 있으며, 이 구조의 분석은 GC가 정확히 어떻게 발생할 수 있는지 이해하는 데 도움이 될 수 있습니다.

실제로 HA는 박테리아, 미토콘드리아, 일부 섬모 및 효모의 핵 코드에서 약간 다를 수 있습니다. 현재 표준 코드와 1-5개의 코돈이 다른 최소 17개의 유전자 코드가 있으며, 보편적 GC에서 벗어난 모든 알려진 변이체에는 총 18개의 서로 다른 센스 a 코돈 대체가 사용됩니다. 표준 코드와의 대부분의 편차는 미토콘드리아 - 10에서 알려져 있습니다. 척추 동물, 편충, 극피 동물의 미토콘드리아는 서로 다른 코드로 암호화되고 곰팡이 균, 원생 동물 및 강장 동물은 하나씩 암호화됩니다.

종의 진화적 근접성은 그들이 유사한 GC를 가지고 있다는 것을 결코 보장하지 않습니다. 유전 코드는 다른 유형의 마이코플라스마 간에도 다를 수 있습니다(일부 종에는 표준 코드가 있고 다른 종에는 다릅니다). 유사한 상황이 효모에 대해 관찰된다.

미토콘드리아는 세포 내에서 살도록 적응한 공생 유기체의 후손이라는 점에 유의하는 것이 중요합니다. 그들은 매우 감소된 게놈을 가지고 있으며 일부 유전자는 세포핵으로 이동했습니다. 따라서 HA의 변화는 더 이상 그렇게 극적이지 않습니다.

나중에 발견된 예외는 코드 진화 메커니즘을 밝히는 데 도움이 될 수 있으므로 진화론적 관점에서 특히 중요합니다.

1 번 테이블.

다양한 유기체의 미토콘드리아 코드.

코돈

범용 코드

미토콘드리아 코드

척추동물

무척추동물

누룩

식물

우가

멈추다

trp

trp

trp

멈추다

AUA

만났다

만났다

만났다

CUA

레우

레우

레우

쓰르

레우

아가

인수

멈추다

세르

인수

인수

AGG

인수

멈추다

세르

인수

인수

코드에 의해 인코딩된 아미노산을 변경하는 세 가지 메커니즘.

첫 번째는 일부 뉴클레오티드(GC-구성) 또는 뉴클레오티드 조합의 불균일한 발생으로 인해 일부 유기체에서 일부 코돈이 사용되지 않는(또는 거의 사용되지 않는) 경우입니다. 결과적으로 이러한 코돈은 사용으로 인해 완전히 사라질 수 있으며(예: 해당 tRNA의 손실로 인해) 향후 신체에 심각한 손상을 일으키지 않고 다른 아미노산을 코딩하는 데 사용할 수 있습니다. 이 메커니즘은 아마도 미토콘드리아에서 일부 방언 코드의 출현에 대한 책임이 있습니다.

두 번째는 정지 코돈을 새로운 의미로 변환하는 것입니다. 이 경우 번역된 단백질 중 일부에 추가가 있을 수 있습니다. 그러나 정지 코돈을 아미노산으로 읽는 번역 오류가 발생할 수 있기 때문에 많은 유전자가 종종 하나가 아닌 두 개의 정지 코돈으로 끝나는 경우가 많기 때문에 상황이 부분적으로 해결됩니다.

세 번째는 일부 균류에서 발생하는 것처럼 특정 코돈의 모호한 판독 가능성입니다.

8 . 연결성.동등한 코돈(즉, 동일한 아미노산을 암호화하는 코돈)의 그룹을 호출합니다. 시리즈. GC는 정지 코돈을 포함하여 21개의 시리즈를 포함합니다. 다음에서는 명확성을 위해 모든 코돈 그룹을 호출합니다. 연락,이 그룹의 각 코돈에서 연속적인 뉴클레오티드 치환에 의해 동일한 그룹의 다른 모든 코돈으로 전달될 수 있는 경우. 21계열 중 18계열이 연결되어 있는데, 2계열은 각각 1개의 코돈을 포함하고 아미노산 세린에 대한 1계열만이 연결되지 않고 2개의 연결된 하위계열로 나뉩니다.


쌀. 5. 일부 코드 시리즈에 대한 연결 그래프. a - 연결된 일련의 발린; b - 연결된 일련의 류신; 세린 시리즈는 관련이 없으며 두 개의 연결된 하위 시리즈로 나뉩니다. 그림은 V.A.의 기사에서 가져온 것입니다. 래트너 " 유전자 코드시스템처럼."

연결성의 특성은 형성 기간 동안 HA가 이미 사용된 코돈과 최소한으로 다른 새로운 코돈을 포착했다는 사실로 설명할 수 있습니다.

9. 규칙성세 쌍둥이의 뿌리에 의한 아미노산의 특성. U 삼중항에 의해 암호화되는 모든 아미노산은 비극성이며 극단적인 특성과 크기가 아니며 지방족 라디칼을 가지고 있습니다. 모든 C-뿌리 3중체는 강한 염기를 가지고 있으며 이들에 의해 암호화되는 아미노산은 상대적으로 작습니다. 루트 A가 있는 모든 삼중항은 약한 염기를 가지며 비소극성 아미노산을 암호화합니다. G-루트 코돈은 아미노산 및 시리즈의 극단 및 비정상 변형을 특징으로 합니다. 그들은 가장 작은 아미노산(글리신), 가장 길고 가장 평평한(트립토판), 가장 길고 "서투른"(아르기닌), 가장 반응성이 큰(시스테인)을 암호화하고, 세린에 대한 비정상적인 하위 집합을 형성합니다.

10. 막힘.범용 CC는 "블록" 코드입니다. 이것은 유사한 물리화학적 특성을 가진 아미노산이 하나의 염기가 서로 다른 코돈에 의해 암호화됨을 의미합니다. 코드의 막힘은 다음 그림에서 명확하게 볼 수 있습니다.


쌀. 6. 민법의 블록 구조. 흰색은 알킬 그룹이 있는 아미노산을 나타냅니다.


쌀. 7. 책에 기재된 수치를 바탕으로 한 아미노산의 물리화학적 성질을 색으로 표현스타이어스 "생화학". 왼쪽 - 소수성. 오른쪽은 단백질에서 알파 나선을 형성하는 능력입니다. 빨간색, 노란색 및 파란색은 소수성 높음, 중간 및 낮음(왼쪽) 또는 알파 나선을 형성하는 해당 정도의 아미노산(오른쪽)을 나타냅니다.

차단성 및 규칙성의 특성은 형성 기간 동안 HA가 이미 사용된 코돈과 최소한으로 다른 새로운 코돈을 포착했다는 사실로도 설명할 수 있습니다.

동일한 첫 번째 염기(코돈 접두사)를 가진 코돈은 유사한 생합성 경로를 가진 아미노산을 코딩합니다. shikimate, pyruvate, aspartate 및 glutamate 계열에 속하는 아미노산의 코돈에는 접두어 U, G, A 및 C가 각각 붙습니다. 고대 아미노산의 생합성 경로 및 현대 암호의 속성과의 연결에 대해서는 "고대 이중선"을 참조하십시오. 유전자 코드"이러한 데이터를 바탕으로 일부 연구자들은 코드의 형성이 아미노산 간의 생합성 관계에 크게 영향을 받았다는 결론을 내렸습니다. 그러나 생합성 경로의 유사성은 전혀 의미가 없습니다. 물리 화학적 특성의 유사성.

11. 잡음 내성.가장 일반적인 형태에서 HA의 노이즈 내성은 무작위 점 돌연변이 및 번역 오류로 인해 아미노산의 물리화학적 특성이 크게 변하지 않는다는 것을 의미합니다.

대부분의 경우 삼중항에서 하나의 뉴클레오티드를 교체해도 암호화된 아미노산이 교체되지 않거나 동일한 극성을 가진 아미노산으로 교체됩니다.

GK의 잡음 내성을 보장하는 메커니즘 중 하나는 퇴화입니다. 평균 퇴화는 - 인코딩된 신호의 수/코돈의 총 수이며, 여기서 인코딩된 신호는 20개의 아미노산 및 번역 종료 기호를 포함합니다. 모든 아미노산에 대한 평균 축퇴 및 종료 기호는 인코딩된 신호당 3개의 코돈입니다.

잡음 내성을 정량화하기 위해 두 가지 개념을 소개합니다. 암호화된 아미노산 클래스의 변화를 일으키지 않는 뉴클레오티드 치환의 돌연변이를 호출합니다. 보수적인.암호화된 아미노산의 클래스를 변경하는 뉴클레오티드 치환 돌연변이를 호출합니다. 근본적인 .

각 세 쌍은 9개의 단일 대체를 허용합니다. 아미노산을 암호화하는 삼중항은 총 61개이므로 모든 코돈에 대해 가능한 뉴클레오티드 치환의 수는

61 x 9 = 549. 이들 중:

23개의 뉴클레오티드 치환으로 정지 코돈이 생성됩니다.

134개의 치환은 암호화된 아미노산을 변경하지 않습니다.
230개의 치환은 암호화된 아미노산의 클래스를 변경하지 않습니다.
162개의 치환은 아미노산 클래스의 변화를 가져옵니다. 급진적입니다.
세 번째 뉴클레오티드의 183개 치환 중 7개는 번역 종결자의 출현으로 이어지고 176개는 보존적입니다.
첫 번째 뉴클레오티드의 183개 치환 중 9개는 터미네이터의 출현으로 이어지며, 114개는 보존적이며 60개는 급진적입니다.
두 번째 뉴클레오티드의 183개 치환 중 7개는 터미네이터의 출현으로 이어지고, 74개는 보존적이며 102개는 급진적입니다.

이러한 계산을 기반으로 우리는 코드의 노이즈 내성에 대한 정량적 추정치를 얻습니다. 이는 근본적인 교체 수에 대한 보수적 교체 수의 비율입니다. 364/162=2.25와 같습니다.

소음 면역에 대한 퇴화의 기여도를 실제로 평가하려면 종에 따라 달라지는 단백질의 아미노산 발생 빈도를 고려해야 합니다.

코드의 노이즈 내성에 대한 이유는 무엇입니까? 대부분의 연구자들은 이 속성이 대체 HA를 선택한 결과라고 생각합니다.

Stephen Freeland와 Lawrence Hurst는 이러한 코드를 임의로 생성했으며 100개의 대체 코드 중 하나만이 범용 GC보다 노이즈 내성이 적지 않다는 것을 알아냈습니다.
이 조사자들이 DNA 돌연변이 패턴과 번역 오류의 실제 추세를 고려하기 위해 추가 제약을 도입했을 때 훨씬 더 흥미로운 사실이 밝혀졌습니다. 이러한 조건에서 백만 개의 가능한 코드 중 단 하나의 코드만이 표준 코드보다 나은 것으로 판명되었습니다.
유전자 코드의 이러한 전례 없는 활력은 그것이 자연 선택의 결과로 형성되었다는 사실로 가장 쉽게 설명됩니다. 아마도 한때 생물학적 세계에는 오류에 대한 고유한 민감도를 가진 많은 코드가 있었을 것입니다. 그것들에 더 잘 대처하는 유기체는 살아남을 가능성이 더 높았고 표준 코드는 단순히 생존을 위한 투쟁에서 승리했습니다. 이 가정은 매우 현실적으로 보입니다. 결국 우리는 대체 코드가 존재한다는 것을 알고 있습니다. 노이즈 내성에 대한 자세한 내용은 Coded Evolution(S. Freeland, L. Hurst "Code Evolution". // In the world of science. - 2004, No. 7)을 참조하십시오.

결론적으로, 나는 20개의 표준 아미노산에 대해 생성될 수 있는 가능한 유전자 코드의 수를 세는 것을 제안합니다. 어떤 이유로 이 숫자는 나에게 결코 오지 않았다. 따라서 생성된 GC에서 AT LEAST ONE CODON으로 인코딩된 정지 신호와 20개의 아미노산이 필요합니다.

정신적으로 우리는 어떤 순서로 코돈에 번호를 매길 것입니다. 우리는 다음과 같이 추론할 것입니다. 정확히 21개의 코돈이 있는 경우 각 아미노산과 정지 신호는 정확히 하나의 코돈을 차지합니다. 이 경우 가능한 GC는 21개입니다!

22개의 코돈이 있으면 21개의 의미 중 하나를 가질 수 있는 추가 코돈이 나타나고 이 코돈은 22개 위치 중 어디에나 위치할 수 있으며 나머지 코돈은 다음과 같이 정확히 하나의 다른 의미 y를 갖습니다. 21개의 코돈. 그런 다음 조합 수 21!x(21x22)를 얻습니다.

23개의 코돈이 있는 경우 유사하게 논의하면 21개의 코돈은 정확히 s의 다른 의미(21! 옵션)를 가지며 두 개의 코돈은 a의 21가지 다른 의미를 갖습니다. 코돈). 이 두 코돈에 대한 서로 다른 위치의 수는 23x22입니다. 23개 코돈에 대한 총 GK 변이체 수 - 21!x21 2x23x22

24개의 코돈이 있는 경우 GC 수는 21!x21 3 x24x23x22, ...

....................................................................................................................

64개의 코돈이 있는 경우 가능한 GC 수는 21!x21 43x64!/21! = 21 43 x64! ~ 9.1x10 145

러시아 연방 교육 과학부 연방 교육청

고등 전문 교육의 주립 교육 기관 "I.I. Polzunov의 이름을 딴 알타이 주립 기술 대학"

자연과학 및 시스템분석학과

"유전 코드"주제에 대한 에세이

1. 유전암호의 개념

3. 유전정보

서지


1. 유전암호의 개념

유전자 코드는 살아있는 유기체의 특징인 뉴클레오티드 서열의 형태로 핵산 분자에 유전 정보를 기록하는 단일 시스템입니다. 각 뉴클레오티드는 그 일부인 질소 염기의 이름을 시작하는 대문자로 표시됩니다. - A (A) 아데닌; - G(G) 구아닌; - C(C) 시토신; - T(T) 티민(DNA 내) 또는 U(U) 우라실(mRNA 내).

세포에서 유전자 코드의 구현은 전사와 번역의 두 단계로 발생합니다.

이들 중 첫 번째는 핵에서 발생합니다. 그것은 DNA의 해당 부분에서 mRNA 분자의 합성으로 구성됩니다. 이 경우 DNA 뉴클레오티드 서열은 RNA 뉴클레오티드 서열로 "재작성"됩니다. 두 번째 단계는 리보솜의 세포질에서 발생합니다. 이 경우 i-RNA의 뉴클레오티드 서열은 단백질의 아미노산 서열로 번역됩니다. 이 단계는 전달 RNA(t-RNA) 및 해당 효소의 참여로 진행됩니다.

2. 유전자 코드의 속성

1. 삼중성

각 아미노산은 3개의 뉴클레오티드 서열로 암호화됩니다.

triplet 또는 codon은 하나의 아미노산을 암호화하는 세 개의 뉴클레오티드 시퀀스입니다.


4(DNA의 서로 다른 뉴클레오타이드의 수)가 20보다 작기 때문에 코드는 모노플일 수 없습니다. 코드는 이중일 수 없습니다. 16(2에 의한 4개의 뉴클레오티드의 조합 및 순열의 수)은 20보다 작습니다. 코드는 삼중항일 수 있습니다. 64(4에서 3까지의 조합 및 순열의 수)는 20보다 큽니다.

2. 퇴화.

메티오닌과 트립토판을 제외한 모든 아미노산은 하나 이상의 삼중항에 의해 암호화됩니다: 2개의 아미노산 1개의 삼중항 = 2 9개의 아미노산 2개의 삼중항 = 18 1개의 아미노산 3개의 삼중항 = 3 5개의 아미노산 4개의 삼중항 = 20 3개의 아미노산 6개의 삼중항 각 = 18 20개의 아미노산에 대한 총 61개의 트리플렛 코드.

3. 유전자 간 문장 부호의 존재.

유전자는 하나의 폴리펩티드 사슬 또는 tRNA, rRNA 또는 sRNA의 한 분자를 암호화하는 DNA의 한 부분입니다.

tRNA, rRNA 및 sRNA 유전자는 단백질을 코딩하지 않습니다.

폴리펩티드를 암호화하는 각 유전자의 끝에는 3개의 종결 코돈 또는 정지 신호(UAA, UAG, UGA) 중 적어도 하나가 있습니다. 그들은 방송을 종료합니다.

일반적으로 AUG 코돈은 리더 시퀀스 다음의 첫 번째 문장 부호에도 속합니다. 대문자의 기능을 수행합니다. 이 위치에서 포르밀메티오닌(원핵생물에서)을 암호화합니다.

4. 독창성.

각 triplet은 하나의 아미노산만 암호화하거나 번역 종결자입니다.

예외는 AUG 코돈입니다. 원핵생물에서 첫 번째 위치(대문자)는 포르밀메티오닌을 암호화하고 다른 위치는 메티오닌을 암호화합니다.

5. 콤팩트함, 또는 유전자 내부 문장 부호의 부재.

유전자 내에서 각 뉴클레오티드는 중요한 코돈의 일부입니다.

1961년 Seymour Benzer와 Francis Crick은 코드가 삼중항이고 컴팩트하다는 것을 실험적으로 증명했습니다.

실험의 본질: "+" 돌연변이 - 하나의 뉴클레오티드 삽입. "-" 돌연변이 - 하나의 뉴클레오티드 손실. 유전자 시작 부분의 단일 "+" 또는 "-" 돌연변이는 전체 유전자를 손상시킵니다. 이중 "+" 또는 "-" 돌연변이도 전체 유전자를 손상시킵니다. 유전자의 시작 부분에 있는 3중 "+" 또는 "-" 돌연변이는 일부만 손상시킵니다. 4배의 "+" 또는 "-" 돌연변이는 다시 전체 유전자를 손상시킵니다.

실험은 코드가 삼중항이고 유전자 내부에 문장 부호가 없음을 증명합니다. 이 실험은 두 개의 인접한 파지 유전자에 대해 수행되었으며 추가로 유전자 사이에 문장 부호가 있음을 보여주었습니다.

3. 유전정보

유전 정보는 유기체의 특성에 대한 프로그램으로, 조상으로부터 받아 유전자 코드의 형태로 유전 구조에 포함됩니다.

유전 정보의 형성은 지구화학적 과정 - 광물 형성 - 진화 촉매(자가촉매)의 체계에 따라 진행되었다고 가정합니다.

최초의 원시 유전자는 점토의 미정질 결정체였을 가능성이 있으며, 각각의 새로운 점토 층은 마치 구조에 대한 정보를 받는 것처럼 이전 층의 구조적 특징에 따라 정렬됩니다.

유전 정보의 실현은 정보(mRNA), 수송(tRNA) 및 리보솜(rRNA)의 세 가지 RNA의 도움으로 단백질 분자를 합성하는 과정에서 발생합니다. 정보 전달 과정은 다음과 같습니다. - 직접 통신 채널을 통해: DNA - RNA - 단백질; 및 - 피드백 채널을 통해: 환경 - 단백질 - DNA.

살아있는 유기체는 정보를 수신, 저장 및 전송할 수 있습니다. 또한 살아있는 유기체는 자신과 주변 세계에 대해 받은 정보를 가능한 한 효율적으로 사용하는 경향이 있습니다. 유전자에 내장되어 있으며 살아있는 유기체의 존재, 발달 및 번식에 필요한 유전 정보는 각 개인에서 그의 후손에게 전달됩니다. 이 정보는 유기체의 발달 방향을 결정하고 환경과의 상호 작용 과정에서 개체에 대한 반응이 왜곡되어 자손 발달의 진화를 보장합니다. 생물이 진화하는 과정에서 새로운 정보가 발생하고 기억되며 그에 대한 정보의 가치가 높아집니다.

특정 환경 조건에서 유전 정보를 구현하는 과정에서 주어진 생물 종의 유기체 표현형이 형성됩니다.

유전 정보는 신체의 형태적 구조, 성장, 발달, 신진대사, 정신 창고, 질병에 대한 소인 및 유전적 결함을 결정합니다.

생물의 형성과 진화에서 정보의 역할을 올바르게 강조하는 많은 과학자들은 이러한 상황을 생명의 주요 기준 중 하나로 언급했습니다. 그래서 V.I. Karagodin은 다음과 같이 믿습니다. "살아있는 것은 적절한 환경 조건에서이 정보의 재생산을 보장하는 정보 및 그에 의해 인코딩 된 구조의 존재 형태입니다." 정보와 삶의 연결은 A.A. Lyapunov: "생명은 개별 분자의 상태에 의해 인코딩된 정보를 사용하여 지속적인 반응을 일으키는 물질의 고도로 정렬된 상태입니다." 우리의 유명한 천체물리학자 N.S. Kardashev는 또한 생명의 정보 구성 요소를 강조합니다. , 재생산을 위해, 그리고 더 많은 정보를 얻기 위해 우리에게 특히 중요합니다." 생태학자 F. Tipler는 자신의 저서 "Physics of Immortality"에서 정보를 저장하고 전송하는 살아있는 유기체의 이러한 능력에 주목합니다. "나는 생명을 자연 선택에 의해 보존되는 일종의 암호화된 정보로 정의합니다." 더욱이 그는 이것이 사실이라면 생명 정보 시스템은 영원하고 무한하며 불멸이라고 믿습니다.

유전암호의 발견과 분자생물학 법칙의 확립은 현대 유전학과 다윈의 진화론을 결합할 필요성을 보여주었다. 따라서 이미 비 고전 생물학으로 간주 될 수있는 합성 진화론 (STE)이라는 새로운 생물학적 패러다임이 탄생했습니다.

살아있는 세계의 진화에 대한 현대적 관점에서 유전, 가변성, 자연 선택과 같은 삼합체와 함께 다윈의 진화의 주요 아이디어는 자연 선택뿐만 아니라 유 전적으로 결정되는 그러한 선택에 대한 아이디어로 보완됩니다. 합성 또는 일반 진화 개발의 시작은 S.S. 인구 유전학에 대한 Chetverikov는 개별 특성과 개인이 선택되는 것이 아니라 전체 인구의 유전자형이 선택되지만 개별 개인의 표현형 특성을 통해 수행된다는 것을 보여주었습니다. 이것은 인구 전체에 유익한 변화의 확산으로 이어집니다. 따라서 진화의 메커니즘은 유전적 수준에서의 무작위 돌연변이와 가장 가치 있는 형질(정보의 가치!)의 유전을 통해 구현되어 가장 생존 가능한 자손을 제공하는 돌연변이 형질의 환경 적응을 결정합니다. .

한편으로는 계절적 기후 변화, 다양한 자연 재해 또는 인재로 인해 인구의 유전자 반복 빈도가 변경되어 결과적으로 유전적 변동성이 감소합니다. 이 과정을 때때로 유전적 부동이라고 합니다. 한편, 다양한 돌연변이의 농도 변화와 개체군에 포함된 유전자형의 다양성 감소로 인해 선택 방향과 강도가 변경될 수 있습니다.


4. 인간 유전자 코드 해독

2006년 5월, 인간 게놈 시퀀싱 작업을 하는 과학자들은 불완전하게 시퀀싱된 마지막 인간 염색체인 염색체 1의 완전한 유전자 지도를 발표했습니다.

예비 인간 유전자 지도는 2003년에 출판되어 인간 게놈 프로젝트의 공식적인 종료를 알렸습니다. 프레임워크 내에서 인간 유전자의 99%를 포함하는 게놈 단편이 시퀀싱되었습니다. 유전자 동정의 정확도는 99.99%였다. 그러나 프로젝트가 끝날 무렵에는 24개의 염색체 중 4개만이 완전히 시퀀싱되었습니다. 사실 유전자 외에도 염색체에는 특성을 암호화하지 않고 단백질 합성에 관여하지 않는 단편이 포함되어 있습니다. 이 조각들이 유기체의 삶에서 수행하는 역할은 아직 알려지지 않았지만 점점 더 많은 연구자들이 그들의 연구에 가장 세심한 주의가 필요하다고 믿는 경향이 있습니다.