[目次]
遺伝子とは何か
遺伝物質は、自分と同じものを正確に自己複製する能力と、遺伝情報をほかの機能分子 (RNAやタンパク質) に伝達して形質を発現させる能力、どちらも備えていなければなりません。生物の遺伝物質は、ふつう二本鎖 DNA です。
ウイルスのなかには、一本鎖 DNA や二本鎖 RNA または一本鎖 RNA の場合もあります。
細胞中のDNAのすべてが遺伝子としてはたらくわけではありません。DNA の一部が、遺伝的な情報をもっているに過ぎません。したがって、遺伝子は DN Aの一定領域を占め、特定の塩基配列を持ち、特定の生物機能を発現する単位として定義することができます。遺伝子以外のDNAは、同じ配列や、よく似た配列を何回も繰り返した反復配列である場合が多いと言えます。
原核生物における遺伝子の構造
DNA中の遺伝情報が発現するときには、遺伝子ごとにRNAがコピーされます。この過程を転写といい、この反応は RNA ポリメラーゼによって行われます。
原核生物ではふつう、1 種類の RNA ポリメラーゼが転写にたずさわります。この酵素が転写を開始するために結合する DNA 上の部位を、プロモーターと言います。その部分には多くの遺伝子に共通な塩基配列が存在しています。DNA 上の各塩基の位置は、転写開始点を +1 とし、それより下流域 ( 3’ 末端側) は「+」をつけ、上流側 ( 5’ 末端側)は「-」をつけて数えます。
転写開始点の上流,、塩基対付近にはプリブナウ配列と言われる -TATAAT- の配列がみられ、-35 塩基対付近には TTGACA の配列がみられます。
(画像出典: 福井・向井・佐藤『植物の遺伝と育種 第2版』(朝倉書店、2013))
また転写終結点付近には、ターミネーターという RNA が分子内でヘアピンのような構造をつくりやすい特別な構造が存在します。
DNA 鎖上の開始コドンから終止コドンまでの連続した配列を、読取り枠 (オープンリーディングフレーム (ORF)) といいます。原核生物やウイルスなどでは ORF は連続しています。一方、真核生物では遺伝子の ORF が翻訳されない配列によって複数個に分断されている方が多いです。ORF は 2 本鎖の内のどちらか一方に乗っていて、DNA 鎖の 5’ 末端がペプチド鎖のアミノ末端 ( N 末端) に、3’ 末端がカルポキシル末端 ( C 末端) に対応します。原核生物では、機能的に関連したタンパク質をコードする複数個の ORF が 1 つの転写単位 (トランスクリプトン) の中に含まれることが多いですが、真核生物では、1 遺伝子が 1 つの転写単位を構成しています。ウイルスなどでは、3 文字の枠組みを 1 字ずつずらすことによって、ORF が重なっている場合があって、同一塩基配列が異なる遺伝子に使われています。
原核生物では、単一のプロモーターによって複数の遺伝子の発現がまとめて調節されることがあって、このような遺伝子群をオペロンと言います。遺伝情報発現の調節はおもに転写レベルで行われています。コード領域の上流にあるプロモーターや、オペレーターという制御領域が重要な役割を果たしています。オペレーター領域には、リプレッサーというタンパク質が結合できて、DNA のメッセンジャー RNA ( mRNA ) への転写を抑制的に調節しています。mRNA の内部には ORF の数に相当する複数個のリボソーム結合部位があって、各々から別々のタンパク質を合成できます。DNA 上で転写されている、未完成の mRNA 上でただちに翻訳が開始され、転写と翻訳が同じ場所で行われます。なお、植物のなかでラン藻だけが原核生物です。
真核生物遺伝子の構造
真核生物の遺伝子の大部分は、1 個の ORF が非コード配列によっていくつかに分断されています。分断された ORF のそれぞれをエキソン、分断する非コード部分をイン トロン (介在配列) と言います。遺伝子当りのイントロンの大きさや数は、遺伝子の種類によって違います。たとえば、光合成において重要な役割を担っている、エンドウの RuBisCo (リブロース -1,5- ビスリン酸カルボキシラーゼ) の小サブユニットをコードする遺伝子では、2 つのイントロンが存在します。
また、イネの種子中のデンプン合成に関係する枝付け酵素の遺伝子は 13 個のイントロンで分断されています。
真核生物遺伝子のプロモーターとして、転写開始点のすぐ上流 ( -20 〜 -30 ) に TATA ボックスという塩基配列が、その上流 ( -70 〜 -80 ) には CCAAT ボックスという塩基配列が存在する場合が多いです。
(画像出典: 福井・向井・佐藤『植物の遺伝と育種 第2版』(朝倉書店、2013))
また、さらに上流あるいはその遺伝子より下流やイントロン内に転写を促進する配列があって、エンハンサーと言います。
真核生物の DNA 上の遺伝情報は、3 種類の RNA ポリメラーゼによって転写されます。タンバク質をコードしている遺伝子は RNA ポリメラーゼⅡによって転写されますが、リポソーム RNA (rRNA) 遺伝子やトランスファー RNA (tRNA) 遺伝子のように、直接 RNA をコードしている場合では RNA ポリメラーゼⅠとⅢによって転写されます。タンパク質をコードしている遺伝子の情報は、イントロンとエキソンの両方ともが、そのまま核内RNA (hnRNA) として転写されます。次に、hnRNA のはじめ ( 5'末端) には、キャップとよばれる特別のヌクレオチドがついて、終わり ( 3' 末端) には、A が多数つながった「ポリA」がつきます。さらにこの RNA からスプライシングによってイントロンの部分が除かれ、エキソンがつなぎあわされて、成熟した mRNA となって核から細胞質へ出ていきます。正確なスプライシングは生物にとって重要なことなので、エキソンとイントロンの境界領域の配列はよく保存されていて、特にイントロンの両端の各 2 塩基 5' GT・・・AG 3' は必須です。
細胞質に出てきた mRNA は、リボソーム上でアミノ酸を結合した tRNA によってタンパク質合成を開始します。したがって、真核生物の細胞では、遺伝情報の転写と翻訳がそれぞれ核と細胞質といった別々の場所で行われていて、原核生物の細胞の場合とは違っています。