Explore
Also Available in:

در واقع چه کسری از ژنوم انسان دارای عملکرد است؟

و چه مقدار تغییر قابل تحمل است؟

توسط رابرت کارتر Robert Carter
ترجمه Behzad Farajollahi

https://dl0.creation.com/articles/p170/c17010/DNA_orbit_animated
Zephyris | CC BY-SA 3.0 | Wikimedia

هر کسی که به علم ژنومیک توجه کرده است می داند که این سوال که ”چه مقدار از ژنوم عملکردی است؟“ به شدت بحث برانگیز است. فرضیهی دنای بی معنی (junk DNA) برای چندین دهه الگوی حاکم بوده است، و اکتشافات اخیر که عملکرد بخش های غیر کد کننده ژنوم را برجسته می کند، به کندی مورد قبول واقع شده است. یک واقعیت است که تنها حدود 2 درصد از ژنوم، پروتئین ها را کد می کند و جهش در ناحیه کد کننده پروتئین به احتمال زیاد تأثیر قابل توجهی دارد.

اما این نیز درست است که بیشتر کار در ژنوم در سطح رنا RNA اتفاق می افتد نه پروتئین. اکثر ژنوم به رنا رونویسی می شود، اما آن رنا سپس برای کنترل تعداد زیادی از عملکردها در سلول استفاده می شود که مقدار کمتر آن مربوط به تولید پروتئین است. آیا دلیل این موضوع این است که ژنوم دارای دنای DNA انگلی زیادی است (یعنی مثلا دنای بدون عملکردی که فقط به این دلیل که می تواند خودش را تکثیر کند حفظ می شود؟) که البته از دیدگاه خلقت گرایی بی معنی است، اما حتی از نقطه نظر تکاملی نیز منطق ضعیفی دارد. چگونه بیشتر رنایی که در حال تولید است هیچ کاری انجام نمی دهد؟ بدتر از آن، آیا تولید انبوه رنای بی فایده اتلاف منابع گرانبها نیست؟ آیا انتخاب طبیعی با حذف زباله های انگلی دائماً ژنوم را اصلاح نمی کرد؟

پاسخ به این سوال مدت زیادی است که در راه است. فهمیدن اینکه چه مقدار از ژنوم عملکرد دارد چیز بی اهمیتی نبود و ما هنوز همه چیز را نمی دانیم. اما اینطور نیست که هیچ چیز نمی دانیم، و ژنتیک دانان روش هایی برای ارزیابی عملکرد دارند:

  • به طور کلاسیک، دانشمندان تکاملی به دنبال مناطق مشترک در میان ژنوم گونه های دوردست بودند. آنها استدلال کردند که اگر چیزی برای مدت طولانی ثابت مانده است، باید مهم باشد. این روش ”فیلوژنتیک“ یا تحول نژادی نامیده می شود و ابزار قدرتمندی در دستان جامعه تکاملی برای متقاعد کردن مردم بر درستی تکامل بوده است. اما برای استدلال آنها محدودیتهایی وجود دارد و موارد بیشتری در زیر نشان داده خواهد شد، به طور خلاصه، که عناصر دنای مشترک اغلب میتوانند در جانداران مدل، با تأثیرات اندک یا بدون هیچ اثر محسوس حذف شوند. اگر چیزی را می توان حذف کرد، چگونه کسی می تواند ادعا کند که باید کاربردی باشد؟
  • روش دیگر برای تخمین عملکرد، مقایسه وضعیت بیماری با دنا است. این در حال حاضر اغلب با استفاده از یادگیری ماشین انجام می شود. این مطالعات ارتباط ژنومی گسترده (GWAS) برای ترسیم نقشه جهشهای خاص مربوط به بیماریهای خاص مورد استفاده قرار گرفتهاند. جای تعجب نیست که بیشتر جهش های ایجاد کننده بیماری در ناحیه کدکننده پروتئین قرار گرفته اند. با این حال، GWAS اغلب در شناسایی یک عامل ژنتیکی خاص شکست خورده است. ما اکنون می دانیم که بسیاری از ویژگی ها به دلیل ترکیب ژن هایی که به طور هماهنگ عمل می کنند ایجاد می شود، بسیاری از افراد با وجود اینکه حامل ژن هایی هستند که باعث مرگ افراد دیگر می شود، با وضعیتی کاملا سالم در حال زندگی هستند، و بسیاری از بیماری ها به دلیل جهش در ژنوم غیر کد کننده ایجاد می شوند.
  • روش دیگر این است که با جستجوی نواحی مختلف ژنوم ببینید که کدام بخش از الگوهای مورد انتظار منحرف می شوند. مسلماً، الگویی که هر فرد انتظار دارد ببیند بسیار وابسته به برخی از مدل های فراگیر است، اما دست کم معقول به نظر می رسد. در نظر بگیرید، ژنوم تنها از چهار حرف تشکیل شده است. A و T حدود 60 درصد از ژنوم و C و G 40 درصد دیگر را تشکیل می دهند. هنگامی که مناطقی را پیدا می کنیم که از این الگوی اساسی فاصله دارند، می توانیم استنباط زیادی داشته باشیم (به عنوان مثال، ژن های کد کننده پروتئین معمولاً غنی از GC هستند). به همین ترتیب، وقتی بخشهایی از DNA را پیدا میکنیم که از فردی به فرد دیگر تفاوت کمی نشان میدهد، ممکن است استنباط کنیم که این ناحیه بسیار مهم است و جهشها در آن ناحیه به احتمال زیاد برای فرد مضر هستند.

استفاده از این آخرین روش برای شناسایی محدودیتهای عملکردی شبیه به داستان مشهوری از جنگ جهانی دوم است. در سال 1943، مطالعه ای توسط آلیس1 (Allies) بر روی سوراخ های گلوله مشاهده شده در هواپیماهایی که به پایگاه بازگشته بودند، انجام شد. یک الگوی بسیار واضح وجود داشت و فکر اولیه این بود که مناطقی که احتمال سوراخ شدن آنها بیشتر بود تقویت شود. بعد فردی متوجه شد که حالت برعکس درست است. مناطق بدون سوراخ حیاتی ترین مناطق هواپیما بودند. دلیل اینکه آنها تقریباً هرگز هواپیماهای دارای سوراخ را در آن مناطق ندیدند این بود که تعداد بسیار کمی از هواپیماهایی که در آن مکان ها مورد اصابت قرار گرفته بودند به پایگاه بازگشتند. این پدیده تمایل یا سوگیری بقا نام دارد.

Martin Grandjean (vector), McGeddon (picture), Cameron Moll (concept).‎survivorship-bias
تصویری از سوگیری بقا. این بازسازی نظری بر اساس گزارش بدون تصویر آبراهام والد از سال 1943 است.

جستوجوی مناطقی از ژنوم که دارای تنوع کمتر از حد انتظار هستند، میتواند به ما بگوید که این مناطق از سایر نواحی مهمتر هستند. اما این تصویر نمی تواند به ما بگوید که بقیه مهم نیستند. به عنوان مثال، شکل خاص یک بالابر دم در یک هواپیمای کوچک ممکن است مهم نباشد، اما با اطمینان وجود آن بالابر مهم است. خلبان می تواند به صورت دستی شرایط مختلف پرواز را تنظیم کند، اما بدون حداقل نسخه یک بالابر دم عملکردی، کنترل اوج پرواز هواپیما (تغییرجهت به بالا یا پایین) غیرممکن خواهد بود. به همین ترتیب، یاخته می تواند بسیاری از شرایط ژنومی مختلفرا تنظیم کند. اگر یک ژن حیاتی جهش پیدا کند، سلول می میرد، اما فقط به این دلیل که برخی از ژن ها می توانند جهش پیدا کنند به این معنی نیست که هیچ عملکردی ندارند. این یک تفاوت حیاتی است که باید در نظر داشت.

ارزیابی عملکرد

تا همین اواخر، ما اطلاعات زیادی در اختیار نداشتیم که بتوانیم با آن کار کنیم. اولین پیش نویس ژنوم انسان تا سال 2001 به پایان نرسیده بود و حتی با وجود اینکه شرکت های آزمایش ژنتیک میلیون ها نمونه را جمع آوری کرده اند، اطلاعات آنها خصوصی و ناقص است. اگر میخواهیم ببینیم کدام قسمتهای ژنوم انسان از فردی به فرد دیگر متفاوت است و کدامها اینطور نیست، به دادههای ژنومی تمامقد و با کیفیت نیاز داریم. پس از آن، ممکن است بتوانیم برخی از مدلهای جهش را روی دادهها اعمال کنیم و ببینیم کدام مکانها به طور قابل توجهی با آنچه انتظار میرود تفاوت دارند. با این حال چالش های دیگری نیز وجود دارد. به عنوان مثال، نواحی کدکننده پروتئین در بین ژنهای شناختهشده تحت انتخاب خالصسازی به طور برجسته بیش از حد نشان داده میشوند،2 و میزان جهش در ناحیه غیر کدکننده ناهماهنگ است. بنابراین، برای انجام چنین مطالعاتی به تعداد زیادی ژنوم با کیفیت خوب و یک مدل جهش پیچیده و پخته نیاز داریم.

این دقیقا همان کاری است که شرکت پایگاه داده تجمع ژنوم (Genome Aggregation Database Consortium) انجام داده است. در مقاله ای که بیش از 200 نویسنده مشترک را فهرست می کند، چن و همکارانش گزارشی در مورد یک سیستم رایانهای برای شناسایی مناطق عملکردی ژنوم ارائه میکند.3 آنها آن را GNOCCI مینامند و از آن برای ایجاد نقشهای از محدودیتهای انسانی در گستره ژنوم استفاده کردند. ”محدودیت“ معیاری برای تغییرپذیری است. آنها این فرض معقول را مطرح کردند که مناطقی که دارای جهش قابل توجه کمتری از حد انتظار هستند باید عملکردی باشند.

آنها با بیش از 150000 ژنوم شروع کردند و آنهایی را انتخاب کردند که بالاترین کیفیت توالی را داشتند. آنها با بیش از 76000 ژنوم انسانی با کیفیت بالا، 644 میلیون مکان از 3.1 میلیارد حرف را در ژنوم شناسایی کردند که در آن تنوع وجود دارد، بالغ بر یک تغییر در هر 5 حرف و یک تغییر در هر 8 حرف پس از حذف موارد پرتکرار.

هنگامی که آنها این نقشه را داشتند، با استفاده از یک مدل جهش پیچیده، شروع به شناسایی مناطق محدودیت کردند. همانطور که بیان کردند:

یکی از چالشهای کلیدی در شمارش محدودیتهای غیرکدکننده، تخمین نرخ جهش پایه واقعی است که میتواند تحتتاثیر پدیدههای ژنومی مختلف قرار گیرد که به طور بالقوه در اندازه های مختلف عمل میکنند.

مدل جهش جدید آنها هر سه نوکلئوتید سه حرف، محل و مقدار متیلیشن در نواحی مختلف ژنوم4 و ”ویژگی های منطقه ای ژنومی“ را در نظر می گیرد. پس از تقسیم ژنوم به بسیاری از قطعات بدون همپوشانی 100 جفت بازی، آنها از این مدل برای پیشبینی سطح تغییرات مورد انتظار در شرایط بی طرف یا خنثی، (بدون حضور انتخاب) در هر ظرف استفاده کردند. آنها یک رد ثابت پیدا کردند: با احتمال بالاتری نواحی کد کننده (حتی بخش هایی که حاوی تنها یک نوکلئوتید کدکننده هستند) تغییر کمتری داشتند. این مناطق بیشتر شبیه ”انحراف از بی طرفی“ بودند و آن مناطق دارای ”محدودیت بیشتر“ بودند. آنها نوشتند:

همانطور که انتظار می رود، میانگین محدودیت برای توالی های کد کننده پروتئین قوی تر از مناطق غیر کد کننده است.

در مناطق غیر کد کننده ژنوم، آنها مناطق ”محدود“ زیادی پیدا کردند که از عناصر تنظیمی شناخته شده غنی بودند. به عبارت دیگر، ما قبلاً در مورد بسیاری از قطعات کوچک مهم در DNA غیر کدکننده اطلاع داشتیم. اما آنها همچنین تعیین کردند که مناطق DNA غیر کدکننده با بیشترین محدودیت با ژن های کد کننده پروتئین محدودتر مرتبط هستند.

جزئیات نرم: تنها بخش کوچکی از قطعات غیرکدکننده (3.9٪) به میانگین امتیاز قطعات کدکننده نزدیک شدند، و کوچکترین بخش از فضای غیرکدکننده (0.05٪) به اندازه محدودترین ناحیه کدکننده پروتئین محدود بود. آنها دریافتند که عناصر تنظیم کننده سیس به طور قابل توجهی در مناطق حفاظت شده پر شده اند. سایر نواحی قابل توجه، محرکها و افزاینده های ژن بودند که به ترتیب 10.2 و 6.3 درصد، زیر اندازه میانگین محدودیت قطعات کدکننده پروتئین بودند. درصد بسیار بالاتری از محدودیت قوی (22.2٪) برای ژن های microRNA پیدا شد. در میان ژنهای طولانی RNA غیر کدکننده، حتی با وجود اینکه بسیاری از آنها دارای فرم ژنهای کدکننده پروتئین هستند، و حتی اگر به طور فعال رونویسی و به طور متناوب پردازش شوند، تنها 3.7 درصد بیشتر محدود می شدند.

هنگامی که آنها بر روی تغییرات ژنتیکی که اثرشان شناخته شده است (مثلاً جهش های ایجاد کننده بیماری) تمرکز کردند، 13000 جفت صفت شناخته شده و 164 جفت دیگر را که قبلا ناشناخته بودند شناسایی کردند.

شکست تبار شناسی

آنها با مقایسه کار خود با رویکردهای مبتنی بر تبارزایی دریافتند که همبستگی ضعیفی بین امتیازات حفاظتی با محدودیت وجود دارد. این یک نتیجه باور نکردنی است! این بدان معناست که شباهت های مشترک هیچ ربطی به تکامل ندارند و تمام آن دهه ها گمانه زنی چیزی بیش از هوای گرم نبود.

اختصاصیت کم توالی یا عدم عملکرد؟

دیوار خانه شما چقدر کاربردی است؟ به یک معنا، زیاد. از گرما در تابستان و سرما در زمستان جلوگیری می کند. سقف را نگه می دارد. از دیدن همسایه ها در هنگام خواب جلوگیری می کند. خوب، اما آیا ضخامت دیوار مهم است؟ در مورد رنگ چطور؟ در مورد تعداد پنجره ها چطور؟ یک ویژگی ساختاری می تواند بسیار سازگار باشد و همچنان عملکرد(های) اصلی خود را انجام دهد.

همین امر در مورد ویژگی های متفاوت طراحی شده ژنوم ما صادق است. مناطق خاصی وجود دارد که تنوع در آنها به سادگی قابل تحمل نیست. مناطق دیگری نیز وجود دارد که در آن تنوع می تواند فراوان باشد. بخش هایی از دنا وجود دارد که نباید آنها را لمس کرد و مناطق دیگری تنها با هدف ایجاد داربست برای قطعات مهم وجود دارد. داربست؟ بگذار توضیح بدهم. ژنوم یک ماهیت چهار بعدی دارد. رشتههای خطی دنا (کروموزومها) یک شبکه تعامل دو بعدی گسترده را کد میکنند، اما آنها همچنین به شکلهای سهبعدی در میآیند که در بعد چهارم یعنی زمان تغییر میکنند. با این حال، از آنجایی که ژنهای مختلف برای کار با یکدیگر طراحی شدهاند، تمایل دارند کنار هم باشند، نه در امتداد یک کروموزوم، بلکه پس از تا شدن کروموزومها در موقعیت در فضای سه بعدی. بنابراین، بخش عظیمی از ژنوم تنها برای نگه داشتن ژن ها در جای خود وجود دارد. بسیاری از این مناطق برای جهش آزاد هستند، اما مطمئناً مهم هستند.

بخشهای کوتاهی از ژنوم وجود دارد که تمایل به چرخش اشتباه دارند. به جای مارپیچ دوگانه راست گرد دنای کلاسیک، این مکان ها می توانند یک مارپیچ نامنظم چپ گرد به نام Z-DNA را تشکیل دهند. تجزیه و تحلیلهای اخیر نشان داده است که جهشهای سرطانزا اغلب در Z-DNA یافت میشوند، Z-DNA اغلب فقط در بالادست ژنهای کدکننده پروتئین یافت میشود، در سیستم ایمنی ذاتی نقش دارد، و ما دست کم یک پروتئین تولید میکنیم zbp1 که برای اتصال به دنا در ساختار Z طراحی شده است.5 درست کمتر از 1 درصد از ژنوم می تواند این آرایش را به خود بگیرد. این نواحی ممکن است نتوانند پروتئین بسازند، و توالی دقیق ممکن است حیاتی نباشد، (به جز حروفی که تغییر آنها ممکن است باعث سرطان شود) اما هنوز هم عملکرد بالایی دارند.

همچنین عملکرد رنا های غیر کد کننده فراوانی که توسط یاخته های ما تولید می شوند را در نظر بگیرید. از آنجایی که آنها برای پروتئین کد نمی کنند، این محدودیت خاص حذف می شود. با این حال، اگرچه ممکن است توالی رنا خیلی محدود نباشد، آنها کارهای زیادی در سلول انجام می دهند که فهرست کردن همه آنها دشوار است.6 برخی از رنا ها به ساختاری تبدیل می شوند که برای مثال در ریبوزوم استفاده می شود. (دستگاهی که پروتئین ها را از روی رنای پیام رسان می سازد، یعنی ترجمه). برخی به عنوان پلی بین رنای پیام رسان و پروتئین (رنای ناقل) عمل می کنند. برخی از آنها برای بازسازی کروماتین7 مهم هستند. برخی به عنوان تنظیم کننده ژن (افزاینده و مهارکننده رونویسی، یعنی فرآیند ساخت رنا از دنا) عمل می کنند.

یکی از مهم ترین نقش های رنای غیر کد کننده، تنظیم سنتز پروتئین است. آنها می توانند رونویسی را با چسبیدن به دنا در یک توالی مکمل تنظیم کنند (به عنوان مثال، همتای عملکردی یک ژن کاذب). این امر از رونویسی آن ناحیه از دنا به رنای پیام رسان جلوگیری می کند و بنابراین پروتئین نمی تواند ساخته شود. آنها همچنین می توانند ترجمه را با چسبیدن به یک رنای مکمل (و در نتیجه جلوگیری از ترجمه آن به پروتئین) یا با اجازه دادن به دستگاه ترجمه پروتئین برای اتصال به آن (در نتیجه رقابت برای جلب توجه و کاهش سرعت ترجمه رنای مکمل) تنظیم کنند. در هر یک از این موارد، توالی دقیق چندان مهم نیست. حتی اگر چندین باز آلی بین رنا با دنا یا رنای هدف تطابق نداشته باشند، اگر توالی به اندازه کافی طولانی باشد و تا زمانی که بازهای کافی با هم مطابقت داشته باشند، این دو باز هم تراز می شوند و می چسبند. بنابراین، در اینجا ما یک مورد از عملکرد بسیار مهم اما با انعطاف پذیری در کد داریم. مطالعه چن (Chen) و همکارانش برای تشخیص چنین چیزهایی طراحی نشده است.

جواب چیست؟

در پایان، این مطالعه جدید، با تمام شگفتی هایش، تنها توانست مناطقی از ژنوم را برجسته کند که جهش آزاد نیست. این فقط یکی از معیارهای عملکرد است. این مطالعه نمی تواند به ما بگوید که چه مقدار از ژنوم عملکردی است، فقط می گوید چه مقدار از توالی به شدت محدودیت دارد. همچنین نمی تواند به ما بگوید که قبل از توقف کار ژنوم چه مقدار جهش می تواند ایجاد شود. در پایان، ما هنوز نمی دانیم که چه مقدار از ژنوم کاربردی است.

هواپیماهای جنگنده جنگ جهانی دوم میتوانستند در برابر انبوهی از آسیب ها مقاومت کنند، بهطوریکه قسمتهایی جدا شود و قسمتهایی پر از سوراخ هستند، و همچنان به اندازه کافی دست نخورده باشند تا به خانه پرواز کنند. چرا؟ چون به خوبی طراحی شده بودند. به همین ترتیب، ژنوم انسان طوری طراحی شد که در برابر انبوهی از آسیب ها مقاومت کند. انسان ها میلیون ها جهش (هزاران در هر فرد، میلیون ها در سراسر جمعیت) را در طول چند هزار سال گذشته دریافت کرده اند، با این حال ما هنوز زنده ایم. مقدار بیشتری درست در قلب سیستم وجود دارد (به عنوان مثال، ما دو نسخه از ژنوم داریم) و اغلب سلول می تواند با انتخاب یک مسیر جایگزین از یک سیستم شکسته دوری کند.

ما بسیار پیچیده تر از هر ماشین ساخت بشری هستیم. طراحی ما گواهی بر درخشش خالق ما است. طراحی ژنوم انسان، یا در واقع هر ژنومی، به شدت مخالف تکامل است، زیرا چگونه یک سیستم کور از خطاهای تصادفی می تواند سیستم بسیار پیچیده ای را ایجاد کند که هم در برابر خطا مقاوم باشد و هم سازگار؟ زندگی به جای اینکه از پایین به بالا خلق شود، از بالا به پایین خلق شده است. خداوند خالق زندگی است. او تمام آن قطعات را طراحی کرد، آنها را گرد هم آورد، سلول را پر از انرژی کرد و سپس ”اجازه داد شروع کند“. و زندگی از آن زمان در حال تکاپو است.

تاریخ انتشار: 14 مارس 2024

مراجع و یادداشت ه

  1. متفقین ائتلافی از کشورها بودند (عمدتاً بریتانیا، اتحاد جماهیر شوروی [روسیه + کشورهای اقماری]، چین و ایالات متحده) که در طول جنگ جهانی دوم با متحدین (عمدتاً آلمان، ایتالیا و اتریش) میجنگیدند. که از سال 1939 تا 1945 به طول انجامید. بازگشت به متن.‏
  2. ادعای ”انتخاب“ اغلب در مفروضات تکاملی مطرح می شود، که دارای زما عمیق است. با این حال موارد واضحی وجود دارد که بقا با تغییرات در برخی از ژن های مهم مرتبط است. این از منظر خلقت گرایی مشکل نیست. اما دو شکل انتخاب وجود دارد: تصفیه کننده و مثبت. انتخاب تصفیه کننده، حذف آلل های بد، مورد نظر این مقاله است. انتخاب مثبت، تکثیر جهشهای جدید، که نادرتر و بحث برانگیزتر است برای دارییسم مهمتر است. بازگشت به متن.‏
  3. Chen, S., et al., A genomic mutational constraint map using variation in 76,156 human genomes, Nature 625:92–100, 2023. بازگشت به متن.‏
  4. متیلیشن یک نوع نشانگر اپی ژنتیکی است اما خود توالی نوکلئوتیدی را تغییر نمی دهد. لامارکیسم داروین اثبات شد؟، Carter, R.W.‎‏ 1 مارس 2011 را ببینید. بازگشت به متن.‏
  5. Brazil, R., More than a mirror-image: left-handed nucleic acids, chemistryworld.com, 5 Feb 2024. بازگشت به متن.‏
  6. E.g., see Kaikkonen, M.U., Lam, M.T.Y., and Glass, C.K., Non-coding RNAs as regulators of gene expression and epigenetics, Cardiovascular Research 90(3):430–440, 2011. بازگشت به متن.‏
  7. در هسته، DNA در اطراف مجتمع های پروتئین هیستون پیچیده شده است. ترکیب DNA + پروتئین کروماتین نامیده می شود. بازگشت به متن.‏

Further Reading