Explore
Also Available in:

Klippa och klistra i människans genom

Forskarna börjar få grepp om koden för splitsning

Skrivet av
Översatt av Torsten Lantz

Originalet publicerat 29 juni 2010
7394splicing-human-genome

Vad är det som skiljer människans genom från det hos enklare organismer som sjöanemoner och maneter? Människan har ungefär samma antal protein-kodande gener som dessa lägre varelser.1 Trots detta är hon mycket mer komplex. Utan att gå in på människans andliga frågor borde man väl ändå kunna hitta denna skillnad i komplexitet kodad nånstans inne i vårt genom – men i så fall var? Eftersom många av våra gener liknar dem hos många enklare organismer så kan svaret inte enbart ligga i genernas innehåll. Istället får man leta i genomets icke genkodande avsnitt (s.k skräp-DNA2) och ta reda på hur generna används för produktion av proteiner.

För några årtionden sedan gällde hypotesen ”en gen – ett protein”.[Översättarens anmärkning: Originalartikeln refererar till en tidig hypotesbenämning, ”en gen – ett enzym”. Denna hypotes blev dock tidigt modifierad till ”en gen – ett protein” eftersom alla proteiner inte är enzymer.Generna specificerar alltså även proteiner som inte är enzymer och som sagt inte i 1:1-förhållande hos eukaryoterna]. Det såg helt enkelt ut som om en gen kodade för ett protein. I prokaryota organismer (bakterier) var detta lätt att visa. De bakterie-gener som man då man kände till hade definierade platser för start och stopp – och däremellan låg de DNA-bokstäver som beskrev de olika aminosyrasekvenserna. Eukaryoter (organismer med cellkärna – allt från jäst till växter och människa) har dock ingen enkel genstruktur. Där såg man att protein-generna var uppdelade i serier av ”exoner” (partier som kodar för proteiner) och ”introner” (mellanliggande icke-kodande sekvenser). Man såg också att ett protein framställdes genom att genen transkriberades till RNA varefter intronerna splitsades bort och exonerna klistrades ihop till något som kunde translateras till ett protein. Även fast detta innebar en viss komplexitet gällde dock fortfarande hypotesen ”en gen – ett protein” för de eukaryotiska protein-generna.

Med tiden insåg man dock att livet inte var så enkelt, särskilt inte när det gällde eukaryoterna. Hypotesen ”en gen – ett protein” blev särskilt besvärande när det gällde de högre (komplexare) eukaryoterna. Till exempel användes de ca 20.000 – 25.000 proteinkodande generna i mänskliga genomet3 till att skapa 100.000 – 300.000 skilda proteiner (det verkliga antalet är osäkert). Det låga antalet gener i det mänskliga genomet var besvärande av flera anledningar.4 För det första innebar det att vi inte hade så många fler gener än mycket enklare organismer. För det andra behövdes det nu en metod som kunde skapa många proteiner från ett fåtal gener – och hur det skulle gå till i så stor skala visste man inte. Och för det tredje så rakade nu komplexiteten hos de genomiska dataprogrammen i höjden - mot nivåer som blev än mer besvärande för de som trodde att vi hade uppkommit genom slumpen.

Att vissa proteiner kunnat framställas genom en process som kallas ”alternativ splitsning” visste man redan innan man var klar med Human Genom Project.5 Man hade sett att exoner kunde hämtas från olika ställen i genomet för att bilda olika kombinationer. Dessa kunde då i sin tur skapa olika proteiner. I projektet ENCODE6 upptäckte man att alternativ splitsning förekom i så hög grad att man nu börjat debattera hur ordet ”gen” ska definieras.7 Det har visat sig att hypotesen ”en gen – ett protein” varit en enormt överdriven förenkling. Men eftersom begreppet ”gen” är så användbart för resten av den här artikeln, så kommer jag att använda ordet i betydelsen av en kontinuerlig DNA-sträcka med start- och ändpunkt bestående av introner och exoner, vilka potentiellt kan transkriberas, splitsas och translateras till ett protein. Varje gen består dock av delar som kan rekombineras med delar från andra gener på andra platser i genomet. På så sätt kan det skapas proteiner som inte direkt kodas av någon specifik gen.

Idén med alternativ splitsning är lysande. Den innebär att man får ett strömlinjeformat genetiskt program som bara tar upp en bråkdel av den plats som det skulle ta upp om det kodade för varje protein för sig. Men den ökade komplexiteten har sitt pris. Man har uppskattat – och då lågt räknat - att varje intron tillför en komplexitet som motsvarar ett tillägg av 30 DNA-bokstäver.8 Detta innebär att ”måltavlan för mutationer” blir större för varje intron som tillförs. Om man tänker på att en genomsnittlig gen har 7-10 introner, och att den totala längden av alla introner ofta är större än den total längden av proteinkodande DNA, så inser man problemet. Det blir en hel del jobb att hålla ett sånt system i gott skick och komplexiteten skapar svårigheter för de naturalistiska ursprungsteorierna. Det är faktiskt så att en betydande del av människans genetiska sjukdomar har tillskrivits mutationer vid splitsningspunkterna mellan introner och exoner.9 Introner brukar räknas in i kategorin skräp-DNA, men de har speciella sekvenser vid start och slut som informerar splitsnings-mekanismen bl.a. om var den ska klippa – så utan funktion är de inte. (Exonerna har också splitsnings-signaler vid ändpunkterna. En del av den information som behövs för att splitsa bort intronerna, befinner sig alltså inom genomets protein-kodande del. De protein-kodande avsnitten kodar samtidigt för proteinsekvenser och splitsningsmönster!)

En betydelsefull upptäckt gjordes i projektet ENCODE – nästan hela genomet hade förr eller senare under en cells livstid överförts till sekvenser i RNA. Dessutom kunde flera överlappande RNA-sekvenser skapas utifrån samma DNA-sträcka. Det här innebar en enorm smäll för de som teoretiserade om skräp-DNA.10 Det som kanske var ännu viktigare var att ENCODE dokumenterade en häpnadsväckande mängd exempel på alternativ splitsning. Nu hade man alltså hamnat i ett läge där man visste att en enormt stor del av genomet var aktivt och att de protein-kodande avsnitten användes i komplexa kombinationer – men utan att veta hur allt detta kom sig. Därför har forskarna nu börjat leta efter en ”splitsningskod” inom genomet - en som då skulle kontrollera ”klippandet och klistrandet” i de protein-kodande generna. Denna splitsningskod måste kunna styra: 1) de komplexa kombinationer av exoner som behövs för att skapa 100 000-tals proteiner utifrån 10 000-tals proteingener. 2) den varierade splitsning som olika sorters celler måste kunna utföra för att olika sorters proteiner ska kunna komma till uttryck i olika celltyper. 3) den förändring av splitsningsmönstren som måste ske över tid, allteftersom en organism utvecklas från befruktat ägg till vuxen varelse (alla gener är inte aktiva under livets alla stadier).All denna information måste finnas kodad i genomet – dock utan att störa de proteinkodande domänerna. Alltså måste det mesta av den här informationen ligga inom intronerna och i mellanrummen mellan generna.

Nyligen kom det ut en uppsats i Nature där författarna påstod sig ha upptäckt början på en splitsningskod. De fann ett underverk av komplexitet. Eftersom forskningslab över hela världen med tiden har genererat en enorm mängd data så kunde författarna göra en omfattande och djupgående undersökning. Särskilt omfattande databaser har sammanställts över vilka gener som är aktiva i olika cellinjer och utvecklingsstadier. Man känner också till många DNA-bindande faktorer och deras särskilda målsekvenser (vanligtvis en kort sträng med bestämda bokstäver som man söker sig fram till utifrån proteiner med roliga namn som “Star”, “Nova”, och “Quaking-like”). Med hjälp av den här kunskapen kunde de ta itu med saken rent statistiskt - för att dokumentera vad som speciellt kännetecknade det som kontrollerar den alternativa splitsningen. Före och efter många exoner hittade de ett flertal ”motiv” (korta DNA-ord på 5-10 bokstäver) med stark koppling till olika celltyper. 60% av mönstren för den alternativa splitsningen i människans arvsmassa kunde förklaras enbart genom om dessa motiv fanns eller inte. Många av motiven var tidigare kända och var platser för kända DNA-bindande proteiner. Många andra motiv var nya för vetenskapen.

Medianvärdet av det antal vävnadsspecifika motiv som kan förknippas med splitsning sträcker sig från 12 per exon i det centrala nervsystemet till 19 per exon i embryot.11 Utöver detta hittade man vävnadsoberoende egenskaper, som hörde ihop med så gott som alla exoner, samt rikligt med korta motiv. Dessa är inte med i beräkningen ovan.Det här betyder att splitsningskoden är komplex - och att det behövs en komplex kombination av instruktioner för att styra hur det stora antalet exoner ska kunna samverka och framställa all denna mängd proteiner som finns i människokroppen.

Man har också upptäckt uttryck som hör ihop med splitsningen, men som ligger mycket längre bort än väntat från de proteinkodande regionerna. Pga av tekniska begränsningar har historiskt sett de flesta studier bara fokuserat på det dussintal bokstäver som - uppströms eller nedströms - legat alldeles i närheten av målsekvensen. Men nu börjar man dokumentera funktioner mycket längre in i de icke proteinkodande regionerna – upp till 300 bokstäver längre bort. Så nu kan ännu mer skräp-DNA överföras till kategorin funktionellt DNA!

Och detta är bara början. Man har bara skrapat på ytan och redan upptäckt en förvånansvärd komplexitet. Man fick bara en noggrannhet på 60% i prediktion. Detta innebär att det finns mycket kvar att upptäcka. Var finns den saknade informationen? Kanske kommer man hitta den djupare in i det icke-kodande DNA:t. Kanske har man inte tillräckligt beaktat DNA:s 3-dimensionella uppbyggnad. Kanske kommer man att hitta ytterligare egenskaper ännu längre bort från målsekvensen – kanske till och med i andra kromosomer! Möjligheterna är obegränsade och vi kommer säkert att uppdatera er vidare när man får veta mera.

Slutligen skulle jag vilja diskuterar ett litet problem med undersökningen. Många ”pseudogener” i genomet påminner om funktionella gener, men har ”mutationer” som gör att de inte kan koda för proteiner. Förekomsten av pseudogener har varit en gåta sedan de upptäcktes. Idén har dock i allmänhet använts för att attackera kreationister och andra förespråkare för design. Jag anser att argumenten är falska.12 Vi har skrivit mycket om detta i tidigare artiklar.13 Fast man har hittat funktioner hos många pseudogener, är det ändå sant att de (efter transkription och splitsning) inte har kunnat translateras till proteiner. När vi nu känner till möjligheten av alternativa splitsningar kan man tänka sig att framtida arbeten skulle kunna komma att visa att många pseudogenetiska exoner användes för syntes av funktionella proteiner. I ett sådant läge skulle hela den pseudogenetiska argumentationen falla ihop som ett korthus. Men det här kan bara tiden utvisa.

Till dess kan vi häpna över hur skickligt det mänskliga genomet är konstruerat. Gud har skrivit ett dataprogram som är hittills oöverträffat av mänsklig teknik. Det är totalt häpnadsväckande att se den visdom och det förutseende som finns inlagt där. Han konstruerade en DNA-sträng som kan motstå tusentals fel (mutationer). Den kan också anpassa sig till förändrade miljöer genom att slå på eller av olika gener – allt efter omständigheterna. Strängen, som är ungefär lika lång som en människa, kan packas ihop i en mikroskopisk cell – utan att bilda knutar! Nu får vi också veta att hans program är ett under av datakomprimering och effektivitet. Det är också långt sinnrikare än vad vi någonsin har kunnat föreställa oss.

Referenser

  1. Putnam, N.H., et al., Sea anemone genome reveals ancestral Eumetazoan gene repertoire and genomic organization, Science317:86–94. Åter till text.
  2. Carter, R.W., The slow, painful death of junk DNA. Åter till text.
  3. Pennisi, E., Gene counters struggle to get the right answer, Science301:1040–1041, 2003. Åter till text.
  4. Claverie, J. Gene number. What if there are only 30,000 human genes? Science 291:1255–1257, 2001. Åter till text.
  5. International Human Genome Sequencing Consortium, Initial sequence and analysis of the human genome, Nature409(6822):860–921, 2001. Åter till text.
  6. ENCODE Project Consortium, Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project, Nature 447:799–816. Åter till text.
  7. Gerstein, M.B., What is a gene, post-ENCODE? History and updated definition, Genome Research 17:669–681, 2007. Åter till text.
  8. Lynch, M., Rate, molecular spectrum, and consequences of human mutation, Proceedings of the National Academy of Sciences USA 107(3):961–968, 2010. Åter till text.
  9. Barash, Y., et al., Deciphering the splicing code, Nature 465:53–59, 2010. Åter till text.
  10. Williams, A., Astonishing DNA complexity update. creation.com/astonishing-dna-complexity-update. Åter till text.
  11. Författaren skriver: ”Utnyttjande av mänskliga embryon är synnerligen stötande för mig, men eftersom den här artikeln inte handlar om etik, moral eller den ”nya sköna världen”, så vill jag avhålla mig från ytterligare kommentarer.” Åter till text.
  12. The Great Dothan Debate. creation.com/the-great-dothan-debate. Åter till text.
  13. För en lista på artiklar om pseudogener, gå till sektionen ”Junk DNA section of the Vestigial Organs Questions and Answers page. Åter till text.

Helpful Resources