Usuari:Arnaulleixa04/Lloc CpG
Els llocs CpG o llocs CG són regions d' ADN on un nucleòtid de citosina és seguit per un nucleòtid de guanina en la seqüència lineal de bases al llarg de la seva direcció 5' → 3' . Els llocs CpG es produeixen amb alta freqüència en regions genòmiques anomenades illes CpG .
Les citosines dels dinucleòtids CpG es poden metilar per formar 5-metilcitosines . Els enzims que afegeixen un grup metil s'anomenen ADN metiltransferases. En els mamífers, entre el 70% i el 80% de les citosines CpG estan metilades. [1] La metilació de la citosina dins d'un gen pot canviar la seva expressió, un mecanisme que forma part d'un camp de la biologia que estudia la regulació gènica que s'anomena epigenètica . Les citosines metilades sovint muten a timines .
En humans, vora el 70% dels promotors situats a prop del lloc d'inici de la transcripció d'un gen (promotors proximals) contenen una illa CpG. [2] [3]
Característiques dels CpG
[modifica]Definició
[modifica]CpG és l'abreviatura de 5'—C—fosfat—G—3', és a dir, citosina i guanina separades només per un grup fosfat ; El fosfat uneix dos nucleòsids qualsevols en l'ADN. La notació CpG s'utilitza per distingir aquesta seqüència lineal monocatenària de l' aparellament de bases CG de citosina i guanina per a seqüències complementàries de doble cadena. Per tant, la notació CpG s'ha d'interpretar com que la citosina es troba a l'extrem 5' de la base de guanina. No s'ha de confondre CpG amb GpC, aquest últim significa que una guanina va seguida d'una citosina en la direcció 5' → 3' d'una seqüència monocatenària.
Omissió per una alta taxa de mutació
[modifica]Fa temps que s'ha observat que els dinucleòtids CpG es produeixen amb una freqüència molt menor en la seqüència de genomes de vertebrats del que s'esperaria a causa de l'atzar. Per exemple, en el genoma humà, que té un contingut de GC del 42%, [4] s'espera que hi hagi un parell de nucleòtids formats per citosina seguit de guanina en un del genoma. Tanmateix, la freqüència dels dinucleòtids CpG en els genomes humans és inferior a una cinquena part de la freqüència esperada. [5]
Aquesta infrarepresentació és conseqüència de l'elevada taxa de mutació dels llocs CpG metilats: la desaminació espontània d'una citosina metilada dona lloc a una timina, i les bases desajustades resultants (T:G) sovint es reparen incorrectament a T:A (en comptes de C:G); mentre que la desaminació de la citosina no metilada dóna lloc a un uracil, que com a base estranya es substitueix ràpidament per una citosina pel mecanisme de reparació per excisió de bases . La velocitat de transició C a T als llocs CpG metilats és aproximadament 10 vegades més alta que als llocs no metilats. [6] [7] [8] [9]
Distribució genòmica
[modifica]Llocs CpG | Llocs GpC |
---|---|
</img> | </img> |
Distribució dels llocs CpG (esquerra: en vermell) i llocs GpC (dreta: en verd) al gen APRT humà. Els CpG són més abundants a la regió upstream del gen, on formen una illa CpG, mentre que els GpC es distribueixen de manera més uniforme. S'indiquen els 5 exons del gen APRT (blau) i els codons d'inici (ATG) i de parada (TGA) es destaquen (blau negreta). |
Els dinucleòtids CpG es troben amb freqüència a les illes CpG (vegeu la definició d'illes CpG, a continuació). Hi ha 28.890 illes CpG al genoma humà, (50.267 si s'inclou illes CpG en seqüències repetides). [10] Aquestes dades són compatibles amb les 28.519 illes CpG trobades per Venter et al. [11] ja que el genoma analitzat per Venter et al. no incloïa l'interior d'elements repetitius molt similars i les regions repetitives extremadament denses a prop dels centròmers. [12] Com que les illes CpG contenen múltiples seqüències de dinucleòtids CpG, sembla que hi ha més de 20 milions de dinucleòtids CpG al genoma humà.
Illes CpG
[modifica]Les illes CpG (o illes CG) són regions amb una alta freqüència de llocs CpG. Tot i que les definicions objectives de les illes CpG són limitades, la definició formal habitual és una regió amb almenys 200 pb, un percentatge de GC superior al 50% i una relació CpG observada/esperada superior al 60%. La "proporció de CpG observada sobre esperada" es pot estimar quan l'observat es calcula com: i l'esperat com [13] o . [14]
Molts gens dels genomes dels mamífers tenen illes CpG associades amb l'inici del gen [15] ( regions promotores ) com a conseqüència de la pressió de selecció sobre aquells organismes amb mutacions de C a T, que poden alterar l'expressió d'aquests gens. Per això, la presència d'una illa CpG s'utilitza per ajudar en la predicció i anotació de gens.
- ↑ Gene, 333, 5-2004, pàg. 143–9. DOI: 10.1016/j.gene.2004.02.043. PMID: 15177689.
- ↑ Proc. Natl. Acad. Sci. U.S.A., 103, 5, 2006, pàg. 1412–7. Bibcode: 2006PNAS..103.1412S. DOI: 10.1073/pnas.0510310103. PMC: 1345710. PMID: 16432200 [Consulta: free].
- ↑ Genes Dev., 25, 10, 2011, pàg. 1010–22. DOI: 10.1101/gad.2037511. PMC: 3093116. PMID: 21576262.
- ↑ Lander, Eric S.; Linton, Lauren M.; Birren, Bruce; Nusbaum, Chad; Zody, Michael C. (en anglès) Nature, 409, 6822, 15-02-2001, pàg. 860–921. Bibcode: 2001Natur.409..860L. DOI: 10.1038/35057062. ISSN: 1476-4687. PMID: 11237011 [Consulta: free].
- ↑ International Human Genome Sequencing Consortium (en anglès) Nature, 409, 6822, 15-02-2001, pàg. 860–921. Bibcode: 2001Natur.409..860L. DOI: 10.1038/35057062. ISSN: 0028-0836. PMID: 11237011 [Consulta: free].
- ↑ Proc Natl Acad Sci U S A, 101, 39, 2004, pàg. 13994–4001. Bibcode: 2004PNAS..10113994H. DOI: 10.1073/pnas.0404142101. PMC: 521089. PMID: 15292512 [Consulta: free].
- ↑ «Cytosine Methylation and DNA Repair». A: DNA Methylation: Basic Mechanisms. 301, 2006, p. 283–315 (Current Topics in Microbiology and Immunology). DOI 10.1007/3-540-31390-7_11. ISBN 3-540-29114-8.
- ↑ Nat Rev Genet, 10, 7, 2009, pàg. 478–488. DOI: 10.1038/nrg2529. PMC: 2744436. PMID: 19488047.
- ↑ Annu Rev Genom Hum Genet, 15, 2014, pàg. 47–70. DOI: 10.1146/annurev-genom-031714-125740. PMID: 25000986 [Consulta: free].
- ↑ Nature, 409, 6822, 2-2001, pàg. 860–921. Bibcode: 2001Natur.409..860L. DOI: 10.1038/35057062. PMID: 11237011 [Consulta: free].
- ↑ Science, 291, 5507, 2-2001, pàg. 1304–51. Bibcode: 2001Sci...291.1304V. DOI: 10.1126/science.1058040. PMID: 11181995 [Consulta: free].
- ↑ Proc. Natl. Acad. Sci. U.S.A., 99, 7, 4-2002, pàg. 4145–6. Bibcode: 2002PNAS...99.4145M. DOI: 10.1073/pnas.092136699. PMC: 123615. PMID: 11904395 [Consulta: free].
- ↑ Journal of Molecular Biology, 196, 2, 1987, pàg. 261–282. DOI: 10.1016/0022-2836(87)90689-9. PMID: 3656447.
- ↑ Proc Natl Acad Sci USA, 103, 5, 2006, pàg. 1412–1417. Bibcode: 2006PNAS..103.1412S. DOI: 10.1073/pnas.0510310103. PMC: 1345710. PMID: 16432200 [Consulta: free].
- ↑ Genetics: Analysis of Genes and Genomes. 6th. Mississauga: Jones & Bartlett, Canada, 2005, p. 477. ISBN 978-0-7637-1511-3.
[[Categoria:ADN]] [[Categoria:Genètica molecular]]