Struktura myšího genomu
odd. Myší molekulární genetiky,
[email protected]
http://www.img.cas.cz/mmg/
q  Výhody experimentálního modelu myši domácí
q  DNA sekvenování - vývoj technologií – od malých k velkým genomům
q  Primární sekvence myšího genomu, chromozomy, organizace jádra
q  Klasifikace genomových oblastí a elementů: geny, centromery,
telomery, repetitivní DNA, transposony
q  Databáze výsledků sekvenačních projektů – volný přístup
Výhody experimentálního modelu myši domácí
Životní cyklus
: březost 20 dnů
: 4-10 mláďat / vrh
: 2-8 vrhů / samice
: pohlavní dospělost v 7 týdnech
Genom - osekvenován
: 19 autozomů + XY
: 2,7 x 109 pb / haploidní genom
: 23 000 genů
: 99% genů má lidského ortologa
Kmeny
Asistovaná reprodukce
: Kryopreservace embryí a spermií
: In vitro fertilizace
: Inbrední - IB
: Outbrední- OB
: Rekombinantní inbrední - RI
: Konsomické- CS
Manipulace myšího genomu:
Prostředky
: Genomová DNA sekvence
: Genomové knihovny v BAC
: DNA mikročipy (expression arrays)
: Embryonální kmenové buňky
: „Gene-trap“-knihovny
: MUGA (Mouse Universal Genotyping Arrays)
: NGS – RNA-seq, ChIP-seq, Methylome-seq...
: Transgeneze
: Knocking-out
: Knocking-down
: Knocking-in
: Podmíněná exprese
: Inducibilní exprese
: Retrovirové vektory
: siRNA
: editace genomu (ZnFN, TALEN, CRISPR)
Metody pro určení sekvence DNA – Generace 1 (G1)
Sanger sequencing /dideoxy or chain termination method/
Chain-termination method requires
single-stranded DNA Template,
DNA primer,
DNA polymerase,
radioactively labeled nucleotides,
modified nucleosides (di-deoxynucleosidetriphosphates - ddNTPs) that
terminate DNA strand elongation
Principle:
DNA-POLYMERASE CHAIN ELONGATION &
SPECIFIC TERMINATION BY
DIDEOXYNUCLEOSIDETRIPHOSPHATEs
REFERENCE: Sanger F, Nicklen S, Coulson AR., DNA sequencing with chain-­‐termina?ng inhibitors, Proc Natl Acad Sci U S A. 1977 Dec;74(12):5463-­‐7 4 TubesReactions for 4 individual ddTTP
Metody pro určení sekvence DNA – G1
4 tubes with reactions for 4individual ddTTP
Sanger sequencing /dideoxy or chain termination method/
radioactive fragments
terminated at 3’ ends specific sites
of incorporated dideoxy nucleotides
are resolved on denaturing polyacrylamide gel
and exposed to autoradiograph films
Electrophoresis on denaturing gel and autoradiography
Frederick Sanger *13.8.1918 +19 .11.2013
http://en.wikipedia.org/wiki/Frederick_Sanger
DNA sekvenování – Sangerova metoda – G1+
Sanger sequencing /dideoxy or chain termination method/- resolved by capilary electropheresis
- DNA Polymerase elongated fragments terminated at 3’ end specific sites
- by Dideoxy nucleotides labeled by base specific fluorescent dyes
- Fragments are resolved by electrophoresis through a polymer in a capillary
- Laser detector reads the sequence according to sequence of specific dye peaks
ABI PRISM Model 3700 Automated Sequencer 96 capillaries. This vastly improved the process, but even so it could take
over a year to read a DNA fragment one gigabase. The workhorse of the Human Genome Project was the
capillary sequencer. This removed the need for radiation and pouring gels, automating the DNA-sequencing
method invented by Fred Sanger in the 1970s.
http://www.wellcome.ac.uk/Education-resources/Education-and-learning/Resources/Animation/WTDV026689.htm
Současné metody sekvenace DNA – G2, G3
- High Throughput-Next Generation Sequencing
v  Next Generation Sequencing Instruments - Principles
q  454/Roche
Pyrosequencing
q  Illumina/ Solexa
Reversible Terminator Nucleotides
q  Solid/Life Technologies
Sequencing by Ligation
q  Ion Torrent/Life Technologies
pH changes during DNA synthesis
q  Pacific Bioscinces
Single DNA polymerase molecule “watched” in action
q  Oxford Nanopore
Single DNA molecule sequenced at nanopore
Sequencing instrument capacities since 2001
ER Mardis. Nature 470, 198-203 (2011)
Kris Wetterstrand, M.S., National Human Genome Research Institute,
E-mail: [email protected]
1 ExaByte = 1x1018
21
1 ZettaByte = 1x10
1http://schatzlab.cshl.edu/presentations/2014.03.24.Keystone%20BigData.pdf
Použití HT-NGS technologií
v  HT - Next Generation Sequencing Applications - Projects
q  Genome Sequencing
new genomes, genome resequencing
q  Transcriptome Sequencing
sequencing – quantification of mRNA, smallRNA
q  Exome Sequencing
sequencing of exome enriched libraries
q  Targeted Sequencing
sequencing of targeted genome enriched regions
q  ChIP - Sequencing
DNA – protein interactions
q  Genome – Wide Methylation
genome-wide cytosine methylation
q  Multiplex Sequencing
barecode specific simultaneous sequencing
q  Microbiome Sequencing
enviromental, human, mouse microbiomes
Sekvenování lidského genomu - IHGSC
IHGSC - Hiearchical shotgun sequencing
International Human
Genome Sequencing
Consortium (IHGSC)
Sekvenování lidského genomu - CELERA
Whole-genome shotgun sequencing
Rychlá metoda celogenomového shotgun sekvenování:
CELERA
(an Applera Corporation
Busisness, Craig Ventor)
Overlapping shredded bactig fragments (red lines) and internally
derived reads from five different individuals (black lines) are combined
to produce a contig and a consensus sequence (green line). Contigs
are connected into scaffolds (red) which are then mapped to the
genome (gray line) with STS (blue star) physical map information
DNA sekvence lidského genomu
q  „draft sequence genomu člověka publikována: 15.2.2001
q  představuje 90% velikosti lidského genomu
q  2.7Gb (2.7 x 109 bp)
ü  REFERENCE #1: International Human Genome Sequencing Consortium (2001). Initial sequencing
and analysis of the human genome. Nature 409 (6822): 860–921.
• Sekvenační postup: Hiearchical shotgun sequencing
• Sekvence lidského genomu přístupná vědecké komunitě ve formě databáze DNA sekvencí
ü  REFERENCE #2 Venter, JC et al. (2001). The sequence of the human genome. Science 291 (5507):
1304–1351.
• Sekvenační postup: Whole Genome Shotgun sequencing
• Původně se CELERA snažila některé DNA sekvence patentovat, a tím vznikalo nebezpečí pouze
komerčního přístupu k některým sekvencím lidského genomu
q  „final sequence oznámena: 25.4.2003 on UCSC genome browser appeared as
assembly July 2003 (NCBI34/hg16)
q  představuje 99.3% velikosti lidského genomu
q  3.1 Gb (3.1 x 109 bp)
q  současná „final sequence
q  3.1 Gb (3.1 x 109 bp)
Dec 2013 (GRCh38/hg38)
DNA sekvence myšího genomu
•  Využití sekvenačních kapacit projektu lidský genom
•  +stará dobrá Sangerova sekvenační metoda,
•  +vylepšené programy na sestavení genomu (genome assembly)
Sekvence genomu myši domácí (kmen C57Bl/6J ) byla publikována: 5.12.2002
„draft sequence“ t.j. 96% předpokládané velikosti myšího genomu – 2.5 Gb
• Mouse Genome Sequencing Consortium (2002) : Initial sequencing and
comparative analysis of the mouse genome, Nature, 420:520-562.
„Draft sekvence genomu myši domácí
Nature. 2002 Dec 5;420(6915):
Kromě vlastní sekvence genomu myši (kmen C57Bl/6J )
zde byly publikovány další důležité články s detailní analýzou sekvence a
porovnání genomu myši s lidským genomem publikovaným dříve
Mouse Genome Sequencing Consortium (2002) : Initial
sequencing and
comparative analysis of the mouse genome,
Nature, 420:520-562.
Author List:
Mouse Genome Sequencing Consortium, Waterston RH, Lindblad-Toh K, Birney E, Rogers J, Abril JF, Agarwal P, Agarwala R,
Ainscough R, Alexandersson M, An P, Antonarakis SE, Attwood J, Baertsch R, Bailey J, Barlow K, Beck S, Berry E, Birren B,
Bloom T, Bork P, Botcherby M, Bray N, Brent MR, Brown DG, Brown SD, Bult C, Burton J, Butler J, Campbell RD, Carninci P,
Cawley S, Chiaromonte F, Chinwalla AT, Church DM, Clamp M, Clee C, Collins FS, Cook LL, Copley RR, Coulson A,
Couronne O, Cuff J, Curwen V, Cutts T, Daly M, David R, Davies J, Delehaunty KD, Deri J, Dermitzakis ET, Dewey C, Dickens
NJ, Diekhans M, Dodge S, Dubchak I, Dunn DM, Eddy SR, Elnitski L, Emes RD, Eswara P, Eyras E, Felsenfeld A, Fewell
GA, Flicek P, Foley K, Frankel WN, Fulton LA, Fulton RS, Furey TS, Gage D, Gibbs RA, Glusman G, Gnerre S, Goldman N,
Goodstadt L, Grafham D, Graves TA, Green ED, Gregory S, Guigó R, Guyer M, Hardison RC, Haussler D, Hayashizaki Y,
Hillier LW, Hinrichs A, Hlavina W, Holzer T, Hsu F, Hua A, Hubbard T, Hunt A, Jackson I, Jaffe DB, Johnson LS, Jones M,
Jones TA, Joy A, Kamal M, Karlsson EK, Karolchik D, Kasprzyk A, Kawai J, Keibler E, Kells C, Kent WJ, Kirby A, Kolbe DL,
Korf I, Kucherlapati RS, Kulbokas EJ, Kulp D, Landers T, Leger JP, Leonard S, Letunic I, Levine R, Li J, Li M, Lloyd C, Lucas
S, Ma B, Maglott DR, Mardis ER, Matthews L, Mauceli E, Mayer JH, McCarthy M, McCombie WR, McLaren S, McLay K,
McPherson JD, Meldrim J, Meredith B, Mesirov JP, Miller W, Miner TL, Mongin E, Montgomery KT, Morgan M, Mott R,
Mullikin JC, Muzny DM, Nash WE, Nelson JO, Nhan MN, Nicol R, Ning Z, Nusbaum C, O'Connor MJ, Okazaki Y, Oliver
K, Overton-Larty E, Pachter L, Parra G, Pepin KH, Peterson J, Pevzner P, Plumb R, Pohl CS, Poliakov A, Ponce TC, Ponting CP,
Potter S, Quail M, Reymond A, Roe BA, Roskin KM, Rubin EM, Rust AG, Santos R, Sapojnikov V, Schultz B, Schultz J,
Schwartz MS, Schwartz S, Scott C, Seaman S, Searle S, Sharpe T, Sheridan A, Shownkeen R, Sims S, Singer JB, Slater G, Smit
A, Smith DR, Spencer B, Stabenau A, Stange-Thomann N, Sugnet C, Suyama M, Tesler G, Thompson J, Torrents D, Trevaskis E,
Tromp J, Ucla C, Ureta-Vidal A, Vinson JP, Von Niederhausern AC, Wade CM, Wall M, Weber RJ, Weiss RB, Wendl MC,
West AP, Wetterstrand K, Wheeler R, Whelan S, Wierzbowski J, Willey D, Williams S, Wilson RK, Winter E, Worley KC,
Wyman D, Yang S, Yang SP, Zdobnov EM, Zody MC, Lander ES.
Nature. 2002 Dec 5;420(6915):
The house mouse, Mus musculus, has been inextricably linked with humans since the beginning of civilization — wherever farmed food was
stored, mice would be found. Many of the advances in twentieth-century biology owe a huge debt to the mouse, which has become the favoured
model animal in most spheres of research. With the completion of the draft sequence of its genome published in this issue, the mouse promises
to continue to provide us with an essential resource for all aspects of biology. In this timeline, we chart the key events in the history of the mouse
that led to this landmark achievement.
commentaryMining the mouse genome p512
We have the draft sequence — but how do we unlock its secrets?
Allan Bradley
news and viewsComparative genomics: The mouse that roared p515
The laboratory mouse has become an indispensable tool for investigators in many areas of biomedical research. The availability of the full
mouse genome sequence will immeasurably advance both the character and the pace of discovery.
Mark S. Boguski
Single nucleotide polymorphisms: Tackling complexity p517
Many traits, including susceptibilities to some diseases, are under complex genetic control. A new way of analysing the mouse genome will be a
great help in understanding the interactions involved.
Joseph H. Nadeau
Functional genomics: A time and place for every gene p518
One benefit of studying mice is that most of their genes have counterparts in humans. Two groups have used this similarity to study when and
where the genes found on human chromosome 21 are switched on.
Roger H. Reeves
articleInitial sequencing and comparative analysis of the mouse genome p520
and Mouse Genome Sequencing Consortium
Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs p563
and The FANTOM Consortium and the RIKEN Genome Exploration Research Group Phase I & II Team*
letters to natureThe mosaic structure of variation in the laboratory mouse genome p574
Claire M. Wade, Edward J. Kulbokas, III, Andrew W. Kirby, Michael C. Zody, James C. Mullikin, Eric S. Lander, Kerstin LindbladToh and Mark J. Daly
doi:10.1038/nature01252
Numerous potentially functional but non-genic conserved sequences on human chromosome 21 p578
Emmanouil T. Dermitzakis, Alexandre Reymond, Robert Lyle, Nathalie Scamuffa, Catherine Ucla, Samuel Deutsch, Brian J. Stevenson,
Volker Flegel, Philipp Bucher, C. Victor Jongeneel and Stylianos E. Antonarakis
Human chromosome 21 gene expression atlas in the mouse p582
Alexandre Reymond, Valeria Marigo, Murat B. Yaylaoglu, Antonio Leoni, Catherine Ucla, Nathalie Scamuffa, Cristina Caccioppoli,
Emmanouil T. Dermitzakis, Robert Lyle, Sandro Banfi, Gregor Eichele, Stylianos E. Antonarakis and Andrea Ballabio
A gene expression map of human chromosome 21 orthologues in the mouse p586
and The HSA21 expression map initiative
DNA sekvence myšího genomu - IV. 2014 / compared to 2008/
This latest major assembly, GRCm38, was released by the Genome Reference Consor;um in January 2012. It is based on Mus musculus strain C57BL/
6J. The GRCm38 primary assembly comprises 21 chromosomes and 22 unplaced scaffolds. Similar to the human genome assembly, the Genome Reference Consor;um will be releasing addi;onal sequence for GRCm38 in the form of minor releases (patches). Assembly:
GRCm38/mm10, Jan 2012
Genebuild:
Ensembl, Jan 2011
Database version:
75.38
Coding genes:
23,148
Non-coding RNA genes:
9,934
Short non-coding genes:
5,860
Long non-coding genes:
4,074
Pseudogenes:
5,935
Gene transcripts:
94,647
Genscan gene predictions:
56,884
Short Variants:
75,968,355
/14,888,174/
Short Variants:
75,968,355
/14,888,174/
Base Pairs:
3,480,955,279
/3,420,842,930/
Golden
Path Length:
http://www.ensembl.org/Mus_musculus
2,730,871,774
/2,716,965,481/
/49.37b/
/22,010/
/3,014/
/1,190/
/40,466/
/72,043/
Myší genom – význam a struktura
Genom – definice – je to veškerá genetická informace organismu.
Tato genetická informace je zapsaná v lineární podobě ve formě DNA (u některých virů je to RNA).
Obsahuje program s instrukcemi a zakódovanými prostředky pro život a reprodukci jedince.
Dávka genomu je rozdílná v somatických a germinálních buňkách (např. diploidní a haploidní).
Genom je fyzicky rozčleněn do chromozomů v buněčném jádře.
Mitochondriální genom je nejaderný, jeho velikost je u myši 16 303 pb.
Typické oblas. myšího chromozomu Myší karyotyp /soubor chromozomů v jádře buňky/ Myš domácí Mus musculus domesticus
20 párů chromozomů
19 párů autozomů + pohlavní
chromozomy X a Y
Anatomie myších a lidských metafazických
chromozomů
Metafazické chromozomy,
ze sleziny samice, Bunker, M.C. 1965
Homo sapiens
Mus mus. domesticus
centromery
sesterské chromatidy
Jaderná DNA - chromozom 17, DNA a chromatin
Jaderná DNA
v metafázi
Chr2 DNAChr8
v interfázi
Cell
Chr17
DNA
HORMAD2
Nucleus
http://en.wikipedia.org/wiki/File:Chromatin_Structures.png
DNA
Chromosome
Chromosome Statistics
Struktura a funkční oblasti myšího chromozomu 17
Length (bps) 94,987,271 Coding genes 1,092 (incl. 8 readthrough) Short non coding genes 186 Long non coding genes 157 (incl. 4 readthrough) Pseudogenes 230 Short Variants 2,820,108 http://www.ensembl.org/Mus_musculus/Location/Chromosome?r=17
Chromosome Statistics
Struktura a funkční oblasti myšího chromozomu 17
Length (bps) 94,987,271 Coding genes 1,092 (incl. 8 readthrough) Short non coding genes 186 Long non coding genes 157 (incl. 4 readthrough) Pseudogenes 230 Short Variants 2,820,108 RefSeqGenes _ Complete Chr17
RefSeqGenes &Contigs_ Chr17:18,077,439-18,377,439
http://genome.ucsc.edu/cgi-bin/hgTracks?db=mm10&position=chr17
Chromosome Statistics
Struktura a funkční oblasti myšího chromozomu 17
Length (bps) 94,987,271 Coding genes 1,092 (incl. 8 readthrough) Short non coding genes 186 Long non coding genes 157 (incl. 4 readthrough) Pseudogenes 230 Short Variants 2,820,108 http://www.ncbi.nlm.nih.gov/mapview/maps.cgi?taxid=10090&CHR=17
Genomy blízkých druhů jsou podobné,
jejich chromozomální členění - karyotyp může být odlišný
2.73 Gb
2.51
Velikosti genomů v Gbp
Gbp = 1 000 000 000 pb
3.10 Gb
3.11
3.35
3.10
Anomální karyotyp: strukturní aberace, numerické aberace,
Balanced Genomic Translocations, Genome Dosage Imbalance
q  Aneuploidie - odlišný počet chromozomů oproti
normálnímu karyotypu - monozomie, trizomie,
tetrazomie, polyploidie (Genome Dosage Imbalance)
q  Nižší počet chromozomů, který vznikl spojením dvou
chromozomů - fúzí jejich centromer - Robertsonovy
translokace
q  Strukturní přestavby chromozomů - reciproké
balancované translokace, nebalancované translokace
Anomální karyotyp – příklady
Normální meiotický crossing-over
a segregace alel do gamet
Chromozomální translokace
Chromozomální translokace Chr16Chr17 „T43H
A
Anomální karyotypy způsobené
translokací T43H ve spermatocytech
heterozygotního samce
B
A. Subchromozomální TRISOMIE
B. Reciproká balancovaná translokace
proximální části chromozomu 17 s
chromozomem 16
CEN& HORMAD2 & SYCP3
DAPI & HORMAD2 & Chr17
Vizualizace jaderné DNA, Chromozomu 17 a proteinu HORMAD2 v pachytenních spermatocytech
trisomického samce Ts43H pomocí fluorescenční mikroskopie postupem FISH a imunobarvením
Chromozomální translokace „T43H
CEN& HORMAD2 & SYCP3
Vizualizace charakteristických proteinových markerů meitoické profáze v pachytenních spermatocytech
imunobarvením pomocí fluorescenční mikroskopie ve vysokém rozlišení: Super-resolution image microscopy - Zeiss
Axioimager Z.1 platform equipped with the Elyra PS.1 super-resolution system for SR SIM
Trisomický samec Ts43H - část jádra pachytenního spermatocytu – synaptomenální komplex (SYCP3) - párování homologních chromosomů
XY – pohlavní chromosomy , šipky označují nespárované oblasti autosomálních chromosomů - obsahující translokaci T43H
Myší genom: od struktury k funkci
Genom /definice/ představuje genetickou informaci organismu.
Tato genetická informace je zapsaná v lineární podobě ve formě DNA (nebo RNA u některých virů).
Obsahuje program s instrukcemi a zakódovanými prostředky pro život a reprodukci jedince.
Dávka genomu je rozdílná v somatických a germinálních buňkách (např. diploidní v
somatických buňkách a haploidní v gametách u myši).
Genom je fyzicky rozčleněn do chromozomů v buněčném jádře.
Typické oblas. myšího chromozomu Geny a jejich regulační segmenty
GEN
Ø  obecná definice celé funkční jednotky, zahrnující
kodující nebo „nekodující“ DNA, spolu s nekodujícími
regulačními oblastmi, a nekodujícími introny)
Ø  genomová DNA, která koduje jednotlivý dědičný znak
vyjádřený buď ve formě proteinu nebo RNA.
Geny a jejich regulační segmenty
Typický gen kodující protein v genomu obratlovců
Centromery
Jsou pro každý chromozom unikátním místem spojení sesterských chromatid
Funkce - rozpoznání i oddělení chromatid pomocí kinetochorového proteinového
komplexu při mitotickém a meiotickém buněčném dělení
Guenatri-2004-JCB
Centromery
DNA sekvence centromer není mezidruhově konzervována
Centromerické repetice u myši mají délku 234 a 120 bp
- jde o AT bohatou DNA
• 
majoritní satelitní - délka 234 bp - 70%AT,
• 
25 000kopií na chromozom, 700 000 kopií/ genom
minoritní satelitní - délka 12O bp - 60%AT,
5 000 kopií/ genom, 100 000 kopií/ genom
Avšak struktura chromatinu centromer je konzervována u eukaryot:
• 
centrální kinetochorový CenH3 chromatin je z vnějších stran
• 
obklopen repeticemi s asociovaným heterochromatinem tvořeným Swi6HP1
studie na myších buňkách odhalily odlišnou organizaci a odlišné asociované proteiny s minor a major satelitní DNA
HP1 marks major satellite domains, whereas CENPs associate minor satellite domains
Centromery
Centromerická DNA myši se skládá z repetic 234 a 120 bp
- jde o AT bohatou sekvenci
Struktura centromery
myšího akrocentrického chromozomu
Red – Minor satelite
Green– Major satelite
Blue – DNA
Metafazické chromozomy
Interfazické chromozomy
DNA-FISH vizualizece struktury centromer, Guenatri-2004-JCB
Telomery
q  Struktura:
telomery jsou tvořeny tandemovými repeticemi
obsahující 3-4 guaniny (TTGGGG Tetrahymena
TTAGGG myš, člověk)
q  Funkce:
zajišťují chromozomům fyzikální stabilitu, chrání je
před zkracováním při jejich replikaci během
buněčných dělení
q  Délka telomer od 300 – 600 bp (kvasinka)
5 až 10 kb (myš, člověk).
Telomery
Konce chromozomů jsou chráněny komplexem proteinů.
TRF1 a TRF2 reorganizují lineární konce
chromozomů do smyčky, která
konci chromozomu propůjčuje větší fyzikální stabilitu
Repetitivní DNA
• 
Transpozibilní DNA
•  DNA transpozony
•  RNA transpozony
• 
Satelitní DNA – repetitivní DNA centromer
• 
Mikrosatelitní DNA – rozptýlena v genomu
• 
rDNA – kodující ribosomální RNA
Repetitivní DNA-38% genomu myši
/u člověka asi 46%/
Transpozony a repetitivní sekvence
v myším genomu, lokalizace na chromozomu
G-pruhování - barvení Giemsa+trypsin)
Ø 
Ø 
Ø 
Ø 
Transposable elements (TEs) -"jumping genes" or transposons
TE move (or jump) from one location in the genome to another
Barbara McClintock maize geneticist discovered TEs in the 1940s
for decadesTE DNA was called "junk" or „selfish DNA
Retrotranspozony
§  Endogenní retrovirové elementy (LTR retrotranspozony), tvoří
3% genomu
§  jde o provirovou DNA integrovanou v genomu
§  za určitých okolností může být provirus aktivován
§  vyúsťující v transpozici elementu
§  jeden z genů je však mutován (např. env), proto se nevytvoří virová
partikule
Repetitivní elementy LINE v  LINE-1 repetice
(Long Interspersed Nuclear Element),
- 500 000 kopií v myším genomu (20%),
- velikost 0.5-5 kb
- sobecká DNA kodující reverzní transkriptázu,
- retrotranspozony schopné se šířit genomem pomocí svého RNA
meziproduktu (výskyt v G pruzích = heterochromatin)
L1-retrotranspoziční cyklus
Repetitivní SINE „Alu elementy
- 
Alu repetice (SINE B1)
(Short Interspersed Nuclear Element)
- asi 500 000 kopií B1 v genomu (3%)
- velikost okolo 300 bp
dimerická struktura, jejíž monomery si jsou podobné
vznikly nezávisle ze 7SL RNA , (výskyt v R pruzích = euchromatin)
- před 100 mil. let byly namnoženy u společného předka hlodavců a primátů
Kategorie: AluS, AluJ, AluY
mohou vyvolat:
- rekombinaci genomové DNA
- replikační skluz
- CpG metylaci
- alternativní splicing
DNA transpozony
q 
dlouhé asi 200bp
(tvoří asi 1% myšího genomu)
q  obsahují gen pro transposazu, který je ohraničen z obou stran repetitivními
sekvencemi (TIRs)
q  enzym transposaza detekuje TIRs a vyštěpí unitř integrovaný
element (TE) a integruje ho na nové
akceptorové místo, vzniklá díra na donorové
pozici je pak buď opravena anebo vyplněna
další kopií transpozonu
Mikro- a mini- satelitní DNA
Mikrosatelity – 1 až 6-nukleotidové repetice
jsou zřejmě náhodně rozloženy po celém genomu,
různé délky od tandemově opakované motivy
např. CACACACACACACACA
Minisatelity – 10 až 40-nukleotidové repetice
a jejich délka se mění od stovek bp po několik kb
Mikrosatelity, minisatelity = „koktající genom“
Jejich využití v genotypizaci jedinců: microsatelite markers, fingerprinting
Genomika a její dcery
Znalost primární DNA sekvence genomů – umožnila rozvoj dlaších oborů: Srovnávací genomika – mezidruhové či mezikmenové vztahy genomů
(SNPs, konzervace, detekce ortologů, funkční anotace)
Funkční genomika – studuje jak je daná primární DNA sekvence genomu
buňkou
(organismem) dynamicky interpretována z hlediska transkripce genů, translace a vzájemných
interakcí
Epigenomika -Epigenetika -zkoumá funkci genomu z hlediska epigenetických
vlastností a změn, které jsou dědičné
ale nejsou závislé jen na primární DNA sekvenci
Systémová biologie – studuje komplexní interakce a integruje mnohostranné přístupy ke studiu
určitého druhu (používá
genomiku, proteomiku, transkriptomiku a další „-omics“)
- je opakem redukcionistického přístupu (jeden gen, -protein, etc...)
Doba genomická a post-genomická
§ 
- vývoj bioinformatických programů s hlediskem „ high-performance computing
pro
analýzu obrovských data setů vyprodukovaných novými technologiemi - DNA
sekvenování – „příštích generací
- HT-NGS
- extrémně narůstají požadavky na kapacity pro zpracování a archivaci dat
§ 
- vyjímečná role myši jako experimentálního modelu se v blízké budoucnosti jistě
potvrdí
§ 
- v současné době se díky nově vyvinutým technologiím pro modifikaci myšího
genomu (ZnF nucleasy, TALEN, CRISPR) otevřely nové možnosti pro (např.):
§ 
ověření funkce genů cílenou mutagenezí
§ 
opravu genových mutací
§ 
radikální přestavbu genomové struktury
§ 
přípravu experimentálních modelů pro studium lidských genetických nemocí
(more)
Mouse Genomes Project/Sanger Institute
17 representative
mouse strains:
GOALs:
o  Complete sequence of multiple inbred strains
o  Bases for systems biology approach to
phenotypic variation in the mouse
PUBLICLY AVAILABLE data:
§  Raw sequence data – Read alignments
§  de Novo assemblies of genomes
§  SNPs – Single Nucleotide Polymorphism
§  Indels – short Insertions and deletions
§  SVs - Structural Variations
§ also RNASeq & ChIPSeq data of some tissues
DATA Visualization on the Web site:
§  Query page to search for SNPs, Indels
§  Lookseq Visualizer to visualize read alignments
§  DAS Tracks – visualization at Esmble browser
o 129P2/OlaHsd (ERP000034)
o 129S1/SvImJ (ERP000035)
o 129S5SvEvBrd (ERP000036)
o A/J (ERP000038)
o AKR/J (ERP000037)
o BALB/cJ (ERP000039)
o C3H/HeJ (ERP000040)
o C57BL/6NJ (ERP000041)
o CAST/EiJ (ERP000042)
o CBA/J (ERP000043)
o DBA/2J (ERP000044)
o FVB/NJ (ERP000687)
o LP/J (ERP000045)
o NOD/ShiLtJ (ERP000046)
o NZO/HlLtJ (ERP000047)
o PWK/PhJ (ERP000048)
o SPRET/EiJ (ERP000049)
o WSB/EiJ (ERP000050)
http://www.sanger.ac.uk/resources/mouse/genomes/
Bioinformatics and statistics
EXAMPLE of SOLUTION:
R is a freely available language and environment for statistical computing and graphics which provides a
wide variety of statistical and graphical techniques: linear and nonlinear modelling, statistical tests, time
series analysis, classification, clustering, etc.
q POSSIBILITIES :
o Quality control of sequencing reads
o Data handling and visualization
o Genomic mapping
o Statistical concepts for data analysis
o RNA-seq data analysis
o ChIP-seq data analysis
o Functional analyses
REFERENCE
• Myší Genom – struktura-funkce, analýza genomickýckých dat
ü Jean-Louis Guenet (2005): The mouse genome, Genome Research, 15:1729-1740
ü  Lee M. Silver (1994): Mouse Genetics, Oxford Univ. Press
http://www.informatics.jax.org/silverbook
ü  M.Cline, J.Kent (2009): Understanding genome browsing, Nature biotechnology,
27:153-155.
ü Eric S. Lander (2011): Initial impact of the sequencing of the human genome. Nature,
470: 187-197. Review.
ü Next-generation sequencing of experimental mouse strains. Mammalian genome :
official journal of the International Mammalian Genome Society 2012;23;910;490-8
WEB sites: Myší genom struktura - funkce a bioinformatika
q 
q 
q 
q 
q 
q 
JAX
Ensembl
NCBI
UCSC
Sanger Inst.
IMG-MMG
http://jaxmice.jax.org/
http://www.ensembl.org/
http://www.ncbi.nlm.nih.gov/
http://genome.ucsc.edu/
http://www.sanger.ac.uk/resources/mouse/genom
http://www.img.cas.cz/mmg/
Příklady bioinformatických úkolů a programů pro jejich řešení:
http://www.broadinstitute.org/scientific-community/software?page=1
q  Annotation
- Ensembl, Artemis, Eponine, Argo, GeneCruiser
q  Alignment to genome – Bowtie, TopHat, BLAST, BLAT, Trinity
q  Whole-genome assembly - SSAHA, SMALT, Arachne, Allpaths, Vicuna
q  Gene expression
- Gene Pattern
q  RNA-seq
- Trinity, Inchworm
q  ChIP-seq
- EdgeR=Bioconductor R-package
q  RNAi
- GenE, GenePattern
q  Phylogenetic Analysis - Tree Chopper
Download

Prednaska 2_2014.pdf - Laboratory of Mouse Molecular Genetics