Информации

Механизам на ретротранспозиција - биологија

Механизам на ретротранспозиција - биологија


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Иако механизмот на ретротранспозиција не е целосно разбран, јасно е дека се користат најмалку две ензимски активности. Едниот е ан интеграза, која е ендонуклеаза која се расцепува на местото на интеграција за да генерира a влечкаат пауза (Слика 9.17). Другата е РНК-зависна ДНК полимераза, исто така наречена реверзна транскриптаза. Овие активности се кодирани во некои автономни ретротранспонзони, вклучувајќи ги и LTR-ретротранспозоните како што се ретровирусни провируси и не-LTR-ретротранспонзони како што се LINE1 елементите.

Слика 9.17. Транспозиција преку РНК-посредник во ретротранспозоните. LINE1, или L1 повторувањата се прикажани како пример.

На РНК транскрипт на транспонираниот елемент е во интеракција со местото на расцепување на целното место на ДНК. Една нишка на ДНК на расцепеното место на интеграција служи како прајмер за реверзна транскриптаза. Оваа ДНК полимераза потоа ја копира РНК во ДНК. Таа cDNA копија на ретротранспонзонот мора да се конвертира во двојно верижен производ и да се вметне на скалесто прекин на целното место. Ензимите потребни за спојување на обратниот транскрипт (првата влакно од новата копија) до другиот крај на скалестата пауза и за синтезата на втората жичка сè уште не се воспоставени. Можеби се користат некои функции за поправка на клеточната ДНК.

Моделот прикажан на Слика 9.17 е конзистентен со која било РНК која служи како шаблон за синтеза на cDNA од скалестата пауза. Сепак, LINE1 mRNA јасно се користи многу почесто од другите РНК. Основата за претпочитање на машината за ретротранспозиција за LINE1 mRNA сè уште се проучува. Можеби ендонуклеазата и реверзната транскриптаза остануваат поврзани со mRNA што ги кодира по завршувањето на транслацијата, така што тие дејствуваат во цисво однос на LINE1 mRNA. Други повторувања кои се проширија неодамна, како на пр Алусе повторува кај луѓето, може да споделува детерминанти на секвенцата со LINE1 mRNA за ова циспредност.

Јасни докази дека ретротранспозоните можат да се движат преку РНК посредник дојдоа од студиите на квасецот Ty-1елементи од Џералд Финк и неговите колеги. Тие поставија одредена Ty-1елемент, наречен TyH3под контрола на А ГАЛпромотор, така што неговата транскрипција (и транспозиција) може да се индуцира со додавање на галактоза во медиумот. Обележаа и TyH3со интрон. По индуцирање на транскрипција на TyH3, дополнителни копии беа пронајдени на нови локации во сојот од квасец. Кога тие беа структурно испитани, беше откриено дека интронот е отстранет. Ако транскриптот на РНК е посредник во движењето на Ty-1елемент, тој е подложен на спојување и интронот може да се отстрани. Оттука, овие резултати одговараат на предвидувањето на транспозиција посредувана од РНК. Тие демонстрираат дека при транспозиција, протокот на Ty-1информациите за секвенцата се од ДНК до РНК до ДНК.

Вежбајте

Ако квасецот Ty-1 движејќи се со механизмот илустриран за репликативна транспозиција со посредство на ДНК на Слика 9.13, што би било предвидено во експериментот штотуку наведен? Исто така, дали очекувате зголемување на транспозицијата кога е индуцирана транскрипцијата?


Резиме

27 јуни 1970 година беше значаен ден за нашето разбирање и за протокот на информации во биолошките системи и за еволуцијата на еукариотските геноми бидејќи ова беше денот кога Природата објавени трудови еден до друг во кои се известува за откривање на ензим кој ја копира РНК во ДНК. Ова набрзо стана познато како реверзна транскриптаза и РНК туморските вируси кај кои беше откриен беа преименувани во ретровируси. Сознанието дека ретровирусите можат да ја претворат својата геномска РНК во ДНК обезбеди пат преку кој тие би можеле да се интегрираат во хромозомите на заразените клетки како што предложија Хауард Темин и неговите колеги неколку години претходно. Во тоа време се мислеше дека способноста за копирање на РНК во ДНК ќе биде ограничена на ретровирусите. Еден од позачудувачките резултати на секвенционирањето на ДНК на целиот геном е откритието дека еукариотите можат да имаат повеќе гени на обратна транскриптаза отколку гени кои кодираат за кој било друг протеин, и дека најголемата поединечна компонента од многу еукариотски геноми е генерирана со обратна транскрипција.


Ретротранспонзони

Дистрибуција и еволуција

Ретротранспонзоните се наоѓаат кај сите еукариоти, но не и кај прокариотите. Постои директна корелација помеѓу големината на еукариотскиот геном и изобилството, но не и типот на ретротранспонзони. На пример, 3% од малиот геном на квасец е составен од ретротранспонзони, кои се сите од класата LTR. Многу поголемиот човечки геном е над 30% ретротранспонзони, претежно од класата не-LTR. Конечно, 75% од уште поголемиот геном на пченка се ретротранспонзони, претежно од класата LTR.

Ретротранспозоните обично воспоставуваат долгорочни асоцијации со геномот на домаќинот. Ова се разликува од транспозоните за кои се верува дека се активни само кратко време во кој било геном и се зависни од хоризонталните трансфери помеѓу видовите за нивниот долгорочен опстанок. Доминантното вертикално (преку герминалната линија) наследување на ретротранспозоните е најизразено кај елементите кои не се LTR. L1 елементите полека се акумулираат во текот на 100-милионската историја на геномите на цицачите. Елементите R2 се стабилни компоненти на геномите на членконогите повеќе од 500 милиони години. Се верува дека овие стабилни односи на ретротранспонзоните со геномот на домаќинот доведоа до развој на специјализирани стратегии за вметнување. Сите ретротранспонзони во квасецот се вметнуваат или во хетерохроматин или веднаш нагоре од tRNA гените, каде што не се мешаат во експресијата на гените на домаќинот. Слично на тоа, различни ретротранспонзони во членконогите се вметнуваат на специфични локации во гените на rRNA или теломерните секвенци на нивниот домаќин.

Долгорочната врска помеѓу ретротранспозоните и геномот на домаќинот го покренува прашањето што го контролира нивниот број на копии и дали тие имаат позитивни, но и негативни ефекти врз геномот. Мобилните елементи се предложени да обезбедуваат варијации во низата што би можеле да им овозможат на домаќините брзо да се развиваат. Од друга страна, прекумерниот број на овие елементи кај многу видови укажува на непотребно непочитување на благосостојбата на геномот на домаќинот. Голем број на еукариоти развиле сложени механизми во обидите да ги елиминираат или замолчат овие елементи. Останува многу да се разбере за оваа „трка на молекуларно вооружување“.


Содржини

Првиот опис на приближно 6,4 kb долга секвенца изведена од LINE беше објавен од J. Adams et al. во 1980 година. [10]

Врз основа на структурните карактеристики и филогенијата на неговиот клучен ензим, реверзната транскриптаза (RT), ЛИНИТЕ се групирани во пет главни групи, наречени L1, RTE, R2, I и Jockey, кои можат да се поделат на најмалку 28 клади. [11] (сл. 1)

Во геномите на растенијата, досега се пријавени само ЛИНИИ од кладата L1 и RTE. [12] [13] [14] Додека L1 елементите се диверзифицираат во неколку подклади, RTE-типот LINE се високо зачувани, често сочинуваат едно семејство. [15] [16]

Кај габите, идентификувани се Tad, L1, CRE, Deceiver и Inkcap-како елементи, [17] при што елементите слични на Tad се појавуваат исклучиво во габичните геноми. [18]

Сите линии кодираат барем еден протеин, ORF2, кој содржи RT и ендонуклеазен домен (EN), или N-терминален APE или C-терминален RLE или ретко и двата. Повремено е присутен рибонуклеазен H домен. Освен за еволутивните древни суперфамилии R2 и RTE, LINE-ите обично кодираат за друг протеин наречен ORF1, кој може да содржи Gag-nuckle, RRM сличен на L1 (InterPro: IPR035300), и/или естераза. Елементите на ЛИНИЈА се релативно ретки во споредба со LTR-ретротранспозоните кај растенијата, габите или инсектите, но се доминантни кај 'рбетниците и особено кај цицачите, каде што претставуваат околу 20% од геномот. [11] (сл. 1)

L1 елемент Уреди

Елементот LINE-1/L1 е еден од елементите кои се уште се активни во човечкиот геном денес. Го има кај сите цицачи [19] освен мегабатите. [20]

Други елементи Уреди

Во човечкиот геном се наоѓаат остатоци од L2 и L3 елементи. [8] Се проценува дека елементите L2 и L3 биле активни

Пред 200-300 милиони години. За разлика од L1 елементите, на L2 елементите им недостигаат дупликации на страничните целни локации. [21] Елементите L2 (и L3) се во истата група како и CR1 кладата, Џоки. [22]

Во човечки Уредување

Во првиот нацрт на човечкиот геном, фракцијата од ЛИНИЧКИ елементи на човечкиот геном беше дадена како 21%, а нивната копија број 850.000. Од нив, L1, L2 и L3 елементите сочинуваа 516.000, 315.000 и 37.000 примероци, соодветно. Неавтономните SINE елементи кои зависат од L1 елементите за нивната пролиферација сочинуваат 13% од човечкиот геном и имаат број на копии од околу 1,5 милиони. [8] Тие веројатно потекнуваат од семејството на ЛИНИИ RTE. [23] Неодамнешните проценки покажуваат дека типичниот човечки геном содржи во просек 100 L1 елементи со потенцијал за мобилизација, но сепак постои прилично голема количина на варијации и некои поединци може да содржат поголем број активни L1 елементи, што ги прави овие поединци повеќе склони кон L1- индуцирана мутагенеза. [24]

Зголемен број на копии на L1, исто така, е пронајден во мозокот на луѓето со шизофренија, што покажува дека елементите на ЛИНИЈА може да играат улога во некои невронски болести. [25]

LINE елементите се шират со таканаречениот механизам за обратна транскрипција со целна подготовка (TPRT), кој првпат беше опишан за елементот R2 од свилената буба Бомбикс мори.

Протеините ORF2 (и ORF1 кога се присутни) примарно се поврзуваат во cis со нивната кодирачка mRNA, формирајќи рибонуклеопротеински комплекс (RNP), најверојатно составен од два ORF2 и непознат број на ORF1 тримери. [26] Комплексот се транспортира назад во јадрото, каде што доменот на ендонуклеазата ORF2 ја отвора ДНК (на TTAAAA хексануклеотидните мотиви кај цицачите [27] ). Така, 3'OH група е ослободена за реверзна транскриптаза да ја прими реверзната транскрипција на транскриптот LINE RNA. По обратната транскрипција, целната нишка се расцепува и новосоздадената cDNA е интегрирана [28]

Новите вметнувања создаваат кратки TSD, а поголемиот дел од новите инсерти се сериозно скратени 5' (просечна големина на влошката од 900 pb кај луѓето) и често превртени (Szak et al., 2002). Бидејќи им недостигаат 5'UTR, повеќето нови инсерти се нефункционални.

Се покажа дека клетките домаќини ја регулираат активноста на ретротранспозиција на L1, на пример преку епигенетско замолчување. На пример, механизмот на интерференција на РНК (РНКи) на малите интерферентни РНК добиени од Л1 секвенците може да предизвика супресија на ретротранспозицијата на Л1. [29]

Во геномите на растенијата, епигенетската модификација на ЛИНИИ може да доведе до промени на изразот на блиските гени, па дури и до фенотипски промени: во геномот на маслената палма, метилацијата на ЛИНИЈА од типот Карма лежи во основата на сомаклоналната, „обложена“ варијанта на ова растение, одговорна за драстично губење на приносот. [30]

Пријавено е ограничување на LINE-1 посредувано од човечко APOBEC3C и тоа се должи на интеракцијата помеѓу A3C со ORF1p што влијае на активноста на реверзната транскриптаза. [31]

Историски пример за L1-доделена болест е хемофилија А, која е предизвикана од вметната мутагенеза. [32] Постојат речиси 100 примери на познати болести предизвикани од вметнување на ретроелемент, вклучувајќи некои видови на рак и невролошки нарушувања. [33] Пријавена е корелација помеѓу мобилизацијата на L1 и онкогенезата за рак на епителните клетки (карцином). [34] Хипометилацијата на LINES е поврзана со хромозомска нестабилност и изменета генска експресија [35] и се наоѓа во различни типови на канцерогени клетки во различни типови ткива. [36] [35] Хипометилацијата на специфичен L1 лоциран во генот МЕТ онко е поврзана со туморогенезата на ракот на мочниот меур, [37] Нарушувањето на спиењето при работа во смени [38] е поврзано со зголемен ризик од рак бидејќи изложувањето на светлина ноќе го намалува мелатонин, хормон што се покажа дека ја намалува L1-индуцираната нестабилност на геномот. [39]


Пристап до документ

  • APA
  • Стандарден
  • Харвард
  • Ванкувер
  • Автор
  • BIBTEX
  • RIS

Резултат од истражувањето: Придонес во списанието › Статија › рецензија

Т1 - Механизми за ретротранспозиција

N2 - Дискутирани се неодамнешните случувања во областа на механизмите за транспозиција што ги користат ретротранспозоните и сродните ретровирусни патишта. Конкретно, се разгледуваат напредокот во областите на ретротранспоронската генска експресија, склопување на честички слични на вирусот, обратна транскрипција и интеграција.

AB - Дискутирани се неодамнешните случувања во областа на механизмите за транспозиција што ги користат ретротранспозоните и сродните ретровирусни патишта. Конкретно, се разгледуваат напредокот во областите на ретротранспоронската генска експресија, склопување на честички слични на вирусот, обратна транскрипција и интеграција.


Мешање во ретротранспозиција од два типа CRISPR ефектори: Cas12a и Cas13a

CRISPRs се ветувачка алатка што се истражува во борбата против егзогените ретровирусни патогени и во оневозможувањето на ендогени ретровируси за трансплантација на органи. Системите Cas12a и Cas13a нудат нови механизми на CRISPR дејства кои не се оценети за интерференција на ретровирус. Посебно, најновата студија откри дека активираниот Cas13a им обезбедува на бактериските домаќини механизам за „пасивна заштита“ за одбрана од инфекција со ДНК фаг со индуцирање запирање на растот на клетките во заразените клетки, што е особено значајно бидејќи дава Cas13a, ефектор CRISPR насочен кон РНК. , со монтирана одбрана и од напаѓачите на РНК и ДНК. Овде, со ремонтирање на долгиот терминален повторувачки ретротранспозон Tf1 како модел систем, кој дели заеднички карактеристики со ретровирусот во однос на нивниот механизам за репликација и животниот циклус, ги пренаменивме CRISPR-Cas12a и -Cas13a за да се мешаат со Tf1 ретротранспозицијата и ги проценивме нивните различни механизми на дејство. Cas12a покажа силна инхибиција на ретротранспозиција, овозможувајќи маргинална транспозиција на Tf1 што веројатно е резултат на траен базен на Tf1 RNA/cDNA посредници заштитени во честички слични на вирусот. Сепак, преостанатите активности беа целосно елиминирани со нови конструкции за упорно таргетирање на crRNA. Од друга страна, насочувањето на Cas13a кон Tf1 RNA посредниците значително ја инхибираше Tf1 ретротранспозицијата. Сепак, за разлика од бактериските домаќини, одржливото активирање на Cas13a со Tf1 транскрипти не предизвика запирање на растот на клетките кај S. pombe, што укажува дека Cas13a активираниот од вирусот веројатно дејствувал поинаку во еукариотските клетки. Студијата доби увид во дејствата на новите CRISPR механизми во борбата против ретровирусни патогени и воспостави системски параметри за развој на нови стратегии за третман на болести поврзани со ретровирус.

Клучни зборови: Клеточна биологија Молекуларна биологија.

Изјава за конфликт на интереси

Конфликт на интереси Авторите изјавуваат дека немаат конфликт на интереси.

Фигури

Сл. 1. Имплементација на системот за уредување Cas12a…

Сл. 1. Имплементација на системот за уредување Cas12a во S. pombe и уредување на MEL1 ген.

Сл. 2. Дизајн и изградба на Tf1-спојување…

Сл. 2. Дизајн и изградба на Tf1-спојувачки репортер систем за ретротранспозиција.

Сл. 3. Интерференција на Tf1 ретротранспозиција од…

Сл. 3. Интерференција на Tf1 ретротранспозиција од CRISPR-Cas12a.

Сл. 4. Продолженото таргетирање на crRNA ги елиминира преостанатите…

Сл. 4. Продолженото таргетирање на crRNA ја елиминира преостанатата ретротранспозиција на Tf1 со Cas12a.

Сл. 5. Мешање со ретротранспозиција на Tf1 со…

Сл. 5. Мешање во ретротранспозиција на Tf1 со CRISPR-Cas13a преку таргетирање на неговите РНК посредници.


Пристап до документ

  • APA
  • Стандарден
  • Харвард
  • Ванкувер
  • Автор
  • BIBTEX
  • RIS

Резултат од истражувањето: Придонес во списанието › Статија › рецензија

Т1 - Механизми за ретротранспозиција

N2 - Дискутирани се неодамнешните случувања во областа на механизмите за транспозиција што ги користат ретротранспозоните и сродните ретровирусни патишта. Конкретно, се разгледуваат напредокот во областите на ретротранспоронската генска експресија, склопување на честички слични на вирусот, обратна транскрипција и интеграција.

AB - Дискутирани се неодамнешните случувања во областа на механизмите за транспозиција што ги користат ретротранспозоните и сродните ретровирусни патишта. Конкретно, се разгледуваат напредокот во областите на ретротранспоронската генска експресија, склопување на честички слични на вирусот, обратна транскрипција и интеграција.


Биологија на ретротранспонзони L1 на цицачи

АпстрактL1 ретротранспозоните сочинуваат 17% од човечкиот геном. Иако повеќето L1 се неактивни, некои елементи остануваат способни за ретротранспозиција. L1 елементите имаат долга еволутивна историја која датира од почетоците на еукариотското постоење. Иако многу аспекти на нивниот механизам за ретротранспозиција остануваат слабо разбрани, тие веројатно се интегрираат во геномската ДНК со процес наречен обратна транскрипција со целна практична форма. L1 ги обликувале геномите на цицачите преку голем број механизми. Прво, тие во голема мера го проширија геномот и со сопствената ретротранспозиција и со обезбедување на машинеријата неопходна за ретротранспозиција на други мобилни елементи, како што е Alus. Второ, тие ја измешаа не-L1 секвенцата низ геномот со процес наречен трансдукција. Трето, тие влијаеле на генската експресија со голем број механизми. На пример, тие повремено се вметнуваат во гените и предизвикуваат болест и кај луѓето и кај глувците. Елементите L1 се покажаа корисни како филогенетски маркери и може да најдат други практични примени во откривањето на гените по вметната мутагенеза кај глувците и во испораката на терапевтски гени.


Дополнителни отворени рамки за читање во LTR ретротранспонзони

Иако ретротранспон замолчени и пол Се верува дека гените се неопходни и доволни за транспонирање, сега се идентификувани голем број ретротранспозонски семејства со аберантни геномски организации (Слика 3). Една честа структурна промена е додавањето на информации за кодирање.

Ретротранспонзони со 'завист-како гени

Една од главните разлики помеѓу ретротранспозоните (со целосно интрацелуларен животен циклус) и нивните заразни ретровирусни роднини е присуството на плик (env) ген во вториот, кој овозможува вирусна честичка да инфицира друга клетка. Голем број на ретроелементи имаат дополнителен ORF во иста позиција како и завист ген пронајден во геномите на ретровирус (Слика 3). Најдобро карактеризираните примери за завист-содржат ретроелементи се Дрософила ерантивируси, вклучувајќи цигански и ЗАМ [9, 10]. Животниот циклус на овие елементи е детално испитан и цигански се покажа дека е заразна [11, 12].

Присуството на ан завист генот во ретроелементот не е ограничен само на ерантивирусите геномските студии го открија тоа завист-како ORFs се широко распространети меѓу ретротранспонзоните и во двете Pseudoviridae (сиревируси) и Метавириди (ерантивируси, метавируси и семотивируси) [13, 14]. Елементи кои содржат ан завист-како ORF во секоја од овие лоза, исто така, потекнуваат од различни видови домаќини. Ретроелементот неодамна покажа дека има завист-како ORF, Будика, е метавирус од човечка крвна трепка [15]. Други примери на метавируси вклучуваат Атила елементи, кои претставуваат голем дел од ретроелементите во Арабидопсис [16]. Во сродниот елемент во јачменот, Баги-2, на завист-како препис е споен, слично на завист транскрипти на ретровирусите [17]. Членовите на групата сиревируси сочинуваат половина од приближно 400-те Pseudoviridae секвенци присутни во GenBank, и од нив, околу една третина имаат ан завист-како ORF (X.G. и D.V., необјавено набљудување). Семотивируси (исто така наречени BEL ретротранспонзони) со завист-како ORFs исто така се опишани во геномите на нематоди, како и кај пуфер рибите и Дрософила [18, 19].

Дали протеините слични на Env овозможуваат овие различни ретроелементи да станат заразни? Во неколку случаи, на завистСе покажа дека гените слични по редоследот се значително слични со гените на различни вируси, што сугерира дека тие се стекнати со ретротранспонзони преку трансдукција на клеточен ген [13]. Освен за некои ерантивируси, каде што протеинот сличен на Env е вмешан во инфекција, функцијата на протеините слични на Env останува нејасна. Амино-киселинските секвенци на овие протеини се многу дивергентни, што го отежнува проценувањето дали тие имаат заедничка функција или не. Сепак, многу протеини слични на Env имаат предвидени трансмембрански домени (како ретровирусни Env протеини), иако ова не е универзална карактеристика. Можно е ретровирусна активност да еволуирала неколку пати во историјата на ретротранспонзоните или дека овие гени може да донесат нови функции, како што е движењето помеѓу ткивата на организмот (како што е предложено за цигански елементи) или движење во клетките (како помеѓу цитоплазмата и јадрото). Алтернативно, протеините слични на Env би можеле да послужат како протеински капери за да ја олеснат репликацијата. Потребни се функционални студии за да се согледаат биолошките улоги на овие интересни гени.

Други дополнителни ORFs

Други нови региони за кодирање се исто така идентификувани во различни ретротранспонзони, но не е јасно колку широко се зачувани овие секвенци за кодирање. На пример, РИРЕ2 на ориз - метавирус - има мал ORF со непозната функција возводно од него замолчени ген [20]. Некои растителни ретротранспонзони носат ORF(и) кои се антисенс на транскриптот на геномската РНК (слика 3), вклучувајќи ги и метавирусите РИРЕ2 од ориз и Гранде1 пченка [21, 22]. Функциите на антисенс ОРФ се исто така непознати. Во неколку случаи, ретротранспонзоните имаат стекнато секвенци кои веројатно немаат никаква улога во животниот циклус на елементите. На Bs1 ретротранспозон на пченка, на пример, има трансдуцирано клеточна генска секвенца - во овој случај дел од ген што кодира АТПаза [23, 24].


Материјали и методи

Откривање на вметнување на ретрокопија на ген од мапирани спарени крајни читања

Спарените крајни отчитувања се состојат од две секвенци на ДНК кои граничат со внатрешен несеквенциониран регион. Со оглед на просечната големина на вметнувањето на библиотеката за секвенционирање и локациите во однос на референтниот геном каде што двата краја на спарениот краен фрагмент мапа, пар пресликувања се нарекуваат усогласени ако секвенционираните краеви се мапираат со референтниот геном во интервал и ориентација компатибилен со конструкцијата на библиотеката. Спротивно на тоа, пар мапирања се нарекуваат несогласни ако спарените краеви се пресликани премногу оддалечени или во погрешна ориентација во однос на референтниот геном на кој се мапирани. Со оглед на доволна длабочина на читање и договор помеѓу повеќекратни спарени отчитувања, несогласните парови за читање може да содржат информации за преуредувањата на геномот во однос на референцата ако преуредувањата донесат две делови од геномот во близина кои се оддалечени еден од друг во референтниот геном. Овде, ние користиме нескладни мапирања за читање за да откриеме GRIP со наоѓање на повеќе несогласни мапирања што ги поврзуваат егзонските секвенци со конзистентна локација оддалечена од егзоните. Се однесуваме на геномот или геномите од кои е генерирана и анализирана библиотека за секвенционирање како геном за барање. За некој регион на хромозомот, ако секвенцата на бараниот геном се совпаѓа со секвенцата на референтниот геном, читаните парови мапирани на тој регион ќе бидат усогласени како што е прикажано во нормалното мапирање на слика 1. Алтернативно, ако регион во бараниот геном содржи структурна варијанта (вметнување, инверзија на бришење и така натаму) во однос на референцата, некои или сите читани парови што се пресликуваат на таа локација може да бидат несогласни. Слика 1, исто така, го демонстрира моделот на несогласни мапирања што укажуваат на вметнување на генска ретрокопија во геномот за барање. Со цел самоуверено да се предвиди присуството на генска ретрокопија во бараниот геном или геномите, потребни ни се најмалку осум различни мапирања помеѓу изворниот ген и неговата локација на вметнување, со најмалку две пресликувања кои го опфаќаат секој спој. Хемијата за секвенционирање на Illumina дава спарени читања каде првото читање во парот е секвенционирано на горната жичка, а второто читање е секвенционирано на долната жичка, така што првото читано се мапира до горната (+) влакно на референтниот геном, а втората читајте мапи до дното (-) на референтниот геном. Со оглед на ова својство, мапирањето на читањата на 5' страна на предвиденото место за вметнување мора да биде на горната жичка, а отчитувањата на 3' страната на локацијата мора да бидат на долната жичка. Слично на тоа, мапирањата на самите несогласни читања мора да бидат конзистентни со оваа шема. Исто така, бараме мапирањето на читањата на изворниот ген да одговара на најмалку два различни егзони. Дополнително, ги филтрираме наводните места за вметнување каде што локацијата се наоѓа во регион на геномот што содржи забележан или неозначен псевдоген. Незабележаните псевдогени се утврдуваат со споредување на местото на вметнување +/- 500 bp со остатокот од референтниот геном користејќи BLAT [76]. Овој метод (GRIPper) беше имплементиран во Python користејќи pysam [77] и е достапен од github [78]. Архивска верзија на софтверот е исто така достапна како дополнителна датотека 4, но предлагаме да ја користите најсовремената верзија преку github.

Утврдување на точката на прекин од меко исечени читања

Многу од човечките примероци анализирани во оваа студија беа мапирани со помош на bwa [79], што овозможува дел од читањето да се усогласи сè додека секвенцата на семето ги исполнува минималните критериуми за несовпаѓање. Непорамнетиот дел од овие пресликувања е означен како меко исечен. Ова обезбедува практично средство за проверка на точките на прекин со барање конзистентни краеви на прекин што одговараат на 5' и 3' спојките на вметната генска ретрокопија. Умножувањето на целните локации се утврдува со пребарување на кореспонденција помеѓу секвенците од двете страни на точката на прекин.

Склопување на локална секвенца за да се идентификуваат ексон-егзонските спојки

Со цел да се идентификуваат ексон-егзонските спојки кои се присутни во вметнати секвенци за ретрокопирање на обработени гени, применивме стратегија за локално склопување во две фази. Прво, прочитајте ги паровите што мапираат во рок од 500 bp од предвиденото место за вметнување што се неусогласени, закотвени на еден крај (чита каде што не е мапирано партнерот), или имаат барем едно читање во парот што е меко исечено, се користат како влез до асемблер за кратко читање. За прв обид за склопување, користиме Velvet [80] со a к-мерна големина од 31, опцијата shortPaired за да се означи дека прочитаните се спарени и должината на вметнувањето од 300. Добиените контиги се порамнети назад кон референтниот геном со помош на BLAT [76] за да се идентификуваат читањата кои мапираат на егзонски секвенци што одговараат на изворот ген и без усогласување со интервентните интрони (споени порамнувања). Поголемиот дел од спојките се констатирани во овој прв чекор со помош на Velvet кој користи де Бруински графикони за водење на склопувањето. Второ, неусогласените, закотвени со еден крај и меко исечените отчитувања што одговараат на преостанатите вметнувања за кои не беше очигледна врската на егзон-ексон, потоа беа составени со помош на PRICE [81], што користи стратегија за склопување на сеење и проширување , и порамнето назад кон референцата за да се идентификуваат споени споеви. Извршивме PRICE за 20 циклуси користејќи ги закотвените парови за читање (оние кои се мапираат уникатно во близина на местото за вметнување на генската ретрокопија) како секвенци на семето.

Симулација на нови вметнувања на ретрокопија на гени

Ретрогените вметнувања беа симулирани со додавање на вметнувања на споени, полиаденилирани mRNA транскрипти на примерокот TCGA-60-2711-11 (LUSC-2711 Normal) со помош на bamsurgeon [82]. Bamsurgeon може да додаде структурни варијанти (вклучувајќи вметнувања) на постоечките BAM-датотеки преку локално склопување проследено со модификација на собраната контиг, симулација на спарено покривање за читање (100 спарени крајни базни парови со 300 безсеквенционирани базни парови за вметнување), престројување и замена во оригиналот БАМ. Додадовме вкупно 2.000 вметнувања од 200 различни обработени mRNA (Табела S11 во дополнителна датотека 1) во LUSC-2711 и го намаливме примерокот на добиениот BAM од 60× просечна покриеност на 40×, 30×, 20×, 10× и 5 × користејќи DownSampleSam, дел од пакетот комунални услуги на Picard [83]. Го користевме GRIPper за да ги откриеме обработените мРНК со шилести за да ги оцениме карактеристиките на откривање. При покривање 60× добивме совршена прецизност и отповикување од 0,751 (1.501 вистински позитивни и 499 лажни негативни без лажни позитиви). Како што се очекуваше, отповикувањето се намалува со намалување на покриеноста (Табела S10 во дополнителната датотека 1). Општо земено, лажните негативни резултати се должат на гените од еден егзон (на пример, OR7G2) при висока покриеност и главно поради недоволна поддршка за читање при мала покриеност. Со оглед на тоа што комбиниравме читања од туморски и нормални геноми за сите примероци TCGA во оваа студија, кои имаат покриеност од 30× или повеќе, беше направено откривање на вметнувања на герминативните линии на примероци со ефективна покриеност од 60× или поголема.

Идентификување на вметнувања на генска ретрокопија вклучени во склопот на референтниот геном

GRIP-овите во референтниот геном што не се присутни кај други поединци ќе се појават како бришења во однос на референцата. За да ги откриеме, ги вкрстивме податоците за бришење од проектот 1.000 геноми [34, 57] со псевдогени прибелешки од GENCODE/ENCODE [84] и Јеил [1]. Бришењето беа добиени во формат на варијантен повик од 1.000 Genomes Project FTP серверот, а псевдогените прибелешки беа добиени од UCSC Genome Browser [85] и од човечката структура на pseudogene.org 65 [3]. За да овозможиме повторувачки секвенци во генските UTRs, дозволивме бришењето да опфати регион до три пати поголем од опкружената псевдогенска прибелешка. Исто така, баравме хомологија помеѓу избришаната секвенца и изворниот ген на означениот псевдоген. Списокот на GRIP-и утврдени на овој начин е вклучен во дополнителната датотека 1 (табела S7 во дополнителната датотека 1), од кои два одговараат на обработените полиморфизми за бришење на псевдогените (псевдокопии од GCSH и ITGB1) споменати во претходната студија [17].

Стратегија за нископропусни геномска секвенца податоци и тумор/нормални парови

Со цел да се утврдат местата за вметнување од голема колекција на геноми секвенционирани со ниска (2× до 5×) покриеност или да се обезбеди максимална чувствителност во утврдувањето на вметнувања специфични за ракот, комбинираме податоци низ повеќе примероци. Ова се постигнува едноставно со извлекување несогласни читања каде што едниот крај се мапира на егзон, а другиот крај на друго место во референтниот геном од секој геном од интерес, и анализирање на споениот сет на несогласни читања масовно притоа следејќи го идентификаторот на примерокот поврзан со секој нескладен пар на мапирани читања. Кога се повикуваат вметнувања, сите геноми кои придонесуваат за читање на повикот се смета дека го имаат вметнувањето.

Пресметување покриеност на генски прибелешки

Со цел да се тестира за збогатување или исцрпување на вметнувањата на генската ретрокопија во однос на прибелешките на гените, мора да имаме точна бројка за тоа колку од склопот на референтниот геном е покриен со множеството користени прибелешки. И за луѓето и за глувчето, користевме UCSC гени [86]: човечка верзија 5 и верзија на глушец 5. Од верзии на овие забелешки форматирани во BED, алатката bedCoverage од изворните услуги на Кент беше искористена за пресметување на делот од опфатениот геном. За да го пресметаме збогатувањето, извршивме тест за пропорции од еден примерок со корекција на континуитет користејќи ја функцијата prop.test во R [87].

Пресметување растојание помеѓу GRIP профилите

Растојанието на Џакард [52] е дефинирано како:

каде А и Б се множества на вметнувања на генска ретрокопија за два генома.



Коментари:

  1. Crichton

    Great answer :)

  2. Woolsey

    And the Swiss, and the reaper, and in general, fucked up. The most amazing thing about pop singers is that they sing with their mouths in the same way ... Fresh food, but it is hard to fight What you warm on your chest, it will sizzle all your life. It is very easy to make a woman happy. Only expensive. Nothing warms the soul like cold beer ...

  3. Tojataxe

    Штета што сега не можам да се изразам - нема слободно време. Ќе бидам ослободен - нужно ќе го изразам мислењето за ова прашање.

  4. Yozshut

    Целосно го споделувам вашето мислење. Ова е добра идеја. Јас те поддржувам.

  5. Maitland

    the very quick answer :)

  6. Khayyat

    Секако. И налетав на ова. Можеме да комуницираме на оваа тема. Овде или во PM.

  7. Simson

    Wonderful, this is a very valuable answer



Напишете порака