Связанные понятия
Предсказание генов — это определение кодирующих и регулирующих последовательностей ДНК в геноме: белковых генов и генов функциональной РНК, промоторов, энхансеров и прочее.
Секвенирование спаренных концов — один из методов секвенирования ДНК нового поколения, основанный на получении и секвенировании библиотеки спаренных концевых фрагментов (англ. paired-end tags, PET), в которой короткие 5’- и 3’- концевые участки фрагментов ДНК/кДНК соединены друг с другом.
Моти́в в молекулярной биологии — относительно короткая последовательность нуклеотидов или аминокислот, слабо меняющаяся в процессе эволюции и, по крайней мере предположительно, имеющая определённую биологическую функцию.
Сайт рестрикции (участок узнавания) — короткая последовательность нуклеотидов в молекуле ДНК, которая распознаётся ферментом эндонуклеазой рестрикции-модификации (рестриктазой). Рестриктаза связывается с молекулой ДНК в точке расположения сайта рестрикции и перерезает цепочку нуклеотидов внутри сайта или в непосредственной близости от него.
Сборка генома — процесс объединения большого количества коротких фрагментов ДНК (ридов) в одну или несколько длинных последовательностей (контигов и скаффолдов) в целях восстановления последовательностей ДНК хромосом, из которых возникли эти фрагменты в процессе секвенирования.
Амплификация (лат. amplificatio — усиление, увеличение), в молекулярной биологии — процесс образования дополнительных копий участков хромосомной ДНК, как правило, содержащих определённые гены либо сегменты структурного гетерохроматина. Амплификация может быть ответом клеток на селективное воздействие (например, при действии метотрексата). Амплификация — один из механизмов активации онкогенов в процессе развития опухоли, например, онкогена N-myc при развитии нейробластомы. Также амплификация — накопление...
Интеракто́м (англ. Interactome) — термин молекулярной биологии, обозначающий полный набор взаимодействий между молекулами в отдельной клетке. Интерактом включает как непосредственные физические контакты между белками (белок-белковые взаимодействия), так и непрямые взаимодействия генов (например, эпистаз).
Мно́жественное выра́внивание после́довательностей (англ. multiple sequence alignment, MSA) — выравнивание трёх и более биологических последовательностей, обычно белков, ДНК или РНК. В большинстве случаев предполагается, что входной набор последовательностей имеет эволюционную связь. Используя множественное выравнивание, можно оценить эволюционное происхождение последовательностей, проведя филогенетический анализ.
Метод дробовика (англ. Shotgun sequencing) — метод, используемый для секвенирования длинных участков ДНК. Суть метода состоит в получении случайной массированной выборки клонированных фрагментов ДНК данного организма, на основе которых может быть восстановлена исходная последовательность ДНК.
Гено́мная библиоте́ка представляет собой набор ДНК всего генома одного организма. Эта ДНК хранится в популяции идентичных векторов, каждый из которых содержит различные вставки ДНК.
Первичная структура (англ. primary structure) биологической молекулы — точное обозначение атомной структуры и расположения химических связей между атомами (включая стереохимию). Для стандартного биополимера, в молекуле которого нет разветвлений и перекрестных связей (например, ДНК, РНК или белков) понятие первичной структуры является синонимом последовательности остатков мономеров (нуклеотидов или аминокислот). Считается, что термин «первичная структура» был впервые употреблён Линнерстрёмом-Лангом...
Открытая рамка считывания (англ. Open Reading Frame, ORF) — последовательность нуклеотидов в составе ДНК или РНК, потенциально способная кодировать белок. Основным признаком наличия ORF служит отсутствие стоп-кодонов (в случае РНК — обычно UAA, UGA и UAG) на достаточно длинном участке последовательности после стартового кодона (в подавляющем большинстве случаев — AUG). Поскольку в некоторых случаях стартовый и терминирующие кодоны отличаются от канонических, а также ввиду возможности супрессии (подавления...
Предсказа́ние структу́ры белка ́ (англ. protein structure prediction) — направление молекулярного моделирования, предсказание по аминокислотной последовательности трёхмерной структуры белка (вторичной, третичной или четвертичной). Существенно отличается от проблемы дизайна белка (англ. protein design). Предсказание структуры белка — одна из самых важных целей биоинформатики и теоретической химии. Оно применяется в медицине (например, в фармацевтике) и биотехнологии (например, при создании новых ферментов...
Вторичная структура — конформационное расположение главной цепи (англ. backbone) макромолекулы (например, полипептидная цепь белка или цепи нуклеиновых кислот), независимо от конформации боковых цепей или отношения к другим сегментам. В описании вторичной структуры важным является определение водородных связей, которые стабилизируют отдельные фрагменты макромолекул.
Картирование коротких прочтений (англ. Short-Read Sequence Alignment, Short-Read Sequence Mapping) — биоинформатический метод анализа результатов секвенирования нового поколения, состоящий в определении позиций в референсном геноме или транскриптоме, откуда с наибольшей вероятностью могло быть получено каждое конкретное короткое прочтение. Обычно является первой стадией в обработке данных в случае, если известен геном исследуемого организма.
Позиционная весовая матрица (ПВМ) — биоинформатический метод, который применяется для поиска мотивов в биологических последовательностях.
Праймер (англ. primer) — это короткий фрагмент нуклеиновой кислоты (олигонуклеотид), комплементарный ДНК- или РНК-мишени, служит затравкой для синтеза комплементарной цепи с помощью ДНК-полимеразы (при репликации ДНК). Затравка необходима ДНК-полимеразам для инициации синтеза новой цепи, с 3'-конца (гидроксильной группы) праймера. ДНК-полимераза последовательно добавляет к 3'-концу праймера нуклеотиды, комплементарные матричной цепи.
Комплементарная ДНК (кДНК, англ. сDNA) — это ДНК, синтезированная на матрице зрелой мРНК в реакции, катализируемой обратной транскриптазой.
Метод Сэнгера — метод секвенирования (определения последовательности нуклеотидов) ДНК, также известен как метод обрыва цепи. Впервые этот метод секвенирования был предложен Фредериком Сэнгером в 1977 году, за что он был удостоен Нобелевской премии по химии в 1980 году. Данный метод был наиболее распространенным на протяжении 40 лет.
Предсказа́ние втори́чной структу́ры РНК — метод определения вторичной структуры нуклеиновой кислоты по последовательности её нуклеотидов. Вторичную структуру можно предсказывать для единичной последовательности или анализировать множественное выравнивание семейства родственных РНК.
Предсказа́ние фу́нкции белка ́ — определение биологической роли белка и значения в контексте клетки. Предсказание функций проводится для плохо изученных белков или для гипотетических белков, предсказанных на основе данных геномных последовательностей. Источником информации для предсказания могут служить гомология нуклеотидных последовательностей, профили экспрессии генов, доменная структура белков, интеллектуальный анализ текстов публикаций, филогенетические и фенотипические профили, белок-белковые...
Повторя́ющиеся после́довательности ДНК (англ. Repetitive DNA) — участки ДНК, включённые в геном, последовательность которых состоит из повторяющихся фрагментов. Выделяют 2 типа таких повторяющихся последовательностей...
Эндонуклеазы рестрикции , рестриктазы (от лат. restrictio — ограничение) — группа ферментов, относящихся к классу гидролаз, катализирующих реакцию гидролиза нуклеиновых кислот.
Предпочте́ние кодо́нов — понятие, описывающее явление неравных частот встречаемости синонимичных кодонов в кодирующих областях генома.
Гены «домашнего хозяйства » (англ. housekeeping genes) — это гены, необходимые для поддержания важнейших жизненных функций организма, которые экспрессируются практически во всех тканях и клетках на относительно постоянном уровне. Гены домашнего хозяйства функционируют повсеместно, на всех стадиях жизненного цикла организма.
Бисульфи́тное секвени́рование — общее название группы методов, направленных на изучение паттерна метилирования ДНК посредством обработки её бисульфитом.
Спе́йсер ы (от англ. spacer — «разделитель») — участки нетранскрибируемой ДНК, расположенные между тандемно повторяющимися генами, например, между генами рибосомальной РНК у эукариот. Их функция, вероятнее всего, заключается в обеспечении высокого уровня точности транскрипции в связанных генах.
Логотип последовательностей (англ. Sequence logo) (в биоинформатике) — метод графического представления консервативности нуклеотидов (в цепи РНК или ДНК) или аминокислот (в белках). Логотип строится по набору выровненных последовательностей. Этот метод позволяет на одном графике отразить следующие характеристики анализируемого участка...
Откры́тый хромати́н (англ. open chromatin) — небольшие участки хроматина, свободные от нуклеосом. Посадке нуклеосом, как правило, препятствуют связанные с хроматином белковые факторы, узнающие определённые последовательности ДНК. К числу таких белков относятся транскрипционные факторы, ДНК- или РНК-полимеразы. Открытый хроматин часто совпадает с цис-регуляторными последовательностями, а именно: промоторами, энхансерами, инсуляторами, сайленсерами, участками начала репликации ДНК. Размер открытых...
Секвенирование нового поколения (англ. next generation sequencing, NGS) — техника определения нуклеотидной последовательности ДНК и РНК для получения формального описания её первичной структуры. Технология методов секвенирования нового поколения (СНП) позволяет «прочитать» единовременно сразу несколько участков генома, что является главным отличием от более ранних методов секвенирования. СНП осуществляется с помощью повторяющихся циклов удлинения цепи, индуцированного полимеразой, или многократного...
Псевдогены (англ. pseudogenes) — нефункциональные аналоги структурных генов, утратившие способность кодировать белок и не экспрессирующиеся в клетке. Термин «псевдоген» был впервые предложен в 1977 году. Некоторые псевдогены могут копироваться из мРНК и включаться в хромосомы, такие последовательности называются процессированными псевдогенами (ретропсевдогенами). Тем не менее, они также нефункциональны. Псевдогены происходят от обычных функциональных генов, однако утрачивают способность экспрессии...
Пиросеквени́рование — это метод секвенирования ДНК (определение последовательности нуклеотидов в молекуле ДНК), основанный на принципе «секвенирование путём синтеза». При включении нуклеотида происходит детекция высвобождающихся пирофосфатов. Технология была разработана Полом Ниреном (швед. Pål Nyrén) и его студентом Мустафой Ронаги англ. Mostafa Ronaghi) в Королевском технологическом институте (Стокгольм) в 1996 году.
Двугибридный анализ — молекулярно-биологический метод для исследования белок-белковых и ДНК-белковых взаимодействий.
Консервати́вные после́довательности (англ. conserved sequences) — схожие или идентичные последовательности, встречающиеся в биологических полимерах: нуклеиновых кислотах, первичной и пространственной структурах белков, полисахаридах как в пределах особей разных видов (ортологичные последовательности), так и в пределах одной особи (паралогичные последовательности). Ортологичные последовательности являются подтверждением того, что определённые последовательности могут поддерживаться эволюцией, несмотря...
Последовательность Шайна — Дальгарно (англ. Shine-Dalgarno sequence, Shine-Dalgarno box) — сайт связывания рибосом на молекуле мРНК прокариот, обычно на расстоянии около 10 нуклеотидов до стартового кодона AUG. Описана австралийскими учёными Джоном Шайном и Линн Дальгарно.Консенсусом является последовательность из шести нуклеотидов AGGAGG; в случае E. coli последовательность Шайна — Дальгарно — AGGAGGU. Комплементарная последовательность CCUCCU, называемая последовательностью анти-Шайна — Дальгарно...
Третичная структура (или трёхмерная структура) — пространственное строение (включая конформацию) всей молекулы белка или другой макромолекулы, состоящей из единственной цепи.
Старт-кодон или инициаторный кодон — первый кодон матричной РНК, c которого начинается трансляция белка в рибосоме. У эукариот и архей старт-кодон всегда кодирует метионин, а у прокариот— модифицированный метионин (N-формилметионин). В большинстве случаев роль инициаторного кодона играет триплет AUG. Старт-кодону предшествует 5′-нетранслируемая область (5'-UTR). В 5'-UTR бактерий локализована последовательность Шайна — Дальгарно (AGGAGG), которая служит для связывания рибосомы и отделёна спейсером...
Нуклеотидная последовательность , генетическая последовательность — порядок следования нуклеотидных остатков в нуклеиновых кислотах. Определяется при помощи секвенирования.
Комплемента́рность (в химии, молекулярной биологии и генетике) — взаимное соответствие молекул биополимеров или их фрагментов, обеспечивающее образование связей между пространственно взаимодополняющими (комплементарными) фрагментами молекул или их структурных фрагментов вследствие супрамолекулярных взаимодействий (образование водородных связей, гидрофобных взаимодействий, электростатических взаимодействий заряженных функциональных групп и т. п.).
Цис-регуляторные элементы (или цис-элементы) — участки ДНК или РНК, регулирующие экспрессию генов, находящихся на той же молекуле (обычно хромосоме).
Транскрипт — молекула РНК, образующаяся в результате транскрипции (экспрессии соответствующего гена или участка ДНК).
Ретротранспозоны (мобильные генетические элементы первого типа, или транспозоны, перемещающиеся через РНК-интермедиаты) — это генетические элементы, которые могут самовоспроизводиться в геноме и являются вездесущими компонентами ДНК многих эукариотических организмов.
Гомеодомен — это структурный домен белков, связывающих ДНК или РНК, широко распространенный среди факторов транскрипции. Домен состоит из 60 остатков аминокислот, и образует структуру спираль-поворот-спираль, в которой альфа-спирали связаны короткими петлевыми участками. Две спирали на N-конце являются антипараллельными, и длиннее спирали на C-конце, которая перпендикулярна осям N-концевым петлям. Непосредственно С-концевая спираль взаимодействует с ДНК. Укладка доменов белков по типу гомеодомена...
Транскрипто́мные техноло́гии (англ. transcriptomics technologies) — методы, разработанные для изучения транскриптома (то есть совокупности всех РНК-транскриптов) организма. В состав транскриптома входят все транскрипты, которые присутствовали в клетке на момент выделения РНК. Исследуя транскриптом, можно установить, какие клеточные процессы были активны в тот или иной момент времени.
Некодирующая
ДНК или Мусорная ДНК (англ. Non-coding DNA англ. junk DNA) — части геномной ДНК организмов, которые не кодируют последовательности белков. Некоторые некодирующие ДНК переводятся в функциональные некодирующие РНК-молекулы. Другие функции некодирующей ДНК включают регуляцию последовательностей кодирующих белки, центромер и теломер.
Количественный анализ экспрессии генов — анализ транскриптома, измерение транскрипционной активности гена, с помощью определения количества его продукта, матричной РНК (мРНК), универсальной для большей части генов.
Кодо́н (кодирующий тринуклеотид) — единица генетического кода, тройка нуклеотидных остатков (триплет) в ДНК или РНК, обычно кодирующих включение одной аминокислоты. Последовательность кодонов в гене определяет последовательность аминокислот в полипептидной цепи белка, кодируемого этим геном.
Энхансер (англ. enhancer — усилитель, увеличитель) — небольшой участок ДНК, который после связывания с ним факторов транскрипции стимулирует транскрипцию с основных промоторов гена или группы генов. Энхансеры не обязательно находятся в непосредственной близости от генов, активность которых они регулируют, и даже не обязательно располагаются с ними на одной хромосоме. Энхансеры могут располагаться как в 5'-, так и в 3'-положении относительно матричной цепи регулируемого гена и в любой ориентации к...