Связанные понятия
Картирование коротких прочтений (англ. Short-Read Sequence Alignment, Short-Read Sequence Mapping) — биоинформатический метод анализа результатов секвенирования нового поколения, состоящий в определении позиций в референсном геноме или транскриптоме, откуда с наибольшей вероятностью могло быть получено каждое конкретное короткое прочтение. Обычно является первой стадией в обработке данных в случае, если известен геном исследуемого организма.
Предсказание генов — это определение кодирующих и регулирующих последовательностей ДНК в геноме: белковых генов и генов функциональной РНК, промоторов, энхансеров и прочее.
Предсказа́ние втори́чной структу́ры РНК — метод определения вторичной структуры нуклеиновой кислоты по последовательности её нуклеотидов. Вторичную структуру можно предсказывать для единичной последовательности или анализировать множественное выравнивание семейства родственных РНК.
Выравнивание последовательностей — биоинформатический метод, основанный на размещении двух или более последовательностей мономеров ДНК, РНК или белков друг под другом таким образом, чтобы легко увидеть сходные участки в этих последовательностях. Сходство первичных структур двух молекул может отражать их функциональные, структурные или эволюционные взаимосвязи. Выровненные последовательности оснований нуклеотидов или аминокислот обычно представляются в виде строк матрицы. Добавляются разрывы между...
Метод дробовика (англ. Shotgun sequencing) — метод, используемый для секвенирования длинных участков ДНК. Суть метода состоит в получении случайной массированной выборки клонированных фрагментов ДНК данного организма, на основе которых может быть восстановлена исходная последовательность ДНК.
Секвенирование спаренных концов — один из методов секвенирования ДНК нового поколения, основанный на получении и секвенировании библиотеки спаренных концевых фрагментов (англ. paired-end tags, PET), в которой короткие 5’- и 3’- концевые участки фрагментов ДНК/кДНК соединены друг с другом.
Сборка генома — процесс объединения большого количества коротких фрагментов ДНК (ридов) в одну или несколько длинных последовательностей (контигов и скаффолдов) в целях восстановления последовательностей ДНК хромосом, из которых возникли эти фрагменты в процессе секвенирования.
Количественный анализ экспрессии генов — анализ транскриптома, измерение транскрипционной активности гена, с помощью определения количества его продукта, матричной РНК (мРНК), универсальной для большей части генов.
Мно́жественное выра́внивание после́довательностей (англ. multiple sequence alignment, MSA) — выравнивание трёх и более биологических последовательностей, обычно белков, ДНК или РНК. В большинстве случаев предполагается, что входной набор последовательностей имеет эволюционную связь. Используя множественное выравнивание, можно оценить эволюционное происхождение последовательностей, проведя филогенетический анализ.
Позиционная весовая матрица (ПВМ) — биоинформатический метод, который применяется для поиска мотивов в биологических последовательностях.
Транскрипто́мные техноло́гии (англ. transcriptomics technologies) — методы, разработанные для изучения транскриптома (то есть совокупности всех РНК-транскриптов) организма. В состав транскриптома входят все транскрипты, которые присутствовали в клетке на момент выделения РНК. Исследуя транскриптом, можно установить, какие клеточные процессы были активны в тот или иной момент времени.
Секвенирование нового поколения (англ. next generation sequencing, NGS) — техника определения нуклеотидной последовательности ДНК и РНК для получения формального описания её первичной структуры. Технология методов секвенирования нового поколения (СНП) позволяет «прочитать» единовременно сразу несколько участков генома, что является главным отличием от более ранних методов секвенирования. СНП осуществляется с помощью повторяющихся циклов удлинения цепи, индуцированного полимеразой, или многократного...
Логотип последовательностей (англ. Sequence logo) (в биоинформатике) — метод графического представления консервативности нуклеотидов (в цепи РНК или ДНК) или аминокислот (в белках). Логотип строится по набору выровненных последовательностей. Этот метод позволяет на одном графике отразить следующие характеристики анализируемого участка...
Транскриптомика отдельных клеток (англ. single-cell transcriptomics) — область биологических исследований, в которой основным инструментом служат методы количественного анализа экспрессии генов в индивидуальных клетках. Эти методы сочетают в себе современные технологии секвенирования РНК отдельных клеток (scRNA-Seq от англ. single-cell RNA sequencing) и последние достижения микрогидродинамики. Они позволяют решить проблему «усреднённых» данных, получаемых при традиционном секвенировании массовых...
Пиросеквени́рование — это метод секвенирования ДНК (определение последовательности нуклеотидов в молекуле ДНК), основанный на принципе «секвенирование путём синтеза». При включении нуклеотида происходит детекция высвобождающихся пирофосфатов. Технология была разработана Полом Ниреном (швед. Pål Nyrén) и его студентом Мустафой Ронаги англ. Mostafa Ronaghi) в Королевском технологическом институте (Стокгольм) в 1996 году.
Модель замен (в биологии) - набор теоретических или эмпирических правил, описывающих процесс замещения нуклеотидов или аминокислот в ходе эволюции последовательности ДНК или белка.
Бисульфи́тное секвени́рование — общее название группы методов, направленных на изучение паттерна метилирования ДНК посредством обработки её бисульфитом.
Сайт рестрикции (участок узнавания) — короткая последовательность нуклеотидов в молекуле ДНК, которая распознаётся ферментом эндонуклеазой рестрикции-модификации (рестриктазой). Рестриктаза связывается с молекулой ДНК в точке расположения сайта рестрикции и перерезает цепочку нуклеотидов внутри сайта или в непосредственной близости от него.
Ионное полупроводниковое секвенирование (англ. Ion Semiconductor Sequencing) является методом определения последовательности ДНК, основанным на обнаружении ионов водорода, которые выделяются во время полимеризации ДНК. Это метод «секвенирования при синтезе», в ходе которого комплементарная цепь строится на основе последовательности матричной цепи.
Интеракто́м (англ. Interactome) — термин молекулярной биологии, обозначающий полный набор взаимодействий между молекулами в отдельной клетке. Интерактом включает как непосредственные физические контакты между белками (белок-белковые взаимодействия), так и непрямые взаимодействия генов (например, эпистаз).
Предпочте́ние кодо́нов — понятие, описывающее явление неравных частот встречаемости синонимичных кодонов в кодирующих областях генома.
Энциклопедия элементов ДНК (англ. The Encyclopedia of DNA Elements, ENCODE) — международный исследовательский консорциум, созданный в сентябре 2003 года. Организован и финансируется американским Национальным институтом исследований генома человека (англ. National Human Genome Research Institute, NHGRI). Задуманный как продолжение проекта «Геном человека», ENCODE ставит целью проведение полного анализа функциональных элементов генома человека. Все результаты, получаемые в ходе реализации проекта...
Простра́нственное выра́внивание — способ установления гомологии между двумя или более полимерными структурами на основании их трёхмерной структуры. Этот процесс обычно применяется к третичной структуре белков, но может также использоваться и для больших молекул РНК. В противоположность простому наложению структур, когда известно по крайней мере несколько эквивалентных аминокислотных остатков, пространственное выравнивание не требует никаких предварительных данных, кроме координат атомов.
Метод Сэнгера — метод секвенирования (определения последовательности нуклеотидов) ДНК, также известен как метод обрыва цепи. Впервые этот метод секвенирования был предложен Фредериком Сэнгером в 1977 году, за что он был удостоен Нобелевской премии по химии в 1980 году. Данный метод был наиболее распространенным на протяжении 40 лет.
Визуализа́ция да́нных секвени́рования РНК — способ визуального представления данных, полученных с помощью РНК-секвенирования (RNA-seq) в наглядной форме, с помощью которого можно увидеть картирование полученных чтений на геном и анализировать уровень экспрессии гена. Существует множество программ, позволяющих осуществить визуализацию.
Эволюция вирусов — раздел эволюционной биологии и вирусологии, который посвящён именно эволюции вирусов. Множество вирусов, в частности РНК-вирусы, имеют маленький период размножения и повышенную частоту мутаций (одна точечная мутация или более на геном за один раунд репликации РНК вируса). Такая повышенная частота мутаций, в случае комбинации с естественным отбором, позволяет вирусам быстро адаптироваться к изменениям в окружающей среде.
Предсказа́ние фу́нкции белка ́ — определение биологической роли белка и значения в контексте клетки. Предсказание функций проводится для плохо изученных белков или для гипотетических белков, предсказанных на основе данных геномных последовательностей. Источником информации для предсказания могут служить гомология нуклеотидных последовательностей, профили экспрессии генов, доменная структура белков, интеллектуальный анализ текстов публикаций, филогенетические и фенотипические профили, белок-белковые...
Космиды (Cosmides) — плазмиды, содержащие фрагмент ДНК фага лямбда включая cos-участок. Вместе с системами упаковки в фаговые частицы in vitro используются как векторные молекулы для клонирования генов и при построении геномных библиотек. Космиды были впервые сконструированы Коллинсом и Брюнингом в 1978 году. Их название происходит от сокращения двух терминов: cos-участок (сам термин в свою очередь происходит от англ. cohesive ends — липкие концы) и плазмида.
Амплификация (лат. amplificatio — усиление, увеличение), в молекулярной биологии — процесс образования дополнительных копий участков хромосомной ДНК, как правило, содержащих определённые гены либо сегменты структурного гетерохроматина. Амплификация может быть ответом клеток на селективное воздействие (например, при действии метотрексата). Амплификация — один из механизмов активации онкогенов в процессе развития опухоли, например, онкогена N-myc при развитии нейробластомы. Также амплификация — накопление...
Моти́в в молекулярной биологии — относительно короткая последовательность нуклеотидов или аминокислот, слабо меняющаяся в процессе эволюции и, по крайней мере предположительно, имеющая определённую биологическую функцию.
Секвенирование экзома — технология секвенирования всех белок-кодирующих генов в геноме (то есть экзома). Она состоит из двух шагов: первый шаг — выбор участков ДНК, кодирующих белки. Эти участки известны как экзоны. У человека насчитывается около 180 000 экзонов, что составляет примерно 1 % от размера генома, или приблизительно 30 миллионов пар нуклеотидов. Второй шаг — секвенирование экзонов с использованием любой платформы высокопроизводительного секвенирования ДНК.
Нанопоровое секвенирование — семейство высокоэффективных методов определения последовательности молекул ДНК или РНК с использованием белковых или твердотельных пор диаметром в несколько нанометров.
Поиск клонов в исходном коде - анализ исходного кода с помощью различных алгоритмов, с целью обнаружения клонированного кода, который может иметь вредоносный характер.
Предсказа́ние структу́ры белка ́ (англ. protein structure prediction) — направление молекулярного моделирования, предсказание по аминокислотной последовательности трёхмерной структуры белка (вторичной, третичной или четвертичной). Существенно отличается от проблемы дизайна белка (англ. protein design). Предсказание структуры белка — одна из самых важных целей биоинформатики и теоретической химии. Оно применяется в медицине (например, в фармацевтике) и биотехнологии (например, при создании новых ферментов...
Гено́мная библиоте́ка представляет собой набор ДНК всего генома одного организма. Эта ДНК хранится в популяции идентичных векторов, каждый из которых содержит различные вставки ДНК.
Генная конверсия представляет собой процесс, посредством которого одна последовательность ДНК заменяется гомологичной последовательностью, так что последовательности становятся идентичными. Конверсия гена может быть либо аллельной, что означает, что один аллель гена заменяет другой аллель того же гена, либо неаллельной/эктопической, при которой одна паралогичная ДНК-последовательность преобразует другую.Паралогичными называют такие последовательности, которые присутствуют в одном и том же геноме...
Откры́тый хромати́н (англ. open chromatin) — небольшие участки хроматина, свободные от нуклеосом. Посадке нуклеосом, как правило, препятствуют связанные с хроматином белковые факторы, узнающие определённые последовательности ДНК. К числу таких белков относятся транскрипционные факторы, ДНК- или РНК-полимеразы. Открытый хроматин часто совпадает с цис-регуляторными последовательностями, а именно: промоторами, энхансерами, инсуляторами, сайленсерами, участками начала репликации ДНК. Размер открытых...
Комплементарная ДНК (кДНК, англ. сDNA) — это ДНК, синтезированная на матрице зрелой мРНК в реакции, катализируемой обратной транскриптазой.
Репарация ошибочно спаренных нуклеотидов — система обнаружения и репарации вставок, пропусков и ошибочных спариваний нуклеотидов, возникающих в процессе репликации и рекомбинации ДНК, а также в результате некоторых типов повреждений ДНК.
Некодирующая
ДНК или Мусорная ДНК (англ. Non-coding DNA англ. junk DNA) — части геномной ДНК организмов, которые не кодируют последовательности белков. Некоторые некодирующие ДНК переводятся в функциональные некодирующие РНК-молекулы. Другие функции некодирующей ДНК включают регуляцию последовательностей кодирующих белки, центромер и теломер.
Двугибридный анализ — молекулярно-биологический метод для исследования белок-белковых и ДНК-белковых взаимодействий.
Открытая рамка считывания (англ. Open Reading Frame, ORF) — последовательность нуклеотидов в составе ДНК или РНК, потенциально способная кодировать белок. Основным признаком наличия ORF служит отсутствие стоп-кодонов (в случае РНК — обычно UAA, UGA и UAG) на достаточно длинном участке последовательности после стартового кодона (в подавляющем большинстве случаев — AUG). Поскольку в некоторых случаях стартовый и терминирующие кодоны отличаются от канонических, а также ввиду возможности супрессии (подавления...
Петлевая изотермическая амплификация (Loop mediated isothermal amplification, LAMP) — техника амплификации ДНК в одной пробирке. Метод LAMP позволяет проводить молекулярную диагностику существенно дешевле и быстрее, по сравнению с ПЦР. При диагностике РНК-вирусов метод LAMP позволяет проводить обратную транскрипцию и амплификацию в одной пробирке, без переноса жидкости.
Гены «домашнего хозяйства » (англ. housekeeping genes) — это гены, необходимые для поддержания важнейших жизненных функций организма, которые экспрессируются практически во всех тканях и клетках на относительно постоянном уровне. Гены домашнего хозяйства функционируют повсеместно, на всех стадиях жизненного цикла организма.
Строковое ядро — это ядерная функция, определённая на строках, т.е. конечных последовательностях символов, которые не обязательно имеют одну и ту же длину. Строковые ядра можно интуитивно понимать как функции, измеряющие похожесть пар строк — чем больше похожи две строки a и b, тем больше значение строкового ядра K(a, b).
Старт-кодон или инициаторный кодон — первый кодон матричной РНК, c которого начинается трансляция белка в рибосоме. У эукариот и архей старт-кодон всегда кодирует метионин, а у прокариот— модифицированный метионин (N-формилметионин). В большинстве случаев роль инициаторного кодона играет триплет AUG. Старт-кодону предшествует 5′-нетранслируемая область (5'-UTR). В 5'-UTR бактерий локализована последовательность Шайна — Дальгарно (AGGAGG), которая служит для связывания рибосомы и отделёна спейсером...
Спе́йсер ы (от англ. spacer — «разделитель») — участки нетранскрибируемой ДНК, расположенные между тандемно повторяющимися генами, например, между генами рибосомальной РНК у эукариот. Их функция, вероятнее всего, заключается в обеспечении высокого уровня точности транскрипции в связанных генах.