Связанные понятия
Позиционная весовая матрица (ПВМ) — биоинформатический метод, который применяется для поиска мотивов в биологических последовательностях.
Предсказание генов — это определение кодирующих и регулирующих последовательностей ДНК в геноме: белковых генов и генов функциональной РНК, промоторов, энхансеров и прочее.
Выравнивание последовательностей — биоинформатический метод, основанный на размещении двух или более последовательностей мономеров ДНК, РНК или белков друг под другом таким образом, чтобы легко увидеть сходные участки в этих последовательностях. Сходство первичных структур двух молекул может отражать их функциональные, структурные или эволюционные взаимосвязи. Выровненные последовательности оснований нуклеотидов или аминокислот обычно представляются в виде строк матрицы. Добавляются разрывы между...
Мно́жественное выра́внивание после́довательностей (англ. multiple sequence alignment, MSA) — выравнивание трёх и более биологических последовательностей, обычно белков, ДНК или РНК. В большинстве случаев предполагается, что входной набор последовательностей имеет эволюционную связь. Используя множественное выравнивание, можно оценить эволюционное происхождение последовательностей, проведя филогенетический анализ.
Предсказа́ние втори́чной структу́ры РНК — метод определения вторичной структуры нуклеиновой кислоты по последовательности её нуклеотидов. Вторичную структуру можно предсказывать для единичной последовательности или анализировать множественное выравнивание семейства родственных РНК.
Предсказа́ние фу́нкции белка ́ — определение биологической роли белка и значения в контексте клетки. Предсказание функций проводится для плохо изученных белков или для гипотетических белков, предсказанных на основе данных геномных последовательностей. Источником информации для предсказания могут служить гомология нуклеотидных последовательностей, профили экспрессии генов, доменная структура белков, интеллектуальный анализ текстов публикаций, филогенетические и фенотипические профили, белок-белковые...
Интеракто́м (англ. Interactome) — термин молекулярной биологии, обозначающий полный набор взаимодействий между молекулами в отдельной клетке. Интерактом включает как непосредственные физические контакты между белками (белок-белковые взаимодействия), так и непрямые взаимодействия генов (например, эпистаз).
Простра́нственное выра́внивание — способ установления гомологии между двумя или более полимерными структурами на основании их трёхмерной структуры. Этот процесс обычно применяется к третичной структуре белков, но может также использоваться и для больших молекул РНК. В противоположность простому наложению структур, когда известно по крайней мере несколько эквивалентных аминокислотных остатков, пространственное выравнивание не требует никаких предварительных данных, кроме координат атомов.
Модель замен (в биологии) - набор теоретических или эмпирических правил, описывающих процесс замещения нуклеотидов или аминокислот в ходе эволюции последовательности ДНК или белка.
Сайт рестрикции (участок узнавания) — короткая последовательность нуклеотидов в молекуле ДНК, которая распознаётся ферментом эндонуклеазой рестрикции-модификации (рестриктазой). Рестриктаза связывается с молекулой ДНК в точке расположения сайта рестрикции и перерезает цепочку нуклеотидов внутри сайта или в непосредственной близости от него.
Секвенирование спаренных концов — один из методов секвенирования ДНК нового поколения, основанный на получении и секвенировании библиотеки спаренных концевых фрагментов (англ. paired-end tags, PET), в которой короткие 5’- и 3’- концевые участки фрагментов ДНК/кДНК соединены друг с другом.
Предпочте́ние кодо́нов — понятие, описывающее явление неравных частот встречаемости синонимичных кодонов в кодирующих областях генома.
Картирование коротких прочтений (англ. Short-Read Sequence Alignment, Short-Read Sequence Mapping) — биоинформатический метод анализа результатов секвенирования нового поколения, состоящий в определении позиций в референсном геноме или транскриптоме, откуда с наибольшей вероятностью могло быть получено каждое конкретное короткое прочтение. Обычно является первой стадией в обработке данных в случае, если известен геном исследуемого организма.
Предсказа́ние структу́ры белка ́ (англ. protein structure prediction) — направление молекулярного моделирования, предсказание по аминокислотной последовательности трёхмерной структуры белка (вторичной, третичной или четвертичной). Существенно отличается от проблемы дизайна белка (англ. protein design). Предсказание структуры белка — одна из самых важных целей биоинформатики и теоретической химии. Оно применяется в медицине (например, в фармацевтике) и биотехнологии (например, при создании новых ферментов...
Количественный анализ экспрессии генов — анализ транскриптома, измерение транскрипционной активности гена, с помощью определения количества его продукта, матричной РНК (мРНК), универсальной для большей части генов.
Пиросеквени́рование — это метод секвенирования ДНК (определение последовательности нуклеотидов в молекуле ДНК), основанный на принципе «секвенирование путём синтеза». При включении нуклеотида происходит детекция высвобождающихся пирофосфатов. Технология была разработана Полом Ниреном (швед. Pål Nyrén) и его студентом Мустафой Ронаги англ. Mostafa Ronaghi) в Королевском технологическом институте (Стокгольм) в 1996 году.
Строковое ядро — это ядерная функция, определённая на строках, т.е. конечных последовательностях символов, которые не обязательно имеют одну и ту же длину. Строковые ядра можно интуитивно понимать как функции, измеряющие похожесть пар строк — чем больше похожи две строки a и b, тем больше значение строкового ядра K(a, b).
Эволюционная дистанция — величина, характеризующая генетические различия между двумя организмами. Находится путём сравнения нуклеотидных последовательностей гомологичных генов. Мерой генетических различий считается процент несовпадений нуклеотидов в соответствующих позициях гена.
Космиды (Cosmides) — плазмиды, содержащие фрагмент ДНК фага лямбда включая cos-участок. Вместе с системами упаковки в фаговые частицы in vitro используются как векторные молекулы для клонирования генов и при построении геномных библиотек. Космиды были впервые сконструированы Коллинсом и Брюнингом в 1978 году. Их название происходит от сокращения двух терминов: cos-участок (сам термин в свою очередь происходит от англ. cohesive ends — липкие концы) и плазмида.
Ионное полупроводниковое секвенирование (англ. Ion Semiconductor Sequencing) является методом определения последовательности ДНК, основанным на обнаружении ионов водорода, которые выделяются во время полимеризации ДНК. Это метод «секвенирования при синтезе», в ходе которого комплементарная цепь строится на основе последовательности матричной цепи.
De novo сборка транскриптома – метод сборки последовательностей транскриптома, который осуществляется без картирования на референсный геном. Из коротких фрагментов (ридов или прочтений), полученных при секвенировании, воссоздаются отдельные последовательности РНК или транскрипты.
Гено́мная библиоте́ка представляет собой набор ДНК всего генома одного организма. Эта ДНК хранится в популяции идентичных векторов, каждый из которых содержит различные вставки ДНК.
Система рестрикции-модификации — ферментативная система бактерий, разрушающая попавшую в клетку чужеродную ДНК. Основная её функция — защита клетки от чужеродного генетического материала, например, бактериофагов и плазмид. Для компонентов системы характерны два типа активности — метилтрансферазная (метилазная) и эндонуклеазная. За каждую из них могут отвечать как отдельные белки, так и один белок, сочетающий в себе обе функции.Система рестрикции-модификации (СР-М) специфична по отношению к определённым...
Моти́в в молекулярной биологии — относительно короткая последовательность нуклеотидов или аминокислот, слабо меняющаяся в процессе эволюции и, по крайней мере предположительно, имеющая определённую биологическую функцию.
Брэйнбоу – это метод нейровизуализации, в основе которого лежит использование флуоресцентных белков. Будучи внедрённым в геном животного, зелёный флуоресцентный белок и его генетически модифицированные варианты окрашивают нервные клетки в разные цвета (в общей сложности до 100 разных оттенков), что позволяет значительно более точно локализовать архитектуру нейронных связей отдельных клеток. Данный метод позволяет картографировать одновременно до 100 нервных клеток.
Метод дробовика (англ. Shotgun sequencing) — метод, используемый для секвенирования длинных участков ДНК. Суть метода состоит в получении случайной массированной выборки клонированных фрагментов ДНК данного организма, на основе которых может быть восстановлена исходная последовательность ДНК.
Диаграмма Насси — Шнейдермана (англ. Nassi — Shneiderman diagram) — это графический способ представления структурированных алгоритмов и программ, разработанный в 1972 году американскими аспирантами Беном Шнейдерманом и Айзеком Насси.
Петлевая изотермическая амплификация (Loop mediated isothermal amplification, LAMP) — техника амплификации ДНК в одной пробирке. Метод LAMP позволяет проводить молекулярную диагностику существенно дешевле и быстрее, по сравнению с ПЦР. При диагностике РНК-вирусов метод LAMP позволяет проводить обратную транскрипцию и амплификацию в одной пробирке, без переноса жидкости.
Сборка генома — процесс объединения большого количества коротких фрагментов ДНК (ридов) в одну или несколько длинных последовательностей (контигов и скаффолдов) в целях восстановления последовательностей ДНК хромосом, из которых возникли эти фрагменты в процессе секвенирования.
Спе́йсер ы (от англ. spacer — «разделитель») — участки нетранскрибируемой ДНК, расположенные между тандемно повторяющимися генами, например, между генами рибосомальной РНК у эукариот. Их функция, вероятнее всего, заключается в обеспечении высокого уровня точности транскрипции в связанных генах.
Гены «домашнего хозяйства » (англ. housekeeping genes) — это гены, необходимые для поддержания важнейших жизненных функций организма, которые экспрессируются практически во всех тканях и клетках на относительно постоянном уровне. Гены домашнего хозяйства функционируют повсеместно, на всех стадиях жизненного цикла организма.
Ро-фактор действует на РНК-субстрате. Ключевая функция ро-фактора заключается в его геликазной активности, энергия для которой обеспечивается с помощью РНК-зависимого АТФ-гидролиза. Первичным сайтом связывания ро-фактора является расширенный одноцепочечный регион (~ 70 нуклеотидов, иногда 80-100 нуклеотидов), богатый цитозином и бедными в гуанином, называемый ро-утилизационным сайтом (rut), синтезируемым в РНК, выше фактической последовательности терминатора. Были выявлены несколько связывающих последовательностей...
Бисульфи́тное секвени́рование — общее название группы методов, направленных на изучение паттерна метилирования ДНК посредством обработки её бисульфитом.
Старт-кодон или инициаторный кодон — первый кодон матричной РНК, c которого начинается трансляция белка в рибосоме. У эукариот и архей старт-кодон всегда кодирует метионин, а у прокариот— модифицированный метионин (N-формилметионин). В большинстве случаев роль инициаторного кодона играет триплет AUG. Старт-кодону предшествует 5′-нетранслируемая область (5'-UTR). В 5'-UTR бактерий локализована последовательность Шайна — Дальгарно (AGGAGG), которая служит для связывания рибосомы и отделёна спейсером...
Метод Сэнгера — метод секвенирования (определения последовательности нуклеотидов) ДНК, также известен как метод обрыва цепи. Впервые этот метод секвенирования был предложен Фредериком Сэнгером в 1977 году, за что он был удостоен Нобелевской премии по химии в 1980 году. Данный метод был наиболее распространенным на протяжении 40 лет.
Синтения — по изначальному определению, расположение каких-либо локусов на одной и той же хромосоме (независимо от того, наблюдается ли у них сцепленное наследование). Сегодня, однако, синтенией обычно называют ситуацию, когда расположение каких-либо локусов на одной и той же хромосоме наблюдается в разных наборах хромосом (например, у разных видов). Это явление также называют общей синтенией (англ. shared synteny). Если при этом совпадает и порядок этих локусов в хромосоме, это называется коллинеарностью...
Амплификация (лат. amplificatio — усиление, увеличение), в молекулярной биологии — процесс образования дополнительных копий участков хромосомной ДНК, как правило, содержащих определённые гены либо сегменты структурного гетерохроматина. Амплификация может быть ответом клеток на селективное воздействие (например, при действии метотрексата). Амплификация — один из механизмов активации онкогенов в процессе развития опухоли, например, онкогена N-myc при развитии нейробластомы. Также амплификация — накопление...
Последовательность Шайна — Дальгарно (англ. Shine-Dalgarno sequence, Shine-Dalgarno box) — сайт связывания рибосом на молекуле мРНК прокариот, обычно на расстоянии около 10 нуклеотидов до стартового кодона AUG. Описана австралийскими учёными Джоном Шайном и Линн Дальгарно.Консенсусом является последовательность из шести нуклеотидов AGGAGG; в случае E. coli последовательность Шайна — Дальгарно — AGGAGGU. Комплементарная последовательность CCUCCU, называемая последовательностью анти-Шайна — Дальгарно...
Генная конверсия представляет собой процесс, посредством которого одна последовательность ДНК заменяется гомологичной последовательностью, так что последовательности становятся идентичными. Конверсия гена может быть либо аллельной, что означает, что один аллель гена заменяет другой аллель того же гена, либо неаллельной/эктопической, при которой одна паралогичная ДНК-последовательность преобразует другую.Паралогичными называют такие последовательности, которые присутствуют в одном и том же геноме...
Открытая рамка считывания (англ. Open Reading Frame, ORF) — последовательность нуклеотидов в составе ДНК или РНК, потенциально способная кодировать белок. Основным признаком наличия ORF служит отсутствие стоп-кодонов (в случае РНК — обычно UAA, UGA и UAG) на достаточно длинном участке последовательности после стартового кодона (в подавляющем большинстве случаев — AUG). Поскольку в некоторых случаях стартовый и терминирующие кодоны отличаются от канонических, а также ввиду возможности супрессии (подавления...
Транскрипт — молекула РНК, образующаяся в результате транскрипции (экспрессии соответствующего гена или участка ДНК).
Блочная сортировка (Карманная сортировка, корзинная сортировка, англ. Bucket sort) — алгоритм сортировки, в котором сортируемые элементы распределяются между конечным числом отдельных блоков (карманов, корзин) так, чтобы все элементы в каждом следующем по порядку блоке были всегда больше (или меньше), чем в предыдущем. Каждый блок затем сортируется отдельно, либо рекурсивно тем же методом, либо другим. Затем элементы помещаются обратно в массив. Этот тип сортировки может обладать линейным временем...
Тепловая карта (англ. heatmap) — графическое представление данных, где индивидуальные значения в таблице отображаются при помощи цвета. Термин «heatmap» изначально был придуман и официально зарегистрирован как товарный знак разработчиком программного обеспечения Кормаком Кинни в 1991 году. Он использовал этот термин, чтобы описать 2D-дисплей, изображающий в режиме реального времени информацию финансового рынка.
Диаграмма классов (англ. Static Structure diagram) — структурная диаграмма языка моделирования UML, демонстрирующая общую структуру иерархии классов системы, их коопераций, атрибутов (полей), методов, интерфейсов и взаимосвязей между ними. Широко применяется не только для документирования и визуализации, но также для конструирования посредством прямого или обратного проектирования.
Нанопоровое секвенирование — семейство высокоэффективных методов определения последовательности молекул ДНК или РНК с использованием белковых или твердотельных пор диаметром в несколько нанометров.
Гомеодомен — это структурный домен белков, связывающих ДНК или РНК, широко распространенный среди факторов транскрипции. Домен состоит из 60 остатков аминокислот, и образует структуру спираль-поворот-спираль, в которой альфа-спирали связаны короткими петлевыми участками. Две спирали на N-конце являются антипараллельными, и длиннее спирали на C-конце, которая перпендикулярна осям N-концевым петлям. Непосредственно С-концевая спираль взаимодействует с ДНК. Укладка доменов белков по типу гомеодомена...