Филогенетическое дерево

  • Филогенетическое дерево (эволюционное дерево, дерево жизни) — дерево, отражающее эволюционные взаимосвязи между различными видами или другими сущностями, имеющими общего предка.

    Вершины филогенетического дерева делятся на три класса: листья, узлы и (максимум один) корень. Листья — это конечные вершины, то есть те, в которые входят ровно по одному ребру; каждый лист отображает некоторый вид живых организмов (или иной объект, подверженный эволюции, например, домен белка). Каждый узел представляет эволюционное событие: разделение предкового вида на два или более, которые в дальнейшем эволюционировали независимо. Корень представляет общего предка всех рассматриваемых объектов. Ребра филогенетического дерева принято называть «ветвями».

    Идея «дерева» появилась в ранних взглядах на жизнь, как на процесс развития от простых форм к сложным. Современные эволюционные биологи продолжают использовать деревья для иллюстрации эволюции, так как они наглядно показывают взаимосвязи между живыми организмами.

Источник: Википедия

Связанные понятия

Молекулярная филогенетика — способ установления родственных связей между живыми организмами на основании изучения структуры полимерных макромолекул — ДНК, РНК и белков. Результатом молекулярно-филогенетического анализа является построение филогенетического дерева живых организмов.
Клади́стика (от др.-греч. κλάδος «ветвь») — направление филогенетической систематики. Характерные особенности кладистической практики состоят в использовании так называемого кладистического анализа (строгой схемы аргументации при реконструкции родственных отношений между таксонами), строгом понимании монофилии и требовании взаимно-однозначного соответствия между реконструированной филогенией и иерархической классификацией. Кладистический анализ — основа большинства принятых в настоящее время биологических...
Древовидная структура является одним из способов представления иерархической структуры в графическом виде.
Баркоди́рование ДНК (ДНК-штрихкодирование, генетический баркодинг, ДНК-баркодинг, англ. DNA barcoding) — метод молекулярной идентификации, который позволяет по коротким генетическим маркерам в ДНК определять принадлежность организма к определённому таксону. В отличие от методов молекулярной филогенетики, ДНК-баркодирование используется для определения места данного организма в уже существующей классификации, а не для построения филогенетических деревьев и дополнения уже существующей классификации...
Филогене́тика, или филогенети́ческая система́тика, — область биологической систематики, которая занимается выявлением и прояснением эволюционных взаимоотношений среди разных видов жизни на Земле, как современных, так и вымерших. Эволюционная теория утверждает, что сходство тех или иных особей или видов часто указывает на общее происхождение или общего предка. Потому взаимоотношения, установленные филогенетической систематикой, часто описывают эволюционную историю видов и их филогенез, исторические...

Упоминания в литературе

Она первоначально изложена в статье «Возникновение родов» (The origin of genera, 1868 г.) и в развёрнутой форме представлена в сводке «Возникновение наиболее приспособленного…» (Соре, 1887). Её основу составляет то же допущение, что и у Ламарка и частью Геккеля: эволюция однонаправленна, в ней объективно существуют общие закономерности, которым подчиняются разные организмы. В отличие от классического ламаркизма (см. 4.3.3), эта направленность выглядит не как единая и единственная Лестница совершенствования, а как несколько (много) параллельных филетических рядов, по которым происходит сходное развитие организмов, последовательно проходящее одни и те же фазы совершенствования (анагенез, термин Копа). Соответственно адекватной формой представления этой эволюционной модели служит не дерево и даже не куст, а «газон» (рис. 11); впрочем, эта теоретическая модель не мешала Копу рисовать стилизованные филогенетические деревья во вполне генеалогическом гекке-левом духе (Соре, 1896).
Всё это делает филогенетическое дерево гаплогрупп достаточно прочной и обоснованной структурой. У него есть, впрочем, слабое место – его филогения не показывает, на каком континенте зародилось человечество, откуда пошли гаплогруппы, начиная с первых, на общем стволе, идущими от нашего общего предка с современным шимпанзе. Говоря языком филогении, дерево гаплогрупп не «укоренено». Укоренение дерева – результат интерпретаций, наблюдений и доступных экспериментальных данных.
Далее благодаря расшифровке геномов целого ряда организмов у ученых появилась возможность провести детальное сравнение последовательностей ДНК нашего и других видов. Когда такое сравнение проводится для области человеческого гена, кодирующей некоторый белок, у нее практически во всех случаях обнаруживается значительное сходство с геномами других млекопитающих. Часто обнаруживается явное, хотя и не такое большое, сходство с генами рыб, а иногда и с более примитивными организмами, такими как плодовые мушки дрозофилы или круглые черви (ДНК человека и одного из видов червей nematod filumuna совпадают на 75 %!). Удивительным образом в итоге нескольких практических опытов выяснялось, что человек и курица друг другу – самые близкие родственники по структуре белка, а следующим по близости к человеку после курицы идет крокодил. Есть отдельные примеры, когда подобие распространяется на все филогенетическое дерево вплоть до генов дрожжевых грибов и даже бактерий. Возможно, дальнейшие исследования покажут, что человек «похож» на шимпанзе не больше, чем на других живых существ, населяющих нашу планету.
Вся концепция «молекулярных часов», на которой, в свою очередь, построены все филогенетические деревья (эволюционные схемы родства) основана на том, что поток случайных мутаций «неотвратим, как смерть и налоги» (С). И только естественный отбор (теоретически) может противостоять этому разрушающему процессу, отбраковывая вредные мутации и оставляя здоровых, немутантных особей… А тут, зубы вот уже 70 млн. лет, как перестали появляться у птиц… поток случайных мутаций не ослабевает все эти 70 млн. лет… Но любознательные биологи взяли, и решили исследовать этот вопрос. И откуда ни возьмись, вполне работоспособная программа развития зубов вдруг «взяла под козырёк» и начала формировать цыпленку зубы! Это как вообще понимать?
Одновременно опубликованы две работы, касающиеся филогении чешуйчатых (ящериц, змей, амфисбен и их родичей). Одна из них реконструирует молекулярную эволюцию ядерных генов, вторая – сравнивает морфологические признаки вымерших и ныне живущих представителей. Два филогенетических дерева оказались принципиально несхожи. В особенности это касается игуан, имеющих множество примитивных черт, но оказавшихся на молекулярном дереве среди своих продвинутых четвероюродных кузин. Этот методологический конфликт пока не удается разрешить.
А потом, несколько лет назад, Пейджел осознал, что подходящие эволюционные деревья, дающие надежную информацию, вдруг стали доступны в огромных количествах – благодаря дешевым и быстрым методикам секвенирования ДНК. Он заметил: «Впервые у нас появился большой набор филогенетических деревьев, по-настоящему годящихся для того, чтобы проверить эту идею», – писал он. И тогда он и его коллеги Крис Вендитти и Эндрю Мид, засучив рукава, приступили к работе.

Связанные понятия (продолжение)

Обучение дерева решений использует дерево решений (как предиктивную модель), чтобы перейти от наблюдений над объектами (представленными в ветвях) к заключениям о целевых значениях объектов (представленных в листьях). Это обучение является одним из подходов моделирования предсказаний, используемых в статистике, интеллектуальном анализе данных и обучении машин. Модели деревьев, в которых целевая переменная может принимать дискретный набор значений, называются деревьями классификации. В этих структурах...
Ключ для определения в биологии — это описанный или реализованный в CAE-системе алгоритм, служащий для помощи в идентификации биологических сущностей, таких как растения, животные, фоссилии, микроорганизмы, зёрна пыльцы. Такие ключи, кроме того, нашли широкое применение в различных областях науки и техники для идентификации разного вида сущностей, например заболеваний, почв, минералов, археологических и антропологических артефактов.
Гомологичными (др.-греч. ὅμοιος «подобный, похожий» + λογος «слово, закон») в биологии называются сопоставимые части сравниваемых биологических объектов.

Подробнее: Гомология (биология)
Биологи́ческая система́тика — научная дисциплина, в задачи которой входит разработка принципов классификации живых организмов и практическое приложение этих принципов к построению системы органического мира. Под классификацией здесь понимается описание и размещение в системе всех существующих и вымерших организмов.
Эволюционное моделирование (англ. Evolutionary computation) использует признаки теории Дарвина для построения интеллектуальных систем (методы группового учёта, генетические алгоритмы). Является частью более обширной области искусственного интеллекта — вычислительного интеллекта.
Дѐндрохроноло́гия (от др.-греч. δένδρον — дерево, χρόνος — время, λόγος — слово, учение) — научная дисциплина о методах датирования событий, природных явлений, археологических находок и древних предметов, основанная на исследовании годичных колец древесины.

Подробнее: Дендрохронология
Генети́ческий алгори́тм (англ. genetic algorithm) — это эвристический алгоритм поиска, используемый для решения задач оптимизации и моделирования путём случайного подбора, комбинирования и вариации искомых параметров с использованием механизмов, аналогичных естественному отбору в природе. Является разновидностью эволюционных вычислений, с помощью которых решаются оптимизационные задачи с использованием методов естественной эволюции, таких как наследование, мутации, отбор и кроссинговер. Отличительной...
Система́тика расте́ний — раздел ботаники, занимающийся естественной классификацией растений.
Диаграмма классов (англ. Static Structure diagram) — структурная диаграмма языка моделирования UML, демонстрирующая общую структуру иерархии классов системы, их коопераций, атрибутов (полей), методов, интерфейсов и взаимосвязей между ними. Широко применяется не только для документирования и визуализации, но также для конструирования посредством прямого или обратного проектирования.
Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя.
Обучение ассоциативным правилам или поиск ассоциативных правил — это метод обучения машин на базе правил обнаружения интересующих нас связей между переменными в большой базе данных. Метод предлагается для установления сильных правил, обнаруженных в базе данных с помощью некоторых мер интересности. Этот основанный на правилах подход генерирует также новые правила по мере анализа дополнительных данных. Конечной целью, исходя из достаточно большого набора данных, помочь машине имитировать выделение...
Ризома (фр. rhizome «корневище») — одно из ключевых понятий философии постструктурализма и постмодернизма, введенное Ж. Делёзом и Ф. Гваттари в одноимённой книге 1976 года и призванное служить основанием и формой реализации «номадологического проекта» этих авторов. Ризома должна противостоять неизменным линейным структурам (как бытия, так и мышления), которые, по их мнению, типичны для классической европейской культуры.
Mетод присоединения соседей — алгоритм биоинформатики, разработанный Наруя Сайтоу и Масатоcи Нэи в 1987 году. Это восходящий кластерный метод для создания филогенетических деревьев. Обычно используется для деревьев, основанных на ДНК или белковых последовательностях. Для его реализации необходимо вычислить расстояния между каждой парой таксонов (например, видов или последовательностей).
Кле́точный автома́т — дискретная модель, изучаемая в математике, теории вычислимости, физике, теоретической биологии и микромеханике. Включает регулярную решётку ячеек, каждая из которых может находиться в одном из конечного множества состояний, таких как 1 и 0. Решетка может быть любой размерности. Для каждой ячейки определено множество ячеек, называемых окрестностью. К примеру, окрестность может быть определена как все ячейки на расстоянии не более 2 от текущей (окрестность фон Неймана ранга...
Задача о покрытии множества является классическим вопросом информатики и теории сложности. Данная задача обобщает NP-полную задачу о вершинном покрытии (и потому является NP-сложной). Несмотря на то, что задача о вершинном покрытии сходна с данной, подход, использованный в приближённом алгоритме, здесь не работает. Вместо этого мы рассмотрим жадный алгоритм. Даваемое им решение будет хуже оптимального в логарифмическое число раз. С ростом размера задачи качество решения ухудшается, но всё же довольно...
Биологические сети — это любые сети являющиеся частью биологических систем. Сеть — это любая система с подразделениями, которые связаны в единое целое, например единичные виды, связанные в единую пищевую сеть.Биологические сети обеспечивают математическое представление связей, обнаруженных в результате экологических, эволюционных и физиологических исследований, таких как нейронные сети. Анализ биологических сетей в отношении заболеваний человека привел к появлению такой области как сетевой медицины...
Интеракто́м (англ. Interactome) — термин молекулярной биологии, обозначающий полный набор взаимодействий между молекулами в отдельной клетке. Интерактом включает как непосредственные физические контакты между белками (белок-белковые взаимодействия), так и непрямые взаимодействия генов (например, эпистаз).
ДСМ-метод — метод автоматического порождения гипотез. Формализует схему правдоподобного и достоверного вывода, называемую ДСМ-рассуждением.
Моти́в в молекулярной биологии — относительно короткая последовательность нуклеотидов или аминокислот, слабо меняющаяся в процессе эволюции и, по крайней мере предположительно, имеющая определённую биологическую функцию.
Роевой интеллект (РИ) (англ. Swarm intelligence) описывает коллективное поведение децентрализованной самоорганизующейся системы. Рассматривается в теории искусственного интеллекта как метод оптимизации. Термин был введён Херардо Бени и Ван Цзином в 1989 году, в контексте системы клеточных роботов. Однако ранее идея подробно рассмотрена Станиславом Лемом в романе «Непобедимый» (1964) и эссе «Системы оружия двадцать первого века, или Эволюция вверх ногами» (1983).
Индукция грамматики (или грамматический вывод) — это процесс в машинном обучении для обучения формальной грамматике (обычно в виде набора правил вывода или порождающих правил или, альтернативно, как конечный автомат или автомат другого вида) из набора наблюдений, то есть построение модели, которая описывает наблюдаемые объекты. Более обще, грамматический вывод — это такая ветвь машинного обучения, в которой пространство примеров состоит из дискретных комбинаторных объектов, таких как строки, деревья...
Картирование коротких прочтений (англ. Short-Read Sequence Alignment, Short-Read Sequence Mapping) — биоинформатический метод анализа результатов секвенирования нового поколения, состоящий в определении позиций в референсном геноме или транскриптоме, откуда с наибольшей вероятностью могло быть получено каждое конкретное короткое прочтение. Обычно является первой стадией в обработке данных в случае, если известен геном исследуемого организма.
Слияние данных является процессом объединения источников данных для получения более согласующейся, точной и полезной информации, чем информация от одного отдельного источника.
Красно-чёрное дерево (англ. Red-black tree, RB-Tree) — это одно из самобалансирующихся двоичных деревьев поиска, гарантирующих логарифмический рост высоты дерева от числа узлов и быстро выполняющее основные операции дерева поиска: добавление, удаление и поиск узла. Сбалансированность достигается за счёт введения дополнительного атрибута узла дерева — «цвета». Этот атрибут может принимать одно из двух возможных значений — «чёрный» или «красный».
Вид (лат. species) — основная структурная единица биологической систематики живых организмов (животных, растений и микроорганизмов); таксономическая, систематическая единица, группа особей с общими морфофизиологическими, биохимическими и поведенческими признаками, способная к взаимному скрещиванию, которое даёт в ряду поколений плодовитое потомство, закономерно распространённая в пределах определённого ареала и сходно изменяющаяся под влиянием факторов внешней среды.
Иерархическая кластеризация (также графовые алгоритмы кластеризации и иерархический кластерный анализ) — совокупность алгоритмов упорядочивания данных, направленных на создание иерархии (дерева) вложенных кластеров. Выделяют два класса методов иерархической кластеризации...
Филогене́з, или филогени́я (др.-греч. φῦλον, phylon — племя, раса и др.-греч. γενετικός, genetikos — имеющий отношение к рождению), — историческое развитие организмов. В биологии филогенез рассматривает развитие биологического вида во времени. Биологическая классификация основана на филогенезе, но методологически может отличаться от филогенетического представления организмов.
Фене́тика (от др.-греч. φαίνω «являю; обнаруживаю») — раздел биологии, изучающий появление и распределение (частоты и их изменения) фенов. Иногда фенетикой также называют численную таксономию (или нумеристическую систематику), в которой равный вес придаётся всем рассматриваемым признакам.
Тепловая карта (англ. heatmap) — графическое представление данных, где индивидуальные значения в таблице отображаются при помощи цвета. Термин «heatmap» изначально был придуман и официально зарегистрирован как товарный знак разработчиком программного обеспечения Кормаком Кинни в 1991 году. Он использовал этот термин, чтобы описать 2D-дисплей, изображающий в режиме реального времени информацию финансового рынка.
Байесовский подход в филогенетике позволяет получить наиболее вероятное филогенетическое дерево при заданных исходных данных, последовательностях ДНК или белков рассматриваемых организмов и эволюционной модели замен. Для снижения вычислительной сложности алгоритма расчёт апостериорной вероятности реализуется различными алгоритмами, использующими метод Монте-Карло для марковских цепей. Главными преимуществами байесовского подхода по сравнению с методами максимального правдоподобия и максимальной экономии...
Кладограмма (англ. cladogram) — одно из основных понятий в современной биологической систематике — древовидный граф, отражающий отношения сестринского родства между таксонами.
Число Стралера, число Хортона — Стралера или число Стралера — Философова математического дерева — это численная мера сложности ветвления.
Принцип минимальной длины описания (англ. minimum description length, MDL) — это формализация бритвы Оккама, в которой лучшая гипотеза (модель и её параметры) для данного набора данных это та, которая ведёт к лучшему сжиманию даных. Принцип MDL предложил Йорма Риссанен в 1978. Принцип является важной концепцией в теории информации и теории вычислительного обучения.
В компьютерных науках ку́ча — это специализированная структура данных типа дерево, которая удовлетворяет свойству кучи: если B является узлом-потомком узла A, то ключ(A) ≥ ключ(B). Из этого следует, что элемент с наибольшим ключом всегда является корневым узлом кучи, поэтому иногда такие кучи называют max-кучами (в качестве альтернативы, если сравнение перевернуть, то наименьший элемент будет всегда корневым узлом, такие кучи называют min-кучами). Не существует никаких ограничений относительно того...

Подробнее: Куча (структура данных)
Семанти́ческая сеть — информационная модель предметной области, имеющая вид ориентированного графа, вершины которого соответствуют объектам предметной области, а дуги (рёбра) задают отношения между ними. Объектами могут быть понятия, события, свойства, процессы. Таким образом, семантическая сеть является одним из способов представления знаний. В названии соединены термины из двух наук: семантика в языкознании изучает смысл единиц языка, а сеть в математике представляет собой разновидность графа...
Коннекто́м (англ. connectome /kəˈnɛktoʊm/) — полное описание структуры связей в нервной системе организма. Область исследований, включающая в себя картографирование и анализ архитектуры нейрональных связей, называется «коннектомика».
Трансвычисли́тельная зада́ча (англ. Transcomputational problem) — в теории сложности вычислений задача, для решения которой требуется обработка более чем 1093 бит информации. Число 1093, называемое «пределом Бремерманна», согласно Гансу-Иоахиму Бремерманну, представляет собой общее число бит, обрабатываемых гипотетическим компьютером размером с Землю, работающим с максимально возможной скоростью, за период времени, равный общему времени существования Земли. Термин «трансвычислительность» был предложен...
Тестирование чёрного ящика или поведенческое тестирование — стратегия (метод) тестирования функционального поведения объекта (программы, системы) с точки зрения внешнего мира, при котором не используется знание о внутреннем устройстве тестируемого объекта. Под стратегией понимаются систематические методы отбора и создания тестов для тестового набора. Стратегия поведенческого теста исходит из технических требований и их спецификаций.
Семейство белков — это группа эволюционно связанных белков, обладающих гомологичной аминокислотной последовательностью. Этот термин почти синонимичен термину «семейство генов», поскольку, если белки имеют гомологичные аминокислотные последовательности, то и кодирующие их гены также должны проявлять значительную степень гомологии в нуклеотидных последовательностях ДНК. Этот термин не следует путать с термином «семейство» в таксономии видов живых организмов.
Модель мозга — любая теоретическая система, которая стремится объяснить физиологические функции мозга с помощью известных законов физики и математики, а также известных фактов нейроанатомии и нейрофизиологии . Существуют по меньшей мере два основных положения, играющих фундаментальную роль в теории функционирования мозга, в отношении которых сходится мнение большинства современных теоретиков...
Генети́ческая дактилоскопи́я, или ДНК-дактилоскопи́я, — система научных методов биологической идентификации индивидуумов (организмов) на основе уникальности последовательности нуклеотидов ДНК каждого живого существа (за исключением однояйцевых близнецов), своеобразного «генетического отпечатка», остающегося индивидуальным и неизменным на протяжении всей жизни индивидуума (организма).
Поиск изображений по содержанию (англ. Content-based image retrieval (CBIR)) — раздел компьютерного зрения, решающий задачу поиска изображений, которые имеют требуемое содержание, в большом наборе цифровых изображений.
Однонуклеотидный полиморфизм (ОНП, англ. Single nucleotide polymorphism, SNP, произносится как снип) — отличия последовательности ДНК размером в один нуклеотид (A, T, G или C) в геноме (или в другой сравниваемой последовательности) представителей одного вида или между гомологичными участками гомологичных хромосом.
Синтения — по изначальному определению, расположение каких-либо локусов на одной и той же хромосоме (независимо от того, наблюдается ли у них сцепленное наследование). Сегодня, однако, синтенией обычно называют ситуацию, когда расположение каких-либо локусов на одной и той же хромосоме наблюдается в разных наборах хромосом (например, у разных видов). Это явление также называют общей синтенией (англ. shared synteny). Если при этом совпадает и порядок этих локусов в хромосоме, это называется коллинеарностью...
Двоичная, бинарная или дихотомическая классификация — это задача классификации элементов заданного множества в две группы (предсказание, какой из групп принадлежит каждый элемент множества) на основе правила классификации. Контекст, в котором требуется решение, имеет ли объект некоторое качественное свойство, некоторые специфичные характеристики или некоторую типичную двоичную классификацию, включает...
а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я