Новости и мнения

Последовательность Древо Жизни

Составление диаграммы прогресса различных крупномасштабных проектов по секвенированию генома, когда исследователи, работающие отдельно над выбранными видами, начинают объединять аналитические ресурсы

Ученые, работающие над секвенированием всевозможных бактерий, архей, растений и животных и предоставлением публичного доступа к этим геномам, надеются использовать эти данные для информирования о проблемах здоровья, промышленности и окружающей среды. Крупномасштабные консорциумы секвенирования производят данные с впечатляющей скоростью, однако в геномном древе жизни остаются значительные пробелы. И хотя эти группы в основном работали независимо друг от друга, вместе они могли бы решать более далеко идущие вопросы, такие как, как развивалась жизнь, как она функционирует в настоящее время, и как она может выглядеть по линии.

«Мы все еще находимся в стадии разработки, где каждый консорциум сосредотачивается на определенной области и строит свои собственные данные и удостоверяется, что они находятся в хорошей форме», – сказал Игорь Григорьев , руководитель программы по геномике грибков в Министерстве энергетики США. (DOE) Объединенный институт генома (JGI) в Уолнат-Крик, штат Калифорния, и часть проекта 1,000 Fungal Genomes. «Некоторый диалог между консорциумами происходит, но масштабная интеграция данных еще впереди».

Хотя среди консорциумов все еще относительно мало перекрестных помех, некоторые из их данных собираются в центральных хранилищах. Помимо базы данных генома Национального центра биотехнологической информации, существует онлайновая база данных геномов (GOLD), финансируемая JGI, которая служит центром для завершенных и текущих инициатив по секвенированию генома и проектов метагенома. ЗОЛОТО в основном сосредоточено на микробных геномах, но включает в себя некоторые эукариотические геномы. Данные многих из этих проектов интегрированы в базы данных JGI, а также могут быть загружены в недавно разработанные инструменты базы знаний, финансируемые Министерством энергетики.

«Важно общаться как в сообществах, так и предлагать креативные инструменты, чтобы задавать более широкие научные вопросы в разных сферах жизни», – сказал Григорьев. «Как научное сообщество, я думаю, что мы сейчас только сейчас. , , двигаясь к этому.

Однако среди этого раннего коллективного импульса некоторые группы все еще работают над секвенированием критических видов в своих собственных областях. В 2011 году члены сообщества микробной геномики были готовы опубликовать рукопись, объединяющую научное сообщество с целью финансирования крупномасштабного проекта геномного секвенирования, охватывающего важные штаммы бактерий и архей. Целью было заполнить пробелы в микробном древе жизни. Однако указ оказался ненужным, поскольку прогресс в инициативах по секвенированию генома, в том числе в отношении тысяч геномов бактерий и архей, таких как пилотный проект «Геномная энциклопедия бактерий и архей (GEBA)», дал повод генетикам и биологам-микробам полагать, что последовательность будет завершена.

«Мы думали, что переломный момент произошел три года назад», – сказал Никос Кирпидес , который возглавляет программу микробной геномики и метагеномики в JGI. «Сообщество полагало, что все больше финансирующих агентств начнут поддерживать исследования микробного секвенирования не только для общественного здравоохранения и промышленности, но и для охвата эталонных геномов филогенетического дерева».

Следователи в JGI и нескольких международных организациях с тех пор упорядочили полные геномы 3000 дополнительных микробов, но охват бактериальных и архейных доменов остается довольно скудным. Таким образом, Кирпидес и его коллеги в настоящее время представляют обновленную рукопись, чтобы повысить осведомленность о важности их Проекта «Микробная Земля», цель которого состоит в том, чтобы упорядочить 7 830 штаммов репрезентативного типа из 11 000 видов, имеющихся в коллекциях культур, в течение следующих трех лет. «Только около 10–15 процентов разнообразия культивируемых архей и видов бактерий до настоящего времени были охвачены секвенированием», – сказал Кирпидес. «Это очень мало».

Частично проблема заключается в том, что многие правительственные и частные финансирующие учреждения больше всего заинтересованы в поддержке ученых, занимающихся секвенированием геномов видов, которые влияют на здоровье человека, проблемы промышленности и экологические проблемы.

«Во многих случаях легче получить финансирование, например, на виды, важные для сельского хозяйства. Проекты такого типа реализуются быстрее, потому что правительства или компании заинтересованы в финансировании направленных усилий », – сказал Тони Габалдон , руководитель отдела биоинформатики и геномики в Центре геномного регулирования в Барселоне, Испания. Один из вопросов, сказал Кирпидес, заключается в том, что финансирующие агентства не часто работают вместе, и обычно требуется больше, чем один финансирующий орган для поддержки широких энциклопедических усилий по секвенированию. «Мы настаиваем на том, чтобы финансирующие агентства изменились: перестали разграничивать проекты по заявкам и работали вместе».

Появилось множество консорциумов, посвященных определению последовательности конкретных ветвей дерева жизни, поскольку исследователи, работающие в тех же областях, осознали, что объединение ресурсов может ускорить научный прогресс. Среди этих групп – Глобальный альянс беспозвоночных (GIGA), Проект «5000 геномов насекомых» (i5K), Проект «1000 грибных геномов», Программа исследований генома растений Национального научного фонда США (NSF) и Проект «Геном 10K», целью которого является последовательность 10 000 геномов позвоночных. Существует также Глобальная инициатива по геному (GGI), возглавляемая Смитсоновским институтом – совместная попытка собрать как минимум один вид из каждого из 9500 описанных семейств беспозвоночных, позвоночных и растений.

По мере того как на рынке появляется все больше и больше технологий секвенирования, а общие затраты на расшифровку геномов снижаются, возникает проблема привлечения и координации экспертов для сбора, аннотирования и размещения данных секвенирования в их биологических контекстах, по словам Кевина Хакетта , национального руководитель программы Министерства сельского хозяйства США (USDA) и один из лидеров проекта i5K.

И эти аналитические усилия важны; вместо того, чтобы исследователи боролись за финансирование, они объединяют тех, кто преследует общие цели, устраняя избыточность и снижая общие затраты. По словам Стивена Гоффа , директора проекта iPlant Collaborative, культура истинного сотрудничества в области геномики только начинает развиваться.

Со своей стороны, вместо создания новых данных о геномном секвенировании команда iPlant делает инструменты облачных вычислений, хранения данных и геномного анализа доступными для более широкого сообщества производителей. Например, iPlant предоставляет инструменты для киберинфраструктуры и анализа, которые помогут Африканскому консорциуму сельскохозяйственных культур выращивать 101 урожай, важный для сельского хозяйства континента. По словам Гоффа, IPlant также вызвался предоставить инфраструктуру для проекта i5K и других проектов по секвенированию насекомых.

Другие консорциумы создают свои собственные инструменты хранения и анализа данных. В рамках своей Программы исследований генома растений NSF ставит целью не только генерировать новые последовательности генома, но и предоставлять платформу для интеграции всех существующих геномных данных для эволюционного анализа и анализа видового разнообразия. В Европе члены группы Европейской биотехнологической инфраструктуры биологических наук (ELIXIR) намерены создать для ученых ресурс для хранения и обмена большими наборами данных, такими как целые геномы.

Команда Григорьева в JGI разработала общедоступный сетевой ресурс по геномике грибков. «MycoCosm является примером интеграции данных по геномике грибов и вычислительных инструментов, а также объединением исследовательского сообщества грибковых биологов», – пояснил он. «Отсюда мы можем перейти к следующему этапу интеграции в нескольких доменах».

Инструменты биоинформатики должны будут развиваться, чтобы идти в ногу, поскольку геномный анализ становится более сложным – охватывая сложные междоменные отношения, такие как симбиотическое взаимодействие между определенными растениями, грибами и эндобактериями. Но даже в пределах базы данных одного консорциума, поскольку количество геномных последовательностей увеличивается от десятков до многих сотен, масштабирование хранилища и аналитических инструментов стало проблемой.

«Многие ученые в области вычислительной техники и биоинформатики работают вместе с биологами, чтобы проанализировать и систематизировать данные о последовательности. Это серьезная проблема, но у меня большой оптимизм, потому что в этой области много инноваций и энергии », – сказал Клаус-Питер Коепфли , один из главных исследователей проекта Genome 10K и приглашенный ученый из Смитсоновского института биологии охраны природы. в Вашингтоне, округ Колумбия. «Есть много препятствий для восстановления филогении всего живого, но это великая цель».

Сколько видов было секвенировано?

За последние 250 лет было выявлено и классифицировано 1,2 миллиона эукариотических видов. Количество видов, которые, по оценкам, существуют на Земле: виды бактерий и архей – от 100 000 до 10 миллионов 1,2 ; виды эукариот, около 8,7 млн. (включая 2,2 млн. морских организмов; ± 1,3 млн., всего) 1 .

ОБЩЕЕ ЧИСЛО ВИДОВ
(ПО ОЦЕНКАМ)
КОЛИЧЕСТВО
ВИДЫ
ОПРЕДЕЛИТЬ /
ОПИСАНО
(Приблизительная)
КОЛИЧЕСТВО
ВИДЫ С
ПОЛНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ ГЕНОМОВ *
(ПО ОЦЕНКАМ)
РЕКОМЕНДАЦИИ
БАКТЕРИИ, ARCHAEA От 100 000 до 10 миллионов 12 000 (460 культурных архей) 17420 бактерий, 362 генома архей База данных GOLD; Исследование нуклеиновых кислот (январь 2012); Всемирный центр данных по микроорганизмам
ГРИБЫ 1.5 миллиона 100000 356 JGI
НАСЕКОМЫЕ 10 миллионов 1 миллион 98 Наука о борьбе с вредителями (май 2007 г.); NCBI; RG Foottit и PH Adler, Биоразнообразие насекомых: наука и общество (2009)
РАСТЕНИЯ 435 000 (наземные растения и зеленые водоросли)

300000

150

Международная организация по сохранению ботанических садов; Список растений ; WS Judd и др., Систематика растений – филогенетический подход (2008); Д. Брамвелл, Plant Talk, 28: 32–4 (2002)
ТЕРРЕСТРИАЛЬНЫЕ ВЕРТЕБРАТЫ, РЫБЫ 80 500 (5500 млекопитающих) 62 345 (5 487 млекопитающих) 235 (80 млекопитающих) Геном 10К; Зоологическое общество Лондона (2012); Наука (декабрь 2010 года); Информационные службы Австралии по биоразнообразию (2009)
МОРСКИЕ БЕСПОЗВОНОЧНЫЕ

6,5 миллиона

1,3 миллиона 60

Журнал наследственности (май 2014 года); Текущая биология (декабрь 2012); Зоологическое общество Лондона (2012); Океанис 19: 5-24 (1993)

ДРУГИЕ БЕСПОЗВОНОЧНЫЕ 1 миллион нематод, несколько тысяч дрозофил 23 000 нематод, 1300 дрозофил 17 нематод, 21 дрозофилы М. Blaxter и др., «Эволюция паразитизма у нематод», « Паразитология» (в печати); Техасский университет A & M ; Молекулярная биология и эволюция (1995)

1 PNAS (август 2002 г.)
2 Международное общество микробной систематики Бергея (2014)
3 PLOS Биология (август 2011)
* по состоянию на 24 апреля 2014 г.

Обсуждение

Ваш e-mail не будет опубликован. Обязательные поля помечены *