Новости и мнения

Новая база данных расширяет число предполагаемых генов, кодирующих белок человека

Некоторые ученые еще не уверены, что список точен.

Геном человека может содержать больше кодирующих белок генов, чем предполагалось ранее. Исследование, опубликованное в прошлом месяце (29 мая) на BioRxiv, предоставляет расширенную базу данных приблизительно из 5000 новых генов, из которых около 1000 кодируют белки, увеличивая предполагаемое количество кодирующих белок генов с приблизительно 20 000 до 21 000.

«Если людям нравится наш список генов, то, возможно, через пару лет мы станем арбитром человеческих генов», – рассказывает Nature соавтор исследования Стивен Зальцберг, вычислительный биолог из Университета Джона Хопкинса.

Зальцберг и его коллеги составили каталог генов и транскриптов человека, используя данные проекта «Экспрессия генотипа ткани» (GTEx), в ходе которого ученые секвенировали РНК из различных тканей у сотен людей. Сравнивая секвенированную РНК с геномом человека, исследователи смогли составить базу данных из 43 162 генов, из которых 21 306 кодированы для белков, а 21 856 были некодирующими генами.

Согласно Nature, этот набор данных включает в себя гораздо больше генов, чем существующие в настоящее время наборы данных. Например, набор генов GENCODE, широко используемая база данных генов человека, поддерживаемая Европейским биоинформационным институтом (EBI) в Великобритании, включает 19 901 кодирующих белок генов и 15 779 некодирующих генов.

Некоторые ученые говорят, что для подтверждения точности нового списка генов требуется больше доказательств. Например, Адам Фрэнкиш, вычислительный биолог из EBI, участвующего в проекте GENCODE, который не участвовал в исследовании, рассказывает Nature, что после тщательного анализа около 100 новых идентифицированных белок-кодирующих генов он и его коллеги обнаружили, что только один из них, кажется, действительно кодируют белок.

Зальцберг говорит Природе, что наличие точного количества генов важно, потому что бесчисленные гены часто игнорируются, то есть те, которые содержат мутации, вызывающие заболевание, могут быть пропущены. С другой стороны, Фрэнкиш говорит Природе, что поспешное добавление генов также может быть проблематичным, потому что они могут отвлечь внимание ученых от генов, которые действительно вовлечены в заболевание.

Обсуждение

Ваш e-mail не будет опубликован. Обязательные поля помечены *