Новости и мнения

Как статистика ослабила предсказательную силу мРНК

Обилие транскрипта не является надежным показателем количества белка, вопреки предположениям исследований.

Using the quantity of messenger RNA (mRNA) as a proxy for protein abundance could be risky, concludes a paper published in PLOS Computational Biology today (May 22). Использование количества мессенджерной РНК (мРНК) в качестве прокси для обилия белка может быть рискованным, завершает работу, опубликованная в PLOS Computational Biology сегодня (22 мая). Авторы изучили данные предыдущих протеомных исследований, и их новые статистические расчеты показали, что, хотя уровни мРНК могут быть полезным ориентиром для уровней белка при сравнении разных генов, использование мРНК для оценки одного и того же гена в разных тканях может вводить в заблуждение.

«Был спор по вопросу о том, насколько хорошо уровни мРНК могут предсказывать уровни белка», – сказал клеточный и молекулярный биолог Марко Йованович из Колумбийского университета, который не принимал участия в исследовании. «Некоторые газеты утверждают, что их предсказательная сила очень ограничена, другие говорят, что они предсказывают это очень хорошо. , , , Проблема заключается в том, что все зависит от того, на что вы смотрите: вас интересуют различия в экспрессии разных генов в одних и тех же тканях или одного и того же гена в разных тканях? Здесь [авторы] прекрасно разграничили эти два, что крайне важно ».

В 2014 году в двух статьях, опубликованных в журнале «Nature», были представлены первые черновые карты протеома человека, в каждой из которых подробно описано количество и распределение различных белков в тканях организма, что определено масс-спектрометрией. Среди множества данных, представленных в одной из статей, был практический фрагмент информации: из анализа огромного количества белков и их соответствующих мРНК в различных тканях авторы определили, что уровни мРНК являются хорошими суррогатами уровней белка. Если это правда, это было бы очень удобно, сказал Йованович, «потому что гораздо проще измерить уровни РНК».

Большинство биологов, вероятно, кивнули бы в этом заключении и читали бы дальше, но биоинженеру Николаю Славову из Северо-восточного университета в Бостоне утверждение газеты представляло собой статистического «слона в комнате», сказал он. «Мне было ясно, что это не соответствовало их данным с того момента, как я их увидел, и поэтому мы решили провести повторный анализ данных».

Проблема, по словам Славова, заключалась в том, что в первоначальном исследовании изменения уровней мРНК и белка между различными генами, которые могут варьироваться в 1000 раз и более, были сгруппированы вместе с различиями экспрессии для отдельных генов между тканями, которые « обычно в 10-кратном диапазоне ». Такой массовый анализ данных привел к созданию« классического парадокса Симпсона », сказал Славов – статистическое явление, при котором очевидные тенденции в отдельных наборах данных исчезают или обращаются вспять при их объединении.

Конечно же, когда Славов повторно проанализировал файлы необработанных данных из двух исследований природы вместе с данными более недавнего исследования протеома, он обнаружил, что при сравнении отдельных генов в разных тканях данные мРНК практически не предсказывают уровни белка вообще.

Славов сказал, что шум в данных был причиной этой непредсказуемости, но в разных наборах данных было достаточно воспроизводимых результатов, чтобы предположить, что остальная часть непредсказуемости была обусловлена ​​тканеспецифичной регуляцией после транскрипции. Вкратце, объяснил Славов, различия в таких вещах, как деградация мРНК, деградация белка и секреция белка между типами клеток, делают уровень мРНК отдельного гена очень плохим предиктором его содержания белка в тканях.

Документ не подразумевает, что никогда не следует доверять уровням мРНК в качестве индикатора экспрессии белка, сказал системный биолог Майкл Спрингер из Гарвардской медицинской школы, который не принимал участия в исследовании. Что касается уровня мРНК и белка, то он сказал: «В общем, это правда. Высокоэкспрессируемые мРНК приводят к высокоэкспрессированным белкам, слабо экспрессируемые мРНК приводят к слабо экспрессируемым белкам ».

«Но, – продолжил он, – если различия более тонкие – поскольку они часто относятся к одному и тому же гену в разных тканях или в разных условиях, тогда вам следует быть осторожным с использованием мРНК в качестве показателя уровня белка. , , Это действительно зависит от вопроса, который вы задаете ».

Ученый связался с Бернхардом Кюстером, одним из авторов исследования природы 2014 года, но не получил ответа.

A. Franks et al., « Посттранскрипционная регуляция в тканях человека », PLOS Computational Biology, 13: e1005535, 2017.

Обсуждение

Ваш e-mail не будет опубликован. Обязательные поля помечены *