Skip to main content

Лекции по биоинформатике: Анализ экспрессии. 4 декабря 2010

Константин Третьяков (Тартуский Университет, BIIT Research Group; STACC)

Данные экспрессии генов являются одними из важнейших объектов исследования современной биоинформатики. Цель данного курса — рассказать о данных экспрессии и основных методах анализа таких данных.

  • Слайды: (pdf)
  • Демонстрация на R: (html)

Re:

Про p.adjust

После лекции был задан следующий вопрос, на который я слету не нашелся как уверенно ответить:

"Поправка FDR в примере на R осуществляется с помощью функции p.adjust, которая не требует параметра. В то же время метод FDR как таковой по определению нуждается в параметре - пропорции ожидаемых "ошибок" в выбранных гипотезах. Ведь он выбирает гипотезы исходя из заранее указанного значения данного параметра. Как так?

Отвечаю здесь. Надеюсь, что ответ достигнет адресата, или же адресат уже сам разобрался. Все просто. Функция p.adjust пересчитывает данные ей p-значения таким образом, чтобы критерий which(adjusted.p.values < 0.05) соответствовал выборке тех p-значений, которые удовлетворяют поправке FDR=0.05.

Другими словами, пересчитанное функцией p.adjust значение в точности равно минимальному FDR, при котором соответствующая гипотеза попадет в выборку.

ответ на вопрос.

Спасибо :)

Добавления к слайдам

Т.к. уже после проведения лекции мне подумалось, что самую последнюю тему наверное следовало проиллюстрировать чуть-чуть поконкретнее, я добавил в слайды и материалы на R дополнительный пример, который на лекции не рассматривался (см. слайды 152-159). Надеюсь что интересующиеся смогут разобраться в нем без пояснений вживую.

Также обратите внимание, что слайды 164-165 содержат несколько ссылок на рекомендуемую литературу по теме.