Октябрь 17

RStudio – день второй

Выкладываю протокол занятий. Результаты работы программы можно посмотреть по ссылке. Ниже приводится тест на самопроверку с подробными объяснениями ответов. Предлагаю пройти, раз уж я его не поленился и сделал.

После выполнения теста нажмите кнопку “Ответить” и ждите результатов, они будут показаны на этой же странице c ответами после каждого вопроса. Возможна небольшая задержка в отображении результатов.

1. Загрузите данные по весу сердец кошек из пакета MASS.


library(MASS)
data("cats")

Таблица данных cat содержит три колонки:
Sex – пол (F – кошка, M – кот);
Bwt – вес кошки в килограммах;
Hwt – вес сердца в граммах.

Какое значение находится в третьей строке и втором столбце таблицы cats?

 
 
 
 

2. Какой самый большой вес у кошки (женский пол) в данной выборке в килограммах?

 
 
 
 

3. Проведите тест на нормальность Шапиро-Уилка для веса кошек.
Выберите два правильных ответа:

  • Чему равно W и p-value?
  • Гипотеза о нормальности распределения принимается или отклоняется?
 
 
 
 
 
 

4. Вы решили построить скрипичную диаграмму (violin plot) с использованием пакета vioplot для того, чтобы сравнить распределение веса для  самок и самцов кошек.

 

rplot01

Какие для этого надо выполнить команды?

Обратите внимание, что кавычки везде двойные. Это проблема пакета тестирования, который заменяет кавычки.

 

 
 
 
 

5. Проведите тест Граббса на промахи для веса сердец кошек. Чему равны статистики?

 
 
 
 

6. Постройте регрессионную модель зависимости веса сердца для всех кошек от веса их тела.

Чему равен регрессионный коэффициент?

 
 
 
 

7. Для той же регресии определите, значим ли свободный член в регрессии?

 
 
 
 

8. А вот такой еще вопрос. Мы разбирали ка построить доверительный интервал для коэффициентов регрессии. Однако по умолчанию строится 95% доверительный интервал, а нас интересует 99%. Воспользуйтесь подсказкой к команде и постройте 99% доверительный интервал для коэффициентов. Чему равна верхняя границв для коэффициента при регрессоре при 99% доверительном интервале?

 
 
 
 

9. А теперь потренируем описательную статистику. Вы уже умеете получать простую статистику с помощью команды summary. Однако Более подробную описательную статистику, которая включает себя: число измерений (nbr.val), число пустых значений (nbr.null), число неопределённых значений (nbr.na), минимум (min), максимум (max), размах (range), сумм (sum), медиану (median), среднее (mean), стандартную ошибку среднего (SE.mean), 95% доверительный интервал для среднего (CI.mean.0.95), дисперсию (var), стандартное отклонение (std.dev), коэффициент вариации (coef.var), коэффициент асимметрии (skewness) и его критерий значимости * (skew.2SE), коэффициент эксцесса (kurtosis) и его критерий значимости (kurt.2SE), тест на нормальность Шапиро-Уилка (normtest.W) и вероятность
нулевой гипотезы для этого теста (normtest.p), можно получить с помощью команды stat.desc пакета pastecs.

Необходимо установить этот пакет,подключить и вывести статистику для данных. Воспользуйтесь помощью к пакету и получите данные о коэффициента асиметрии для веса кошек. Чему он равен?

 
 
 
 

10. И, в заключение, вспомним работу с выборкой. Установим генератор случайных чисел командой

set.seed(2016)

чтобы у нас получились одинаковые ответы. Сделайте таблицу cat2, содержащую выборку из 10 случайных элементов из таблицы cats. Сделайте описательную статистику для этой таблицы

Чему равна медиана веса кошек?

 
 
 
 

 

Если у вас есть какие-либо вопросы – спрашивайте в комментариях.


Метки:

Опубликовано 17.10.2016 Тушавин В.А. в категории "Изучаем R и RStudio