1- 0_Технология разработки программного обеспечения (Технология разработки программного обеспеченияКонтрольная работа № 1)
.docТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
СИСТЕМ УПРАВЛЕНИЯ И РАДИОЭЛЕКТРОНИКИ
(ТУСУР)
Заочный факультет (дистанционная форма обучения)
Кафедра автоматизированных систем управления (АСУ)
Технология разработки программного обеспечения
Контрольная работа № 1
Студент Авдеева Екатерина Сергеевна
Дата выполнения работы _ _
Дата проверки _ _
Оценка _ _
И. О. Фамилия преподователя _ _
Подпись преподователя _ _
Мирный
2009 г.
В а р и а н т № 1
Задание 1.
Даны четырехклеточные таблицы:
а) в социологическом исследовании опрошено 190 человек. Получена таблица:
-
100
0
0
100
б) в ходе исследования было обследовано 500 предприятий. Получена таблица:
-
100
100
100
100
в) в исследовании опрошено 150 человек. Получена таблица:
-
100
0
0
50
1) Есть ли связь между признаками в таблицах?
2) Какова сила связи между признаками в таблицах?
3) Получите формулы для вычисления отклонения фактической
частоты от "независимой" в таблице 2х2 для клеток a и b.
Сделайте вывод.
Решение:
Будем рассматривать генеральную совокупность, где классификация сделана на основании наличия (отсутствия) признака А. Задача о взаимозависимости возникает, если имеется два признака А и В. Пусть α - отсутствие признака А, β - отсутствие признака В. Количества попаданий в четыре возможные подгруппы могут быть представлены таблицей:
|
В |
неВ |
Сумма |
А |
(АВ) |
(А β) |
(А) |
неА |
(αВ) |
(α β) |
(α) |
Сумма |
(В) |
(β) |
n |
Это таблица 22 – четырехклеточная. Чаще ее записывают в виде
a |
b |
a+b |
c |
d |
c+d |
a+c |
b+d |
n |
Если между признаками А и В не существует никакой связи, то есть если обладание признаком А не связано с обладанием признаком В, доля индивидов с признаком А среди индивидов, обладающих признаком В, должна быть равна доле индивидов с признаком А среди индивидов, не обладающих признаком В.
По определению признаки независимы в данной совокупности из n наблюдений, если . Данное соотношение можно переписать в виде: .
Если для какой-либо таблицы выполнено неравенство , означающее, что доля А среди В больше, чем среди не В, то А и В называют положительно связанными или просто связанными.
Если имеем противоположное неравенство , значит, A и B отрицательно связаны.
Мера связи Q выражается через коэффициент ассоциации Юла:
При следует - признаки независимы.
При следует - полная связанность.
При следует - полная связанность.
а)
|
В |
неВ |
Сумма |
А |
100 |
0 |
100 |
неА |
0 |
100 |
100 |
Сумма |
100 |
100 |
190 |
Поскольку , значит А и В положительно связаны.
Мера связи: - полная связанность.
б)
|
В |
неВ |
Сумма |
А |
100 |
100 |
100 |
неА |
100 |
100 |
100 |
Сумма |
100 |
100 |
500 |
Поскольку , значит, А и В положительно связаны.
Мера связи: - связь отсутствует.
в)
|
В |
неВ |
Сумма |
А |
100 |
0 |
100 |
неА |
0 |
50 |
50 |
Сумма |
100 |
50 |
150 |
Поскольку , значит, А и В положительно связаны.
Мера связи: - полная связанность.
Разность между наблюдаемой частотой и частотой, полученной в предположении, что признаки независимы, для клетки (АВ):
Для клетки a:
Для клетки b:
Для постоянных маргинальных частот разность между наблюдаемой и “независимой” частотами в любой клетке будут равны , т.е. однозначно определяет отклонение от независимой частоты.
Задание 2.
Вычислить ранговые критерии
а) p1: 3 2 1 4 б) p1: 1 2 3 4 в) p1: 5 2 3 4
p2: 3 2 1 4 p2: 3 1 4 2 p2: 4 3 2 1
г) p1: 2 2 2 4 5 д) p1: 1 2 3 е) p1: 1 2 3
p2: 1 4 2.5 2.5 5 p2: 1 2 3 p2: 3 2 1
p3: 1 2 3 p3: 2 2 2
p4: 1 2 3 p4: 2 2 2
Решение:
а)
p1: 3 2 1 4
p2: 3 2 1 4
Ранговый коэффициент корреляции Спирмэна:
Коэффициент корреляции Спирмэна = 1, значит, есть сильная связь между ранжировками.
Упорядочиваем одну из двух выборок:
p1: 1 2 3 4
p2: 1 2 3 4
Коэффициент ранговой корреляции Кендэла:
Коэффициент ранговой корреляции Кендэла = 1, значит, есть сильная связь между ранжировками.
б)
p1: 1 2 3 4
p2: 3 1 4 2
Ранговый коэффициент корреляции Спирмэна:
Коэффициент корреляции Спирмэна = 0, значит, связь между ранжировками отсутствует.
Упорядочиваем одну из двух выборок:
p1: 1 2 3 4
p2: 3 1 4 2
Коэффициент ранговой корреляции Кендэла:
Коэффициент ранговой корреляции Кендэла = 0, значит, связь между ранжировками отсутствует.
в)
p1: 5 2 3 4
p2: 4 3 2 1
Ранговый коэффициент корреляции Спирмэна:
Коэффициент корреляции Спирмэна = -0.2, значит, есть слабая связь между ранжировками.
Упорядочиваем одну из двух выборок:
p1: 4 3 2 5
p2: 1 2 3 4
Коэффициент ранговой корреляции Кендэла:
Коэффициент ранговой корреляции Кендэла = 0, значит, связь между ранжировками отсутствует.
г)
p1: 2 2 2 4 5
p2: 1 4 2.5 2.5 5
Поскольку есть группы неразличимых рангов:
Ранговый коэффициент корреляции Спирмэна:
R=0.57, значит, связь между ранжировками средняя.
Упорядочиваем одну из двух выборок:
p1: 2 2 2 4 5
p2: 1 4 2.5 2.5 5
,
Коэффициент ранговой корреляции Кендэла:
Коэффициент ранговой корреляции Кендэла = 0.25, значит, есть слабая связь между ранжировками.
д)
p1: 1 2 3
p2: 1 2 3
p3: 1 2 3
p4: 1 2 3
Ранжировок больше 2, т.е. необходимо вычислить коэффициент конкордации:
, значит, между оценками экспертов есть сильная связь.
е)
p1: 1 2 3
p2: 3 2 1
p3: 2 2 2
p4: 2 2 2
Поскольку есть объединенные ранги, формула
должна быть модифицирована в
, значит, связь между оценками экспертов отсутствует.
Задание 3.
На основе данных исследования получена таблица
Пол |
Оценка состояния здоровья |
|||
Не болею совсем |
Болею редко |
Болею часто |
Совсем больной |
|
Мужской |
10 |
20 |
60 |
10 |
Женский |
5 |
20 |
65 |
10 |
Есть ли и какова связь в оценке здоровья мужчин и женщин ?
Указание: а) провести анализ при помощи ХИ-квадрат теста
б) вычислить [X/Y]
в) перейти к ранговым переменным и оценить
согласованность мнений
Решение:
а) Выдвигаем гипотезу о том, что связи в оценке здоровья мужчин и женщин нет.
, где
Пол |
Оценка состояния здоровья |
Сумма |
|||
Не болею совсем |
Болею редко |
Болею часто |
Совсем больной |
||
Мужской |
10 |
20 |
60 |
10 |
100 |
Женский |
5 |
20 |
65 |
10 |
100 |
Сумма |
15 |
40 |
125 |
20 |
200 |
Число степеней свободы:
При уровне значимости из таблицы
Расчетное значение , значит, гипотеза об отсутствии связи в оценке здоровья мужчин и женщин подтверждается. Связь отсутствует.
б) Направленные (несимметричные) коэффициенты определяются формулами:
,
Пол |
Оценка состояния здоровья |
|||
Не болею совсем |
Болею редко |
Болею часто |
Совсем больной |
|
Мужской |
10 |
20 |
60 |
10 |
Женский |
5 |
20 |
65 |
10 |
в) перейдём к ранговым переменным
p1: 1 2 3 1
p2: 1 3 4 2
Для оценки согласованности мнений можно руководствоваться значением коэффициента Спирмэна.
р = 0.7, значит, есть связь между мнениями.