Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1- 0_Технология разработки программного обеспечения (Технология разработки программного обеспеченияКонтрольная работа № 1)

.doc
Скачиваний:
32
Добавлен:
23.06.2014
Размер:
218.11 Кб
Скачать

ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

СИСТЕМ УПРАВЛЕНИЯ И РАДИОЭЛЕКТРОНИКИ

(ТУСУР)

Заочный факультет (дистанционная форма обучения)

Кафедра автоматизированных систем управления (АСУ)

Технология разработки программного обеспечения

Контрольная работа № 1

Студент Авдеева Екатерина Сергеевна

Дата выполнения работы _ _

Дата проверки _ _

Оценка _ _

И. О. Фамилия преподователя _ _

Подпись преподователя _ _

Мирный

2009 г.

В а р и а н т № 1

Задание 1.

Даны четырехклеточные таблицы:

а) в социологическом исследовании опрошено 190 человек. Получена таблица:

100

0

0

100

б) в ходе исследования было обследовано 500 предприятий. Получена таблица:

100

100

100

100

в) в исследовании опрошено 150 человек. Получена таблица:

100

0

0

50

1) Есть ли связь между признаками в таблицах?

2) Какова сила связи между признаками в таблицах?

3) Получите формулы для вычисления отклонения фактической

частоты от "независимой" в таблице 2х2 для клеток a и b.

Сделайте вывод.

Решение:

Будем рассматривать генеральную совокупность, где классификация сделана на основании наличия (отсутствия) признака А. Задача о взаимозависимости возникает, если имеется два признака А и В. Пусть α - отсутствие признака А, β - отсутствие признака В. Количества попаданий в четыре возможные подгруппы могут быть представлены таблицей:

В

неВ

Сумма

А

(АВ)

(А β)

(А)

неА

(αВ)

(α β)

(α)

Сумма

(В)

(β)

n

Это таблица 22 – четырехклеточная. Чаще ее записывают в виде

a

b

a+b

c

d

c+d

a+c

b+d

n

Если между признаками А и В не существует никакой связи, то есть если обладание признаком А не связано с обладанием признаком В, доля индивидов с признаком А среди индивидов, обладающих признаком В, должна быть равна доле индивидов с признаком А среди индивидов, не обладающих признаком В.

По определению признаки независимы в данной совокупности из n наблюдений, если . Данное соотношение можно переписать в виде: .

Если для какой-либо таблицы выполнено неравенство , означающее, что доля А среди В больше, чем среди не В, то А и В называют положительно связанными или просто связанными.

Если имеем противоположное неравенство , значит, A и B отрицательно связаны.

Мера связи Q выражается через коэффициент ассоциации Юла:

При следует - признаки независимы.

При следует - полная связанность.

При следует - полная связанность.

а)

В

неВ

Сумма

А

100

0

100

неА

0

100

100

Сумма

100

100

190

Поскольку , значит А и В положительно связаны.

Мера связи: - полная связанность.

б)

В

неВ

Сумма

А

100

100

100

неА

100

100

100

Сумма

100

100

500

Поскольку , значит, А и В положительно связаны.

Мера связи: - связь отсутствует.

в)

В

неВ

Сумма

А

100

0

100

неА

0

50

50

Сумма

100

50

150

Поскольку , значит, А и В положительно связаны.

Мера связи: - полная связанность.

Разность между наблюдаемой частотой и частотой, полученной в предположении, что признаки независимы, для клетки (АВ):

Для клетки a:

Для клетки b:

Для постоянных маргинальных частот разность между наблюдаемой и “независимой” частотами в любой клетке будут равны , т.е. однозначно определяет отклонение от независимой частоты.

Задание 2.

Вычислить ранговые критерии

а) p1: 3 2 1 4 б) p1: 1 2 3 4 в) p1: 5 2 3 4

p2: 3 2 1 4 p2: 3 1 4 2 p2: 4 3 2 1

г) p1: 2 2 2 4 5 д) p1: 1 2 3 е) p1: 1 2 3

p2: 1 4 2.5 2.5 5 p2: 1 2 3 p2: 3 2 1

p3: 1 2 3 p3: 2 2 2

p4: 1 2 3 p4: 2 2 2

Решение:

а)

p1: 3 2 1 4

p2: 3 2 1 4

Ранговый коэффициент корреляции Спирмэна:

Коэффициент корреляции Спирмэна = 1, значит, есть сильная связь между ранжировками.

Упорядочиваем одну из двух выборок:

p1: 1 2 3 4

p2: 1 2 3 4

Коэффициент ранговой корреляции Кендэла:

Коэффициент ранговой корреляции Кендэла = 1, значит, есть сильная связь между ранжировками.

б)

p1: 1 2 3 4

p2: 3 1 4 2

Ранговый коэффициент корреляции Спирмэна:

Коэффициент корреляции Спирмэна = 0, значит, связь между ранжировками отсутствует.

Упорядочиваем одну из двух выборок:

p1: 1 2 3 4

p2: 3 1 4 2

Коэффициент ранговой корреляции Кендэла:

Коэффициент ранговой корреляции Кендэла = 0, значит, связь между ранжировками отсутствует.

в)

p1: 5 2 3 4

p2: 4 3 2 1

Ранговый коэффициент корреляции Спирмэна:

Коэффициент корреляции Спирмэна = -0.2, значит, есть слабая связь между ранжировками.

Упорядочиваем одну из двух выборок:

p1: 4 3 2 5

p2: 1 2 3 4

Коэффициент ранговой корреляции Кендэла:

Коэффициент ранговой корреляции Кендэла = 0, значит, связь между ранжировками отсутствует.

г)

p1: 2 2 2 4 5

p2: 1 4 2.5 2.5 5

Поскольку есть группы неразличимых рангов:

Ранговый коэффициент корреляции Спирмэна:

R=0.57, значит, связь между ранжировками средняя.

Упорядочиваем одну из двух выборок:

p1: 2 2 2 4 5

p2: 1 4 2.5 2.5 5

,

Коэффициент ранговой корреляции Кендэла:

Коэффициент ранговой корреляции Кендэла = 0.25, значит, есть слабая связь между ранжировками.

д)

p1: 1 2 3

p2: 1 2 3

p3: 1 2 3

p4: 1 2 3

Ранжировок больше 2, т.е. необходимо вычислить коэффициент конкордации:

, значит, между оценками экспертов есть сильная связь.

е)

p1: 1 2 3

p2: 3 2 1

p3: 2 2 2

p4: 2 2 2

Поскольку есть объединенные ранги, формула

должна быть модифицирована в

, значит, связь между оценками экспертов отсутствует.

Задание 3.

На основе данных исследования получена таблица

Пол

Оценка состояния здоровья

Не болею

совсем

Болею редко

Болею часто

Совсем больной

Мужской

10

20

60

10

Женский

5

20

65

10

Есть ли и какова связь в оценке здоровья мужчин и женщин ?

Указание: а) провести анализ при помощи ХИ-квадрат теста

б) вычислить [X/Y]

в) перейти к ранговым переменным и оценить

согласованность мнений

Решение:

а) Выдвигаем гипотезу о том, что связи в оценке здоровья мужчин и женщин нет.

, где

Пол

Оценка состояния здоровья

Сумма

Не болею

совсем

Болею редко

Болею часто

Совсем больной

Мужской

10

20

60

10

100

Женский

5

20

65

10

100

Сумма

15

40

125

20

200

Число степеней свободы:

При уровне значимости из таблицы

Расчетное значение , значит, гипотеза об отсутствии связи в оценке здоровья мужчин и женщин подтверждается. Связь отсутствует.

б) Направленные (несимметричные) коэффициенты определяются формулами:

,

Пол

Оценка состояния здоровья

Не болею

совсем

Болею редко

Болею часто

Совсем больной

Мужской

10

20

60

10

Женский

5

20

65

10

в) перейдём к ранговым переменным

p1: 1 2 3 1

p2: 1 3 4 2

Для оценки согласованности мнений можно руководствоваться значением коэффициента Спирмэна.

р = 0.7, значит, есть связь между мнениями.