5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Болбачан_О_А_,_Ибраимова_Д
.pdfТема 8. КОРРЕЛЯЦИЯ
Цель изучения темы
Студент должен знать:
•сущность корреляционной связи между признаками;
•направления и силу корреляционной связи;
•сущность коэффициента детерминации.
Студент должен уметь:
•владетьметодикойвычислениякоэффициентакорреляции по методу рангов и оценки характера, силы связи;
•вычислять коэффициент детерминации.
План изучения темы
1. Разбор темы по учебным вопросам
•Определение понятия «корреляционная связь».
•Коэффициент корреляции: понятие: методика вычисления.
•Оценка направления и силы коэффициента корреляции.
•Коэффициент детерминации: применение: методика вычисления.
2.Решение задач.
3.Закрепление материала по контрольным вопросам и те-
стам
Коэффициент корреляции
Все явления в природе и обществе находятся во взаимосвязи. Корреляционная связь – изменение какого-либо признака связано главным образом, но не исключительно с изменением другого явления или признака. Например, вес человека в основном зависит от его роста, однако, кроме роста, на величину веса влияют и другие факторы – питание, состояние здоровья, занятия спортом и т. д. Поэтому люди одинакового роста имеют разный вес за редким исключением. Кроме корреляционной связи, имеется функциональная связь – строгая зависимость явлений. Например, чем больше радиус шара, тем больше объем, чем длин-
91
Рекомендовано к изучению сайтом МедУнивер - https://meduniver.com/
нее день, тем короче ночь. При функциональной связи изменение какого-либо явления вызывает обязательно строго определенные изменения другого явления.
При положительной (прямой) связи, когда изменение одного явления идет в том же направлении, что и изменение другого явления, коэффициент корреляции принимает значение в пределах от 0 до +1. В случаях отрицательной (обратной) связи, когда изменение одного явления сопровождается изменением другого явления в обратном направлении, коэффициент корреляции принимает значение в пределах от 0 до –1. Чем больше коэффициент корреляции приближается к 1 (–1), тем больше связь изучаемых явлений. Значение коэффициента корреляции, равное 0, свидетельствует об отсутствии связи, а равное 1 (–1) – о полной связи.
Методы вычисления коэффициента корреляции:
•ранговая корреляция (способ Спирмана – Р), менее точный;
•способ квадратов (способ Пирсона – r), более точный,
применяется для малой выборки.
Формула вычисления коэффициента ранговой корреляции (способ Спирмана):
,
где 6 – постоянная величина; d – разность между порядковыми номерами рядов; n – число корреляционных рядов.
Пример вычисления коэффициента ранговой корреляции (способ Спирмана) (таблица 8.1).
Методика вычисления.
1.Определение порядковых номеров (ранги) возраста и величины лейкоцитов в порядке увеличения величин (графа х и у).
2.Вычисление разности рангов d: (х – у).
3.Воздействие разности рангов в квадрат d и определение их суммы ∑d2.
92
Таблица 8.1 – Показатели содержание уровня лейкоцитов в крови в зависимости от возраста
|
|
Возраст, лет, |
Лейкоциты, |
Ранги в сторону увеличения |
Разность рангов d, |
Квадрат разности |
||
|
|
Возраст, |
Лейкоциты, |
|||||
|
|
х |
у |
х |
у |
(х – у) |
рангов, d2 |
|
|
|
|
|
|
|
|
|
|
|
|
20–29 |
193,3 |
1 |
1 |
0 |
0 |
|
Рекомендовано |
|
30–39 |
222,5 |
2 |
4 |
-2 |
4 |
|
|
|
|
|
|
|
|
∑d2 = 18 |
|
|
|
40–49 |
224,4 |
3 |
5 |
-2 |
4 |
|
|
|
50–59 |
220,0 |
4 |
3 |
1 |
1 |
|
|
|
60–69 |
218,8 |
5 |
2 |
3 |
9 |
|
|
|
70 и старше |
229,7 |
6 |
6 |
0 |
0 |
|
изучению к |
93 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
com/.https://meduniver - МедУнивер сайтом |
|
|
|
|
|
|
|
|
4. Данные представляют в формулу:
.
5. Оценка показателя проводится по шкале (таблица 8.2).
Таблица 8.2 – Шкала оценки направления и силы коэффициента корреляции
Сила связи |
|
Характер связи |
|
Прямая |
|
Обратная |
|
|
|
||
Слабая |
0–0,29 |
|
0 – (–0,29) |
Средняя |
0,3–0,69 |
|
–0,3 – (–0,69) |
Сильная |
0,7–1 |
|
–0,7 – (–1) |
В данном примере связь прямая (знак +), средняя (0,5).
Вычисление коэффициента детерминации, показывающего долю влияния причины на следствие (в нашем случае влияние возраста на количество лейкоцитов), производится по формуле
R = P2 × 100 = 0,52 × 100 = 25 %.
Вычисление коэффициента по способу квадратов (Пирсона) имеется в соответствующей литературе.
Задачи
Задача 1
Влияние содержания уровня фтора в воде на заболеваемость кариеса у детей
Зона |
Средняя концентрация фтора, |
Количество |
|
мг/л |
выявленных детей |
Первая |
0,29 ± 0,01 |
631 |
Вторая |
0,60 ± 0,02 |
448 |
Третья |
1,18 ± 0,07 |
252 |
Определить коэффициент корреляции между содержанием фтора и кариесом зубов.
94
Задача 2
Влияние содержания уровня фтора в воде на флюороз у детей
Район |
Количество |
Концентрация фтора, |
|
выявленных детей |
мг/л |
А |
1 635 |
1,8 |
Б |
1 835 |
2,5 |
В |
2 010 |
2,9 |
Г |
1 600 |
1,7 |
Определить коэффициент корреляции между содержанием фтора и флюорозом.
Задача 3
Зависимость между длительностью охлаждения организма (2 ч ежедневно) и уровнем молочной кислоты
в крови у подростков
Дни охлаждения |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Молочная кислота, |
77,0 |
77,0 |
77,2 |
77,1 |
88,5 |
88,9 |
88,7 |
99,0 |
99,5 |
99,3 |
мг% |
|
|
|
|
|
|
|
|
|
|
Определить направление и силу связи между двумя показателями путем вычисления коэффициента корреляции, вычислить коэффициент детерминации.
Задача 4
Суточная потребность белка восьмилетних девочек
Вес девочек, кг |
20 |
22 |
23 |
25 |
26 |
27 |
28 |
|
Суточная потребность |
62,0 |
66,0 |
62,0 |
75,0 |
75,0 |
78,0 |
82,0 |
|
в белках, г |
||||||||
|
|
|
|
|
|
|
Определить коэффициент корреляции между весом девочек и суточной потребностью белка, вычислить коэффициент детерминации.
95
Рекомендовано к изучению сайтом МедУнивер - https://meduniver.com/
Задача 5
Поглощение радиоактивного йода щитовидными железами у крыс в разные сроки их пребывания в условиях высокогорья
Дни пребывания |
10 |
15 |
20 |
25 |
30 |
35 |
Радиоактивность, % |
12,0 |
15,0 |
15,0 |
17,0 |
20,0 |
15,0 |
Определить коэффициент корреляции между днем пребыванияввысокогорьеипоглощениемрадиоактивногойодащитовидными железами, вычислить коэффициент детерминации.
Задача 6
Распространенность пневмокониоза среди шахтеров
Возраст, лет |
Выявлено на 100 рабочих |
До 20 |
0,1 |
21–30 |
0,3 |
31–40 |
1,3 |
41–50 |
8,8 |
50 и старше |
5,0 |
Определить направление и силу связи между этими явлениями путем вычисления коэффициента ранговой корреляции, вычислить коэффициент детерминации.
Контрольные вопросы
1.Виды корреляционной связи и их сущность.
2.Методы вычисления коэффициента корреляции.
3.Оценка коэффициента корреляции.
4.Коэффициент детерминации: понятие.
Тесты
1.Формасвязимеждуявлениямиилипризнаками:а)функциональная, б) стандартизованная, в) количественная г) качественная.
2.Сила корреляционной связи: а) нормальная, б) сильная, в) обычная, г) усредненная.
3.Существуютнаправлениякорреляционнойсвязи:а)сплошная, б) прерывистая, в) обратная, г) кривая.
96
4.Существует способ вычисления коэффициента корреляции: а) Фишера, б) Пирсона, г) Стьюдента, д) Ермоловой.
5.Корреляция означает: а) прямую связь, б) пропорциональную связь, в) полную связь, г) взаимосвязь.
6. Слабая корреляционная связь: а) 0–0,29; б) 0,3–0,69;
в) 0,7–1,0; г) > 1.
7. Средняя корреляционная связь: а) > 1; б) 0,7–1,0; в) 0–0,29;
г) 0,3–0,69.
97
Рекомендовано к изучению сайтом МедУнивер - https://meduniver.com/
Тема 9. РЕГРЕССИЯ
Цель изучения темы
Студент должен знать:
•применение метода регрессии в практике врача;
•принципы построения шкалы регрессии;
•методику вычисления коэффициента регрессии;
•методику вычисления уравнения линейной регрессии;
•методику вычисления среднего квадратического отклонения коэффициента регрессии.
Студент должен уметь:
•вычислять коэффициент регрессии;
•вычислять уравнение линейной регрессии;
•вычислять среднеквадратическое отклонение коэффициента регрессии;
•строить график регрессии.
План изучения темы
1. Разбор темы по учебным вопросам
•Коэффициент регрессии: понятие, методика вычисления.
•Уравнение линейной регрессии: методика вычисления.
•Среднее квадратическое отклонение коэффициента регрессии: методика вычисления.
•Методика построения графика шкалы регрессии.
2.Решение задач
3.Закреплениематериалапоконтрольнымвопросамитестам
Коэффициент регрессии
Регрессия – функция, позволяющая по величине одного коррелируемого (связанного) признака определить средние величины другого признака.
С помощью регрессии ставится задача выяснить, как количественно меняется одна величина при изменении другой величины. Например, насколько в среднем увеличится вес ребенка
98
с увеличением его роста на определенную величину. Имея местный стандарт, например, родители ребенка могут коррелировать его вес в соответствии с увеличением роста.
Для определения размера этого изменения применяется коэффициент регрессии.
Формула определения коэффициента регрессии:
,
где rxy– коэффициент корреляции; у – первая сравниваемая величина; х – вторая сравниваемая величина; σх и σу – среднее квадратическое отклонение для ряда первой и второй величины.
С помощью коэффициента регрессии можно определить величину одного из признаков (массы тела, зная значение другого – роста).Этовозможновычислитьспомощьюуравнениялинейной регрессии по формуле
,
где у – искомая величина (масса тела); х – известная величина роста; – коэффициент регрессии массы тела по росту;
Му – среднее значение массы тела; Мх – среднее значение роста. В жизни люди одинакового роста могут иметь разный вес.
Меру индивидуального разнообразия характеризует сигма регрессии. Формула:
,
где σ – среднее квадратическое отклонение изучаемого признака; rxy – коэффициент корреляции.
По данным сигмы регрессии можно построить график (шкала регрессии), по которому возможно, зная рост, найти и средний вес, и индивидуальное колебание веса.
Пример. Данные веса и роста 10-летних мальчиков:
•среднее квадратическое веса (Ϭу) = ±3,0.
•среднее квадратическое роста (Ϭх) = ±4,0.
•коэффициент корреляции роста и веса (rху) = +0,7.
99
Рекомендовано к изучению сайтом МедУнивер - https://meduniver.com/
Определить коэффициент регрессии веса 10-летних мальчиков по их росту.
Подставив в формулу числовые, получим:
.
Вывод: при изменении среднего роста 10-летних мальчиков на 1 см средний вес их изменяется на 0,52 кг.
Пример. Средний рост изучаемых 10-летних мальчиков
(Mx ) = 120 см, средний вес (My ) = 22 кг, Ry/x = 0,52.
Каков будет вес детей при росте 121 см, 122 см и т. д. Определяется по формуле
y = My + Ry/x (x – Mx ),
где y – искомая величина (вес детей), x – рост детей, которому придаем любое нужное значение, Ry/x – коэффициент регрессии по росту, My – средний вес детей, Mx – средний рост детей.
Вычисление:среднийвесдетейприросте121смбудетравен: y = 22 + 0,52 × (121 – 120) = 22,52 кг и т. д.
В практике имеет значение не только оценка средних размеров групп, но и оценка индивидуальных значений веса, роста и т. д. Однако индивидуальные значения могут быть разнообразны, т. е. у людей с одинаковым ростом часто встречается разный вес. Меру разнообразия индивидуальных размеров представляет сигма уравнения регрессии по формуле
,
где Ϭу – среднеквадратическое отклонение изучаемого признака (веса), Rxy – коэффициент корреляции.
На нашем примере .
100