Кривая нормального распределения

  • автор:

Кривая нормального распределения

Большинство процедур статистического анализа, часто используемых в исследованиях, основаны на предположении о том, что наблюдаемые переменные распределяются среди всей популяции по нормальному закону. Если переменная имеет нормальное распределение, то при графическом представлении данных большого числа измерений этой переменной получится кривая характерной колоколообразной формы, которая называется кривой нормального распределения (ее часто называют просто нормальной кривой). Если, например, измерить рост (переменная) большого числа мужчин и женщин, случайно выбранных однажды утром из толпы прохожих на углу живленной улицы, то в этой выборке окажется относительно небольшая процентная доля очень высоких и очень низкорослых людей. Большинство людей из выборки будут иметь средний рост. В графической форме эту серию наблюдений можно представить в виде кривой нормального распределения, изображенной на рис. 2.2.

Рис. 2.2. Кривая нормального распределения

Естественно происходящие события, такие как забастовки, дают индустриально-организационным психологам возможность проведения полезных полевых и обсервационных исследований.

Любую нормальную кривую можно описать с помощью двух чисел. Одно из них — это усредненное по всем измерениям значение переменной, выраженное в единицах используемой шкалы, то есть среднее значение (m) распределения. Как показано на рис. 2.2, точка с абсциссой m лежит на оси симметрии кривой. Второе число, описывающее нормальную кривую, характеризует вариабельность, или разброс точек кривой относительно среднего значения. С помощью математических преобразований вариабельность всех кривых такого вида можно выразить через стандартную единицу, которая называется стандартным отклонением (s).

Если известны среднее значение и стандартное отклонение нормальной кривой, то любой человек может точно воспроизвести эту кривую, поскольку при нормальном распределении переменной в каждый интервал длиной в одно стандартное отклонение влево или вправо от среднего значения попадает строго определенная процентная доля всех наблюдавшихся значений переменной. Эти процентные доли указаны на рис. 2.2: например, 68,26 % всех значений переменной отличаются от среднего значения не более чем на одно стандартное отклонение (по 34,13 % в меньшую и в большую стороны).

Кривая нормального распределения не только служит основой формального статистического анализа, но и используется в некоторых других целях. Одна из наиболее важных целей — объяснить людям, что означают баллы, полученные ими при прохождении тестов. Если среднее значение результатов стандартизованного теста математических способностей равно 50 баллам, а стандартное отклонение — 10, то человек, получивший, например, 70 баллов, справился с тестом лучше, чем примерно 95 % людей, которые проходили этот тест. Результат 70 баллов на два стандартных отклонения превышает средний (50 + 10 + 10 = 70).

Большинство статистических процедур основаны на предположении о нормальности кривой распределения, но некоторые важные для исследования переменные не подчиняются нормальному закону распределения. Такая переменная, как пол, имеет бимодальное распределение, то есть при измерении она может принимать только два значения — мужской и женский. Другие переменные имеют так называемое асимметричное распределение, когда большинство значений переменной группируется вокруг точки измерительной шкалы, которая не является средним значением. Асимметричное распределение имеет вес тела американцев; для людей любого роста и пола (то есть при условии контроля над ростом и полом) доля людей с весом выше среднего больше, чем доля людей с весом ниже среднего.

Для анализа переменных, имеющих бимодальное, асимметричное и другие отличные от нормального распределения, необходимы специальные статистические процедуры, но за немногими исключениями (например, пол) эти переменные редко встречается в индустриально-организационной психологии. Однако распределение данных наблюдений для конкретной выборки может отличаться от не нормального из-за особенностей плана эксперимента или ошибок при формировании выборки.

Корреляция и корреляты

Корреляцией называется такая связь между переменными, когда по изменениям одной из этих переменных можно предсказывать изменения другой. В литературе по индустриально-организационной психологии распространенным примером такой связи является соотношение между возрастом и выраженной удовлетворенностью работой. За годы исследований во многих работах была обнаружена тенденция к положительной корреляции между этими переменными; это означает, что возрастание одной из них происходит вместе с возрастанием другой. С увеличением возраста в целом увеличивается и выраженная удовлетворенность работой. С другой стороны, между удовлетворенностью работой и отсутствием на работе часто обнаруживают отрицательную корреляцию; это значит, что с возрастанием одной из этих переменных другая убывает. С увеличением выраженной удовлетворенности работой уровень отсутствия на работе обычно падает.

Разработаны различные процедуры, с помощью которых можно определить, существует ли между двумя переменными, такими как возраст и удовлетворенность работой, корреляционная связь, а если существует, то положительная или отрицательная. Все эти процедуры основаны на одной и той же методике. Производится измерение обеих переменных у каждого испытуемого, и результаты измерений обрабатываются: помощью определенной вычислительной процедуры. Эта процедура позволяет получить коэффициент корреляцииr, который уже упоминался выше.

В некоторых исследованиях одно из двух измерений, которые при корреляционном анализе проводят у каждого испытуемого, фактически является группой измерений. Индустриально-организационного психолога может, например, заинтересовать связь между результатами пяти отборочных тестов при приеме на работу и показателями учебы по программе профессиональной подготовки. Для исследования этой связи он может использовать процедуру множественной корреляции. Первое измерение — это измерение показателей подготовки каждого испытуемого. Второе измерение — это комбинированный результат тестирования (одно число), который математически выводится из результатов пяти различных отборочных тестов. Когда коэффициент корреляции для этих двух переменных рассчитан, результат обозначают через R (читается как «множественный R»), чтобы было ясно, что речь идет о большем числе переменных, чем обычные две.

Все коэффициенты корреляции, независимо от метода их расчета, лежат в диапазоне от -1,00 до +1,00. (В дальнейшем мы будем опускать знак «плюс» для положительных коэффициентов корреляции.) Значение коэффициента корреляции указывает на силу связи между переменными; чем оно ближе к 1,00 со знаком «плюс» или «минус», тем сильнее эта связь.

Коэффициент корреляции рассчитывается математически, но часто его представляют графически, в виде так называемого точечного графика. Вводится система координат с двумя осями, вдоль каждой из которых откладываются значения одной из переменных, и строятся точки, соответствующие результатам каждого испытуемого. На рис. 2.3 показан точечный график, отражающий относительные позиции 18 испытуемых по результатам грамматического теста и словарного теста. Один испытуемый (Испытуемый 5) получил по 60 баллов за оба теста. Большинство остальных испытуемых получили разные результаты за разные тесты, но явно существует сильная тенденция к тому, чтобы при высоком результате одного теста результат второго теста тоже был высоким.

Рисунок 2.3. Точечный график, показывающий результаты (в баллах) грамматического теста и словарного теста

Рассчитанный по данным рис. 2.3 коэффициент корреляции r = 0,94.

Вопрос 26 Нормальная кривая как инструмент подбора

Из паттерна расположения точек, которые поднимаются из нижнего левого угла графика в верхний правый угол, видно, что это положительная корреляция. Если бы корреляция была отрицательной, то точки опускались бы из верхнего левого угла в нижний правый.

Корреляционные связи

Связь между переменными на рис. 2.3 является линейной; это значит, что точки лучше всего ложатся на прямую линию. Однако не все корреляционные связи являются линейными. Некоторые исследователи, например, предполагают, что связь между окончательным уровнем образования и удовлетворенностью работой, по сообщениям испытуемых, является нелинейной связью.Это означает, что более высокая удовлетворенность работой связана как с высокими, так и с низкими уровнями образования. Более низкая удовлетворенность работой связана со средними уровнями образования. Этот паттерн представлен графически на рис. 2.4.

Рис.2.4. Графическое изображение нелинейной корреляционной связи

Если исследователь использует стандартные процедуры для расчета коэффициента корреляции между переменными, которые на самом деле связаны нелинейной 1ависимостью, то у него вполне может получиться, что между этими переменными вообще не существует связи. В таком случае он сделает неправильный вывод, что связь между удовлетворенностью работой и уровнем образования отсутствует. Чтобы включить такую возможность, исследователи перед тем, как сделать вывод об отсутствии связи между переменными, проводят стандартную процедуру тестирования на наличие нелинейной связи.

Возможность существования нелинейной связи между переменными не является единственным фактором, затрудняющим выявление истинного характера корреляционной зависимости. Присутствие сильной опосредующей переменной также может вешать обнаружению связи между двумя переменными и приводить к неправильным выводам, если оно останется незамеченным. Опосредующая переменная— это переменная, оказывающая предсказуемое влияние на характер связи между двумя другими переменными. Например, Хэкман и Олдхэм (Hackman & Oldham, 1976) выдвинули гипотезу о том, что характер связи между: а) обогащением содержания работы и 5) улучшением выполнения работы и/или удовлетворенностью работой зависит от в) индивидуальных потребностей в личном росте и достижениях. При низком уровне этих потребностей между переменными а и б нет связи или есть очень слабая связь; при высоком уровне потребностей между а и б может существовать сильная положительная корреляция.

В ситуациях, где действуют значимые опосредующие переменные, сила связи между независимой и зависимой переменными определяется уровнем опосредующей переменной. Если гипотеза Хэкмана и Олдхэма верна, то исследователь, который не учел различия в уровнях индивидуальных потребностей в личном росте, вероятнее всего, не обнаружит корреляции между своими измерениями показателей обогащения содержания работы и выполнения работы/удовлетворенности. Учет нелинейной связи и опосредующих переменных является шагом вперед по сравнению с рассмотрением простых корреляционных зависимостей и позволяет изучать более сложные формы человеческого поведения.

Дата добавления: 2016-11-12; просмотров: 357 | Нарушение авторских прав

Рекомендуемый контект:


Похожая информация:


Поиск на сайте:


  1. Понятие нормального распределения

    При построении теоретической нормальной кривой необходимо учитывать следующие свойства нормального распределения:

    1. приблизительно все значения х лежат в «3»-интервале:

    1. нормальная кривая симметрична относительно прямой

    2. максимум нормальной кривой находится в точке

    Гистограмму, полигон частот и нормальную кривую целесообразно совместить на одном графике.

    ПРИМЕР 2. Построить гистограмму, полигон эмпирических частот и нормальную кривую по данным примера 1.

    РЕШЕНИЕ.

    1) Гистограмма – это фигура из столбцов, основание которых равно ширине интервала xi, а высота – частотеni . Если соединить середины интервалов отрезками прямых, получим полигон эмпирических частот в координатах (xi, ni). Значения интервалов и эмпирических частот приведены в табл.4.

    2) Определяем значения f*(x). В примере 1 ширина интервала xi=6%, а объем выборки n=100. Тогда получим:

    Значения f*(x) приведены в столбце 7 табл. 4.

    3) Определяем «3»-интервал:

    4) нормальная кривая симметрична относительно прямой

    5) максимум нормальной кривой находится в точке

    На рис. 1 построены гистограмма, полигон эмпирических частот и нормальная кривая. Сравнение графиков наглядно показывает, что теоретическая кривая удовлетворительно отражает опытные данные. Близость нормальной кривой к эмпирическим частотам подтверждает правильность допущения о том, что исследуемая случайная величинаХ распределена нормально.

    3. Проверка гипотезы о законе распределения по критерию колмогорова

    Пусть эмпирическое распределение задано в виде таблицы, в которой перечислены варианты xi и значения эмпирической функции распределения F*(x) (табл.5).

    Таблица 5

    Значения эмпирической функции распределения

    F*(x)

    F*(x1)

    F*(x2)

    F*(xn)

    Для каждого значения xi определим теоретические значения функции распределения F(x). При уровне значимости  необходимо проверить, насколько сильно эмпирическая функция распределения F*(x) отличается от теоретической F(x).

    В этом случае в качестве критерия для проверки статистической гипотезы о неизвестном законе распределения генеральной совокупности используется случайная величина D, которая называется критерием согласия Колмогорова:

    где D – максимальное значение абсолютной величины разности между эмпирической и теоретической функциями распределения.

    Порядок проверки нулевой гипотезы:

    1. по выборке определяем D и вычисляем наблюдаемое значение величины .

    2. по таблице распределения Колмогорова (см. Приложение 2) определяем критическое значения критерия в зависимости от уровня значимостиα.

    3. Если , то нулевая гипотеза принимается.

    Если , то нулевая гипотеза отвергается.

    ПРИМЕР 3. По данным примера 1 с помощью критерия Колмогорова при уровне значимости  =0,05 необходимо проверить нулевую гипотезу о том, что случайная величина Х имеет нормальный закон распределения.

    РЕШЕНИЕ. Выдвигаем нулевую гипотезу Но: случайная величина Х имеет нормальный закон распределения с параметрами N(119,2; 9,35). Выдвигаем альтернативную гипотезу Н1: случайная величина Х не имеет нормальный закон распределения с параметрами N(119,2; 9,35).

    Сначала определяем значения относительных частот Wi, накопленных частот nнак, накопленных частостей Wнак (табл.5) и значения эмпирической функции распределения F*(x) (табл.6).

    Таблица 6

    Группированный статистический ряд, статистическое распределение частот, относительных частот, накопленных частот и частостей

    № интервала

    xi, %

    nнак

    0,03

    0,07

    0,11

    0,20

    0,28

    0,19

    0,10

    0,02

    Wнак

    0,03

    0,10

    0,21

    0,41

    0,69

    0,88

    0,98

    1,00

    Для непрерывных случайных величин значения эмпирической функции распределения F*(x)можно найти только на концах интервала (табл. 6), так как неизвестно, сколько значений случайной величины, принадлежащих этому интервалу, меньше х.

    Для определения теоретической функции распределения используем функцию Лапласа (см. Приложение 3):

    Например:

    Результаты вычислений обобщим в табл.7 и на рис. 2, откуда следует, что:

    Таблица 7

  2. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ — одно из важнейших распределений вероятностей.

    Управление эффективностью: кривая нормального распределения

    Термин Н. р. , принадлежащий К. Пирсону (К. Pearson) (более старые названия Гаусса закон, Гаусса Лапласа распределение), применяют как по отношению к распределениям вероятностей случайных величин, так … Математическая энциклопедия

  3. Кривая нормального распределения — (Normal Curve) кривая Гаусса, нормальное эмпирическое статистическое распределение, графическое изображение которого напоминает колокол, на вершине которого покоится наиболее часто встречающееся значение … Социология: словарь

  4. Распределение Парето — Плотность вероятности … Википедия

  5. Распределение Коши — Плотность вероятности … Википедия

  6. Распределение Лоренца — Распределение Коши Плотность вероятности Зелёная кривая соответствует стандартному распределению Коши Функция распределения Цвета находятся в соответствии с гр … Википедия

  7. Распределение парето — Плотность вероятности xm = 1 Функция распределения xm = 1 Параметры … Википедия

  8. ГАУССИАНА РАСПРЕДЕЛЕНИЕ (или КРИВАЯ) — Нормальное распределение, или кривая, часто называется гауссианой, или, просто, распределением, или кривой Гаусса, в честь К.Ф. Гаусса (1777 1855), великого немецкого математика и астронома … Толковый словарь по психологии

  9. Гауссиана распределение (или кривая) — нормальное распределение величин в виде синусоиды. Например, распределение людей по их интеллекту, когда начало и конец кривой отображают число идиотов и гениев, а пик кривой индивидов со средним интеллектом. Термин создан в честь великого… … Энциклопедический словарь по психологии и педагогике

  10. закон распределения Гаусса — нормальное распределение гауссова кривая гауссово распределение — Тематики информационные технологии в целом Синонимы нормальное распределениегауссова… … Справочник технического переводчика

  11. Коши распределение — Распределение Коши Плотность вероятности Зелёная кривая соответствует стандартному распределению Коши Функция распределения Цвета находятся в соответствии с гр … Википедия

  12. Одномерное нормальное распределение

    Нормальное распределение имеет плотность::

    (*)

    В этой формуле , фиксированные параметры, – среднее, – стандартноеотклонение.

    Графики плотности при различных параметрах приведены ниже.

    Характеристическая функция нормального распределения имеет вид:

    Дифференцируя характеристическую функцию и полагая t = 0, получаем моменты любого порядка.

    Кривая плотности нормального распределения симметрична относительно и имеет в этой точке единственный максимум, равный

    Параметр стандартного отклонения меняется в пределах от 0 до ∞.

    Среднее меняется в пределах от -∞ до +∞.

    При увеличении параметра кривая растекается вдоль оси х, при стремлении к 0 сжимается вокруг среднего значения (параметр характеризует разброс, рассеяние).

    При изменении кривая сдвигается вдоль оси х (см.

    графики).

    Варьируя параметры и , мы получаем разнообразные модели случайных величин, возникающие в телефонии.

    Типичное применение нормального закона в анализе, например, телекоммуникационных данных – моделирование сигналов, описание шумов, помех, ошибок, трафика.

    Графики одномерного нормального распределения

    Рисунок 1. График плотности нормального распределения: среднее равно 0, стандартное отклонение 1

    Рисунок 2. График плотности стандартного нормального распределения с областями, содержащими 68% и 95% всех наблюдений

    Рисунок 3. Графики плотностей нормальных распределений c нулевым средним и разными отклонениями (=0.5, =1, =2)

    Рисунок 4 Графики двух нормальных распределений N(-2,2) и N(3,2).

    Заметьте, центр распределения сдвинулся при изменении параметра .

    Замечание

    В программе STATISTICA под обозначением N(3,2) понимается нормальный или гауссов закон с параметрами: среднее = 3 и стандартное отклонение =2.

    В литературе иногда второй параметр трактуется как дисперсия, т.е.

    квадрат стандартного отклонения.

    Вычисления процентных точек нормального распределения с помощью вероятностного калькулятора STATISTICA

    С помощью вероятностного калькулятора STATISTICA можно вычислить различные характеристики распределений, не прибегая к громоздким таблицам, используемым в старых книгах.

    Шаг 1. Запускаем Анализ / Вероятностный калькулятор / Распределения.

    В разделе распределения выберем нормальное.

    Рисунок 5. Запуск калькулятора вероятностных распределений

    Шаг 2. Указываем интересующие нас параметры.

    Например, мы хотим вычислить 95% квантиль нормального распределения со средним 0 и стандартным отклонением 1.

    Укажем эти параметры в полях калькулятора (см. поля калькулятора среднее и стандартное отклонение).

    Введем параметр p=0,95.

    Галочка «Обратная ф.р». отобразится автоматически. Поставим галочку «График».

    Нажмем кнопку «Вычислить» в правом верхнем углу.

    Рисунок 6. Настройка параметров

    Шаг 3. В поле Z получаем результат: значение квантиля равно 1,64 (см. следующее окно).

    Рисунок 7. Просмотр результата работы калькулятора

    Далее автоматически появится окно с графиками плотности и функции распределения нормального закона:

    Рисунок 8. Графики плотности и функции распределения. Прямая x=1,644485

    Рисунок 9. Графики функции нормального распределения. Вертикальные пунктирные прямые- x=-1.5, x=-1, x=-0.5, x=0

    Рисунок 10. Графики функции нормального распределения. Вертикальные пунктирные прямые- x=0.5, x=1, x=1.5, x=2

    Оценка параметров нормального распределения

    Значения нормального распределения можно вычислить с помощью интерактивного калькулятора.

    Двумерное нормальное распределение

    Одномерное нормальное распределение естественно обобщается на двумерное нормальное распределение.

    Например, если вы рассматриваете сигнал только в одной точке, то вам достаточно одномерного распределения, в двух точках – двумерного, в трех точках – трехмерного и т.д.

    Общая формула для двумерного нормального распределения имеет вид:

    Где – парная корреляция между X1 и X2;

    – среднее и стандартное отклонение переменной X1соответственно;

    – среднее и стандартное отклонение переменной X2соответственно.

    Если случайные величины Х1 и Х2 независимы, то корреляция равна 0, = 0, соответственно средний член в экспоненте зануляется, и мы имеем:

    f(x1,x2) = f(x1)*f(x2)

    Для независимых величин двумерная плотность распадается в произведение двух одномерных плотностей.

    Графики плотности двумерного нормального распределения

    Рисунок 11. График плотности двумерного нормального распределения (нулевой вектор средних, единичная ковариационная матрица)

    Рисунок 12. Сечение графика плотности двумерного нормального распределения плоскостью z=0.05

    Рисунок 13. График плотности двумерного нормального распределения (нулевой вектор мат. ожидания, ковариационная матрица с 1 на главной диагонали и 0.5 на побочной)

    Рисунок 14. Сечение графика плотности двумерного нормального распределения (нулевой вектор мат. ожидания, ковариационная матрица с 1 на главной диагонали и 0.5 на побочной) плоскостью z= 0.05

    Рисунок 15. График плотности двумерного нормального распределения (нулевой вектор мат. ожидания, ковариационная матрица с 1 на главной диагонали и -0.5 на побочной)

    Рисунок 16. Сечение графика плотности двумерного нормального распределения (нулевой вектор мат. ожидания, ковариационная матрица с 1 на главной диагонали и -0.5 на побочной) плоскостью z=0.05

    Рисунок 17. Сечения графиков плотностей двумерного нормального распределения плоскостью z=0.05

    Для лучшего понимания двумерного нормального распределения попробуйте решить следующую задачу.

    Задача. Посмотрите на график двумерного нормального распределения. Подумайте, можно ли его представить, как вращение графика одномерного нормального распределения?Когда нужно применить прием деформации?

    Читайте далее — многомерное нормальное распределение

    Связанные определения:
    Cтандартное нормальное распределение
    Критерий Колмогорова-Смирнова
    Нормальное распределение
    Шапиро-Уилка W критерий

    В начало

    Нормальное распределение (Гаусса) в Excel

    1.2, 1.3.

    Рис. 1.2. Полигон распределения

    Рис. 1.3. Гистограмма

    По форме полигона распределения или гистограмме можно сделать вывод о форме распределения. Однако судить о закономерностях данного эмпирического распределения по полигону или гистограмме рискованно, так как оно зависит, в частности, от числа исследуемых единиц.

    Характерные черты распределения проявляются при увеличении числа наблюдений.

    Предел, в виде сплошной плавной линии, к которому стремится гистограмма, при уменьшении величины интервала или полигон распределения при увеличении числа наблюдений именуется кривой распределения.

    Среди различных кривых распределения особое место занимает нормальное распределение.

    Нормальное распределение представляет собой симметричную колоколообразную кривую, имеющую максимум в точке, соответствующей , рис. 1.4.

    — σ + σ

    Рис. 1.4. Кривая нормального распределения

    Основными свойствами кривой нормального распределения являются:

    1) 68,3 % всей площади, ограниченной осью х и кривой нормального распределения сосредоточено на участке ;

    2) 95,4 % площади на участке ;

    3) 99,7 % площади на ;

    4) Точки перегиба кривой нормального распределения находятся на расстоянии .

    На практике эмпирическое распределение может отличаться от нормального, имея асимметрию или эксцесс.

    Степень асимметрии оценивается с помощью нормированного момента третьего порядка.

    ,

    где — центральный момент третьего порядка.

    Если R3>0,5 независимо от знака, то асимметрия считается существенной. Знак указывает на направленность асимметрии «+» — правосторонняя, «-» левосторонняя.

    При соблюдении условия ряд распределения может бытьостровершинным или низковершинным.

    Показатель эксцесса отражает эту особенность.

    ,

    где — центральный момент четвертого порядка.

    Если Ех>0, то распределение островершинно, если Ех<0 –низковершинно.

    1.8. Статистический анализ взаимосвязей социально-экономических явлений

    Любое общественное явление находится в связи с другими явлениями. Исследование таких взаимосвязей – важнейшая задача статистики.

    Различают два вида связей, существующих между явлениями, – функциональные и стохастические.

    Функциональной называется зависимость, при которой одному значению факторного признака строго соответствует единственное значение результативного признака.

    Стохастическая зависимость характеризуется тем, что результативный признак неполностью определяется факторным признаком, его влияние проявляется в среднем при достаточно большом числе наблюдений.

    Наиболее часто для исследования стохастических зависимостей используют метод корреляции.

    Термин корреляция происходит от английского слова correlation – соотношение, соответствие.

    К изучению связи методом корреляции обращаются в том случае, когда нельзя изолировать влияние посторонних факторов. При этом число наблюдений должно быть достаточно велико, так как малое число наблюдений не позволяет обнаружить закономерность связи.

    Первая задача корреляции заключается в математическом выражении изменения результативного признака в связи с изменением одного или несколько факторных признаков. Данная задача решается определением уравнения регрессии и носит название регрессионного анализа. Вторая задача состоит в определении степени влияния искажающих факторов –различных показателей тесноты связи и называется корреляционным анализом.

    Регрессионный анализ включает в себя этапы:

    1. Логический анализ – разделение коррелирующих признаков на факторные и результативный.

    2. Определение типа зависимости. Корреляционная зависимость называется парной, если она имеет место между двумя признаками (факторным и результативным) и множественной (многофакторной) – между тремя и более связанными между собой признаками.

    Парная зависимость называется прямолинейной, если может быть описана уравнением прямой линии икриволинейной, описываемой уравнением:

    гиперболы ,

    параболы и т.д.

    Определить тип уравнения зависимости можно, исследуя зависимость графически, построением корреляционного поля или эмпирической линии регрессии.

    При построении корреляционного поля в системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой, как это показано на рис. 1.5.

    Рис. 1.5. График корреляционного поля

    При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем теснее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связей.

    Эмпирическая линия регрессии строится в системе координат, где на оси абсцисс откладывается значение факторного признака, а на оси ординат рассчитанное среднее для данного факторного признака значение результативного.

    3. Определение параметров уравнения регрессии.

    Оценка параметров уравнения регрессии (а0, а1, а2 и т.д.) осуществляется методом наименьших квадратов на основе системы нормальных уравнений.

    Для нахождения параметров линейной парной регрессии () система нормальных уравнений имеет вид:

    Для гиперболы

    Для параболы второго порядка

    Для многофакторной зависимости:

    ……………………………………………………………………

    В уравнениях регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков, а коэффициенты регрессии а1, а2, …, аn показывают, на сколько изменяется в среднем значение результативного признака при увеличении факторного признака на единицу собственного измерения.

    Корреляционный анализ

    Для оценки тесноты связи в статистическом анализе используют показатели:

    эмпирического корреляционного отношения (ηэ)

    ,

    где — межгрупповая вариация результативного признака;- общая вариация результативного признака.

    Наличие взаимосвязей между результативным и факторным признаком имеет при η ≤ 0,5.

    Универсальным показателем тесноты связи является показатель теоретического корреляционного отношения или индекс корреляции (ηm)

    ,

    где — рассчитанные (теоретические) значения результативного признака.

    Показатель теоретического корреляционного отношения может использоваться для оценки тесноты связи не только в парных, но и многофакторных зависимостей.

    Для оценки тесноты связи прямолинейной зависимости используется линейный коэффициент корреляции (r)

    или .

    Линейный коэффициент корреляции может изменяться от -1 до +1. Чем ближе значение r по абсолютной величине к единице, тем теснее связь. Если r>0, то связь между факторным и результативным признаками прямо пропорциональная, если r<0, то обратно пропорциональная.

    Для предварительной оценки тесноты связи корреляции может использоваться коэффициент корреляции знаков (коэффициент Г. Фехнера).

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *