Основные математические модели, используемые в теории надежности

Большинство факторов, оказывающих влияние на производственный процесс, не остаются неизменными. Поэтому числовые данные, собранные в результате наблюдения, не могут быть одинаковыми, но обязательно подчиняются определенным закономерностям, называемым распределением.

Если измерять контролируемый параметр непрерывно, можно построить его график плотности распределения. Однако на практике проводят измерения только в определенные промежутки времени и не всех изделий, а только некоторых. Поэтому по результатам измерений строят обычно гистограмму - ступенчатую фигуру, контуры которой дают приблизительное представление о графике плотности, то есть о характере распределения изучаемого параметра.

Гистограмма – это столбиковая диаграмма, служащая для графического представления имеющейся количественной информации.

Обычно основой для построения гистограммы служит интервальная таблица частот, в которой весь диапазон измеренных значений случайной величины разбит на некоторое число интервалов, и для каждого интервала указано количество значений, попавших на данный интервал.

Последовательность построения гистограммы следующая.

1. Находят наибольшее (X max ) и наименьшее (X min ) значения случайной величины и вычисляют размах изменения R

R = X max X min .

2. Задают некоторое число разрядов k . При n < 100 можно принять k = 6.

3. Определяют ширину разряда h = . Для упрощения расчётов полученное значение h округляют в любую сторону.

4. Устанавливают границы разрядов и подсчитывают число измерений в каждом из них. При подсчёте значения Х , находящегося на границе разряда, его следует всегда относить к разряду, расположенному слева или справа.

5. Устанавливают m i – число значений Х , попавших в данный разряд.

6. Определяют частоту появления величины p i в данном разряде

p i = ,

где n общее число всех опытных данных.

7. В системе координат p i = f (X ) на ширине разряда h откладывают величину p i как высоту и строят прямоугольник.

Результат заносят в таблицу

Таблица. Гистограмма распределения

Интер валы

m i

p i =

Очевидно, что площадь элементарного прямоугольника

s i = hy i = p i ,

а площадь всей гистограммы

S = = = 1.

Таким образом, гистограмма представляет собой совокупность прямоугольников.

Рис. Гистограмма (1 ) и полигон (2 ) распределения величины Х

Анализ гистограммы сводится к её сравнению с типовыми случаями.

Обычный тип (симметричный или колоколообразный). Наивысшая частота оказывается в середине основания гистограммы (и постепенно снижается к обоим концам). Форма симметрична. Такая гистограмма по внешнему виду приближается к нормальной (гауссовской) кривой, и можно предполагать, что ни один из факторов, влияющих на исследуемый процесс, не преобладает над другими.

Эта форма гистограммы встречается чаще всего. В этом случае среднее значение случайной величины (применительно к технологической операции – это показатель уровня настроенности) близко к середине основания гистограммы, а степень ее рассеяния относительно среднего значения (для технологических операций – это показатель точности) характеризуется крутизной снижения столбцов.

Рис. Обычный тип гистограммы

Гребенка (мультимодальный тип). Классы через один имеют более низкие частоты.

Такая форма гистограммы встречается, кода число единичных наблюдении, попадающих в класс, колеблется от класса к классу или когда действует определенное правило округления данных Возможно требуется осуществить расслоение данных, то есть определить дополнительные признаки для группировки наблюдаемых значений.

Рис. Гребёнка

Положительно (отрицательно) скошенное распределение . Среднее значение гистограммы локализуется справа (слева) от середины основания гистограммы. Частоты довольно резко спадают

При движении влево (вправо) и, наоборот, медленно вправо (влево). Форма асимметрична.

Такая форма гистограммы встречается, когда нижняя (верхняя) граница регулируется либо теоретически, либо по значению допуска или когда левое (правое) значение недостижимо. В этом случае также можно предполагать, что на процесс оказывает преобладающее влияние какой-либо фактор, в частности, подобная форма встречается, когда имеет место замедленный (ускоренный) износ режущего инструмента.

Подобная гистограмма характерна также для распределения Рэлея, которое характеризует форму либо несимметричность изделия.

Рис. Положительно скошенное распределение

Распределение с обрывом слева (справа). Среднее арифметическое гистограммы локализуется далеко слева (справа) от середины основания. Частоты резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Форма асимметрична.

Рис. Распределение с обрывом слева

Это одна из тех форм, которые часто встречаются при 100 %-ном просеивании изделий из-за плохой воспроизводимости процесса, а также когда проявляется резко выраженная положительная (отрицательная) асимметрия.

Плато (равномерное и прямоугольное распределения). Частоты в разных классах образуют плато, поскольку все классы имеют более или менее одинаковые ожидаемые частоты.

Рис. Плато

Такая форма встречается в смеси нескольких распределений, имеющих различные средние, но может также указывать на какой-либо преобладающий фактор, например, равномерный износ режущего инструмента.

Двухпиковый тип (бимодальный тип). В окрестностях середины основания частота низкая, зато есть по пику с каждой стороны.

Такая форма встречается, когда смешиваются два распределения с далеко отстоящими средними значениями, то есть имеет смысл провести расслоение данных. Такую же форму гистограммы можно наблюдать и в случае, когда какой-либо преобладающий фактор меняет свои характеристики, например, если режущий инструмент имеет сначала ускоренный, а затем замедленный износ.

Рис. Двухпиковый тип

Распределение с изолированный пиком . Наряду с распределением обычного типа появляется маленький изолированный пик.

Рис. Распределение с изолированным пиком

Такая форма появляется при наличии малых включений данных из другого распределения или ошибки измерения. При получении подобной гистограммы следует прежде всего проверить достоверность данных, а в том случае, когда результаты измерений не вызывают сомнения, продумать обоснованность выбранного способа разбиения наблюдаемых значений на интервалы.

Кроме того, по гистограмме можно провести оценку процесса.

При использовании гистограмм для оценки качества процесса на шкале значений наблюдаемого параметра отмечают нижнюю и верхнюю границы поля допуска (поля спецификации) и через эти точки проводят две прямые параллельные столбцам гистограммы.

Если вся гистограмма оказывается внутри границ поля допуска, процесс статистически устойчив и не требует никакого вмешательства.

Если левая и правая границы гистограммы совпадают с границами поля допуска, то желательно уменьшить разброс процесса, так как любое воздействие может привести к появлению изделий, не удовлетворяющих допуску.

Если часть столбцов гистограммы оказывается за границами поля допуска, то необходимо провести регулировку процесса так, чтобы сместить среднее ближе к центру поля допускаили уменьшить вариации, чтобы добиться меньшего разброса.

В последующих главах мы встретим несколько различных типов случайных величин. В этом разделе мы перечислим эти новые часто встречающиеся случайные величины, их ФПВ, ПФР и моменты. Мы начнём с биномиального распределения, которое является распределением дискретной случайной величины, а затем представим распределение некоторых непрерывных случайных величин.

Биномиальное распределение. Пусть - дискретная случайная величина, которая принимает два возможных значения, например или , с вероятностью и соответственно. Соответствующая ФПВ для показана на рис. 2.1.6.

Рис. 2.1.6. Функция распределения вероятностей

Теперь предположим, что

где , , - статистически независимые и идентично распределенные случайные величины с ФПВ, показанной на рис. 2.1.6. Какова функция распределения ?

Чтобы ответить на этот вопрос, заметим, что изначально - это ряд целых чисел от 0 до . Вероятность того, что , просто равна вероятности того, что все . Так как статистически независимы, то

.

Вероятность того, что , равна вероятности того, что одно слагаемое , а остальные равны нулю. Так как это событие может возникнуть различными путями,

.

(2.1.84)

различных комбинаций, которые приводят к результату , получаем

где - биномиальный коэффициент. Следовательно, ФПВ можно выразить как

, (2.1.87)

где означает наибольшее целое число , такое, что .

ИФР (2.1.87) характеризует биномиальное распределение случайной величины.

Первые два момента равны

а характеристическая функция

. (2.1.89)

Равномерное распределение. ФПВ и ИФР равномерно распределенной случайной величины показан на рис. 2.1.7.

Рис. 2.1.7. Графики ФПВ и ИФР для равномерно распределенной случайной величины

Первые два момента равны

,

, (2.1.90)

,

а характеристическая функция равна

(2.1.91)

Гауссовское распределение. ФПВ гауссовской или нормально распределенной случайной величины определяется формулой

, (2.1.92)

где - математическое ожидание, а - дисперсия случайной величины. ИФР равна

где - функция ошибок, которая определяется выражением

. (2.1.94)

ФПВ и ПФР иллюстрируется на рис. 2.1.8.

Рис. 2.1.8. Графики ФПВ (а) и ИФР (b) гауссовской случайной величины

ИФР можно также выразить через дополнительную функцию ошибок, т.е.

,

. (2.1.95)

Заметим, что , , и . Для дополнительная функция ошибок пропорциональна площади под частью гауссовской ФПВ. Для больших значений дополнительная функция ошибок может быть аппроксимирована рядом

, (2.1.96)

причем ошибка аппроксимации меньше, чем последнее удерживаемое слагаемое.

Функция, которая обычно используется для площади под частью гауссовской ФПВ, обозначается через и определяется как

, . (2.1.97)

Сравнивая (2.1.95) и (2.1.97), находим

. (2.1.98)

Характеристическая функция гауссовской случайной величины со средним и дисперсией равна

Центральные моменты гауссовской случайной величины равны

(2.1.100)

а обычные моменты можно выразить через центральные моменты

. (2.1.101)

Сумма статически независимых гауссовских случайных величин также является гауссовской случайной величиной. Чтобы это продемонстрировать, предположим

где , - независимые случайные величины со средним и дисперсиями . Используя результат (2.1.79), мы находим, что характеристическая функция равна

Следовательно, является гауссовской случайной величиной со средним и дисперсией .

Хи-квадрат-распределение. Случайная величина с хи-квадрат-распределением порождается гауссовской случайной величиной, в том смысле, что ее формирование можно рассматривать как преобразование последней. Для конкретности, пусть , где - гауссовская случайная величина. Тогда имеет хи-квадрат-распределение. Мы различаем два вида хи-квадрат распределения. Первое называется центральным хи-квадрат-распределением, и получается, когда имеет нулевое среднее значение. Второе называется нецентральным хи-квадрат-распределением, и получается, когда имеет ненулевое среднее значение.

Сначала рассмотрим центральное хи-квадрат-распределение. Пусть - гауссовская случайная величина с нулевым средним и дисперсией . Поскольку , результат даётся функцией (2.1.47) с параметрами и . Таким образом, получаем ФПВ в виде

, . (2.1.105)

которое не может быть выражено в замкнутом виде. Характеристическая функция, однако, может быть выражена в замкнутой форме:

. (2.1.107)

Теперь предположим, что случайная величина определяется как

где , , - статистически независимые и одинаково распределенные гауссовские случайные величины с нулевыми средними и дисперсией . Вследствие статистической независимости характеристическая функция

. (2.1.109)

Обратное преобразование этой характеристической функции дает ФПВ

, , (2.1.110)

где - гамма-функция, определённая как

,

Целое число, , (2.1.111)

Эта ФПВ является обобщением (2.1.105) и названа хи-квадрат- (или гамма-) ФПВ с степенями свободы. Она иллюстрируется рис. 2.1.9.

Случай, когда равны

Первые два момента равны

, (2.1.112)

ИФР равна

, (2.1.113)

Рис. 2.1.9 Графики ФПВ для случайной величины с хи-квадрат-распределением для нескольких значений степеней свободы

Этот интеграл преобразуется к неполной гамма-функции, которая была табулирована Пирсоном (1965).

Если четно, интеграл (2.11.113) можно выразить в замкнутом виде.

В частности, пусть , где - целое. Тогда, используя повторно интегрирование по частям, получаем

, . (2.1.114)

Теперь рассмотрим нецентральное хи-квадрат-распределение, которое является результатом возведения в квадрат гауссовской случайной величины с ненулевым средним. Если - гауссовская случайная величина со средним и дисперсией , случайная величина имеет ФПВ

, (2.1.115)

Этот результат получается при использовании (2.1.47) для гауссовской ФПВ с распределением (2.1.92). Характеристическая функция для ФПВ

. (2.1.116)

Для обобщения результатов предположим, что является суммой квадратов гауссовских случайных величин, определенных (2.1.108). Все , , предполагаются статистически независимыми со средними , , и одинаковыми дисперсиями . Тогда характеристическая функция, получаемая из (2.1.116), при использовании соотношения (2.1.79) равна

. (2.1.117)

Обратное преобразование Фурье от этой характеристической функции даёт ФПВ

где введено обозначение

а - модифицированная функция Бесселя первого рода порядка , которую можно представить бесконечным рядом

, . (2.1.120)

ФПВ, определяемая (2.1.118), называется нецентральным хи-квадрат-распределение с степенимя свободы. Параметр назван параметром нецентральности распределения. ИФР для нецентрального хи-квадрат-распределения с степенями свобода

Этот интеграл не выражается в замкнутой форме. Однако, если - целое чмсло, ИФР можно выразить через обобщенную -функцию Маркума, которая определяется как

, (2.1.122)

, (2.1.123)

Если заменить переменную интегрирования в (1.2.121) на , причём , и положить, что , тогда можно легко найти

. (2.1.124)

В заключение заметим, что первые два момента для центрального хи-квадрат распеделения случайных величин равны

,

.

Релеевское распределение. Релеевское распределение часто используется как модель для статистических сигналов, переданных через радиоканалы, таких как, например, в сотовой радиосвязи. Это распределение тесно связано с центральных хи-квадрат-распределением. Чтобы это проиллюстрировать, положим, что , где и - статистически независимые гауссовские случайные величины с нулевыми средними одинаковой дисперсией . Из изложенного выше следует, что имеет хи-квадрат-распределение с двумя степенями свободы. Следовательно, ФПВ для

, . (2.1.126)

Теперь предположим, что мы определяем новую случайную величину

. (2.1.127)

Выполнив простые преобразования в (2.1.126), получим для ФПВ

, . (2.1.128)

Это ФПВ для релеевской случайной величины. Соответствующая ИФР равна

, . (2.1.129)

Моменты от равны

, (2.1.130)

а дисперсия

. (2.1.131)

Характеристическая функция для распределённой по Релею случайной величины

. (2.1.132)

Этот интеграл можно выразить так:

где - это вырожденная гипергеометрическая функция, определяемая как

, … (2.1.134)

Боули (1990) показал, что можно выразить как

. (2.1.135)

Как обобщение полученных выше выражений рассмотрим случайную величину

где , , статистически независимые одинаково распределенные гауссовские случайные величины с нулевым средним. Ясно, что имеет хи-квадрат-распределение с степенями свободы. Его ФПВ задаётся формулой (2.1.100). Простые преобразования переменной в (2.1.110) приводят к ФПВ для в виде

, . (2.1.137)

Как следствие фундаментальной зависимости между центральным хи-квадрат-распределением и релеевским распределением, соответствующая ИФР достаточно простая. Так, для любого ИФР для можно представить в форме неполной гамма-функции. В специальном случае, когда чётко, т.е. когда , ИФР для может быть представлено в замкнутой форме

, . (2.1.138)

В заключении приведём формулу для -го момента

, , (2.1.139)

справедливую для любого .

Распределение Райса. В то время как распределение Релея связано с центральным хи-квадрат-распределением, распределение Райса связано с нецентральным хи-квадрат-распределением. Чтобы проиллюстрировать эту связь, положим , где и - статистически независимые гауссовские случайные величины со средним , и одинаковой дисперсией . Из предыдущего рассмотрения мы знаем, что имеет нецентральное хи-квадрат-распределение с параметром отклонения . ФПВ для получаем из (2.1.118), а при находим

, . (2.1.140)

Теперь введём новую переменную .

ФПВ для получается из (2.1.140) путём замены переменной

, . (2.1.141)

Функция (2.1.141) называется распределением Райса.

Как будет показано в гл. 5, эта ФПВ характеризует статистику огибающей гармонического сигнала подверженному воздействию узкополосного гауссовского шума. Она также используется для статистики сигнала, перееденного через некоторые радиоканалы. ИФР для легко найти из (2.1.124) для случая, когда . Это даёт

, , (2.1.142)

где определяется (2.1.123).

Для обобщения приведённого выше результата пусть определяется (2.1.136), где , - статистически независимые случайные величины со средним , и одинаковыми дисперсиями . Случайная величина имеет нецентральное хи-квадрат-распределение с -степенями свободы нецентральным параметром , определяемое (2.1.119). Еe ФПВ определяется (2.1.118), следовательно, ФПВ для равна

, , (2.1.143)

а соответствующая ИФР

где определяется (2.1.121). В частном случае, когда - целое число, имеем

, , (2.1.145)

которое следует из (2.1.124). В заключении отметим, что -й момент от

, , (2.1.146)

где - вырожденная гипергеометрическая функция.

-распределение Накагами. И распределение Релея, и распределение Райса часто используется для описания статистики флуктуаций сигнала на выходе многопутевого канала с замираниями. Эта модель канала рассматривается в гл. 14. Другое распределение, часто используется для характеристики статистических сигналов, передаваемых через многопутевые каналы с замираниями - это -распределение Накагами. ФПВ для этого распределения дано Накагами (1960)

, , (2.1.147)

где определяется как

а параметр определяется как отношение моментов и назван параметром замираний:

, . (2.1.149)

Нормализованную версию для (2.1.147) можно получить путём введения другой случайной величины (см. задачу 2.15). -й момент от равен

.

При можно видеть, что (2.1.147) приводит к распределению Релея. При значениях удовлетворяющих условию , получаем ФПВ, которая имеет более протяжённые хвосты, чем при распределении Релея. При значениях хвосты ФПВ распределения Накагами убывают быстрее, чем для распределения Релея. Рисунок 2.1.10 иллюстрирует ФПВ для различных значений .

Многомерное гауссовское распределение. Из многих многопараметрических или многомерных распределений, которые могут быть определены, многопараметрическое распределение Гаусса наиболее важное и наиболее часто используется на практике. Введём это распределение и рассмотрим его основные свойства.

Предположим, что , являются гауссовскими случайными величинами со средними , , дисперсиями , и ковариациями , . Ясно, что , . Пусть - это матрица ковариаций размерности с элементами . Пусть определяет вектор-столбец случайных величин и пусть означает вектор-столбец средних значений , . Совместная ФПВ гауссовских случайных величин , , определяется так., то видим, что если гауссовские случайные величины не коррелированны, они также статистически независимы. являются некоррелированными и, следовательно, статистически независимыми. в виде является диагональной. Следовательно, мы должны потребовать мы получаем собственные векторы

Следовательно,

.

Легко показать, что и , где диагональные элементы равны и .

МИНОБРНАУКИ РОССИИ

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«Чувашский государственный университет имени И.Н. Ульянова»

Факультет дизайна и компьютерных технологий

Кафедра компьютерных технологий

по дисциплине «Надежность, эргономика и качество АСОиУ»

на тему «Основные математические модели, используемые в теории надежности »

Выполнил:

студент гр. зДиКТ-25-08

Люсенков И.В.

Проверил:

Григорьев В.Г.

Чебоксары

Введение

    Основные математические модели, используемые в теории надежности……. 3

    Распределение Вейбулла…………………………………………………………. 3

    Экспоненциальное распределение………………………………………………. 4

    Распределение Рэлея……………………………………………………………… 5

    Нормальное распределение (распределение Гаусса)………………………….. 5

    Определение закона распределения ……………………………………………. 6

    Выбор числа показателей надежности …………………………………………. 7

    Точность и достоверность статистической оценки показателей надежности… 10

    Особенности программ на надежность………………………………………… 11

    Литература……………………………………………………………………… 13

Основные математические модели, используемые в теории надежности

В приведенных выше математических соотношениях зачастую использовалось понятие плотности вероятности и закон распределения.

Закон распределения - устанавливаемая определенным образом связь между возможными значениями случайной величины и соответствующими их вероятностями.

Плотность распределения (вероятностей) - широко распространенный способ описания закона распределения

Распределение Вейбулла

Распределение Вейбула является двухпараметрическим распределением. Согласно этому распределению плотность вероятности момента отказа

где δ - параметр формы (определяется подбором в результате обработки экспериментальных данных, δ > 0);

λ - параметр масштаба,

От значения коэффициента формы во многом зависит график функции плотности вероятности.

Интенсивность отказов определяется по выражению

(2)

Вероятность безотказной работы

(3)

Отметим, что при параметре δ = 1 распределение Вейбулла переходит в экспоненциальное, а при δ = 2 - в распределение Рэлея.

При δ <1 интенсивность отказов монотонно убывает (период приработки), а при δ >1 монотонно возрастает (период износа). Следовательно, путем подбора параметра δ можно получить, на каждом из трех участков, такую теоретическую кривую λ(t), которая достаточно близко совпадает с экспериментальной кривой, и тогда расчет требуемых показателей надежности можно производить на основе известной закономерности.

Экспоненциальное распределение

Как было отмечено экспоненциальное распределение вероятности безотказной работы является частным случаем распределения Вейбулла, когда параметр формы δ = 1. Это распределение однопараметрическое, то есть для записи расчетного выражения достаточно одного параметра λ = const . Для этого закона верно и обратное утверждение: если интенсивность отказов постоянна, то вероятность безотказной работы как функция времени подчиняется экспоненциальному закону:

(4)

Среднее время безотказной работы при экспоненциальном законе распределения интервала безотказной работы выражается формулой:

(5)

Таким образом, зная среднее время безотказной работы Т 1 (или постоянную интенсивность отказов λ), можно в случае экспоненциального распределения найти вероятность безотказной работы для интервала времени от момента включения объекта до любого заданного момента t.

Распределение Рэлея

Плотность вероятности в законе Рэлея имеет следующий вид

(6)

где δ * - параметр распределения Рэлея.

Интенсивность отказов равна:

. (7)

Характерным признаком распределения Рэлея является прямая линия графика λ(t), начинающаяся с начала координат.

Вероятность безотказной работы объекта в этом случае определится по выражению

(8)

Нормальное распределение (распределение Гаусса)

Нормальный закон распределения характеризуется плотностью вероятности вида

(9)

где m x , σ x - соответственно математическое ожидание и среднеквадратическое отклонение случайной величины Х.

При анализе надежности РЭСИ в виде случайной величины, кроме времени, часто выступают значения тока, электрического напряжения и других аргументов. Нормальный закон - это двухпараметрический закон, для записи которого нужно знать m x и s x .

Вероятность безотказной работы определяется по формуле

(10)

а интенсивность отказов - по формуле

(11)

В данном пособии показаны только наиболее распространенные законы распределения случайной величины. Известен целый ряд законов, так же используемых в расчетах надежности: гамма-распределение, χ 2 -распределение, распределение Максвелла, Эрланга и др.

Распределение Рэлея введено Дж. У. Рэлеем (1880) в связи с задачей сложения гармонических колебаний со спиральными фазами. Закон Рэлея применяется для описания неотрицательных величин, в частности, когда случайная величина является радиусом - вектором при двухмерном гауссовом распределении. В ткацком производстве закон Рэлея широко применяется для анализа геометрической формы, например некруглости, нецилиндричности, эксцентриситета намотки на сновальных валах и ткацких навоях. Также встречается в применениях теории вероятностей, например к радиотехнике.

Распределение является геометрической суммой случайных величин , подчиненных закону Гаусса с параметрами: .

Плотность вероятности распределения Рэлея имеет вид:

(2.3.1)

где - среднее квадратическое отклонение исходного двухмерного распределения =). Значение является параметром закона Рэлея.

Максимальное значение плотности равно и достигается при (на рис.2.3.1 даны графики плотности распределения Рэлея при различных ).

Рис.2.3.1 графики плотности распределения Рэлея при различных

Функция распределения имеет вид: (2.3.2)

При замене новой переменной получим плотность вероятности и функцию распределения нормированного закона Рэлея:

(2.3.3)

(2.3.4)

Графики нормированной плотности вероятности и функции распределения показаны на рис. 2.3.2.

Дифференциальная кривая (рис. 2.3.2,а) имеет положительную асимметрию и более острую вершину, чем гауссово распределение.

Рис.2.3.2. Плотность вероятности (а) и функция распределения (б) нормированного закона Рэлея.

Вычислим математическое ожидание, дисперсию и среднее квадратическое отклонение:

1. Математическое ожидание.

Следовательно, (2.3.5)

2.Дисперсия.

.

.

Следовательно,

(2.3.6)

3.Среднее квадратическое отклонение.

(2.3.7).

Вычислим асимметрию и эксцесс:

1.Ассиметрия.

, где .

Следовательно,

(2.3.8)

2.Эксцесс.

, где .

Следовательно,

(2.3.9)

Нормированное рэлеевское распределение не зависит от параметра и легко табулируется.

Конец работы -

Эта тема принадлежит разделу:

Доклады по дисциплине дополнительные главы математической статистики. Регрессионный анализ

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Виды регрессионного анализа
Многошаговая регрессия (ШРА) - последовательность шагов РА, выполняемая в направлении увеличения или уменьшения количества учитываемых коэффициентов линейной модели регрессии.

Линейная регрессия
Регрессионный анализ - раздел математической статистики, объединяющий практические методы исследования регрессионной зависимости между величинами по статистическим данным. Проблема

Исследование линейной зависимости между ЧСС и мощностью выполняемой работы на основе РА
Рассчитать и построить график уравнения линейной регрессии для относительных значений PWC170 (1) и времени челночного бега 3х10 м у 13 исследуемых и сделать вывод о точности расчета урав

Описание объекта
В нашем случае объектом исследования является совокупность наблюдений за посещаемостью WEB сайта Комитета по делам семъи и молодежи Правительства г. Москвы www.telekurs.ru/ismm. Тематика сайта – эт

Факторы формирующие моделируемое явление
Отбор факторов для модели осуществляется в два этапа. На первом идет анализ, по результатам которого исследователь делает вывод о необходимости рассмотрения тех или иных явлений в качестве переменн

Построение уравнения регрессии
Используя программное обеспечение «ОЛИМП» (которое в свою очередь использует для расчетов указанные выше принципы и формулы чем значительно облегчает нам жизнь), найдем искомое урав

Смысл модели
При увеличении количества вакансий в день, количество посетивших сайт людей будет увеличиваться. Это означает что в настоящий момент сайт не полностью удовлетворяет запросы пользователей, что необ

Общее назначение
Любой закон природы или общественного развития может быть выражен в конечном счете в виде описания характера или струк­туры взаимосвязей (зависимостей), существующих между изу­чаемыми явлениями или

Оценивание линейных и нелинейных моделей
Формально говоря, Нелинейное оценивание является универсальной аппроксимирующей процедурой, оценивающей любой вид зависимости между переменной отклика и набором независимых переменных. В общ

Регрессионные модели с линейной структурой
Полиномиальная регрессия. Распространенной “нелинейной” моделью является модель полиномиальной регрессии. Термин нелинейная заключен в кавычки, поскольку эта модель линейна

Существенно нелинейные регрессионные модели
Для некоторых регрессионных моделей, которые не могут быть сведены к линейным, единственным способом для исследования остается Нелинейное оценивание. В приведенном выше примере для скорости

Регрессионные модели с точками разрыва
Кусочно - линейная регрессия. Нередко вид зависимости между предикторами и переменной отклика различается в разных областях значений независимых переменных. Например,

Методы нелинейного оценивания
Метод наименьших квадратов Функция потерь Метод взвешенных наименьших квадратов Метод максимума правдоподобия Максимум правдоподобия и логит/пробит мод

Начальные значения, размеры шагов и критерии сходимости
Общим моментом всех методов оценивания является необходимость задания пользователем некоторых начальных значений, размера шагов и критерия сходимости алгоритма. Все методы начинают свою работу с ос

Оценивание пригодности модели
После оценивания регрессионных параметров, существенной стороной анализа является проверка пригодности модели в целом. Например, если вы определили линейную регрессионную модель, а реальная зависим

Распределения Пирсона (хи – квадрат), Стьюдента и Фишера
В приложениях статистики очень часто используют связанные с нормальным распределения: распределение (хи-квадрат

Распределения Вейбулла - Гнеденко
Экспоненциальные распределения - частный случай так называемых распределений Вейбулла - Гнеденко. Они названы по фамилиям инженера В. Вейбулла, введшего эти распределения в практику анализа результ

Факторный анализ как метод редукции данных
Под редукцией понимается переход от многих исходных количественных признаков к пространству факторов, число которых значительно меньше числа исходных количественных признаков. Например, от исходных

Общий обзор методов факторного анализа
В основе каждого метода факторного анализа лежит математическая модель, описывающая соотношения между исходными признаками и обобщенными факторами. Перейдем к краткой характеристике этих моделей дл

Метод главных компонент
В основе модели для выражения исходных признаков через факторы здесь лежит предположение о том, что число факторов равно числу исходных признаков (k=m), а характерные факторы вообще отсутств

Центроидный метод
Этот метод основан на предположении о том, что каждый из исходных признаков aj(j = 1...m) может быть представлен как функция небольшого числа общих факторов F1

Метод экстремальной группировки параметров
Данный метод также основан на обработке матрицы коэффициентов корреляции между исходными признаками. В основе этого метода лежит гипотеза о том, что совокупность исходных признаков может быть разби

Критерии рационального выбора числа факторов
Сколько факторов следует выделять?Напомним, что анализ главных компонент является методом сокращения или редукции данных, т.е. методом сокращения числа переменных. Возникает естест

Проверка качественных характеристик выборки
Будем рассматривать критерии однородности. Любой статистически критерий проверки гипотез пред­ставляет собой средство измерения. Поэтому пользоваться им следует также квалифицированно, как

Критерий Смирнова
Предполагается, что функции распределения и

Критерий однородности Лемана-Розенблатта
Критерий однород­но­сти Лемана-Розенблатта представляет собой критерий типа. Критерий был предложен

Метод минимального расстояния
Равномернаяметрика,или метрика Колмогорова, - одна из наиболее старых и наиболее часто используемых вероятностных метрик. Термин «метрика Колмогорова» в отечественной литературе ис

Проверка количественных характеристик выборки
В §1 были определены характеристики генеральной совокупности, т.е. принадлежность к одной генеральной выборке, а также среднее и первый момент. На данном этапе имеется функция распределени

Кластерный анализ в задачах социально-экономического прогнозирования
Кластерный анализ может быть успешно использован в зада­чах социально-экономического прогнозирования. При анализе и прогнозировании социально-экономических явлений исследователь довольно часто стал

Кластерный анализ как инструмент подготовки эффективных маркетинговых решений
Причины неудач или недостаточно быстрого роста бизнеса в нашей стране часто списываются на несовершенную систему кредитования, пробелы в законодательстве, общую экономическую нестабильность и, нако

Иерархические методы кластерного анализа
Суть иерархической кластеризации состоит в последовательном объединении меньших кластеров в большие или разделении больших кластеров на меньшие. Иерархические аглом

Меры сходства
Для вычисления расстояния между объектами используются различ­ные меры сходства (меры подобия), называемые также метриками или функциями расстояний. Для придания больших весов более отдале

Методы объединения или связи
Когда каждый объект представляет собой отдельный кластер, рас­стояния между этими объектами определяются выбранной мерой. Возни­кает следующий вопрос - как определить расстояния между кластерами? С

Иерархический кластерный анализ в SPSS
Рассмотрим процедуру иерархического кластерного анализа в паке­те SPSS (SPSS). Процедура иерархического кластерного анализа в SPSS предусматривает группировку как объектов (строк матрицы данных), т

Определение количества кластеров
Существует проблема определения числа кластеров. Иногда можно априорно определить это число. Однако в большинстве случаев число кластеров определяется в процессе агломерации/разделения множества об

Итеративный процесс
Вычисляются центры кластеров, которыми затем и далее считаются покоординатные средние кластеров. Объекты опять перераспределяются. Процесс вычисления центров и перераспределения объектов п

Проверка качества кластеризации
После получений результатов кластерного анализа методом k-сред­них, следует проверить правильность кластеризации (т.е. оценить, на­сколько кластеры отличаются друг от друга). Для этого рассчитывают

Сравнительный анализ иерархических и неиерархических методов кластеризации
Перед проведением кластеризации у аналитика может возникнуть вопрос, какой группе методов кластерного анализа отдать предпочтение. Выбирая между иерархическими и неиерархическими методами, необхо­д

Новые алгоритмы и некоторые модификации алгоритмов кластерного анализа
Методы, которые мы рассмотрели, являются «классикой» кластерного анализа. До последнего времени ос­новным критерием, по которому оценивался алгоритм кластеризации, было качество кластеризации: пола

Алгоритм BIRCH
(Balanced Iterative Reducing and Clustering using Hierarchies) Алгоритм предложен Тьян Зангом и его коллегами. Благодаря обобщенным представлениям кластеров, скорость кластеризаци

Алгоритм WaveCluster
WaveCluster представляет собой алгоритм кластеризации на основе волновых преобразований. В начале работы алгоритма данные обоб­щаются путем наложения на пространство данных многомерной ре­шетки. Н

Алгоритмы Clarans, CURE, DBScan
Алгоритм Clarans (Clustering Large Applications based upon RANdomized Search) формулирует задачу кластеризации как случайный поиск в графе. В результате работы этого алгоритма совокупность узлов гр

Однофакторный дисперсионный анализ
Однофакторная дисперсионная модель имеет вид: xij = μ + Fj + εij, (1) где х

Многофакторный дисперсионный анализ
Следует сразу же отметить, что принципиальной разницы между многофакторным и однофакторным ДА нет. Многофакторный анализ не меняет общую логику ДА, а лишь несколько усложняет ее, поскольку, кроме у

Использование дисперсионного анализа при изучении миграционных процессов
Миграция - сложное социальное явление, во многом определяющее экономическую и политическую стороны жизни общества. Исследование миграционных процессов связано с выявлением факторов заинтересованнос

Принципы математико-статистического анализа данных медико-биологических исследований
В зависимости от поставленной задачи, объема и характера материала, вида данных и их связей находится выбор методов математической обработки на этапах как предварительного (для оценки характера рас

Биотестирование почвы
Многообразные загрязняющие вещества, попадая в агроценоз, могутпретерпевать в нем различные превращения, усиливая при этом свое токсическое действие. По этой причине оказались необх

Дисперсионный анализ в химии
ДА – совокупность методов определения дисперсности, т. е. характеристики размеров частиц в дисперсных системах. ДА включает различные способы определения размеров свободных частиц в жидких и газовы

Функция плотности вероятности

Функция распределения

, x ³ 0;

Точечная оценка параметра закона распределения

.

Закон распределения Эрланга (гамма-распределение)

Функция плотности вероятности

Функция распределения

, x ³ 0;

Точечная оценка параметров закона распределения:

и по k" принимается k как ближайшее целое (k=1, 2, 3,...); .

Закон распределения Вейбулла

Функция плотности вероятности

функция распределения

, x ³ 0;

Точечная оценка параметров закона распределения

;

В системах с приоритетами требований различают относительный приоритет (без прерывания обслуживания), когда при поступлении требования с более высоким приоритетом оно принимается на обслуживание после окончания ранее начавшегося обслуживания требования с меньшим приоритетом, и абсолютный приоритет, когда канал освобождается немедленно для обслуживания поступившего требования с более высоким приоритетом.

Шкала приоритета может быть построена исходя из каких-то внешних относительно системы обслуживания критериев или на показателях, связанных с работой самой системы обслуживания. Практическое значение имеют следующие типы приоритетов:

приоритет у требований с наименьшим временем обслуживания. Эффективность данного приоритета может быть показана на следующем примере. Поступили последовательно два требования с длительностью обслуживания соответственно 6,0 и 1,0 ч. При приеме их на обслуживание освободившимся каналом в порядке поступления простой составит для 1-го требования 6,0 ч и для второго 6,0+1,0 = 7,0 ч или суммарно для двух требований 13,0 ч. Если дать приоритет второму требованию и его принять на обслуживание первым, то его простой составит 1,0 ч и простой другого– 1,0+6,0 = 7,0 ч или суммарно для двух требований 8,0 ч. Выигрыш от назначенного приоритета составит 5,0ч (13-8) сокращения простоев требований в системе;

приоритет у требований с минимальным отношением времени обслуживания к мощности (производительности) источника требования, например, к грузоподъемности автомобиля.

Механизм обслуживания характеризуется параметрами отдельных каналов обслуживания, пропускной способностью системы в целом и другими данными об обслуживании требований. Пропускная способность системы определяется числом каналов (аппаратов) и производительностью каждого из них.

45.Определение доверительных интервалов случайных величин



Интервальная оценка параметра распределения случайной величины определяется тем, что с вероятностью g

abs(P – P м) ≤d,

где P – точное (истинное) значение параметра;

P м – оценка параметра по выборке;

d – точность (ошибка) оценивания параметра Р.

Наиболее часто принимают g от 0.8 до 0.99.

Доверительный интервал параметра – это интервал, в который попадает значение параметра с вероятностью g. Например, на этой основе находится требуемый размер выборки случайной величины, который обеспечивает оценку математического ожидания при точности d с вероятностью g. Вид связи определяется законом распределения случайной величины.

Вероятность попадания случайной величины в заданный интервал [Х 1 , Х 2 ] определяется приращением интегральной функции распределения на рассматриваемом интервале F(Х 2)–F(Х 1). Исходя из этого, при известной функции распределения можно найти ожидаемое гарантированное минимальное Х гн (x≥ Х гн) или максимальное значение Х гв (x≤ Х гв) случайной величины с заданной вероятностью g (рисунок 2.15). Первое из них является тем значением, больше которого случайная величина будет с вероятностью g, а второе – что случайная величина с вероятностью g меньше этого значения. Гарантированное минимальное значение Х гн с вероятностью g обеспечивается при F(x)= 1-g и максимальное Х гв при F(x)=g. Таким образом, значения Х гн и Х гв находятся по выражениям:

Х гн = F -1 (1-g);

Х гв = F -1 (g).

Пример. Случайная величина имеет экспоненциальное распределение с функцией .

Требуется найти значения Х гн и Х гв, для которых случайная величина х с вероятностью g=0.95 соответственно больше Х гн и меньше Х гв.



Исходя из того, что F -1 (α) = -1/l ln(1- α) (см.вывод ранее) и α = 1-g = 0.05 получаем

Х гн = -1/l ln(1- α) = -1/0.01 ln(1-0.05)=-100 (-.0513)=5.13.

Для Х гв α = g = 0.95 аналогично имеем

Х гв = -1/l ln(1- α) = -1/0.01 ln(1-0.95)=-100 (-2.996)=299.6.

Для нормального закона распределения значения Х гн и Х гв могут быть рассчитаны по формулам

Х гн = х м + s U 1- g = х м - s U g ;

Х гв = x м + s U g ,

где x м – математическое ожидание случайной величины; s – среднеквадратическое отклонение случайной величины; U g – односторонняя квантиль нормального закона распределения при вероятности g.

Рисунок 2.15 – Графическая интрепретация определения Х гн и Х гв

46.Описание потоков требований на обслуживание

Входящий поток представляет собой последовательность требований (заявок), прибывающих в систему обслуживания, и характеризуется частотой поступления требований в единицу времени (интенсивностью) и законом распределения интенсивности потока. Входящий поток может быть описан также интервалами времени между моментами поступления требований и законом распределения этих интервалов.

Требования в потоке могут поступать по одному (ординарные потоки) или группами (неординарные потоки).

Свойство ординарности потока заключается в том, что в любой момент времени может поступить только одно требование. Иными словами, свойство заключается в том, что вероятность поступления больше одного требования за малый промежуток времени есть бесконечно малая величина.

В случае группового поступления требований задается интенсивность поступления групп требований и закон ее распределения, а также размер групп и закон их распределения.

Интенсивность поступления требований может изменяться во времени (нестационарные потоки) или зависит только от единицы времени, принятой для определения интенсивности (стационарные потоки). Поток называется стационарным, если вероятность появления n требований за промежуток времени (t 0 , t 0 +Δt) не зависит от t 0 , а зависит только от Δt.

В нестационарном потоке интенсивность изменяется во времени по непериодической или периодической закономерности (например, процессы сезонного характера), а также может иметь периоды, соответствующие частичной или полной задержке потока.

В зависимости от того, имеется ли связь между числом требований, поступивших в систему до и после некоторого момента времени, поток бывает с последействием или с отсутствием последействия.

Ординарный, стационарный поток требований с отсутствием последействия является простейшим.

47.Критерии согласия Пирсона и Романовского