1 февраля 2022
Графические методы оценки влияния факторов на качество продукции
Главный недостаток графических методов, с помощью которых можно проанализировать влияние факторов на качество процессов/продуктов – неоднозначность интерпретации. Можно привести достаточно примеров, когда на основе одного и того же графика специалисты приходят к разным заключениям. Таким образом, необходим более точные инструменты анализа - аналитические методы оценки влияния факторов:
Артем Михайлович Егоров,
руководитель учебной частью Центра Статистических Технологий
Дисперсионный анализ
Корреляция Пирсона
Критерий "Хи-квадрат"
Т-критерий Стьюдента
U-критерий Манна-Уитни
Критерий Краскела-Уоллиса
Корреляция Спирмена
Корреляция Кендела
С помощью этих методов анализа можно решить большинство практических задач по анализу факторных влияний на качество продукции. Все методы объединены одной целью – выяснить оказывает ли влияние некоторый фактор на качество продукции или процесса. Обратите внимание, что методы не отвечают на вопрос о том, какое влияние оказывает фактор. Чтобы оценить силу влияния фактора можно использовать как раз графический инструментарий.
Каждый метод имеет свои предпосылки использования. На основе этих предпосылок нами была разработана схема, позволяющая выбрать адекватный метод анализа в любой практической ситуации.
Схема выбора метода анализа влияния факторов
Конечно, у каждого из этих методов имеется своя не совсем простая формула расчета, но мы считаем этот вопрос вторичным, поскольку даже очень глубоко разобравшись в методологии расчета этих методов не происходит качественного скачка в понимании факторных влияний. Красота момента заключается в том, что все эти методы сегодня прекрасно реализованы в таких компьютерных программах как STATISTICA , MINITAB , SPSS , STATGRAPHICS и частично в Excel. Поэтому на долю аналитика выпадает только вопрос правильного выбора метода анализа, а также правильной интерпретации его результатов.
Выбор метода анализа определяется шкалой, в которой представлены исходные данные. Мы выделили два типа шкал – количественную и качественную. Такого разделения было достаточно для выбора графического инструмента. Однако сейчас от нас потребуются еще некоторые уточнения. Когда речь идет о количественных шкалах всегда можно поставить следующий вопрос, а подчинена ли измеряемая характеристика нормальному распределению? Чтобы ответить на этот вопрос существует много методов и подходов. Один из самых простых – построение гистограммы. На рисунке №1 показана гистограмма, которая бывает у нормально распределенных выборок. На рисунке №2 представлен случай ненормального распределения данных.
Рис. 1 Пример гистограммы, подчиненной нормальному распределению
Рис. 2 Пример гистограммы, не соответствующей нормальному распределению
(Вопросы построения гистограммы не обсуждаются в данной статье. Любое издание, посвященное статистическому управлению качества, подробно разбирает этот инструмент).
Данные представленные в качественной шкале могут иметь два и более уровней. Например, если мы анализируем влияние смены на процент несоответствующей продукции, то фактор «смена» представлен в качественной шкале. Если мы работаем в три смены, то, следовательно, этот фактор имеет ровно три уровня. Фактор «пол сотрудника», очевидно, имеет только два уровня. Если на выходе процесса качество продукции контролируется по альтернативному признаку (принять/отклонить), то мы имеем также качественную шкалу с двумя уровнями.
Предположим мы выбрали нужный метод анализа и с помощью указанного выше программного обеспечения провели необходимые вычисления. Как интерпретировать результаты? Все выделенные методы анализа в результате расчетов выводят показатель, называемый в литературе – статистическая значимость и обозначаемый латинскими буквами («р-level » или «sig.»).
Статистическая значимость - это вероятность того, что фактор не оказывает никакого влияния на качество процесса/продукта. Любая вероятность как известно может принимать любые значения от 0 до 1. Поэтому если в результате анализа мы получим запись p-level=0,76, то мы прочтем это так: «вероятность того, что фактор не оказывает влияние на качество, равна 0,76, значит, фактор не влияет." Случаи, когда в результате анализа статистическая значимость менее 0,05 указывают о наличии влиянии фактора. Таким образом, после проведения анализа нас интересует всего один показатель – статистическая значимость.
Если статистическая значимость меньше пяти сотых, то фактор оказывает влияние на качество процесса/продукта. Степень влияния мы определяем, используяграфики.
Примеры выбора метода анализа и интерпретации полученных результатов
Постановка задачи
Вид графика Метод P-level Выводы
Оказывает ли влияние содержание углерода на появление поверхностных дефектов. Фактор – количественный с нормальным распределением, зависимая величина – качественная (2 уровня). Ящичная диаграмма Т-критерий Стьюдента Р=0,37
Содержание углерода в данной марке стали не оказывает влияние на образование дефектов поверхности.
Оказывает ли влияние влажность воздуха в цехе на твердость готовой продукции. Фактор – количественный с ненормальным распределением, зависимая величина – количественная с ненормальным распределением. Диаграмма рассеяния Корреляция Спирмена Р=0,002
Влажность воздуха оказывает статистически значимое влияние на твердость продукции.
Оказывает ли влияния источник сырья (3 поставщика) на процент несоответствующей продукции на выходе процесса. Фактор – качественный (3 уровня), зависимая величина – количественная с ненормальным распределением. Ящичная диаграмма Критерий Краскелла-Уоллиса Р=0,83
Процент несоответствующей продукции не зависит от поставщика сырья.
Оказывает ли влияние вид технологической оснастки (два варианта) на появление брака. Фактор – качественный (2 уровня), зависимая величина – качественная (2 уровня). Круговая диаграмма Критерий Хи-квадрат Р=0,01
Вид оснастки влияет на появление брака. При одном из видов оснастки доля бракованной продукции существенно выше, чем при другом варианте.
Артем Михайлович Егоров,
руководитель учебной частью Центра Статистических Технологий
Дисперсионный анализ
Корреляция Пирсона
Критерий "Хи-квадрат"
Т-критерий Стьюдента
U-критерий Манна-Уитни
Критерий Краскела-Уоллиса
Корреляция Спирмена
Корреляция Кендела
С помощью этих методов анализа можно решить большинство практических задач по анализу факторных влияний на качество продукции. Все методы объединены одной целью – выяснить оказывает ли влияние некоторый фактор на качество продукции или процесса. Обратите внимание, что методы не отвечают на вопрос о том, какое влияние оказывает фактор. Чтобы оценить силу влияния фактора можно использовать как раз графический инструментарий.
Каждый метод имеет свои предпосылки использования. На основе этих предпосылок нами была разработана схема, позволяющая выбрать адекватный метод анализа в любой практической ситуации.
Схема выбора метода анализа влияния факторов
Конечно, у каждого из этих методов имеется своя не совсем простая формула расчета, но мы считаем этот вопрос вторичным, поскольку даже очень глубоко разобравшись в методологии расчета этих методов не происходит качественного скачка в понимании факторных влияний. Красота момента заключается в том, что все эти методы сегодня прекрасно реализованы в таких компьютерных программах как STATISTICA , MINITAB , SPSS , STATGRAPHICS и частично в Excel. Поэтому на долю аналитика выпадает только вопрос правильного выбора метода анализа, а также правильной интерпретации его результатов.
Выбор метода анализа определяется шкалой, в которой представлены исходные данные. Мы выделили два типа шкал – количественную и качественную. Такого разделения было достаточно для выбора графического инструмента. Однако сейчас от нас потребуются еще некоторые уточнения. Когда речь идет о количественных шкалах всегда можно поставить следующий вопрос, а подчинена ли измеряемая характеристика нормальному распределению? Чтобы ответить на этот вопрос существует много методов и подходов. Один из самых простых – построение гистограммы. На рисунке №1 показана гистограмма, которая бывает у нормально распределенных выборок. На рисунке №2 представлен случай ненормального распределения данных.
Рис. 1 Пример гистограммы, подчиненной нормальному распределению
Рис. 2 Пример гистограммы, не соответствующей нормальному распределению
(Вопросы построения гистограммы не обсуждаются в данной статье. Любое издание, посвященное статистическому управлению качества, подробно разбирает этот инструмент).
Данные представленные в качественной шкале могут иметь два и более уровней. Например, если мы анализируем влияние смены на процент несоответствующей продукции, то фактор «смена» представлен в качественной шкале. Если мы работаем в три смены, то, следовательно, этот фактор имеет ровно три уровня. Фактор «пол сотрудника», очевидно, имеет только два уровня. Если на выходе процесса качество продукции контролируется по альтернативному признаку (принять/отклонить), то мы имеем также качественную шкалу с двумя уровнями.
Предположим мы выбрали нужный метод анализа и с помощью указанного выше программного обеспечения провели необходимые вычисления. Как интерпретировать результаты? Все выделенные методы анализа в результате расчетов выводят показатель, называемый в литературе – статистическая значимость и обозначаемый латинскими буквами («р-level » или «sig.»).
Статистическая значимость - это вероятность того, что фактор не оказывает никакого влияния на качество процесса/продукта. Любая вероятность как известно может принимать любые значения от 0 до 1. Поэтому если в результате анализа мы получим запись p-level=0,76, то мы прочтем это так: «вероятность того, что фактор не оказывает влияние на качество, равна 0,76, значит, фактор не влияет." Случаи, когда в результате анализа статистическая значимость менее 0,05 указывают о наличии влиянии фактора. Таким образом, после проведения анализа нас интересует всего один показатель – статистическая значимость.
Если статистическая значимость меньше пяти сотых, то фактор оказывает влияние на качество процесса/продукта. Степень влияния мы определяем, используяграфики.
Примеры выбора метода анализа и интерпретации полученных результатов
Постановка задачи
Вид графика Метод P-level Выводы
Оказывает ли влияние содержание углерода на появление поверхностных дефектов. Фактор – количественный с нормальным распределением, зависимая величина – качественная (2 уровня). Ящичная диаграмма Т-критерий Стьюдента Р=0,37
Содержание углерода в данной марке стали не оказывает влияние на образование дефектов поверхности.
Оказывает ли влияние влажность воздуха в цехе на твердость готовой продукции. Фактор – количественный с ненормальным распределением, зависимая величина – количественная с ненормальным распределением. Диаграмма рассеяния Корреляция Спирмена Р=0,002
Влажность воздуха оказывает статистически значимое влияние на твердость продукции.
Оказывает ли влияния источник сырья (3 поставщика) на процент несоответствующей продукции на выходе процесса. Фактор – качественный (3 уровня), зависимая величина – количественная с ненормальным распределением. Ящичная диаграмма Критерий Краскелла-Уоллиса Р=0,83
Процент несоответствующей продукции не зависит от поставщика сырья.
Оказывает ли влияние вид технологической оснастки (два варианта) на появление брака. Фактор – качественный (2 уровня), зависимая величина – качественная (2 уровня). Круговая диаграмма Критерий Хи-квадрат Р=0,01
Вид оснастки влияет на появление брака. При одном из видов оснастки доля бракованной продукции существенно выше, чем при другом варианте.