26 января 2026
Одновыборочный t-критерий Стьюдента Пиво, коммерческая тайна и студенты. Блог.
Одновыборочный t-критерий Стьюдента
Пиво, коммерческая тайна и студенты.
https://t.me/benchmarka
Хотя как раз студенты тут ни при чем совсем. Но – по порядку:
Пиво. «t-критерий» придумал Уильям Сили Госсет (1876–1937), английский химик-технолог и статистик, который работал в пивоваренной компании Гиннесс (Arthur Guinness Son & Co.) в Дублине.
Он занимался контролем качества продукции и селекцией сортов ячменя и хмеля. И, как водится, столкнулся с проблемой, или точнее (мы же про науку, и решение проблем да?) – с противоречием: для оценки, например, урожайности нового сорта или содержания спирта в партии есть только небольшие партии продукции – бизнес больше не дает.
Основным статистическим инструментом в то время был Z-критерий, а он на малых выборках дает слишком много ошибочных выводов. Итого – если нельзя увеличить количество выборок – это не во власти специалиста, то… Надо изменить инструмент оценки. Это-то как раз он умел.
И примерно в 1906-1097 гг. Госсет, в отпуске (!), пошел поработать в биометрическую лабораторию Карла Пирсона (ага, тот самый, который тоже «критерий) ))) в Лондоне. И математически вывел распределение для стандартизированной разности средних при неизвестной дисперсии генеральной совокупности. Это и было распределение t-Стьюдента.
А почему Стьюдент? А потому что «соглашение о конфиденциальности» и коммерческая тайна. У Гиннесса с этим было более чем жестко. Но ученый же, как он может молчать об открытии? И Госсет в 1908 году публикуется в журнале Biometrika под скромным псевдонимом «Студент». И мир узнал о t-распределении Стьюдента и t-критерии.
Позже статистик Рональд Фишер доработал и популяризировал работу "Стьюдента", доказав её универсальность и создав целый набор t-критериев (двухвыборочные, парные). И именно Фишер показал, что t-критерий — идеальный инструмент для планирования экспериментов с малыми выборками.
Это была история, а теперь текущие (очень общие) характеристики:
Когда использовать: если нужно проверить, отличается ли среднее значение метрики от заданного значения (теоретического или ожидаемого).
Пример решаемой задачи: контроль качества на производстве – останавливать ли оборудование для переналадки при текущих значениях. Или из другой отрасли - проверить, соответствует ли средний показатель конверсии новой страницы сайта ожидаемому уровню в 5%.
Кол-во наблюдений: одна выборка (n). Практический минимум: n ≥ 3. Надежно: n ≥ 20-30.
Тип данных: Количественные данные (интервальные или пропорциональные): вес, время, концентрация, прочность, размер и т.д.
Группы сравнения: выборка vs гипотетическое значение.
Предположения о данных: нормальность данных, независимость наблюдений.
Параметры на выходе: t-статистика, p-value, Степени свободы (df) – зависят от объема выборки (n-1) и типа теста, доверительный интервал для разницы средних (или среднего).
Нюансы использования: при малом объеме выборки (<30) или при нарушении нормальности данных можно использовать непараметрические методы.
Пример калькулятора: https://www.graphpad.com/quickcalcs/ttest1/
Вот примерно так все и работает. Еще один метод вам в копилку. Дальше – больше. Не отключаемся.
#метод #статистика #аналитика #качество #эксперименты #шестьсигм
Пиво, коммерческая тайна и студенты.
https://t.me/benchmarka
Хотя как раз студенты тут ни при чем совсем. Но – по порядку:
Пиво. «t-критерий» придумал Уильям Сили Госсет (1876–1937), английский химик-технолог и статистик, который работал в пивоваренной компании Гиннесс (Arthur Guinness Son & Co.) в Дублине.
Он занимался контролем качества продукции и селекцией сортов ячменя и хмеля. И, как водится, столкнулся с проблемой, или точнее (мы же про науку, и решение проблем да?) – с противоречием: для оценки, например, урожайности нового сорта или содержания спирта в партии есть только небольшие партии продукции – бизнес больше не дает.
Основным статистическим инструментом в то время был Z-критерий, а он на малых выборках дает слишком много ошибочных выводов. Итого – если нельзя увеличить количество выборок – это не во власти специалиста, то… Надо изменить инструмент оценки. Это-то как раз он умел.
И примерно в 1906-1097 гг. Госсет, в отпуске (!), пошел поработать в биометрическую лабораторию Карла Пирсона (ага, тот самый, который тоже «критерий) ))) в Лондоне. И математически вывел распределение для стандартизированной разности средних при неизвестной дисперсии генеральной совокупности. Это и было распределение t-Стьюдента.
А почему Стьюдент? А потому что «соглашение о конфиденциальности» и коммерческая тайна. У Гиннесса с этим было более чем жестко. Но ученый же, как он может молчать об открытии? И Госсет в 1908 году публикуется в журнале Biometrika под скромным псевдонимом «Студент». И мир узнал о t-распределении Стьюдента и t-критерии.
Позже статистик Рональд Фишер доработал и популяризировал работу "Стьюдента", доказав её универсальность и создав целый набор t-критериев (двухвыборочные, парные). И именно Фишер показал, что t-критерий — идеальный инструмент для планирования экспериментов с малыми выборками.
Это была история, а теперь текущие (очень общие) характеристики:
Когда использовать: если нужно проверить, отличается ли среднее значение метрики от заданного значения (теоретического или ожидаемого).
Пример решаемой задачи: контроль качества на производстве – останавливать ли оборудование для переналадки при текущих значениях. Или из другой отрасли - проверить, соответствует ли средний показатель конверсии новой страницы сайта ожидаемому уровню в 5%.
Кол-во наблюдений: одна выборка (n). Практический минимум: n ≥ 3. Надежно: n ≥ 20-30.
Тип данных: Количественные данные (интервальные или пропорциональные): вес, время, концентрация, прочность, размер и т.д.
Группы сравнения: выборка vs гипотетическое значение.
Предположения о данных: нормальность данных, независимость наблюдений.
Параметры на выходе: t-статистика, p-value, Степени свободы (df) – зависят от объема выборки (n-1) и типа теста, доверительный интервал для разницы средних (или среднего).
Нюансы использования: при малом объеме выборки (<30) или при нарушении нормальности данных можно использовать непараметрические методы.
Пример калькулятора: https://www.graphpad.com/quickcalcs/ttest1/
Вот примерно так все и работает. Еще один метод вам в копилку. Дальше – больше. Не отключаемся.
#метод #статистика #аналитика #качество #эксперименты #шестьсигм