Замечания о рассчётах
Для получения результатов мы использовали данные лабораторных испытаний, в которые входили почти 1000 образцов. Перед проведением статистического анализа определялись и удалялись выбросы в генеральной совокупности данных. Выбросы – грубые ошибки, допущенные или экспериментатором, или при записи данных. Выбросы мешают статистической обработке и приводят к неточным результатам.
Поиск грубых ошибок осуществлялся следующим образом: для начала данные были рассортированы по возрастанию исследуемого параметра, после чего срезались «шапки»: несколько нижних и верхних значений, наиболее сильно отличающихся от «ядра». Для определения выбросов чаще всего используются Q-критерий, критерий Грабса, также можно использовать критерий Фишера и анализ выбросов с использованием квартилей. У каждого из этих методов есть свои недостатки и преимущества, мы по возможности использовали комбинацию из всех этих методов, однако, основным для нас был квартильный анализ.
После того как грубые ошибки внутри набора данных были удалены, рассчитывалась дисперсия и математическое ожидание. Математическое ожидание (M) рассчитывается по формуле (1), однако, для упрощения в данном случае можно рассматривать как среднее арифметическое всех значений (2), а дисперсия – среднеквадратичное отклонение от математического ожидания (3).
После нахождения дисперсии и математического ожидания, было проверено подчиняются ли данные нормальному распределению, рассчитываемому по формуле 4:
Рассмотрим нормальное распределение в общем виде, представленное на рисунке:
По оси Y находится вероятность обнаружения параметра в данной точке, по оси X в точке 0 находится математическое ожидание, «сигма» – дисперсия.
Таким образом, цель создания таблицы упростить выбор моторного масла, а также помочь в интерпретации результатов анализа.
После получения данных о нормальном распределении, мы обработали эти данные и предложили свои рекомендованные значения, на которые стоит опираться при выборе масла данной категории.