Automobile
Сравнение boosted и linear типов регрессии
Результаты показали, что оба способа определения вероятности –linear regression и boosted decision tree regression – обладают высокой точностью. У linear regression точность = 0.98, а у boosted – 0.99. Для анализа остальных данных была выбрана boosted regression, так как у нее практически в два раза меньше средняя абсолютная ошибка.
Если говорить о факторах, влияющих на цену, можно особенное значение некоторых показателей. В нашем анализе присутствуют преимущественно машины средней стоимости и ниже (8000 по медиане и 11000 по средней). Среди машин, представленных в выборке, также преобладают те, у которых средние показатели по нормализованным потерям, количеству лошадиных сил, расходу топлива и размеру двигателя. Следовательно, можно предположить, что именно эти факторы оказали наиболее значительное влияние на цену. Также по графику видно, что преобладают такие марки машин, как Toyota и Nissan. Это относительно бюджетные марки, что тоже могло повлиять на общий график цены.