Video games Rating

Мой датасет — большая выборка из различных видеоигр. В колонках прописывался издатель, год выпуска, жанр и т.д. Я решил натренировать модель на предугадывание средней оценки от журналистов при помощи других факторов, которые не относятся к оценкам. После первого прогона при помощи обычной линейной регрессии система показала себя очень здорово, но дело в том, что оценки критиков сильно коррелируют с оценками обычных игроков. Поэтому я убрал этот столбец из датасета. Затем я разделил его в соотношении 80/20 и попробовал разные виды регрессий (Линейную, по Байесу и Decision Forest). Регрессия по Байесу показала себя лучше всего. Коэффициент определения превысил 0.5, а среднее отклонение от истинного значения не превышало 9 (по 100-бальной шкале)