Проекты Data Science, как следует из названия, имеют научную составляющую. Как правило, она выражается в построении модели зависимости целевой переменной (цены товара, вероятности брака детали или покупки) от имеющихся данных (информации о покупках, качестве исходных материалов и так далее).
Исследование может быть как успешным — построена прогнозная или рекомендательная модель хорошего качества — так и неуспешным, когда зависимости между исходными данными и целевой переменной найти не удалось.