Построить прогноз продаж, трафика, спроса и предложения, итд на будущий год можно десятком (!) различных способов.
Прежде всего следует различать технический анализ и анализ с учетом фундаментальных факторов.
Первый опирается лишь на математику и по сути является экстраполяцией по регрессионной математической модели, второй учитывает также и внешние (макроэкономические, геополитические, рыночные, итд) факторы.
Соискателю на позицию Предиктивного (Прогнозного) Аналитика в качестве теста обычно предлагают задачу построения технического прогноза на следующий год, предоставив данные двух предыдущих лет, часто с посуточной статистикой.
Причем берут прошлые "ровные" периоды без потрясений и форс-мажоров. А затем просто сравнивают свой исторический факт с прогнозом от соискателя.
Чем ближе прогноз соискателя к факту работодателя -- тем лучше работает метод соискателя и тем выше интерес компании к нему.
Изложу здесь мой излюбленный подход для решения таких задач на примере данных некоторой компании, которая ежедневно замеряла трафик визитов своего сайта в 2015 и 2016 годах.
И которой нужно построить прогноз на 2017 год. Это реальный кейс, предлагаемый в числе других задач одним из российских медиахолдингов, название которого оставим за кадром :)
1. Я НЕ делю интервал на годовые отрезки, и не анализирую их по отдельности, а анализирую первым делом сразу и всю выборку на наличие глобального тренда.
Он может быть линейным, экспоненциальным, параболическим, или содержать в себе паттерн переходного процесса, вызванного каким-либо стрессом (например, локдауном ковида, но это тема отдельного разговора) итд.
На графике интервалы 2015, 2016 и прогнозируемого 2017 годов выделены красными пунктирами на шакале условного времени в днях.
И в данном случае отлично выявляется чистый нисходящий линейный тренд. То есть, трафик визитов сайта компании линейно падает.
И в предположении этого нисходящего линейного тренда мы пойдем дальше.
2. На втором этапе анализа из исследуемой выборки нужно вычесть выявленный тренд и далее исследовать Residuals-выборку на периодическую сезонную годовую составляющую.
Другими словами искать синусоиду с периодом 365 дней, так как подавляющее большинство реальных корпоративных данных всегда имеет годовую сезонность. Иногда это может быть сумма двух синусоид с разными амплитудами и фазами, но не будем усложнять :)
3. На третьем этапе анализа нужно вычесть из Residuals-выборки периодическую сезонную годовую составляющую и подвергнуть то, что осталось спектральному анализу, чтобы понять ЧТО еще сезонного там скрыто. Это могут быть составляющие с 30-дневным периодом и/или полумесячным периодом в 15 дней и/или недельным 7-дневным периодом и/или полунедельным 3,5-дневным периодом.
В нашем случае здесь хорошо выявляется лишь 7-дневная периодическая составляющая. Так как это данные трафика сайта бизнес-направленности. А не, скажем -- продаж, где присутствует зависимость от зарплаты (обычно первая декада каждого месяца) и аванса (обычно 20-е числа каждого месяца) :)
В итоге у нас получается сумма глобального тренда, периодической составляющей с периодом 365 дней и еще одной периодической составляющей с периодом 7 дней.
Довольно несложная модель.
4. Все что нам остается -- это просуммировать по месяцам суточные данные и отобразить все это на линейчатой диаграмме.
Конечно, реальные корпоративные кейсы сложнее. И любые прогнозы постоянно еженедельно "причесываются". На основании план-фактов еженедельно строятся снопы прогнозов и с учетом информационного и новостного фона строятся гипотезы дальнейшего развития событий (пессимизм, оптимизм, медиана, среднее, мода). Но это тема уже совсем отдельного разговора :)
Прогнозирование -- это потрясающе увлекательный квест!
Надеюсь, это было интересно и познавательно.
Не стесняйтесь обращаться, я хорошо разбираюсь в предмете достоверного прогнозирования и всегда готов помочь с решением простой задачи или реально сложного корпоративного кейса.
Я помогу вам заглянуть в будущее!