Обратный отсчет 415000

Имеется выборка данных – стохастический временной ряд, отражающий рост аудитории портала E-xecutive. Выборка регулярно пополняется данными с сайта портала.

Необходимо спрогнозировать день, когда размер аудитории портала достигнет или впервые превысит заветный уровень – 415000.

Для этого в своём комментарии просто укажите прогнозируемую дату в формате ДД/ММ/ГГ.
Если позднее вы пожелаете уточнить свой прогноз – просто сделайте новое предсказание в очередном своём комментарии.
Количество прогнозных предсказаний участника в обратном отсчёте НЕ ограничивается.
Свои прежние прогнозы НЕ удаляем и НЕ редактируем, они должны сохраняться в треде в неизменном виде.
В этом обратном отсчёте учитываются только те прогнозы, которые были сделаны не менее, чем за 7 дней до фиксации заветного уровня – Момента Истины.

Методика оценки точности прогнозов:
Очевидно, чем короче Дистанция до Момента Истины, с которой делается предсказание – тем меньше возможная Ошибка.
Поэтому для оценки каждого прогнозного предсказания учитывается НЕ Ошибка в чистом виде, а отношение Ошибки к Дистанции, с которой оно было сделано.
Арктангенс этого отношения даст значение углового отклонения прогноза от факта. Чем меньше угол, тем точнее данный прогноз.
Для всех предсказаний участника в обратном отсчёте, вычисляется среднее значение угловых отклонений. Чем меньше среднее значение – тем лучше в целом прогнозы участника в этом обратном отсчёте.
Всё это будет отражено в Ведомости обратного отсчёта, которую я представлю сразу же после наступления Момента Истины.

(Вся матчасть со ссылками, чертежами и формулами – в первом комменатрии к этой публикации.)

Победителем станет участник, среднее угловое отклоненение прогнозных предсказаний которого будет минимальным.
Победитель получит приз!

Расскажите коллегам:
Комментарии
Researcher, Москва

Здесь в Лицах Сообщества можно посмотреть размер аудитории портала на текущий день. Значение обновляется раз в сутки примерно в 06:00 (МСК).
По этой ссылке доступна выборка данных DataSet.csv, которую я парсю с июля. Скачайте, импортируйте в XLS и используйте для своего анализа и прогноза. Обновлю файл по запросу в комментах.
И там же лежат ведомости предшествующих Обратных отсчётов.


Чертёж с терминами и обозначениями для наглядности.



Методика оценки точности прогнозов.
Theta – это буква греческого алфавита для обозначения угла. Пишу латиницей, так как порталу не нравятся греческие буквы :)

Инженер-конструктор, Санкт-Петербург

Тут интересна другая задача, сколько надо сделать прогнозов и с какими интервалами, чтобы получить минимальный угол Тета при той или иной системе прогнозирования.

Researcher, Москва
Михаил Лурье пишет:
Тут интересна другая задача, сколько надо сделать прогнозов и с какими интервалами, чтобы получить минимальный угол Тета при той или иной системе прогнозирования.

Не попробуете -- не узнаете :)

Researcher, Москва

Сделаю первый выстрел -- 16/12/2022 зафиксируем уровень 415000+.

Researcher, Москва

Алексей Уланов, временно находящийся в бане, передал всем привет и сделал ставку на 13/12/2022. Время сообщения 14/11/2022 22:14.
Ок, так и запишем.

Researcher, Москва

Третий выстрел -- 10/12/2022 зафиксируем 415000+.
Если предположить, что все именно так и будет, то расклад по отклонениям такой.

По договоренности с Модераторами все последующие Обратные отсчеты будут вестись в треде одной и той же вот этой дискуссии. Чтобы не проявлять назойливость и не занимать все пространство блока Дискуссий. Поэтому мы сделали ее название более общим.

И для меня остается загадкой логика момента, когда происходит обновление данных о числе участников портала. И природа этого смещения.
В сентябре это было ранее утро. Сейчас это время чуть за 11:00.
Такое впечатление, что этот момент каждый день смещается в среднем на +6 минут в сторону опоздания. Но это неточно.


Исполнительный директор, Москва

Я, конечно, не великий математик, но сделаю свою ставку.

Оптимистичный прогноз - 11.12.2022

Реалистичный прогноз - 12.12.2022

Пессимистичный прогноз - 20.12.2022

 

Какие методы использовались для составления прогнозов - расскажу после оглашения "победителя")

Researcher, Москва
Василий Пензин пишет:
Реалистичный прогноз - 12.12.2022

Я буду учитывать реалистичный, если вы не против, ок? :) Нужно выбрать один для учета.
Спасибо! Вы очень порадовали меня :)

Исполнительный директор, Москва
Сергей Средний пишет:
Спасибо!

Вы вправе использовать любой мой прогноз as is )))

Researcher, Москва

Вот здесь я прочитал, что портал обновляет рейтинги ежедневно в 04:00. Что логично, так как это время самой минимальной активности портала.

В середине лета, когда я начал накапливать выборку по числу участников, я предположил, что портал в это же время обновляет не только рейтинги, но и число участников и первое время в выборке указывал дату с этим же временем 04:00, но специально это не проверял.

А в конце сентября я заметил, что обновление числа участников происходит около 6:00. И как оказалось вполне себе целенаправленно плывет в среднем на +5 минут ежедневно в сторону опоздания.
Сейчас конец ноября и обновление числа участников происходит уже около 11:00.
Что, конечно, не может не сказываться на точности регрессионных методов, которые я использую для построения прогнозных моделей.

В общем я скорректировал выборку (DataSet.csv), а именно -- скорректировал время фиксации числа участников, и в выборке оно теперь плывет примерно на +5 минут ежедневно. Как это и происходит в реальности.
Пришлось скорректировать и модели. А вместе с ними и прогнозы.

Поэтому мой четвертый выстрел -- это 13 декабря.
И в связи с тем, что время обновления числа участников плывет, то это 13 декабря после полудня, где-нибудь в 14:00 точно обновится.

Оставлять комментарии могут только зарегистрированные пользователи
Обсуждение статей
Все комментарии
Дискуссии
3
Евгений Равич
Всегда любопытно посмотреть на легкое перемещение многотонной прочной конструкции, если это касае...
Все дискуссии
HR-новости
Россияне назвали размер пенсии мечты

Среди жителей мегаполисов наиболее высокий уровень запросов в Москве и Санкт-Петербурге.

Каждый пятый россиянин хотел бы стать блогером

При этом более 80% россиян положительно относятся к деятельности блогеров.

Треть IT-сотрудниц считают реальной проблему карьерного развития женщин в сфере IT

Подавляющее большинство использовали свою гендерную принадлежность для продвижения по карьерной лестнице или решения рабочих вопросов.

Более половины россиян предпочтут премии корпоративам

При этом при наличии гарантии премирования 68% работников хотели бы отметить наступающий Новый год с коллегами.