Обратный отсчет 413000

Аудитория портала E-xecutive медленно прирастает. Число участников сообщества можно посмотреть, кликнув "Сообщество" в меню портала.
Значение обновляется один раз в сутки в 04:00 (МСК).
Если его мониторить, то несложно оценить темпы прирастания аудитории портала.

Предлагаю сыграть в (Предиктивно-) Аналитическую (Бизнес-) Игру.

Любой желающий в любой момент может сделать прогноз относительно того, когда число участников портала пересечет некий заветный уровень, скажем, 413000.
Для этого нужно просто ниже в треде указать в своем комментарии дату в формате ДД/ММ/ГГ, когда по вашему мнению значение числа участников впервые превысит (или окажется равным) заветному уровню.
Если через некоторое время вы пожелаете уточнить свой прогноз -- пожалуйста, просто сделайте новое предсказание в очередном своем комментарии.
Количество предсказаний участника не ограничивается.
Но, что важно, свои прежние предсказания НЕ удаляем и НЕ редактируем, они должны сохраняться в треде в неизменном виде.

По факту достижения заветного уровня (наступления Момента Истины), я сделаю расчет Рейтинга для всех участников и объявлю победителя -- самого одаренного прорицателя.

Методика расчета Рейтинга такая:
Очевидно, чем ближе мы к Моменту Истины (чем короче Дистанция, с которой делается предсказание), тем достовернее и точнее этот Момент Истины можно спрогнозировать (с меньшей Ошибкой).
Поэтому для каждого участника я буду учитывать НЕ Ошибку в чистом виде, а отношение Ошибки к Дистанции, с которой это предсказание было сделано.
Для всех предсказаний, сделанных участником, я вычислю их среднее значение — сложу эти соотношения (Ошибкаᵢ/Дистанцияᵢ) и поделю полученную сумму на Общее Число Предсказаний N, сделанных участником.
А затем переверну дробь, чтобы рейтинг работал по принципу -- чем точнее прогнозы участника, тем выше его Рейтинг.

Дистанции, с которой были сделаны предсказания, учитываются с точностью до минут, чтобы избежать коллизий.
Сами предсказания -- до дня, так как значение числа участников меняется лишь раз в сутки.
Если участник пишет, что оставляет свой последний прогноз в силе (или повторяет свой последний прогноз), то как новый он НЕ учитывается (в этом нет смысла).
А, если участник опубликовал свой новый прогноз, а потом через некоторое вернулся к одному из прежних, то, конечно, учитываются все.

Победителем станет участник, набравший максимальный Рейтинг в данном раунде обратного отсчета к заветному уровню 413000.
Естественно, бюллетень расчета рейтингов я выложу в общий доступ, все совершенно прозрачно.

Осталось лишь придумать призовой фонд для победителя и можно начинать :)

Ну, например:
В этом раунде обратного отсчета к уровню 413000 спонсором призового фонда выступлю я.
Призом станет бутылка хорошего красного сухого вина с рейтингом 4.0+ по данным Vivino.
Вино за мой счет, сама пересылка (только по РФ) оплачивается получателем при получении посылки (выберем что-нибудь побюджетней).
Если победителем становлюсь я сам -- то уступаю приз следующему за мной в Рейтинге участнику.

Норм? Если есть вопросы -- пожалуйста, задавайте.

Расскажите коллегам:
Комментарии
Researcher, Москва

Вот тут можно посмотреть текущее число участников портала:
Немного о терминах:

Формула расчета Рейтинга:

Researcher, Москва
Максим Часовиков пишет:

Мне кажется позднее.. Ну пусть будет 7 ноября. 

Хорошая ставка.
Это же все рассчитывается. Тут не гадать нужно, а сделать расчет.
У меня две модели. Консервативная указывает на 25 октября ±5 дней (90% шансы). Но все меняется -- сейчас пошло оживление. А данных у меня только с середины июля -- не так много для достовреного планирования в долгосрок. Поэтому это в общем математика, но с элементами лотереи :)
Чем больше данных -- тем больше ясности.

Researcher, Москва

30 сентября 2022 зафиксируем уровень 413000.

Это заметно отличается от моего первого прогноза, да.
Примерно с 25 августа наблюдается устойчивая динамика роста регистраций.
Допускаю, что она может замедлиться за пару недель, и заветная дата отодвинется на первую декаду октября, но пока это никак не видно из цифр.

Researcher, Москва

Раз уж никто не хочет играть в мои прогнозные игры -- открою карты.

Я построил три прогнозных сценария для тренда количества регистраций портала.


Первый оптимистичный, при котором динамика послеотпускного роста (которая начала проявляться с 25 августа) продолжится без стагнации. Он дает нам дату фиксации уровня 413000 -- 04 Октября.
Третий пессимистичный, при котором динамика роста застагнирует в перспективе пары дней, дает нам дату -- 18 Октября.
Второй (в середине) медианный, дает нам дату -- 11 Октября.

Достоверно математически определить тренд пока весьма затруднительно в силу малой выборки данных для экстраполяции и отсутствия у меня исторических данных сезонности прошлых лет.
Но интуитивно я склоняююсь к идее, что факт будет где-то в конце первой декады Октября, может быть 08-10 Октября -- это на уровне ощущений.

Корректировать свой предыдущий прогноз я пока не буду, соберу чуть больше данных, и как только кривая начнет хорошо выявляться и станет ясна -- дам очередную корректировку.

Researcher, Москва

Мои расчеты показывают, что вероятней всего мы зафиксируем на портале уровень 413000+ участников в интервале дат 06..11 октября 2022.
Эта область выделена светло-синим эллипсом.


Обратимся также и к нематематическим прогнозным методикам.
Мой Волшебный Хрустальный Шар говорит, что Светлый Рыцарь прибудет, когда Солнце будет в Весах, а Луна в Овне.
Полагаю, что имеется в виду дата 09 октября.


Примем 09 октября 2022 в качестве моего 3-го прогнозного предсказания.

Итак, на данный момент у меня сделано 3 выстрела:
23 августа 2022, 12:39 -- 25 октября
07 сентября 2022, 11:51 -- 30 сентября
11 сентября 2022, 12:24 -- 09 октября

Когда мы, наконец, пройдем заветный уровень 413000 -- я рассчитаю для каждого выстрела Theta углового расхождения и посчитаю среднее расхождение факта с прогнозом.

Отображу все это в такой ведомости и выложу где-нибудь здесь.
Все-таки идея оценивать прогнозы по отдельности в виде углового отклонения и все вместе как среднее угловое отклонение мне нравится больше, чем высчитывать некий абстрактный рейтинг.


Для чего все это?
Во-первых, мне интересно исследовать специфику прирастания аудитории портала.
Во-вторых, мне нравится оттачивать прогнозные методики на любом новом кейсе.
В-третьих, just for fun. Если больше увлеченных этой темой людей (прогнозных аналитиков) включится в игру -- будет веселей. Отличный повод попасть в поле зрения друг друга и навести мосты.

Про Хрустальный Шар -- это, конечно, была шутка :)
Хотя как сказать :)

Руководитель, Москва

Да, похоже я был слишком консервативен. Есть шансы, что это может случиться уже в сентябре. Не так уж и много осталось 800 регистраций, 40 в день, вполне реально. 

Researcher, Москва
Максим Часовиков пишет:

Да, похоже я был слишком консервативен. Есть шансы, что это может случиться уже в сентябре. Не так уж и много осталось 800 регистраций, 40 в день, вполне реально. 

Да, вы можете сделать уточнение прогноза в любой момент, как пожелате.
Этот обратный отсчет больше такой пристрелочный.

И я уже готовлю дискуссию для обратного отсчета 414000.
В принципе все то же самое, но я там чуть лучше и понятней изложу правила игры и сделаю несколько уточнений.

Инженер-конструктор, Санкт-Петербург

Мне кажется, что более корректно строить прогноз не на количество участников Сообщества, а на прирост участников Сообщества от какой-то фиксированной даты.

Ведь это не трамвай, где пассажиры входят и выходят, здесь в основном приходят новые участники, количество уходящих незначительно.

Причем большее число новых участников приходит за счет инструментов продвижения Сообщества - выдача в поиске, наличие ссылки на сайте партнере, агрегаторе или в почтовой рассылке.

Человек заходит для ознакомления с заинтересовавшей его статьей, начинает ее читать, а дочитывать можно только после регистрации. Вот и новый участник Сообщества.

Researcher, Москва
Михаил Лурье пишет:
Мне кажется, что более корректно строить прогноз не на количество участников Сообщества, а на прирост участников Сообщества от какой-то фиксированной даты.

Как пожелаете :)
Постройте, пожалуйста, прогноз на прирост 806 участников к сегодняшнему их числу 412194.
И спрогнозируйте дату, когда это случится.

Это в точности та же самая задача -- спрогнозировать дату, когда число участников достигнет уровня 413000 (=412194+806).

Просто в моей формулировке задачи содержится меньше условий, которые надо принять во внимание. И она формулируется чуть проще.

Этот Обратный отсчет 413000 -- он больше пристрелочный и экспериментальный, чтобы лучше понять как подать идею предиктивной игры.
Предыдущая моя дискуссия Самый высоколиквидный актив, где я впервые завел разговор о прогнозировании предыдущего уровня 412000 -- она была вообще не об игре, но идея предиктивной игры у меня родилась именно тогда.

И вот, наконец, я сформулировал и опубликовал новую дискуссию Обратный отсчет 414000, где чуть иначе сформулировал методику оценки точности прогнозов участников -- улучшил и упростил для восприятия -- вместо абстрактного рейтинга ввел угловое отклонение прогнозов.
Там я также все более качественно проиллюстрировал.
И, что важно -- предложил поделиться с любым пожелавшим включиться в игру историческими данными, которые спарсю к моменту его запроса.
Чтобы уравнять технические шансы любого нового участника с уже играющими.
Ибо ценность не в том, чтобы накопить набор данных, а в том, чтобы построить лучшую прогнозную модель и на основании ее насколько возможно загодя начать выдавать максимально точные прогнозы.

Хотя, кому лень считать, можно и просто угадывать. Но по опыту скажу, что если кому-то и повезет с угадыванием в этом обратном отсчете, то в последующих -- он вряд ли повторит столь же отличный резульат и НЕ подтвердит свою прогнозную экспертизу.
Прогнозная экспертиза дает повторямость хороших результатов в ансамбле кейсов. Угадывание не дает повторяемости.

Надо додумать идею призового фонда, но это не обязательно.

Welcome!

Инженер-конструктор, Санкт-Петербург
Сергей Средний пишет:
Как пожелаете :)Постройте, пожалуйста, прогноз на прирост 806 участников к сегодняшнему их числу 412194.И спрогнозируйте дату, когда это случится.Это в точности та же самая задача -- спрогнозировать дату, когда число участников достигнет уровня 413000 (=412194+806).Просто в моей формулировке задачи содержится меньше условий, которые надо принять во внимание. И она формулируется чуть проще.

График будет более наглядный, если мы сместим начало координат. А так понятно, что это все связано.

Researcher, Москва
Михаил Лурье пишет:
График будет более наглядный, если мы сместим начало координат. А так понятно, что это все связано.

Ну, совмещать начала координат -- это не обязательно.

В своих моделях я использую условную нумерацию дней, которая удобна мне. Но любой может использовать любую свою методу.
Есть модели, которым, например все равно какой день взят за x=0 -- например полиномиальные. А есть модели, которые очень чувствительны к выбору начала координат -- целое семейство сигмоидальных кривых, экспоненты, итд.
Лично я использую сплайны -- разные модели на разных фреймах и масштабах.
На очень узких фреймах можно все спрогнозировать используя линейную регрессию, которой тоже все равно, где x=0.
А вот на фреймах от пары недель -- она будет давать ошибку. Особенно в периоды, когда динамика меняется. Как это произошло в конце августа.

График и модели, с которыми работает участник игры -- это его внутренняя кухня. Их не обязательно публиковать. Скажу больше, если на кону игры стоит хороший приз -- этого делать вообще не нужно, чтобы не подсказывать другим.

Единственное, что важно -- выдавать время от времени в треде Обратного отсчета свои прогнозы в виде даты некоторого заранее оговоренного уровня. Прогнозы можно уточнять как угодно часто. Ограничений на это нет.
Но в методике оценки точности все попытки участника учитываются, конечно.
Хорошей практикой является -- сделать иницирующий первый прогноз сразу, второй -- когда пройдем полпути, третий -- когда пройдем 75% пути, итд.
Но это не обязательно.

Если хотите, то вот вся выборка, которая есть у меня. Это CSV формат, надеюсь разберетесь как импортировать в XLS и/или другой софт.
Первый столбец до запятой дата и время (время всегда 04:00, когда на портале происходит обновление данных), после запятой число участников портала на этот момент.

04/07/22 04:00,410425
05/07/22 04:00,410438
06/07/22 04:00,410480
10/07/22 04:00,410586
14/07/22 04:00,410699
15/07/22 04:00,410741
17/07/22 04:00,410779
18/07/22 04:00,410795
21/07/22 04:00,410886
23/07/22 04:00,410939
26/07/22 04:00,410996
27/07/22 04:00,411024
28/07/22 04:00,411057
29/07/22 04:00,411084
30/07/22 04:00,411094
31/07/22 04:00,411106
01/08/22 04:00,411120
02/08/22 04:00,411146
03/08/22 04:00,411187
04/08/22 04:00,411214
05/08/22 04:00,411242
06/08/22 04:00,411272
07/08/22 04:00,411283
08/08/22 04:00,411303
09/08/22 04:00,411339
10/08/22 04:00,411367
11/08/22 04:00,411398
12/08/22 04:00,411426
13/08/22 04:00,411457
14/08/22 04:00,411468
15/08/22 04:00,411482
16/08/22 04:00,411506
17/08/22 04:00,411529
18/08/22 04:00,411560
19/08/22 04:00,411592
20/08/22 04:00,411619
21/08/22 04:00,411627
22/08/22 04:00,411641
23/08/22 04:00,411669
24/08/22 04:00,411703
25/08/22 04:00,411720
26/08/22 04:00,411764
27/08/22 04:00,411782
28/08/22 04:00,411792
29/08/22 04:00,411807
30/08/22 04:00,411850
31/08/22 04:00,411877
01/09/22 04:00,411903
02/09/22 04:00,411943
03/09/22 04:00,411976
04/09/22 04:00,411992
05/09/22 04:00,412007
06/09/22 04:00,412041
07/09/22 04:00,412087
08/09/22 04:00,412113
09/09/22 04:00,412143
10/09/22 04:00,412179
11/09/22 04:00,412194

Попробуйте с этими данными построить прогноз достижения уровня 413000 в этом треде.
А как будете готовы, то и можете принять участие в Обратном отсчете 414000 :)
Я туда приду со своими прогнозами чуть позднее.
Но тут есть важный нюанс -- бОльшая дистанция, с которой делается прогноз, дает более высокую неопределенность, но лучше прощает ошибку, так как в методике оценки точности прогнозов я учитываю отношение Ошибки к Дистанции, а не Ошибку в чистом виде.
Поэтому важно выбрать свою оптимальную тактику игры, исходя их специфики ваших аналитических инструментов.

Включайтесь! Это интересно.

Инженер-конструктор, Санкт-Петербург
Сергей Средний пишет:
Если хотите, то вот вся выборка, которая есть у меня. Это CSV формат, надеюсь разберетесь как импортировать в XLS и/или другой софт.Первый столбец до запятой дата и время (время всегда 04:00, когда на портале происходит обновление данных), после запятой число участников портала на этот момент.

В Excel перенес, я люблю с Excel поиграться.

Захотел посмотреть, как зависит приход участников от дня недели, но к сожалению у Вас не все дни присутствуют в данных, поэтому это посмотреть можно не для всех недель.

Кстати, с удивлением выяснил, что в функции Excel по определнию дней недели - воскресенье - это 1 день, а суббота - 7 день. Ну как в библии.

Оставлять комментарии могут только зарегистрированные пользователи
Обсуждение статей
Все комментарии
Дискуссии
Все дискуссии
HR-новости
Tesla заменит опционы на денежные выплаты для большинства сотрудников

В 2021 году штат Tesla вырос на 40% год к году — до 100 тысяч человек.

Авиакомпания Red Wings перестала допускать пилотов младше 35 лет на международные рейсы

Такие же проблемы есть у компаний у Utair и iFly.

Самозанятые работники смогут получать больничные

Согласно оценкам чиновников, воспользоваться такой системой страхования захотят примерно 2 млн человек.

Магазины Lego в России откроются под названием «Мир кубиков»

Все площадки планируют обновить до конца октября текущего года.