Обратный отсчет 414000

Аудитория портала E-xecutive постоянно прирастает.
Число участников сообщества можно посмотреть, кликнув "Сообщество" в меню портала. Значение обновляется раз в сутки в 04:00 (МСК).
Оно стохастично (~случайно), но поддается прогнозированию.

Любой желающий в любой момент может сделать прогноз даты, когда число участников портала пересечет некий заветный уровень, в этом обратном отсчете 414000.
Для этого нужно ниже в треде в своем комментарии указать прогнозируемую дату в формате ДД/ММ/ГГ, когда по вашему мнению значение числа участников сравняется или впервые превысит заветный уровень.
Если через некоторое время вы пожелаете уточнить свой прогноз -- пожалуйста, просто сделайте новое предсказание в очередном своем комментарии.
Количество предсказаний участника не ограничивается.
Но, что важно -- свои прежние предсказания НЕ удаляем и НЕ редактируем, они должны сохраняться в треде в неизменном виде.
По факту достижения заветного уровня (наступления Момента Истины), я опубликую Ведомость со всеми прогнозами участников этого обратного отсчета и оценкой их точности.

Методика оценки точности прогнозов такая:
Очевидно, чем ближе мы к Моменту Истины (чем короче Дистанция, с которой делается предсказание), тем достовернее и точнее этот Момент Истины можно спрогнозировать (с меньшей Ошибкой).
Поэтому для каждого участника я учитываю НЕ Ошибку в чистом виде, а отношение Ошибки к Дистанции, с которой это предсказание было сделано.
По сути отношение Ошибки к Дистанции -- это тангенс углового отклонения прогноза от факта. Поэтому, рассчитав арктангенс отношения Ошибки к Дистанции я получаю значение углового отклонения и выражаю его в градусах. Чем меньше угол, тем точнее данное предсказание.
Для всех предсказаний, сделанных участником, я также вычисляю их среднее значение — складываю абсолютные значения угловых отклонений и делю полученную сумму на общее число предсказаний N, сделанных участником в этом обратном отсчете. Чем меньше это среднее значение -- тем лучше в целом прогнозы участника обратного отсчета.

Дистанции, с которых были сделаны предсказания, учитываются с точностью до минут, чтобы избежать коллизий.
Сами предсказания -- до дня, так как значение числа участников обновляется порталом лишь раз в сутки (в 04:00 МСК).
Если участник пишет, что оставляет свой последний прогноз в силе (или повторяет свой последний прогноз), то как новый он НЕ учитывается (в этом нет смысла).
А, если участник опубликовал свой новый прогноз, а потом через некоторое вернулся к одному из прежних, то, конечно, учитываются все.

Победителем в обратном отсчете становится участник, среднее значение угловых отклонений прогнозов которого будет минимальным.
Естественно, Ведомость оценки прогнозов я выложу в общий доступ -- здесь все совершенно прозрачно.
Если есть вопросы -- пожалуйста, задавайте.

Можно играть на интерес или придумать призовой фонд. Этот вопрос открыт и остается на усмотрение участников обратного отсчета.
Соль игры в умении строить достоверные прогнозные модели. Если пожелаете -- я дам те исторические данные, которые уже спарсил к моменту вашего запроса.

Расскажите коллегам:
Комментарии
Researcher, Москва
Михаил Лурье пишет:
Закономерности от чего Вы ищете, от каких факторов (параметров) - температуры на улице, длительности светового дня, фазы Луны, курса доллара и т.д.?

Я уже отвечал на этот вопрос. И, кстати, вам.
Мы же с вами обсуждали, что существует недельная активность. В одни дни недели активность выше, в другие ниже. Просто в силу того, что участники портала активней в середине недели и малоактивны в выходные, например.

Точно так же существует месячная активность.
Также внутри этих периодов есть полупериоды.
А снаружи -- кратные им.
А есть, спорадические паттерны -- например, в праздники или дни, когда занятость участников на короткое время становится настолько высокой, что наблюдается 4-5 дневная просадка в активности на портале (например, в первые числа сентября).

Зависит она от календаря, по которому люди живут и работают.
Но вы можете заложить любую логику в свой прогноз (хоть ретроградный Меркурий). Есть шанс, что это будет работать лучше :)

Инженер-конструктор, Санкт-Петербург
Сергей Средний пишет:
Зависит она от календаря, по которому люди живут и работают.Но вы можете заложить любую логику в свой прогноз (хоть ретроградный Меркурий). Есть шанс, что это будет работать лучше :)

Вы пишите о зависимости от шкалы времени, это мы обсуждали, а от других факторов есть зависимость, которые напрямую не связаны со шкалой времени?

Вообще для более детального анализа надо анализировать не только изменение в количестве участников Сообщества каждый день, но и персональный состав приходящих участников. Но это достаточно трудоемко, чтобы заниматься этим без конкретной цели.

Researcher, Москва
Михаил Лурье пишет:
Вы пишите о зависимости от шкалы времени, это мы обсуждали, а от других факторов есть зависимость, которые напрямую не связаны со шкалой времени?

Да, конечно.

Наблюдаемый случайный процесс впитывает в себя ВСЕ -- и периодические факторы (будь то календарь по которому живут люди, фазы Луны, если хотите, итд) и непериодические или спорадические (например, геополитические события, разовую рекламную кампанию портала, итд).
То есть, выборка -- это как годовые кольца дерева, в которые пишется все. И годовая климатическая сезонность, и внезапные засухи со вспышками на Солнце.
Я провожу технический анализ этих данных, и выявляю периодические факторы в них, и также выявляю в данных спорадические всплески, природы которых я не знаю, но я их вижу. Особым образом я учитываю и их и наблюдаю за их свойствами по мере роста количества данных в выборке.

Например, с начала октября в данных присуствует сильное влияние, которое с постоянной силой толкает число регистраций вверх. По ряду признаков это не похоже на следствие какой-то рекламной кампании портала, так как у такого другой паттерн. Так проявляется либо долгопериодическая сезонная особенность, либо это субтренд, который связан, например, с ростом сокращений сотрудников, которые в поиске новых возможностей регистрируются на всех профессиональных ресурсах, чтобы привлечь к себе внимание. По мере роста числа данных я буду лучше понимать природу этой составляющей. Пока что для меня это долгопериодическая составляющая с полугодовым периодом. В таком амплуа она работает на коротких горизонтах (1/2 мес, например), на длинных может давать заметную ошибку. И менно из-за этого я и накосячил в этом Обратном отсчете.
Ну, пусть кто-нибудь сделает лучше, я же только ЗА :)

По просьбе Евгения Равича здесь я довольно подробно изложил примерный подход к построению модели, которуя я затем использую для экстраполции.

Кроме технического анализа, можно проводить и фундаментальный анализ. Он подразумевает исследование факторов вне выборки и поиск корреляций. Фундаментальный анализ дает представление (точнее, гипотезы) о природе тех или иных составляющих в выборке. И с учетом понимания их природы позволяет более точно учитывать их влияние.
Я НЕ провожу фундаментального анализа в данном случае -- это затратный и трудоемкий процесс, просто овчинка не стоит выделки. Да и на столь малых выборках такие вещи сложно анализировать.
Но это не препятствует возможности делать прогноз.

Михаил Лурье пишет:
Вообще для более детального анализа надо анализировать не только изменение в количестве участников Сообщества каждый день, но и персональный состав приходящих участников. Но это достаточно трудоемко, чтобы заниматься этим без конкретной цели.

Такие вещи сейчас делаются с помощью нейронных сетей.
В общем такие гиганты как Гугл, Эппл, Мета, Амазон, Майкрософт, Тесла (да, у Маска есть компания, которая занимается исключительно ИИ) и многие многие другие только этим и заняты -- на больших данных они ищут связи, которые позволяют им узнавать паттерны поведения людей и очень достоверно прогнозировать их действия. Все это в общем служит главным образом их обогащению. Но не только, они решают еще кучу других задач по ходу.

Инженер-конструктор, Санкт-Петербург
Сергей Средний пишет:
Наблюдаемый случайный процесс впитывает в себя ВСЕ -- и периодические факторы (будь то календарь по которому живут люди, фазы Луны, если хотите, итд) и непериодические или спорадические (например, геополитические события, разовую рекламную кампанию портала, итд).

Это похоже на реальность.

Сергей Средний пишет:
Например, с начала октября в данных присуствует сильное влияние, которое с постоянной силой толкает число регистраций вверх. По ряду признаков это не похоже на следствие какой-то рекламной кампании портала, так как у такого другой паттерн. Так проявляется либо долгопериодическая сезонная особенность, либо это субтренд, который связан, например, с ростом сокращений сотрудников, которые в поиске новых возможностей регистрируются на всех профессиональных ресурсах, чтобы привлечь к себе внимание. По мере роста числа данных я буду лучше понимать природу этой составляющей. Пока что для меня это долгопериодическая состалвяющая с полугодовым периодом. В таком амплуа она работает на коротких горизонтах (1 мес, например), на длинных может давать заметную ошибку.

А вот тут был бы интересен анализ аналогичных тенденций на других интернет-ресурсах.

Совместный анализ разных интернет-ресурсов был бы информативен.

Researcher, Москва
Михаил Лурье пишет:
Совместный анализ разных интернет-ресурсов был бы информативен.

Наверное, да. Но здесь я не преследую целей, а наслаждаюсь исследовательским процессом :)

Я сейчас прохожу обучение по Нейронным Сетям (Neural Networks), Машинному Обучению (Machine Learning) и Искусственному Интеллекту (Artificial Intelligence).

И это -- просто вынос мозга. Это самые передовые знания в IT-индустрии, которые раскрывают просто невероятные возможности для анализа.
Это примерно в 4 раза повышает мою ликвидность на рынке аналитиков и дает ряд очень заманчивых возможностей.
Это сложная программа продолжительностью около 1 года, сразу скажу. Но я человек увлеченный.
После окончания обучения я стану эльфом 80-го левела в предиктивном анализе. Но, возможно, что я пойду еще дальше и с учетом моего опыта в биздеве займусь созданием инновационных интеллектуальных аналитических продуктов.


Researcher, Москва

Вот что имеем на данный момент.
Мой прежний прогноз 11 ноября оставляю пока в силе.
Но есть шансы, что зафиксируем уровень 414000+ мы все же 12 ноября. В зависимости от того произойдет ли пересечение до обновления данных порталом (около 11:00) или после. Но делать ставку на 12 ноября пока не буду.



Менеджер по компенсациям , Москва
Сергей Средний пишет:
существует недельная активность. В одни дни недели активность выше, в другие ниже. Просто в силу того, что участники портала активней в середине недели

В середине недели, как я заметил, происходит "жестокая модерация", с удалением комментов и "забаниваением" комментаторов.

Насколько справедлива гипотиза, что прибавление участников в середине недели связано с тем, что забаненный условный "Вася Пупкин", не согласный с тем, что ему в рот забили кляп, регистрируется, как новый участник, условный "Федя Залупкин", для того, чтобы снова высказаться на злободневную для него тему, ибо не может в себе держать высказывания, и тем самым как бы увеличивает число участников портала, но на самом деле, нет, ибо мульто-персонаж.

Researcher, Москва
Вячеслав Фомичев пишет:
В середине недели, как я заметил, происходит "жестокая модерация", с удалением комментов и "забаниваением" комментаторов.

Возможно.
Кривая прироста аудитории портала выглядит по дням недели с 07 по 13 ноября включительно так.


Количество регистраций в сутки -- это интеграл по кривой в интервале этих суток, другими словами площадь под кривой на интервале этих суток.

Пн 07 Ноя = 33,88
Вт 08 Ноя = 40,37
Ср 09 Ноя = 41,11
Чт 10 Ноя = 42,44
Пт 11 Ноя = 37,53
Сб 12 Ноя = 25,46
Вс 13 Ноя = 22,76

С Пн 07 Ноя по Вс 13 Ноя (включительно, закрашено серым) = 243,55
-- это улов участников портала этой недели с Пн по Вс.

Паттерн (форма кривой) практически не меняется. Он может слегка плавать -- то хобот чуть поднимется или опустится, то хвост, то сам слоник станет меньше или наоборот слегка подрастет. Но форма плюс/минус одна и та же.
Так как помимо внутринедельной активности есть еще и внутримесячная и ряд других.

У паттерна есть некоторая двугорбость в середине недели -- интересная особенность. Не знаю с чем она связана. Возможно, с тем, что вы упомянули -- с чисткой аккаунтов, но уж больно он стабильный и регулярный. А, возможно, и с тем, что в среду на работников ложится самая большая нагрузка по рабочим делам и у них просто становится меньше времени, чтобы сидеть на портале. Может быть погрешность аппроксимации. Для меня это не так уж и важно.

Как видим, больше всего регистраций приходится на Чт, Ср и Вт.
Если бы не двугорбость, то Ср была бы лидером :) А так Чт, Среда на втором месте, Вт на третьем.
На эти 3 дня недели приходится 51% всего недельного прироста.

В настоящее время я анализирую активность может быть десятка пабликов.
Плюс/минус это всегда рост с понедельника по пятницу (с пиком в середине недели) и просадка на выходных. Двугорбость наблюдается, но не всегда.

И шансы на 12 ноября 2022 существенно подросли.



Инженер-конструктор, Санкт-Петербург
Сергей Средний пишет:
Вячеслав Фомичев пишет: В середине недели, как я заметил, происходит "жестокая модерация", с удалением комментов и "забаниваением" комментаторов.
У паттерна есть некоторая двугорбость в середине недели -- интересная особенность. Не знаю с чем она связана. Возможно, с тем, что вы упомянули -- с чисткой аккаунтов, но уж больно он стабильный и регулярный. А, возможно, и с тем, что в среду на работников ложится самая большая нагрузка по рабочим делам и у них просто становится меньше времени, чтобы сидеть на портале. Может быть погрешность аппроксимации. Для меня это не так уж и важно.

Мне тоже кажется, что такой эффект возврата после забанивания (как сейчас говорят, отмены) может иметь место, но вряд ли это тенденция. Если бы это была тенденция, то это было бы заметно по возврату к забаненной теме возможно в менее жестком формате, а этого вроде нет.

Researcher, Москва

Все-таки, с высокой веротяностью мы зафиксируем уровень 414000+ 12 ноября.
Пересечем во второй половине 11 ноября, а зафиксируем видимо все же 12 ноября.

Корректировать свой предыдущий прогноз (11/11/2022) не буду, это уже не так интересно.


Результаты, видимо, будут такими (если вдруг тренд не скакнет резко вверх или вниз). То есть, Алексей Уланов меня снова обходит :)


Посмотрим. Пока мы не зафиксируем факт, все это носит вероятностный характер.

Было бы, конечно, интересней и веселей, если в игру включилось человек 5 из тех, кто умеет рассчитывать такие вещи, и кто строит свои прогнозы (гипотезы) на базе каких-то своих моделей.

Напомню, что давно открыт Обратный отсчет 415000 и попытать свои силы в предиктивном анализе любой желающий может там.

Researcher, Москва

Ну вот, 12 ноября, мы достигли уровня 414008.
Этот Обратный отсчет закрыт :) Победа за Алексеем Улановым.

Приглашаю всех пройти в залу № 415000.

Аналитик, Москва
Сергей Средний пишет:

Ну вот, 12 ноября, мы достигли уровня 414008.
Этот Обратный отсчет закрыт :) Победа за Алексеем Улановым.

Приглашаю всех пройти в залу № 415000.

А как насчёт приза победителю?

Researcher, Москва
Константин Комшуков пишет:
А как насчёт приза победителю?

В этом раунде не объявлял, но если будет настаивать -- обязательно вручу :)
В Обратном отсчете 415000 точно будет. Там объявил.
Вы прогнозы будете делать или просто поговорить зашли?

2
Обсуждение статей
Все комментарии
Дискуссии
Все дискуссии
HR-новости
«Кухня на районе» запустит автоматы с готовой едой и кафетерии в Москве

Для сервиса выход в офлайн — один из способов увеличить оборот.

За год стереотипов в отношении женщин на рынке труда стало меньше

В 81% компаний сообщили, что семейное положение женщины не влияет на решение о ее работе.

Сервис аренды самокатов Whoosh выйдет на IPO

Ожидается, что это произойдет 14 декабря 2022 года.

«МегаФон» продал долю в «Связном»

Оператор «МегаФон» владел 25% акций сети магазинов «Связной».