Обратный отсчет 413000

Аудитория портала E-xecutive медленно прирастает. Число участников сообщества можно посмотреть, кликнув "Сообщество" в меню портала.
Значение обновляется один раз в сутки в 04:00 (МСК).
Если его мониторить, то несложно оценить темпы прирастания аудитории портала.

Предлагаю сыграть в (Предиктивно-) Аналитическую (Бизнес-) Игру.

Любой желающий в любой момент может сделать прогноз относительно того, когда число участников портала пересечет некий заветный уровень, скажем, 413000.
Для этого нужно просто ниже в треде указать в своем комментарии дату в формате ДД/ММ/ГГ, когда по вашему мнению значение числа участников впервые превысит (или окажется равным) заветному уровню.
Если через некоторое время вы пожелаете уточнить свой прогноз -- пожалуйста, просто сделайте новое предсказание в очередном своем комментарии.
Количество предсказаний участника не ограничивается.
Но, что важно, свои прежние предсказания НЕ удаляем и НЕ редактируем, они должны сохраняться в треде в неизменном виде.

По факту достижения заветного уровня (наступления Момента Истины), я сделаю расчет Рейтинга для всех участников и объявлю победителя -- самого одаренного прорицателя.

Методика расчета Рейтинга такая:
Очевидно, чем ближе мы к Моменту Истины (чем короче Дистанция, с которой делается предсказание), тем достовернее и точнее этот Момент Истины можно спрогнозировать (с меньшей Ошибкой).
Поэтому для каждого участника я буду учитывать НЕ Ошибку в чистом виде, а отношение Ошибки к Дистанции, с которой это предсказание было сделано.
Для всех предсказаний, сделанных участником, я вычислю их среднее значение — сложу эти соотношения (Ошибкаᵢ/Дистанцияᵢ) и поделю полученную сумму на Общее Число Предсказаний N, сделанных участником.
А затем переверну дробь, чтобы рейтинг работал по принципу -- чем точнее прогнозы участника, тем выше его Рейтинг.

Дистанции, с которой были сделаны предсказания, учитываются с точностью до минут, чтобы избежать коллизий.
Сами предсказания -- до дня, так как значение числа участников меняется лишь раз в сутки.
Если участник пишет, что оставляет свой последний прогноз в силе (или повторяет свой последний прогноз), то как новый он НЕ учитывается (в этом нет смысла).
А, если участник опубликовал свой новый прогноз, а потом через некоторое вернулся к одному из прежних, то, конечно, учитываются все.

Победителем станет участник, набравший максимальный Рейтинг в данном раунде обратного отсчета к заветному уровню 413000.
Естественно, бюллетень расчета рейтингов я выложу в общий доступ, все совершенно прозрачно.

Осталось лишь придумать призовой фонд для победителя и можно начинать :)

Ну, например:
В этом раунде обратного отсчета к уровню 413000 спонсором призового фонда выступлю я.
Призом станет бутылка хорошего красного сухого вина с рейтингом 4.0+ по данным Vivino.
Вино за мой счет, сама пересылка (только по РФ) оплачивается получателем при получении посылки (выберем что-нибудь побюджетней).
Если победителем становлюсь я сам -- то уступаю приз следующему за мной в Рейтинге участнику.

Норм? Если есть вопросы -- пожалуйста, задавайте.

Расскажите коллегам:
Комментарии
Аналитик, Нижний Новгород
Сергей Средний пишет:
Эдакая геймификация довольно серьезных идей.

Да я понимаю что Вы имеете ввиду под "игрой". И насколько "игра" эффективней любой другой формы обучения применительным практикам.

Сергей Средний пишет:
...уступать мне в оценке, так как по определению будет делать их после меня и с меньшей дистанции до Момента Истины и его средняя Theta будет выше (то есть уступать моей).

А вот баба Яга не согласна. Например я, как ленивый аналитик, учитывая Ваш профессионализм, теорию вероятности, могу предположить что Вы обозначили наиболее вероятное множество значений события. Событие, скорее всего, случится раньше или позже по той же теории вероятности. Смещая дату события на 1 день до или после Вашей даты, я получаю 50%-ную вероятность быть как минимум ближе прогноза к факту, за исключением Вашего точного попадания. Вы подняли мне шансты с 0, дырки от бублика, до 50%, минус вероятность Вашего точного попадания.

Researcher, Москва
Михаил Трофименко пишет:
Смещая дату события на 1 день до или после Вашей даты, я получаю 50%-ную вероятность быть как минимум ближе прогноза к факту, за исключением Вашего точного попадания. Вы подняли мне шансты с 0, дырки от бублика, до 50%, минус вероятность Вашего точного попадания.

Да, верно.
Но вам придется выбрать прогноз ДО моего или ПОСЛЕ моего.
И таким образом или заметно обыграть меня в точности, несмотря на более поздний прогноз и, если угадаете направление; либо проиграть мне, если не угадаете с направлением, и тем более, что ваш прогноз пойдет позднее моего.

И по совокупности попыток, если их у вас было несколько в раунде (обратном отсчете), если принять равновероятность ДО или ПОСЛЕ -- скорее всего проиграть, ну или в самом лучшем случае сыграть так же.
Здесь вы все верно заметили.

Но вся соль этой игры в том, что стрельба с длинной дистанции как бы это сказать -- прощает ошибку, при условии, что вы умеете хорошо целиться. С другой стороны, если не целитесь, то есть, при отсутствии фундаментальных знаний о свойствах тренда, исторической выборки и хорошей методики прицеливания с длинной дистанции можно просто выстрелить совсем в молоко, так как тренд гуляет -- на него влияет куча факторов, и они открываются только по факту наблюдения за тредном и накопления знаний о нем.
Стрельба же с близкой дистанции снижает риск сильно отклониться, но метод оценки чувствителен к сокращению дистанции, так как роль ошибки с сокращением дистанции усиливается.
Получается, что каждому нужно искать свой балланс между дистанцией и точностью (методом) прицеливания.

И есть еще один важный момент.
Если в игре принимает участие, скажем, 10 человек. То лучший (самый профессиональный) прогнозный аналитик редко бывает первым. Обычно в обратном отсчете первое место берет некий случайный человек, который стрельнул лишь один раз и случайно попал где-то рядом с Моментом Истины.
Но повторить такой же результат в следующем раунде (обратном отсчете) такому везунчику скорее всего не удастся. По понятным причинам -- это как два раза выиграть в лоттерею.
И, чем больше выстрелов в раунде (обратном отсчете) делает участник, тем его среднее отклонение объективно лучше характеризует его профессиональную меткость.

Лучший прогнозный аналитик как правило дает стабильно 2-3 место от раунда к раунду. А люди на первых местах постоянно менются :)
Также такой профессиональный снайпер стреляет заметно лучше по мере приближения к Моменту Истины до некоторой критической дистанции (то есть угловое отклонение снижается для последующих выстрелов в раунде) и его среднее угловое отклонение от обратного отсчета к обратному отсчету тоже снижается, так как он накапливает знания о наблюдаемом тренде.

Можно было бы ввести дополнительное правило о нескольких обязательных выстрелах или стрельбе по расписанию или усложнить метод оценки с учетом числа выстрелов -- но НЕ вижу в этом большого смысла, мы же здесь не корову проигрываем/выигрываем.

В следующем раунде игры, а именно -- Обратном отсчете 414000 -- в первом комментарии к нему, где я подробно с картинками изложил правила и методику оценки, я также привел все исторические данные, которые собрал с июля по сегодня. Вы можете использовать их для построения своего анализа и прогноза.

Алексей Уланов +9834 Алексей Уланов Начальник участка, Москва
Сергей Средний пишет:
Алексей Уланов пишет:
Если она в Ваших расчетах не учтена, событие произойдет на 2-3 дня раньше. Моя ставка на 12 октября 2022г, на день кадрового работника в 23ч 45 минут. 

Учтена в некоторой степени, так как экстраполяция учитывает любые зарождающиеся плавные субтренды.
Резкие скачки и другие НЕразмытые во времени изменения в тренде -- конечно, нет. Для прогнозирования таких дельта-всплесков (вейвлетов) используется другая методика и их проявление оценивается иначе. На данной выборке они не поддаются прогнозированию. Но такие вещи можно угадывать.
Здесь я в это просто не лезу, руководствуясь исключительно математикой. Но это остается на личное усмотрение любого участника.

Алексей, нужна только дата, без времени. Так как портал обновляет данные по участникам ежедневно в 04:00, то мне не ясно как трактовать 12/10/22 23:45 -- как (видимо) 13 октября или как (все же) 12 октября.
В течение дня значение не меняется, его изменение фиксируется ежедневно в 04:00. Поэтому, если пересечение уровня 41300 произойдет, как вы полагаете 12/10/22 23:45, то зафиксируем мы этот факт только 13 октября в 04:00.
Поэтому прошу вас учтонить -- 13 или 12 октября?

Если принять, что мы зафиксируем 413000+ согласно моему 4-му прогнозу 15 октября 2022 и что ваш прогноз это 13 октября, то тогда текущий расклад выглядит так:


То есть, у вас, Алексей, хорошие шансы получить бутылку призового вина :)
Но на все воля Боженьки.

Сейчас позвонил знакомому тарологу, точно видит меня в виде жениха с кубком вина 13 числа. Корректируйте свои прогнозы под волю неба.

Researcher, Москва
Алексей Уланов пишет:
Сейчас позвонил знакомому тарологу, точно видит меня в виде жениха с кубком вина 13 числа. Корректируйте свои прогнозы под волю неба.

Ха-ха :) Так я и учел в Ведомости ваш прогноз как 13 октября 04:00.
Посмотрим. Мой пока оставлю как есть 15 октября. Я пока играю строго с математикой. Может быть в последующих раундах сделаю шаг в сторону неформальных методов.

Если ваш прогноз или прогнозы окажутся лучшими в этом раунде и вы сумеете повторить похожие результаты в последующих раундах (обратных отсчетах), то определенно вы что-то знаете или обладаете даром прорицателя, ну или методом прогнозирования, который хорошо работает (по крайней мере лучше моего).
Отлично! Значит в моем треде собираются правильные люди с deep future vision :)

Аналитик, Нижний Новгород
Сергей Средний пишет:
Вы можете использовать их для построения своего анализа и прогноза.

Нет уж, увольте. Я в отпуске, а времени всё равно нет. Завтра опять попрусь на работу. А бутылочку для перезагрузки я и так себе организую.

Researcher, Москва
Михаил Трофименко пишет:
А бутылочку для перезагрузки я и так себе организую.

Когда сам себе -- не интересно. Интересно -- когда удача приносит вам ее в подарок. Ну и дело же не в бутылочке, а в умении создать себе и другим настроение, в дружеском общении. Но смотрите сами, двери Обратных отсчетов открыты.

Аналитик, Нижний Новгород
Сергей Средний пишет:
Интересно -- когда удача приносит вам ее в подарок.

Не азартен, да и подарков от жизни не жду. Так меньше разочарований. Придерживаюсь установки с самой юности - надейся на лучшее, но предполагай худшее.

Сергей Средний пишет:
Ну и дело же не в бутылочке, а в умении создать себе и другим настроение, в дружеском общении.

Да, но какое Вы создадите настроение "другим" если просто выиграете? Для дружеского общения важно не получать, а отдавать, делиться, сопереживать. Например, лайк хорошей теме или доброе слово. Отдавать, помогать охренительно приятно.

Researcher, Москва
Михаил Трофименко пишет:
Да, но какое Вы создадите настроение "другим" если просто выиграете? Для дружеского общения важно не получать, а отдавать, делиться, сопереживать. Например, лайк хорошей теме или доброе слово. Отдавать, помогать охренительно приятно.

Так я и отдаю -- в тексте дискуссии выше написал же, что если мои прогнозы будут лучшими, то вручу приз первому, кто за мной.
Ну и важно понимать, просто повторюсь, что явление, которое мы исследуем здесь -- стохастично, то есть НЕ предопределено и содержит в себе случайность. То есть, каким бы умным кто бы ни был, но случай имеет влияние на результат. Хотя, конечно, навыки работы с цифрами -- заметно повышают шансы.

Аналитик, Нижний Новгород
Сергей Средний пишет:
Так я и отдаю -- в тексте дискуссии выше написал же, что если мои прогнозы будут лучшими, то вручу приз первому, кто за мной.

Так это только Вы. А давайте наоборот. Если я выиграю, то с меня бутылка. А вообще, если уж пошла такая пьянка, стоит приурочить следующую встречу дискуссионного клуба к результам Вашего конкурса. 

Researcher, Москва
Михаил Трофименко пишет:
Если я выиграю, то с меня бутылка.

Ну, логика у большинства работает иначе. Призы получать приятно. Это работает как мотивационный стимул стремиться к выигрышу, когда на кону приз.

Про вино я заговорил только в Обратном отсчете 413000, чтобы чуть заинтриговать участников.
В Обратном отсчете 414000 -- играем пока на интерес.

Но, если вы захотите подарить кому-либо бутылку вина, то для этого в принципе связка с Обратными отсчетами не обязательна :)
Ну или, если желаете -- можете стать спонсором призового вина в Обратном отсчете 414000.
Если вдруг выиграете сами первое место, то вручите следующему участнику за вами.
Но я ни на чем вообще не настаиваю :) Просто как идея.

Мне все это интересно в общем больше по соображениям пообщаться, посчитать, порисовать графики, ну такое все. Алкоголь я практически не употребляю -- ну может пару бокалов за ужином раз в пару месяцев.

Researcher, Москва

С утра пораньше я решил проапдейтить и поисследовать мою регрессионную модель и сравнить ее с линейной.

Любая регрессионная модель, которая строится на основании выборки случайной величины, безусловно, является приближением.
И разность между моделируемыми и наблюдаемыми значениями случайного процесса -- формирует рассеивание, которое можно оценить с помощью функции плотности веротяности этой разности.

Для выборки числа участников портала, которую я парсю с июля (на сегодня 71 значение) я построил две регрессионных модели:
- сложную НЕлинейную, которую я использую для прогнозирования будущих значений числа участников портала
- и примитивную линейную, на которой настаивали здесь некоторые участники, как самой эффективной для экстраполяции

Для каждой из этих моделей я проанализировал рассеивание наблюдаемых значений от моделируемых и отобразил все это в виде двух функций плотности вероятности этих рассеиваний, также для каждой из них выделил доверительные интервалы, которые покрывают рассеивание с веротяностью 95%:
- малиновая кривая плотности рассеивания -- для моей нелинейной модели
- синяя кривая -- для линейной модели


Что же мы видим?
Мы видим, что доверительный интервал P=95% для моей сложной нелинейной модели, которую я использую для прогнозирования, значительно у́же -- всего [-12; +12].
То есть, 95% наблюдаемых значений не выходят за пределы трубки, окаймляющей мою регрессионную модель на ±12 участников портала.

Такой же доверительный интервал P=95% для линейной модели значительно шире, аж в 2,83 раза -- [-34; +34].
То есть, 95% наблюдаемых значений покрываются уже более широкой трубкой, окаймляющей линейную модель на ±34 участников. Здесь рассеивание наблюдается сильней.

Если принять, что аудитория портала прирастатет в среднем на 25 участников в день, то линейная модель при прочих равных с нелинейной моделью будет заведомо уступать ей в точности по меньшей мере на ±2 дня. Продчеркну -- при прочих равных условиях.
И при условии, что наблюдаемый случайный процесс прирастания аудитории портала носит стационарный характер. Что, конечно, заведомо не так. И, чем сильней эта нестационарность проявляется, тем хуже работает линейная модель по определению.

Линейная регрессия, конечно, может применяться, но очень ограниченно.
Будет интересно, если в Обратном отсчете 414000 примет участие адепт чистых линейных подходов, чтобы просто на практике понаблюдать что и как работает.


PS График выглядит просто как сладкая конфетка :)
Вообще, кривая нормального распределения для многих аналитиков -- это фетиш, который нереально доставляет. Мне кажется, здесь есть что-то по Фрейду :)

Researcher, Москва

Вот что имеем на данный момент.


У Среднего (то есть, меня) -- 4 предсказания. У Часовикова и Уланова -- по 1 предсказанию.
У меня большой разброс, но это нормально, если учесть, что попытки спрогнозировать дату достижения уровня 413000 я начал делать еще 23 августа (x=44796,5), когда выборка была совсем скудной (39 значений), и понимания свойств тренда у меня было мало.

Очень хороший выстрел у Алексея Уланова, но он был сделан как поправка к моему 4 прогнозу, то есть базировался не столько на собственном исследовании, сколько на моем :) Но у каждого свое ноу-хау.
Максиму Часовикову можно было бы скорректировать свой прогноз еще неделю-другую назад, очевидно, что он уже не актуален.

А я сделаю свой пятый прогноз, он будет отличаться от моего четвертого (15 октября) на -1 день и окажется в точности по середине между ним и прогнозом Алексея Уланова (13 октября).
Итак, 14 октября 2022 мы зафиксируем уровень 413000+.

Если предположить, что все именно так и будет, то вот что имеем:


Лидирует Алексей Уланов.

До Момента Истины осталось около 2-х с половиной недель, и выбирать здесь уже почти не из чего (либо 14 октября, либо на крайняк все же 15 октября, либо 13 октября, остальные варианты мне видятся совсем маловероятными).
Но, если вы, друзья, желаете попробовать свои силы в прогнозировании, то тред с Обратным отсчетом 414000 -- стоит почти нераспечатанный и с нетерпением ожидает ваших прогнозных идей :)
Историческую выборку (72 значения) скачаете по ссылке в конце первого комментария там.

Researcher, Москва
Михаил Лурье пишет:
Интересно, довольно стабильный приход участников по субботам, в сентябре больше чем в августе.

Я экспериментально выяснил, что обновление числа участников происходит НЕ в 04:00, а в 06:00. То есть, фиксация данных происходит на +2 часа позднее, чем я полагал ранее.
С учетом этого я сделал более точный расчет долей по дням недели прироста числа участников портала. Здесь оценка от 00:00 до 24:00 каждого дня.


Недельный же прирост аудитории портала колеблется от 151 до 203 участников или другими словами 177 ±26 участников -- он плавает в зависимости номера недели в месяце и есть еще более долгопериодичские осцилляции.

В течение текущей недели ожидается прирост около 192 участников -- с этого понедельника по воскресенье включительно.

Интересной особенностью является двугорбость графика -- Ср дает стабильно чуть меньший прирост, чем Вт и Чт.
Сначала я полгал, что это какая-то погрешность. Но нет -- это совершенно четко выявляемая особенность, природа которой мне до конца неясна.
Полагаю, что на Ср приходится бОльшая загрузка участников по работе, чем во Вт и Чт и на E-xecutive в Ср остается меньше времени.

Это смещение на +2 часа я исправил в исторической выборке.
В моих прогнозных моделях имеет место незначительный сдвиг по фазе периодических составляющих, но существенного влияния на прогнозные даты это не оказывает.

1 3
Оставлять комментарии могут только зарегистрированные пользователи
Обсуждение статей
Все комментарии
Дискуссии
Все дискуссии
HR-новости
Магазины Lego в России откроются под названием «Мир кубиков»

Все площадки планируют обновить до конца октября текущего года.

Госдума приняла закон о кредитных каникулах для мобилизованным россиян

Кредитные каникулы распространяются и на членов семей военнослужащих.

Опубликован рейтинг «Топ-1000 лучших российских менеджеров»

В рейтинг этого года попали «новые» номинации: директор по развитию, директор по связям с инвесторами, директор по закупкам и директор по цифровой трансформации.

В 2023 году маткапитал вырастет до 589,5 тыс. рублей на первого ребенка

На второго ребенка – 779 тыс. рублей.