Задача о разборчивом HR: как выбрать лучшего кандидата с помощью теории вероятности

В теории вероятностей существует классическая задача, известная под разными названиями: задача разборчивой невесты, задача привередливого жениха или задача остановки выбора. С учетом специфики портала Executive.ru назовем ее задачей выбора лучшего кандидата на работу, потому что именно ее каждый день решает HR-менеджер в своей компании.

Условия задачи

  • HR-менеджеру необходимо подобрать сотрудника на вакансию.
  • На эту должность имеется N кандидатов, и значение N известно.
  • Кандидаты проходят собеседование последовательно в случайном порядке, и каждого кандидата можно однозначно оценить по общей для них всех шкале ранжирования, скажем от 0 до 1.
  • Решение о приеме или отклонении кандидата основано только на рангах кандидатов, прошедших собеседование к данному моменту времени.
  • Сразу после собеседования прошедший его кандидат либо безвозвратно отклоняется, либо принимается на вакансию, и это решение является окончательным. В случае принятия положительного решения по кандидату – собеседование кандидатов останавливается.
  • Нужно найти общее решение, состоящее в выработке оптимальной стратегии, гарантирующей выбор лучшего кандидата из всей группы N с наибольшей вероятностью. Другими словами – стратегия должна максимизировать ожидаемый выигрыш.

HR-менеджер выигрывает, когда принимает лучшего кандидата из N.

Впервые эта задача была опубликована Мартином Гарднером в журнале Scientific American за февраль 1960 года. Хотя до того ей уже уделялось большое внимание в научных кругах. На тему ее решения написаны целые тома. В том числе – по различным модификациям этой задачи, например, когда заранее неизвестно общее количество кандидатов N.

Примечательно, что в докторской диссертации Бориса Березовского, известного бизнесмена и политического деятеля, впоследствии члена-корреспондента РАН, на соискание ученой степени доктора наук «Разработка теоретических основ алгоритмизации принятия предпроектных решений и их применения», защищенной в 1983 году, рассматривается обобщение нашей задачи о разборчивой невесте.

Решение

Для решения этой задачи можно применять различные подходы. В силу их сложности и громоздкости приводить здесь я их не буду – при желании подробности можно найти в сети. Не вдаваясь в математические выкладки и доказательства, приведу сразу решение этой замечательной задачи.

Оптимальная стратегия найма выглядит так: отсобеседовать N/e первых кандидатов, где e=2,71828 – число Эйлера или основание натурального логарифма, а затем выбрать из оставшихся первого, который окажется лучше всех предыдущих.

Предположим, что HR-менеджер отобрал 8 резюме кандидатов, которые по его мнению соответствуют вакансии и требованиям компании. Следовательно, N в нашей формуле = 8.

Далее HR-менеджер:

  • Провел собесдеования с первыми N/e = 8/2,71828... = 2,9430... ≈ 3 кандидатами, пока не принимая никаких решений.
  • Зафиксировал для себя максимальный ранг среди отсобеседованных кандидатов. Предположим, первые 3 кандидата имели ранги 0,4; 0,25; 0,6. И тогда максимальным рангом будет 0,6.
  • Продолжает собеседовать кандидатов далее до момента, пока не попадется кандидат с рангом больше 0,6. Именно этому кандидату сделать предложение о работе, а дальнейшие собеседования не проводить.

Описанное выше решение подходит для стратегии выбора лучшего кандидата. С увеличением числа кандидатов N вероятность выбора лучшего кандидата стремится к 1/e = 36,8...%. Не густо?

Расширим условия задачи

Предположим, что HR-менеджер руководствуется менее строгим выбором: согласен выбрать одного из двух лучших кандидатов. В этом случае:

  • Рекрутер должен провести собеседования приблизительно у 34,7% первых кандидатов, не принимая решений, лишь фиксируя их ранги, определив лучшего.
  • Из следующих приблизительно 32% кандидатов (вплоть до 66,7% от всех) выбрать того соискателя, который окажется лучше всех предыдущих.
  • Из оставшихся 33,3% претендентов соглашаться на выбор и второго по качеству среди уже всех отсобеседованных.

При данном подходе с увеличением числа кандидатов N вероятность выбора одного из двух лучших кандидатов стремится к 57,4%, что уже заметно выше.

Можно было бы пойти дальше и расширить выбор, например, один из трех лучших кандидатов, но не будем усложнять. Во-первых, в реальной жизни HR не принимает решений о найме самостоятельно, а лишь предлагает лучших кандидатов руководителю. Во-вторых, обычно двух лучших кандидатов бывает вполне достаточно для руководителя, чтобы он принял окончательное решение, кого из них принять на работу.

Вывод

После выбора рекрутером лучшего кандидата или одного из двух лучших кандидатов из N отобранных резюме с применением вышеописанных подходов достаточно будет пригласить на финальное собеседование с руководителем именно его и любого другого среди тех, кто прошел собеседование, но минимально уступает «лучшему», если он еще будет находиться в поиске работы к тому моменту и готов будет пройти финальное собеседование с руководителем.

Благодаря такому системному подходу:

  • Шансы заполучить на работу в компанию лучшего кандидата будут чрезвычайно высоки.
  • Руководитель получит на выбор двух заведомо лучших кандидатов от HR-менеджера.
  • Затраты времени HR-менеджера на закрытие вакансии будут существенно снижены, чем при бессистемном интуитивном подборе.
  • Риски потерять лучшего кандидата будут минимальными.

Читайте также:

Расскажите коллегам:
Комментарии
Researcher, Москва
Михаил Лурье пишет:
Первое что приходит в голову, если в 1-ой или 2-ой шкатулке больше 500 юаней, то беру. Нет, беру из 3-ей, что там есть.

Это вполне рабочее интуитивное решение, которое, думаю, первым приходит в голову многим, но оно не оптимальное :)

Михаил Лурье пишет:
Хотя возможно, уровни согласия на первой и второй коробке для оптимального решения нужно брать разные, для первой большее значение.

Да :)

Инженер-конструктор, Санкт-Петербург
Сергей Средний пишет:
Михаил Лурье пишет: Первое что приходит в голову, если в 1-ой или 2-ой шкатулке больше 500 юаней, то беру. Нет, беру из 3-ей, что там есть.
Это вполне рабочее интуитивное решение, которое, думаю, первым приходит в голову многим, но оно не оптимальное :)

Если исходить из того, что уровни согласия по 1-ой и 2-ой шкатулке одинаковый, то при уровне 500 юаней матожидание будет 687 юаней.

Оптимальным при этих условиях будет уровень согласия по 1-ой и 2-ой шкатулке 577 юаней, матожидание будет 692 юаня.

Сергей Средний пишет:
Михаил Лурье пишет: Хотя возможно, уровни согласия на первой и второй коробке для оптимального решения нужно брать разные, для первой большее значение.
Да :)

Тут надо решать систему уравнений от двух неизвестных.

Посмотрю попозже.

Инженер-конструктор, Санкт-Петербург
Михаил Лурье пишет:
Сергей Средний пишет:
Михаил Лурье пишет: Хотя возможно, уровни согласия на первой и второй коробке для оптимального решения нужно брать разные, для первой большее значение.
Да :)
Тут надо решать систему уравнений от двух неизвестных. Посмотрю попозже.

Для разных уровней согласия у меня получилось, что оптимальный вариант это уровень согласия по 1-ой шкатулке 625 юаней, по 2-ой шкатулке 500 юаней.

Матожидание при этих условиях 695 юаней.

Researcher, Москва
Михаил Лурье пишет:
Для разных уровней согласия у меня получилось, что оптимальный вариант это уровень согласия по 1-ой шкатулке 625 юаней, по 2-ой шкатулке 500 юаней. Матожидание при этих условиях 695 юаней.

Это очень близко к моему решению. О котором я вскоре напишу здесь.
Примем, что вы успешно решили кейс :) Поздравляю!
Запись с вашим именем на моей Аллее Славы в профиле сделал :)

Как решали?

Инженер-конструктор, Санкт-Петербург
Сергей Средний пишет:
Как решали?

Ну для начала я уровни согласия и количество денег а шкатулке рассматривал в перемнных от 0 до 1, нормировал по шкале 0 - 1, потом развернул обратно.

В первой шкатулке уровень согласия x, во второй у.

Тогда с вероятностью 1-х в первой шкатулке будет монет больше x, в этом случае матожидание количества монет (1+x)/2.

Тогда с вероятностью 1-у во второй шкатулке будет монет больше у, в этом случае матожидание количества монет (1+y)/2, и еще надо учесть, что вероятность перехода ко второй шкатлке будет х.

Вероятность перехода к третьей шкатулке будет x*y, а матожидание денег в третьей шкатулке 0,5.

Общее матожидание полученных монет по всем 3-м шкатулкам будет:

M = (1-x)*(1+x)/2 + x*(1-y)*(1+y)/2 + x*y*0,5

M = (1+x-x^2-x*y^2+x*y)/2

Ищем оптимум 2*M (умножаем на 2 для красоты преобразований).

Берем частные производные 2*M по x и y:

по x -> 1 - 2*x - y^2 + y

по y -> -2*x*y + x

Приравниваем частные производные к 0:

1 - 2*x - y^2 + y = 0

 -2*x*y + x =0

Из второго уравнения сокращаем x (он не нулевой):

-2*y + 1 =0

y=0,5

Подставляем y=0,5 в первое уравнение:

x = (1 - y^2 + y)/2 = 0,625

То есть, уровень согласия по 1-ой шкатулке 625 юаней, по 2-ой шкатулке 500 юаней.

M = 0,695

Матожидание при этих условиях 695 юаней.

Инженер-конструктор, Санкт-Петербург

Кстати, строго говоря надо отдельно рассмотреть вариант x = 0, тогда мы не можем второе уравнение сократить на x.

Это значит, что мы всегда открываем первую шкатулку, матожидание в этом случае будет 500 юаней, это меньше 695 юаней, которые получаются в нашем решении.

Researcher, Москва
Михаил Лурье пишет:
Это значит, что мы всегда открываем первую шкатулку, матожидание в этом случае будет 500 юаней, это меньше 695 юаней, которые получаются в нашем решении.

Тогда:

Число шкатулок Уровень согласия
2 500,00
3 625,00
4 695,31
5 741,73
6 775,08
7 800,38
8 820,30
9 836,45
20 914,33
100 975,32

Вне зависимости сколько шкатулок изначально, и сколько осталось открыть -- уровни согласия одни и те же.


По-моему, мы где-то раньше по треду задавались вопросом какова будет стратегия, гарантирующая максимальный выигрыш (речь шла о выборе летчиком ВПП), если заведомо известно, что оцениваемые объекты равномерно распределены на интервале 0..1 или в данном случае от 0 до 1000. Вот это она :) И здесь НЕ нужен тестовый период.

Кстати, я подготовил вчера публикацию и отправил ее на проверку в Редакцию.
Там эта задача про три шкатулки фигурирует лишь как пример.
А тема -- Симуляция. Там я показываю как можно решать такие вероятностные задачи с помощью имитационного моделирования.

Надеюсь, скоро опубликуют :)

Инженер-конструктор, Санкт-Петербург

Небольшое уточнение к изложенному выше решению.

Если в 1-ой шкатулке число монет больше или равно x, то берем монеты из этой шкатулки, а если число монет меньше x, то переходим ко 2-ой шкатулке.

Если во 2-ой шкатулке число монет больше или равно y, то берем монеты из этой шкатулки, а если число монет меньше y, то переходим к 3-ой шкатулке.

За счет этого надо учитывать влияние дискретизации на вероятность, что не было учтено в описанном выше решении.

Вероятность того, что в 1-ой шкатулке число монет больше или равно x, будет не 1-х, а 1-х+0,001, а вероятность того, что число монет меньше x, будет не х, а х-0,001. Это за счет того, что пограничная монета будет учтена в одном событии и не учтена в другом.

Аналогично, вероятность того, что во 2-ой шкатулке число монет больше или равно y, будет не 1-y, а 1-y+0,001, а вероятность того, что число монет меньше x, будет не y, а y-0,001. 

То есть надо учитывать влияние дискретизации на вероятность d, для 1000 монет d=0,001.

Поэтому, формула матожидания будет:

M = ((1-x+d)*(1+x) + (x-d)*(1-y+d)*(1+y) + (x-d)*(y-d))/2

В приведенном выше решении d=0.

Поэтому, надо уточнить как параметр d влияет на параметры, рассмотренные в задаче.

Привожу таблицу расчета.

 

M y
d 0,001 0,4900 0,4950 0,5000 0,5050 0,5100
x 0,6100 0,6955 0,6955 0,6955 0,6955 0,6955
0,6200 0,6956 0,6956 0,6956 0,6956 0,6956
0,6250 0,6956 0,6956 0,6957 0,6956 0,6956
0,6300 0,6956 0,6956 0,6956 0,6956 0,6956
0,6350 0,6956 0,6956 0,6956 0,6956 0,6956
0,6400 0,6955 0,6955 0,6956 0,6955 0,6955

Мы видим, что оптимум для тех же значений.

Каково влияние d видно из таблицы для d=0

M y
d 0,000 0,4900 0,4950 0,5000 0,5050 0,5100
x 0,6100 0,6952 0,6952 0,6952 0,6952 0,6952
0,6200 0,6953 0,6953 0,6953 0,6953 0,6953
0,6250 0,6953 0,6953 0,6953 0,6953 0,6953
0,6300 0,6953 0,6953 0,6953 0,6953 0,6953
0,6350 0,6952 0,6953 0,6953 0,6953 0,6952
0,6400 0,6952 0,6952 0,6952 0,6952

0,6952

То есть влияние небольшое.

Но если монет будет меньше, то это влияние надо учитывать.

Инженер-конструктор, Санкт-Петербург

Еще одно дополнение к учету влияния дискретизации.

В расчете матожидания для 3-ей шкатулки нужно учесть, что нужно использовать не медианную точку отрезка 0 ... 1, а медианную точку отрезка d ... 1, поскольку диапазон числа монет не 0 ... 1000, а 1 ... 1000.

С учетом этого формула матожидания:

M = ((1-x+d)*(1+x) + (x-d)*(1-y+d)*(1+y) + (x-d)*(y-d)*(1+d))/2

Привожу таблицу расчета.

M y
d 0,001 0,4900 0,4950 0,5000 0,5050 0,5100
x 0,6100 0,6956 0,6957 0,6957 0,6957 0,6957
0,6200 0,6958 0,6958 0,6958 0,6958 0,6958
0,6250 0,6958 0,6958 0,6958 0,6958 0,6958
0,6300 0,6958 0,6958 0,6958 0,6958 0,6958
0,6350 0,6957 0,6958 0,6958 0,6958 0,6957
0,6400 0,6957 0,6957 0,6957 0,6957 0,6957

Таким образом, изменения минимальные.

Замечу, что при решении таких задач "математическая" часть может делаться с учетом некоторых упрощений, а окончательная "расчетная" часть должна учитывать все моменты.

Инженер-конструктор, Санкт-Петербург

Приведу окончательную таблицу по условиям задачи с указанием количества монет.

Различие в значении матожидания в 3-м знаке после запятой числа монет.

 

Mатожидание числа монет 2-ая шкатулка, число монет ≥
498 499 500 501 502
1-ая шкатулка, число монет ≥ 623 695,805 695,807 695,808 695,808 695,808
624 695,808 695,809 695,810 695,811 695,810
625 695,809 695,811 695,812 695,812 695,812
626 695,810 695,811 695,812 695,813 695,812
627 695,809 695,811 695,812 695,812 695,812
628 695,808 695,809 695,810 695,811 695,810
Оставлять комментарии могут только зарегистрированные пользователи
Статью прочитали
Обсуждение статей
Все комментарии
Дискуссии
3
Евгений Равич
Хороший пример конспирологии. Есть реальные примеры? Просьба заодно уточнить, что такое "не понр...
Все дискуссии
HR-новости
53% компаний возьмут студентов и подростков на летнюю подработку

За год интерес к такой практике вырос на 8%.

Россиян ждет шестидневная рабочая неделя

Шестидневной эта неделя оказалась за счет переноса выходного дня на понедельник – 29 апреля – для того, чтобы отдыхать россияне могли без перерыва.

Половина россиян будут работать в майские праздники

Женщины чаще мужчин сообщали, что не собираются работать в государственные выходные.

Cпрос на специалистов в сфере производства вырос почти в 2 раза

Средние предлагаемые зарплаты в производстве выросли на 16% в I квартале по сравнению с аналогичным периодом в прошлом году.