За последний год нейросети совершили мощный прорыв и сравнялись с профессионалами в нескольких важных областях интеллектуальной деятельности. Цель этой статьи – показать в каких сферах профессиональных деятельностей нейросети опередили, а в чем ИИ не дано превзойти человека.
Но вначале рассмотрим не профессиональную интеллектуальную деятельность, а игровую. Игры всегда были полигоном для проверки интеллекта, когда-то его измеряли умением играть в шахматы и го.
Кто, кого, когда
- Май 1997 года. Компьютер IBM Deep Blue обыграл действующего чемпиона мира Гарри Каспарова. Это стало настоящим шоком для шахматного сообщества. Хотя Deep Blue и не был полноценным искусственным интеллектом – он всего лишь перебирал огромное количество возможных ходов, используя человеческие наработки, но это было начало новой эры – машинный интеллект начал брать верх.
- 2016 год. Настоящий прорыв произошел, когда программа AlphaGo победила одного из сильнейших игроков в го – Ли Седоля. Причем с разгромным счетом 4:1. Хотя Ли был уверен, что машина, лишенная интуиции, не способна обыграть в древнейшей стратегической игре с числом возможных позиций, превышающим количество атомов во Вселенной. Просто перебором тут не обойтись, нужно именно думать. AlphaGo обучалась на партиях профессионалов и показала, что способна на нестандартные ходы, которые удивили даже мастеров.
- Январь 2019 года. ИИ снова заявил о себе – на этот раз в стратегии StarCraft II. Нейросеть AlphaStar от DeepMind (Google) победила польского профессионала Гжегожа MaNa Коминча со счетом 5:1. Эта игра требует не только стратегического мышления, но и быстрой реакции, умения управлять множеством юнитов и принимать решения при нехватке информации. Один матч человек все же выиграл, но в целом – снова машина оказалась сильнее.
- Апрель 2019 года. Система OpenAI Five победила чемпионов мира – команду OG – в Dota 2. Интересно, что ее не обучали правилам игры напрямую. Она училась самостоятельно, играя с самой собой в течение 10 месяцев – суммарно 45 тыс. часов. Результат оказался впечатляющим – машина не просто поняла механику игры, но и научилась взаимодействовать в команде.
- Лето 2019 года. ИИ добрался и до покера – игры, где ключевыми навыками считаются блеф и чтение эмоций. Долгое время считалось, что это – сугубо человеческая территория. Однако разработки DeepStack и Libratus доказали обратное. Libratus обыграл четырех профессионалов и забрал $1,7 млн призовых. А чуть позже ИИ Pluribus, разработанный Facebook (принадлежит Meta, которая признана экстремистской и запрещена в РФ) и Carnegie Mellon, научился блефовать и играть сразу против пятерых человек одновременно.
От зубрилы к универсальному разуму
В 2023 году появилась ChatGPT-4 – продвинутая модель, способная без проблем решать кейсы MBA. Ученые из университета Арканзаса (США) провели исследование, в ходе которого сравнивали креативное мышление людей и модель ChatGPT-4 – OpenAI рекламировала ее как «более креативную» по сравнению с предыдущими версиями. Казалось, что ИИ вплотную приблизился к человеческому интеллекту. Но настоящий переворот произошел позже – с появлением модели o1-preview в сентябре 2024 года, а затем модели OpenAI o3, которая впервые в истории прошла тест на обобщающее мышление, сравнимое с человеческим.
Дело в том, что модели, вроде GPT-4, обучаются на миллионах текстов. Они отлично справляются с типичными задачами – написать статью, ответить на вопрос, сгенерировать код. Но когда речь заходила о нестандартных ситуациях, они «спотыкались» – ведь все, что они делали, это находили шаблоны в известных данных. Можно сказать, это были отличники, заучившие все по учебнику, но неспособные решить задачу с подвохом.
Чтобы по-настоящему измерить интеллект ИИ, в научном сообществе разработали тест ARC-AGI – набор задач, где модель должна сама вывести закономерности, изучив всего три обучающих примера. Здесь нельзя просто запомнить ответ – нужно понять суть.
Для сравнения, GPT-4 набирал менее 30%. А модель OpenAI o3, представленная в декабре 2024 года, выдала результат в 85%, обогнав не только все другие ИИ, но и большую часть людей (85% было полгода назад, сейчас уже больше).
Если GPT-4 был похож на энциклопедию, то o3 – это уже вполне себе состоявшийся ученый. Вместо тупого перебора, система формирует гипотезы, проверяет их на примерах и уточняет. Это уже не просто «натасканный» интеллект, а адаптивное мышление. Он может то, что есть у нас – способность быстро схватывать суть, учиться на нескольких примерах и применять знания в новой ситуации.
Это стало возможным благодаря принципиально новой архитектуре, которая позволила системе обучаться прямо во время теста. Такой подход называется Test-Time Training (TTT) – обучение на лету. Это ближе к тому, как учится человек – анализируя ситуацию в моменте, а не опираясь только на прошлый опыт.
Раньше ИИ был «зубрилой». То есть нужно было показать ему тысячи примеров. Теперь – достаточно пары. o3 может обобщать, адаптироваться, искать причинно-следственные связи и даже формулировать простые объяснения сложным вещам. Это универсальный разум, способный решать задачи, которые раньше были под силу только человеку.
Особенно впечатляет то, как o3 справляется с противоречивыми или неполными данными. Он не «зависает», а строит сложные, нюансированные модели реальности – как если бы у него была интуиция. Так работает наш мозг, когда мы решаем головоломку, не имея всех подсказок. Особенно интересно рассмотреть этот процесс на конкретных примерах решения логических задачек или вопросов игры «Что? Где? Когда?».
С появлением o3 ИИ можно применять там, где раньше требовалась человеческая гибкость ума – в научных исследованиях, медицинской диагностике, разработке инноваций. Он не просто отвечает, а генерирует идеи, видит связи, решает задачи, на которые нет готовых ответов. Более того, ИИ проводит полноценное глубокое исследование на очень серьезном научном уровне.
Так, совсем недавно – мае 2025 года, я написал себе и своим знакомым не только научные статьи, но и кандидатские диссертации по 150 страниц и реальными ссылками в тексте на все 200 с лишним научных источников. На написание диссертации у ИИ уходило около часа (научную статью пишет вообще меньше чем за 10 минут).
Это раньше ИИ был глупым и мог генерировать полный бред, выдумывая несуществующие факт и ссылки на несуществующие источники. Сейчас совсем другое – получается очень осмысленный текст, обладающий настоящей научной новизной и практической значимостью. А самое главное – детектор ИИ, который есть в программе «Антиплагиат.Вуз», не показывает что текст сгенерирован. Оригинальность больше 95% и при этом нет отметки о генерации текста. Таким образом, происходит обесценивание научных званий, поскольку написать кандидатскую и даже докторскую диссертацию – вообще не составляет никакого труда.
Американские и китайские конкуренты OpenAI тоже разрабатывают очень достойные модели. Российские нейросети пока отстают.
Каких специалистов уже заменяют на ИИ
Понятно, что ИИ вытесняет рутинные операции, автоматизируя их. Так шведская финтех-компания Klarna в 2024 году остановила найм новых сотрудников, поскольку, по мнению гендиректора компании, ИИ уже может выполнять всю работу, которую выполняли люди. Как и в других технических компаниях, здесь есть естественная убыль работников. Люди в среднем остаются в компании на 5 лет, и каждый год уходят 20% сотрудников. Не нанимая новых людей, компания сокращается. Было 4 500 сотрудников, а стало на тысячу меньше.
Сокращение происходило за счет команды маркетинга и команды поддержки клиентов. Их работу передали ИИ-агентам. Использование нейросетей позволило Klarna сократить затраты на зарплаты, сэкономив около 10 млн долларов. Но часть прибыли от этого пошла на повышение зарплат действующих сотрудников. Сейчас компания перестраивает бизнес-процессы, чтобы сделать ИИ более эффективным. Через год планируется сократить число сотрудников до 2 500 человек.
То же самое касается:
- Юристов, чья работа заключается в анализе тысяч страниц договоров, судебных дел и юридических документов для поиска прецедентов или несоответствий. Они заменяются одним ИИ, способный за минуты выполнять задачи, на которые у человека уходят часы, а именно – проверять типовые договоры, анализировать нормативно-правовые акты, составлять стандартные юридических бумаг и готовить шаблонные иски.
- Бухгалтеров, которые занимаются обработкой счетов, сверкой данных и подготовка стандартной отчетности.
- Рекрутеров, которые проводят первичный отбор резюме по ключевым параметрам.
- Переводчиков технической и деловой документации.
- Журналистов и копирайтеров, занимающихся написанием новостных заметок на основе данных: биржевых сводок или спортивных результатов.
- Рекламщиков, создающих простые рекламные тексты и SEO-статьи.
- Программистов, но не тех, кто разрабатывает сложную архитектуру ПО, а тех, кто пишет простые скрипты и исправляет ошибки в коде.
Каким специалистам приготовиться на выход
Выше речь идет об относительно рутинной деятельности. Но ИИ может заменить и высокоинтеллектуальных специалистов. Так что господа консультанты, траблшутеры (решатели неразрешимых проблем) и прочие тризовцы – до свидания!
Сейчас продвинутые нейросети решают все кейсы, которые Сергей Фаер описал в своей книге «Траблшутинг. Как решать нерешаемые задачи, посмотрев на проблему с другой стороны». Причем нейросети, помимо решений, которые предлагает Сергей Фаер, дают и более оптимальные альтернативные решения. И эти решения находятся не за несколько часов или дней, как у команды траблшутеров, а всего за несколько секунд. У меня были ситуации, когда решения подсказывал мой личный ИИ-агент в Telegram.
ИИ-агенты, обученные на миллионах патентов, могут запросто систематизировать информацию, анализировать базы данных, предлагать решения на основе заложенных алгоритмов и принципов, моделировать различные сценарии и предлагать нестандартные технические решения, основанные на принципах ТРИЗ (теории решения изобретательских задач). Так что можно констатировать полную девальвацию профессионалов из этой сферы интеллектуальной деятельности, как и специалистов по ТРИЗ. Это как до появления калькуляторов ценилось умение быстро считать в уме, а теперь в этом нет никакого смысла.
Что касается бизнес-консультантов и финансовых аналитиков, то значительная часть работы этих специалистов – это сбор и анализ рыночных данных, финансовой отчетности, выявление трендов и построение прогнозов. ИИ превосходно справляется с этими задачами, обрабатывая огромные массивы информации и находя неочевидные корреляции. В консультациях, связанных с ситуациями, где может возникнуть риск, ИИ-агенты также отлично справляются.
Что останется за человеком
То, что не свойственно нейросетям – уникальные человеческие качества, такие как критическое мышление в условиях неопределенности, способность к мотивационному анализу, стратегическое видение и подлинная креативность.
А самое ценное качество мышления – это проницательность (умение вникать в самую суть в любых ситуациях). Это мышление высшего качества. ИИ уже достиг уровня мышления Сократа – мышления первого сорта. Человек с мышлением высшего качества всегда будет находиться на более интеллектуальном уровне. Но это тема для отдельной статьи.
Читайте также:
Не вижу в этом ни одного минуса и массу плюсов.
Удалось умной системе найти новое знание - или Вам нужно больше времени?
Когда-то давным-давно, когда ИИ широкие массые не обсуждали, я втретила интересное мнение, что машина может заменить человека практичнески во всех сферах деятельности, кроме оценки рисков и коммуникаций. Сейчас машина прекрасно решает эти задачи. Если в оценки рисков никто не совершенен, то так ли мы довольным коммуникациями с ИИ? Где ценность таких навыков, как эмпатия, эмоциональный интеллект (или по простому, понашему, способность сопереживать собеседнику, его поддержка, выраженная искренними словами и эмоциями)?
И все-таки, несмотря на посыл, что человек скоро перестанет работать, так как его заменит ИИ, истина и будщее мне представляется исключительно в кооперации хомо сапиенса и созданного им ИИ!
Назвать это преувеличением окажется лестью. У Вас есть материалы, доказывающие, что это так?
Современное состояние ИИ крайне далеко от того, чтобы хотя бы хорошо, а не прекрасно решать вопросы "риск-менеджмента в целом". Хотя даже сама такая постановка задачи с неизбежностью столкнется с вопросом: "Что такое риск?", на который и среди специалистов нет однозначного ответа.
Здесь вообще под вопросом ценность эмпатии при коммуникации с ИИ. Как минимум, "сопереживание" и "искренность" инженерно невозможно реализовать в рамках машинного обучения на текущей стадии его развития. Кроме того, промпт-инжиниринг предполагает исполнение конкретных задач оператора, как правило - прикладного назначения.
Если задача стоит "сымитировать" эмоции, такие решения давно существуют на рынке - даже раньше появления ChatGPT. Одним из пионеров технологии был проект Replica AI, созданный для "общения" с умершими родственниками на основании оцифровки артефактов их жизни. С развитием проекта фокус сместился на систему-компаньона, но это не изменило суть технологии - общение имитируется системой и не является "подлинным" в человеческом понимании.
ИИ прекрасно приспособлен к рутинным задачам, в которых человек может либо быстро уставать, либо в силу биологических особенностей не справляться (например, сравнительный анализ библиотек текстов). Перекладывание таких задач с человека на ИИ освобождает время для более креативных задач, и в этом состоит основная выгода от использования ИИ. В любое время он будет просто удобным помощником, но никогда - полным заменителем человека. Однако, во многих областях это решает "проблему Форда": дает рабочие руки без "всего рабочего впридачу".
Интересно, как должна была бы быть устроена такая система. Что у неё на входе?
Я лично знаком с разработчиком продукта, реализованного по технологии ИИ, а ранее (еще до GPT) были версии с применением бота в Телеграм, есть видео.
С моей точки зрения, ИИ-бот хорошо выполняет рутинные операции по написанию различной документации (регламенты, инструкции, политики), но никакую систему количественной оценки "с нуля" за эксперта он, конечно, не создаст.
Мы же говорим не о текстах и правильном порядке слов, которому можно научить.
Есть (и давно были) системы AI принципиально другой сложности. Есть проекты и разработки с реальными результатами нейрочипов и библиотек для их программирования.
Но оценка рисков, например, в большом и сложном проекте - нетривиальная задача даже для человека с опытом, профессиональными знаниями и полностью вовлеченного в эту работу. Тем более - дальнейшая работа по предотвращению и минимизации негативных последствий в будущем времени.
Пока не понимаю, что имелось в виду в предыдущем комментарии Елены Курочкиной об успехах AI в управлении рисками.
Эрик Бёрн не доказал свою теорию трех эго-состояний (Родитель, Взрослый, Ребенок) в строгом научном смысле, которого вы требуете (эмпирические данные, воспроизводимые эксперименты, нейробиологическое подтверждение). Ни он сам, ни его последователи не представили доказательств, которые соответствовали бы современным стандартам доказательной медицины или экспериментальной психологии.
Доказательная база существует преимущественно для эффективности терапии, использующей ТА (хотя и не самая обширная по сравнению с КПТ), и для исследования некоторых связанных конструктов (сценарии, трансакции), но не для фундаментальной концепции трех эго-состояний как объективных психических реалий.
Теория эго-состояний — это философско-клиническая конструкция, которая помогла многим практикам и клиентам, но она не прошла проверку на соответствие жестким критериям научного доказательства, которые вы запрашиваете. Ее ценность лежит в сфере практического применения и описательной силы, а не в эмпирически подтвержденной нейропсихологической реальности.
Доказательство теории эго-состояний Эрика Бёрна в строгом научном смысле — задача чрезвычайно сложная, если вообще возможная в ее оригинальной формулировке. Вот основные пути и методы, которые потребовались бы, и почему они проблематичны:
o Что нужно: Найти уникальные, устойчивые и воспроизводимые паттерны активности мозга (или нейронные сети), которые:
– Четко соответствуют только состоянию "Родитель", только состоянию "Взрослый" и только состоянию "Ребенок".
– Активируются специфически при переключении между этими состояниями (по данным самоотчета или наблюдения).
– Отличаются от активности, связанной с другими известными психическими процессами (воспоминания, эмоции, когнитивный контроль, теория сознания и т.д.).
o Методы:
– фМРТ (функциональная магнитно-резонансная томография): Измеряет изменения кровотока, связанные с активностью мозга. Нужны сложные эксперименты, где испытуемые сознательно переключаются между эго-состояниями (или это переключение провоцируется стимулами), и сканирование фиксирует паттерны.
– ЭЭГ/МЭГ (Электроэнцефалография/Магнитоэнцефалография): Измеряют электрическую/магнитную активность мозга с высоким временным разрешением. Можно искать специфические паттерны волн или когерентности при активации разных эго-состояний.
– ПЭТ (Позитронно-эмиссионная томография): Может измерять метаболизм глюкозы или рецепторную активность в разных состояниях.
o Проблемы:
– Субъективность состояния: Как объективно определить, что человек именно сейчас в состоянии "Внутренний Ребенок", а не просто испытывает детскую эмоцию или вспоминает детство? Самоотчет ненадежен.
– Дискретность vs. Континуум: Мозг редко работает дискретными "блоками". Активность, связанная с воспоминаниями (возможно, часть "Родителя" или "Ребенка"), эмоциями ("Ребенок"), рациональным анализом ("Взрослый"), постоянно смешивается. Выделить чистые состояния крайне сложно.
– Индивидуальные различия: Паттерны могут сильно различаться у разных людей.
– Конкурирующие объяснения: Любую наблюдаемую активность можно объяснить через более устоявшиеся нейрокогнитивные конструкции (рабочая память, системы эмоций, автобиографическая память, исполнительные функции).
o Что нужно: Создать психометрически безупречный инструмент (опросник, структурированное интервью, поведенческая задача), который:
– Надежно (consistently) измеряет проявления каждого эго-состояния как отдельные, но связанные конструкты.
– Имеет высокую конвергентную валидность (сильно коррелирует с другими методами измерения того же эго-состояния).
– Имеет высокую дискриминантную валидность (слабо коррелирует с измерениями других эго-состояний и с измерениями похожих, но иных психологических конструктов, например, черт личности Большой Пятерки, стилей привязанности, когнитивных схем).
– Обладает предсказательной валидностью (способен предсказывать реальное поведение в специфических ситуациях, которые, по теории, должны запускать определенные эго-состояния).
o Методы: Разработка и статистическая валидация опросников, создание стандартизированных поведенческих тестов или кодируемых наблюдений за взаимодействием.
o Проблемы:
– Существующие опросники (Egogram и др.) критикуются за слабую психометрику и смешение с другими конструктами (например, "Ребенок" может измерять просто эмоциональность или импульсивность).
– Очень трудно доказать, что измеряется именно глубинная структура личности (эго-состояние), а не просто стиль поведения или ситуативная реакция.
– Высокая дискриминантная валидность — ключевая проблема. Сложно показать, что "Родитель" — это не просто высокий Добросовестность + низкая Открытость опыту (из Большой Пятерки) плюс интериоризованные нормы.
o Что нужно: Разработать эксперименты, где:
– Активация конкретного эго-состояния (например, через приминг, внушение в гипнозе, специфические триггеры) приводит к предсказуемым изменениям в поведении, эмоциях, когнитивных процессах, отличным от изменений при активации других эго-состояний или нейтральном состоянии.
– Эти изменения соответствуют теоретическим предсказаниям (напр., активация "Критического Родителя" повышает осуждение других, активация "Адаптивного Ребенка" повышает конформность, активация "Взрослого" улучшает решение логических задач и снижает эмоциональную реактивность).
o Методы: Лабораторные эксперименты с рандомизацией, контрольными группами, двойным слепым методом (где возможно), строгим операционализированием переменных (как активировали состояние, как измерили результат).
o Проблемы:
– Операционализация: Как надежно и специфично активировать только одно эго-состояние? Методы (воспоминания, ролевые игры, специфические стимулы) могут активировать множество процессов одновременно.
– Контроль переменных: Трудно изолировать влияние активируемой "части" от общих факторов (настроения, усталости, контекста эксперимента).
– Специфичность предсказаний: Теория Бёрна дает общие описания, но не всегда четкие, фальсифицируемые предсказания для лабораторных условий. Альтернативные теории (например, когнитивные модели) могут предсказывать те же результаты.
o Что нужно: Показать, что индивидуальный профиль эго-состояний (измеренный надежно), стабилен во времени (но может меняться в терапии) и предсказывает долгосрочные жизненные траектории (успешность отношений, карьеры, психическое здоровье) лучше, чем существующие, более устоявшиеся модели личности (например, Большая Пятерка) или диагностические категории.
o Методы: Многолетние исследования больших когорт с повторными измерениями эго-состояний и ключевых жизненных показателей.
o Проблемы: Огромные затраты времени и ресурсов. Сложность надежного измерения эго-состояний на протяжении лет. Доказать уникальный вклад теории поверх других мощных предикторов очень трудно.
Главные методологические препятствия:
Вывод о возможности доказательства:
o Например: Показать, что терапевтические техники, явно использующие язык и концепцию эго-состояний (например, диалог между частями), приводят к уникальным и воспроизводимым положительным изменениям у клиентов по сравнению с другими методами, и что эти изменения опосредованы специфическими процессами (например, изменением баланса между самоотчетами о разных "частях"), которые нельзя объяснить общими факторами терапии или другими механизмами.
Таким образом, строгое научное доказательство теории в ее изначальном виде представляется методологически почти невозможным. Научная работа скорее может быть направлена на исследование отдельных аспектов, связанных с теорией (межличностные трансакции, жизненные сценарии), или на валидацию терапевтической эффективности ТА как подхода, использующего эту модель, а не на подтверждение существования эго-состояний как фундаментальных нейропсихических структур.
Нет.
Спасибо.
Ответ понятен и - честно говоря - вполне ожидаем, но и его нужно обосновать.
Как именно он был получен? Какая-то система в чьих-то руках не нашла таких доказательств в работах Бёрна? А потом не нашла и в работах его последователей?
Интересно, что побуждает тех, кто до сих пор увлечённо рассказывает нам о трех состояниях, ссылаться на недоказанную автором теорию.
А всем прочим нужно внимательно читать статьи Бёрна и понимать особенности его работы и детали научной полемики в те времена, чтобы сделать собственные выводы о том, зачем эта теория вообще ему понадобилась.