Эволюция интеллекта: от древних рыб к мозгу млекопитающих и принципам ИИ

Это четвертая часть обзора книги Макса Беннета, посвященной истории интеллекта. В предыдущих главах мы проследили, как эволюция привела от четвероногих к млекопитающим, наделив их усовершенствованным мозгом с неокортексом — универсальной шестислойной «микросхемой». Млекопитающие, подобно современным нейросетям, способны к воображению, генерации нового, обучению на ошибках и обладают эпизодической памятью.

Выход на сушу и борьба за выживание

Около 400 миллионов лет назад, в эпоху господства хищных рыб в океанах, другим видам пришлось искать экологические ниши для выживания. Одни обзавелись панцирями, другие уменьшились в размерах, а третьи, подобно головоногим моллюскам, сделали ставку на интеллект. Смелая стратегия заключалась в том, чтобы покинуть водную среду и освоить сушу, где бурно развивалась растительность. Первопроходцами стали членистоногие, давшие начало паукообразным и насекомым. Богатая флора снизила уровень углекислого газа, что привело к похолоданию и девонскому вымиранию, когда океаны замерзли. Нашим предкам удалось найти свою нишу и выйти на сушу еще до катастрофы. В условиях холода они отходили всё дальше от воды, постепенно обретая конечности, подобно саламандрам. Одна эволюционная линия осталась близкой к воде, став земноводными, а другая, амниоты, ушла вглубь суши в поисках растений и насекомых, научившись откладывать кожистые яйца и выживать без воды.

Теплокровность и господство рептилий

Жизнь на суше столкнула животных с проблемой перепадов температур. Амниоты были хладнокровными, и их стратегия заключалась в поиске теплых мест. Так появились рептилии. Однако ночные заморозки делали их уязвимыми и малоподвижными. Этим воспользовались терапсиды — другая ветвь амниот, развившая способность к терморегуляции. Будучи теплокровными, они могли охотиться ночью, что сделало их доминирующими хищниками пермского периода, около 300 миллионов лет назад. Некоторые терапсиды достигали размеров тигра и напоминали крупных пушистых ящериц.

Около 250 миллионов лет назад произошло пермско-триасовое вымирание — самое масштабное в истории планеты, уничтожившее до 96% морских и 70% наземных видов. Причины до конца не ясны (вулканы, астероид, метаногенные микробы), но последствия очевидны: крупные терапсиды вымерли, не выдержав новых условий. Выжили более экономные рептилии. Терапсиды не исчезли полностью, но были представлены лишь мелкими животными, такими как цинодонты, скрывавшиеся в пещерах.

Абада Лоден

Рождение млекопитающих и эволюция мозга

Рептилии, особенно динозавры, стали властителями суши. Чтобы выжить рядом с ними, нашим предкам пришлось радикально уменьшиться в размерах (до ~10 см), прятаться днем в пещерах и выходить ночью, когда хищники были менее активны. Так появились первые млекопитающие. В эпоху динозавров у них развилась ключевая инновация — способность не только к пробному обучению, но и к воображению. Возможно, этому способствовало улучшенное зрение, дававшее больше данных, или теплокровность, ускорившая нейронные процессы. Мозг млекопитающих стал работать быстрее.

От ранних хордовых до терапсидов мозг эволюционировал медленно. Мозг ящерицы мало отличался от мозга рыбы. Но у млекопитающих появилась новая кора — неокортекс. Хотя изначально он был мал, именно он стал основой человеческого разума, составляя сейчас около 70% объема нашего мозга. Его толщина — 2-4 мм, а большая площадь, образующая извилины, позволяет выполнять множество функций одновременно.

Устройство неокортекса: универсальная микросхема

Вернон Маунткасл, пионер в изучении коры, обнаружил, что её основная структурная единица — вертикальный столбец нейронов толщиной около 500 микрон. Он установил структурную однородность неокортекса: вся кора состоит из практически идентичных столбцов. Разница между зонами лишь в том, откуда они получают информацию и куда её отправляют. Это означает принципиальную взаимозаменяемость корковых участков, что подтверждается восстановлением функций после инсульта, когда, например, слепые пациенты вновь начинают видеть.

Под микроскопом видно, что столбец состоит из шести взаимосвязанных слоев нейронов (у ранних позвоночных их было три). Слой 5 соединяется с базальными ганглиями, таламусом и двигательными областями. Слой 4 получает импульсы от таламуса, а слой 6 отправляет их обратно.

Шестислойное строение коры головного мозга

Восприятие как генеративная модель

Человеческое восприятие демонстрирует ключевые принципы работы неокортекса: 1) разум дополняет недостающую информацию, 2) мы можем рассматривать только одно объяснение за раз, 3) увидев что-то однажды, трудно перестать это видеть. Еще в XIX веке Герман Гельмгольц предположил, что мы воспринимаем не реальность напрямую, а её виртуальную модель, построенную мозгом на основе сенсорных данных.

Основываясь на этой идее, Джеффри Хинтон и его команда (включая Питера Даяна) создали «машину Гельмгольца» — систему ИИ, работающую по аналогичному принципу. В отличие от обычных нейросетей, она имеет обратные связи от выходов к входам. В режиме распознавания она работает как обычная сеть. Но в генеративном режиме выходные нейроны активируют нейроны нижних слоев, создавая новое изображение. Сеть училась сама, без явных указаний, и отлично справлялась как с распознаванием нечетких образов, так и с генерацией новых, реалистичных изображений. По сути, это была одна из ранних генеративных моделей.

Коллаж с лицами, созданный ИИ

Добавим, что в 2024 году Хинтон получил Нобелевскую премию по физике за исследования в области машинного обучения. Множество данных свидетельствует, что неокортекс работает схожим образом, демонстрируя симметрию между восприятием и воображением.

Эта модель объясняет, почему люди, потерявшие зрение, часто видят галлюцинации — без сенсорного ввода генеративная модель больше ничем не сдерживается. Некоторые ученые называют нормальное восприятие «контролируемой галлюцинацией». Генеративные процессы также могут объяснять сны — возможно, они стабилизируют дневной поток информации. Поскольку воображение и узнавание используют одни и те же нейроны, они не могут происходить одновременно. Это открывает перспективы для «чтения» снов.

Неокортекс, по-видимому, постоянно находится в режиме прогнозирования сенсорной информации. Если рефлексы предсказывают реакции тела, а базальные ганглии — награду, то неокортекс предсказывает мир через его реконструкцию. Вероятно, его изначальной функцией было именно моделирование, а не распознавание.

Три ключевые способности млекопитающих

Модельный разум млекопитающих дал им три новые способности для выживания:

1. Планирование через воображение. Они научились использовать воображение для мысленного проигрывания последствий действий. Эксперименты 1930-х годов показали, что крысы «задумываются» на развилках лабиринта. Позже, с помощью электродов, ученые буквально видели, как мыши представляют будущий путь. Имея модель среды, предки могли мысленно исследовать её для поиска оптимального маршрута.

2. Обучение на ошибках через контрафактивное мышление. Эта способность позволяет устанавливать причинно-следственные связи. Мы представляем альтернативное прошлое («а что, если бы...») и делаем выводы о причинах событий. Это решает проблему распределения заслуг (credit assignment) — понимания, какие именно действия привели к успеху или неудаче.

3. Эпизодическая память как моделирование. Интересно, что при вспоминании прошлого или представлении будущего активируются одни и те же нейроны. Мы не столько «помним», сколько «воображаем» прошлое. Это объясняет ненадежность свидетельских показаний. Гиппокамп играет ключевую роль: он отвечает за быстрое запоминание новых событий, но не за их детальное воспроизведение. Неокортекс же может строить детальные модели, но медленно запоминает новое. Их взаимодействие решает проблему «катастрофического забывания»: гиппокамп помогает неокортексу интегрировать новые воспоминания, не стирая старые.

Модельное планирование и его ограничения

Процесс моделирования прошлого и будущего схож с модельным обучением с подкреплением в ИИ. Такие системы предварительно проигрывают возможные сценарии перед принятием решений. Это дает гибкость, но требует решения сложных проблем: построения точной модели и выбора, что именно моделировать (проблема поиска). Поэтому многие успешные алгоритмы ИИ (как AlphaZero в начале) работают без модели, действуя быстро, но менее гибко.

Разработчики AlphaZero столкнулись с проблемой поиска в Го: возможных ходов было слишком много. Система научилась выбирать лишь несколько наиболее перспективных направлений для анализа. Хотя AlphaZero превзошла человека в Го, её успех ограничен. Ключевое отличие мозга млекопитающих — способность динамически менять стратегию планирования в зависимости от ситуации, тогда как AlphaZero всегда ищет одинаково.

Лобная кора: дирижер намерений

Неокортекс млекопитающих делится на две основные части. Задняя (сенсорная) кора строит модели внешнего мира. Лобная кора, в свою очередь, управляет этими моделями — решает, когда и что представлять. Она состоит из моторной коры, зернистой (gPFC) и незернистой префронтальной коры (aPFC). Интересно, что в aPFC, древнейшей области, отсутствуют нейроны 4-го слоя.

Основные области префронтальной коры

Лобная кора моделирует не внешний мир, а внутренние состояния: желания, намерения, цели. Её входы связаны с гиппокампом, миндалиной и гипоталамусом. Крысы с повреждением этой области перестают «задумываться» на развилках, действуют импульсивно и имеют проблемы с памятью. Люди после инсульта в лобной коре часто испытывают апатию и потерю мотивации.

Когда решение неочевидно и прогнозы из разных областей конфликтуют, aPFC инициирует процесс моделирования. Она может приостановить действие (как мышь, замершая перед выбором), выбрать несколько вариантов для мысленного проигрывания (в сотрудничестве с сенсорной корой), а затем, с помощью базальных ганглиев, которые оценивают «плюсы» и «минусы», принять решение, выбирая вариант, вызывающий наибольшее «возбуждение».

От сознательных решений к привычкам

Если выбор повторяется многократно (около 500 раз), базальные ганглии обучаются и начинают запускать действие автоматически, минуя кору. Формируется привычка. Мы не задумываемся, как ходить или говорить. Эта двойственность между медленным, осознанным принятием решений и быстрым, автоматическим поведением описана Даниэлем Канеманом в книге «Думай медленно... решай быстро».

В психологии это различие известно как целенаправленное и привычное поведение. Млекопитающие — первые животные, у которых появились истинные намерения. Базальные ганглии просто закрепляют поведение, ведущее к награде. А префронтальная кора ставит цель (например, «добраться до воды») и планирует действия для её достижения, невзирая на препятствия. Именно поэтому в aPFC не нужен 4-й слой, получающий прямые сенсорные сигналы, — её работа больше связана с внутренними целями, а не с внешней реальностью.

Иерархия целей и контроль движений

Сначала базальные ганглии «учат» кору, но по мере развития роль меняется, и кора начинает направлять ганглии, что подтверждается изменениями в aPFC в процессе взросления.

Функции лобной коры — планирование, внимание, рабочая память — могут быть разными проявлениями одного процесса: убеждения базальных ганглий с помощью моделей. Это позволяет животному делать более разумный выбор и переключаться между осознанными действиями и привычками. Ящерица, лишенная такой системы, обречена на бесконечные пробы и ошибки в простом лабиринте.

Моторная кора, вопреки названию, изначально участвует не в прямом управлении мышцами, а в планировании движений. Согласно идее Карла Фристона, она выдает прогнозы о движениях на основе сигналов от сенсорных зон. Эти прогнозы затем реализуются на уровне спинного мозга. Моторная кора активна как при реальном, так и при воображаемом движении. Это позволяло нашим предкам осваивать сложные двигательные навыки, например, лазанье по деревьям. Для уже освоенных действий включаются базальные ганглии (привычка).

Согласованная работа мозга

Разные части мозга ставят свои цели, образуя иерархию. aPFC генерирует высокоуровневые намерения («пить»). Они передаются в премоторную кору, которая разбивает их на подзадачи, а те, в свою очередь, — в моторную кору, планирующую конкретные движения конечностей. Все эти уровни связаны с базальными ганглиями, обеспечивающими возможность автоматизации. Повреждение любого звена этой цепи приводит к специфическим нарушениям: апатии при повреждении aPFC, двигательным расстройствам при повреждении моторной коры, потере привычек (как вредных, так и полезных) при повреждении базальных ганглий.

[Мои] Книги Рецензии на книги Эволюция Млекопитающие Мозговой интеллект Искусственный интеллект Нейронные сети Наука Наука Популярная документальная литература Длинные статьи 0

Больше интересных статей здесь: Новости науки и техники.

Источник статьи: Краткая история интеллекта (4).