Краткая история интеллекта (4)

Продолжаем знакомиться с книгами Макса Беннета.
Предыдущие части были опубликованы в этой серии.

Л.Л. Краткое введение: Теория эволюции показала миру сначала четвероногих, а затем и млекопитающих, с усовершенствованным мозгом и неокортексом, построенными на основе универсальной шестислойной «микросхемы». Млексы полагаются на воображение и могут генерировать новые вещи, как и популярные сегодня нейронные сети. Они также учатся на своих ошибках и обладают эпизодической памятью.

400 миллионов лет назад хищные рыбы доминировали в океанах, в то время как другие животные прятались в экологических нишах. У кого-то получился твердый панцирь. Некоторые люди уменьшились в размерах. Некоторые даже поумнели (именно тогда на сцену вышли головоногие моллюски). Агрессивная стратегия состоит в том, чтобы уйти от рыбы и уйти на сушу, к быстро развивающимся растениям, которые уже дали листья и семена. Первое — членистоногие. Там они эволюционировали в паукообразных и насекомых. Богатая наземная флора снижает уровень углекислого газа, уменьшая парниковый эффект и способствуя более прохладному климату. Девонское вымирание произошло, когда океаны замерзли и стали непригодными для жизни. И снова необходимо найти свою нишу, чтобы выжить. Наши предки нашли свое жизненное пространство и достигли суши еще до того, как вымерли. По мере приближения холодов они отходят все дальше от воды, постепенно образуя конечности. Животным, которому они подражали, была саламандра. Одна из эволюционных линий не порвала с водой и не стала земноводным. Другие покидают побережье в поисках пищи: растений и насекомых. Они стали амниотами. Амниоты могут выжить без воды и откладывать кожистые яйца.

Одной из проблем, с которыми сталкивается жизнь на суше, являются колебания температуры. Амниоты — хладнокровные животные, и их стратегия — найти теплое место. Именно это сделали их потомки-рептилии. Чаще всего они замерзают ночью, когда их мышцы не могут нормально двигаться. Однако замерзающие по ночам рептилии — достойная добыча. Для кого? Возьмем, к примеру, терапсиды. Это еще одна линия эволюции амниот. Они способны регулировать температуру своего тела, а значит, являются теплокровными животными. Да, он потребляет энергию, но делает возможной ночную охоту. Это сделало их самыми успешными животными пермского периода 300 миллионов лет назад. Некоторые из них размером с тигра и выглядят как большие пушистые ящерицы.

Еще одно пермское массовое вымирание произошло 250 миллионов лет назад, в результате чего вымерло 96% морской жизни и 70% наземной жизни. Существует множество теорий относительно того, почему это произошло: причиной считаются вулканы, астероиды, микроорганизмы, производящие метан, или сочетание факторов. Никто не знает наверняка. Но мы знаем последствия. Большие терапсиды остались в прошлом. Их обжорство не идет им на пользу. Более экономные рептилии сохранились. Около пяти миллионов лет жизнь была скрыта в крошечных карманах, разбросанных по всей планете. Терапсиды не исчезли, а были представлены лишь мелкими животными типа цинодонтов, скрывавшимися в пещерах.

Абада Лоден

Рептилии стали властителями суши и лидерами пищевой пирамиды. Чтобы избежать хищных ящериц, нашим предкам приходилось уменьшать размеры своего тела до десяти сантиметров, днем ​​прятаться в пещерах, а ночью выходить подышать свежим воздухом, поскольку в это время предки были малоподвижны и имели плохое зрение. Они стали первыми млекопитающими. Когда-то в эпоху доминирования динозавров у них появилась новая способность, помогающая им выжить. Это самая большая инновация со времен кембрийских рыб. Они учатся не только методом проб и ошибок, но и посредством воображения. Почему они? Возможно, более продвинутое видение может изменить ситуацию, предоставив больше данных. Или, может быть, это теплая кровь, которая способствует неврологическим процессам. Мозг млекопитающих быстрее.

От самых ранних хордовых до терапсидов мозг мало прогрессировал. Эволюция воздействует и на другие органы. Мозг ящерицы мало чем отличается от мозга рыбы. Но у млекопитающих у него уже есть новая кора (неокортекс). Хотя она и мала по сравнению с сенсорной корой головного мозга, она становится центральной в развитии человеческого разума. Наш неокортекс составляет 70% огромного объема нашего мозга. Его толщина колеблется от двух до четырех миллиметров, а большая площадь (размер небольшого стола) приводит к образованию извилин. В ходе экспериментов выяснилось, что он может выполнять одновременно множество функций, которые «разбросаны» по его площади.

Вернон Маунткасл, один из пионеров в изучении активных электродов на корковых нейронах, обнаружил, что корковые нейроны возбуждаются вертикальными столбцами толщиной около 500 микрон. Поэтому их обычно соединяют вертикально. Наконец, он установил структурную однородность всей области неокортекса. Все оно состоит из практически идентичных неокортикальных столбцов. Единственная разница между разными зонами заключается в том, откуда они получают информацию и куда ее отправляют. Это приводит нас к мысли о том, что корковые участки в принципе взаимозаменяемы, что подтверждено экспериментально. Это объясняет нам постепенное восстановление функций мозга с течением времени после инсульта. Некоторые пациенты даже начинают снова видеть после потери зрения.

Структуру столбцов, основной «микросхемы» неокортекса, можно увидеть под микроскопом. Он состоит из шести взаимосвязанных слоев нейронов (вместо трех у ранних позвоночных). Слой 5 соединяет базальные ганглии, таламус и двигательные области. Четвертый получает импульсы непосредственно от таламуса, а шестой отправляет их туда.

Шестислойное строение коры головного мозга

Характеристики человеческого восприятия показывают, как работает неокортекс. Во-первых, наш разум восполняет недостающее. Во-вторых, мы можем думать только об одном объяснении одновременно. В-третьих, однажды увидев это, трудно не увидеть это. Немецкий физик Герман Гельмгольц еще в XIX веке предположил, что мы воспринимаем не реальную реальность, а только виртуальную, смоделированную реальность, основанную на том, что мы видим. Эта идея объясняет нам эти особенности восприятия.

Основываясь на этой идее, Джеффри Хинтон и его команда (в которую входил Питер Даян, который помог установить роль дофамина в TD-обучении) попытались создать систему искусственного интеллекта, работающую по принципу Гельмгольца. Его система, которую он называет «машиной Гельмгольца», похожа на другие нейронные сети, но содержит связи в противоположном направлении: от выхода ко входу. Принимая рукописные цифры снизу (по одному нейрону на пиксель), сеть передает информацию вверх, активируя выходные нейроны. В этом режиме распознавания работают обычные нейронные сети. Но у Хинтона также есть генеративный режим, в котором выходные нейроны вызывают обратную активацию нейронов нижнего слоя. Этот процесс повторяется до тех пор, пока не наступит состояние равновесия для входа, соответствующего обратному сигналу сверху. При этом никто в сети не объяснил, дают семерку или двойку. Она научилась сама. Он отлично справляется с производством того, что получает.

Похоже, что-то не так? Однако оказывается, что машина Гельмгольца сама может распознавать несовершенные изображения, идеально суммировать информацию и, что самое приятное, генерировать совершенно новые изображения. Да, это была одна из самых ранних генеративных моделей. Способность создавать новые реалистичные изображения требует от модели понимания природы исходного изображения и того, как его изменить.

Коллаж с лицами, созданный ИИ

Добавлю кое-что, чего не упомянуто в книге: в 2024 году Хинтон получил Нобелевскую премию по физике за исследования в области обучения. В принципе, по медицине тоже могут дать один балл. Ведь существует множество свидетельств того, что неокортекс работает аналогичным образом: как с особенностями восприятия, так и с симметрией между восприятием и воображением.

Можно представить, что те, чьи глаза перестают функционировать, теряют зрение. На самом деле они видели многое. Они галлюцинируют. Это явление можно объяснить в рамках модели Гельмгольца. Некоторые учёные называют нормальное восприятие «осторожной иллюзией». Без сенсорной информации она больше не сдерживается. Генеративные модели также объясняют, почему мы мечтаем. Они могут стабилизировать ежедневный поток сенсорной информации посредством генерации противодействующей силы. Следует отметить, что воображение и узнавание не могут происходить одновременно. В обоих случаях задействованы одни и те же нейроны. Поэтому недалек тот день, когда мы сможем определить мечту человека.

Неокортекс, по-видимому, находится в режиме непрерывного прогнозирования сенсорной информации. Если рефлекторные цепи предсказывают рефлексы, а базальные ганглии предсказывают вознаграждение, то неокортекс предсказывает мир посредством своей реконструкции. Первоначальной функцией неокортекса, вероятно, было моделирование мира, а не распознавание, которое уже существует.

Модель разума млекопитающих дала им три новые способности, которые помогли нашим предкам выжить. Во-первых, они развили способность к методу проб и ошибок, используя свое воображение, чтобы представить последствия будущих действий. Еще в тридцатые годы эксперименты на крысах показали, что животные останавливались и думали на развилках лабиринта, глядя сначала то в одну, то в другую сторону. Позже, подключив к мозгу электроды, можно было буквально увидеть, как мыши представляют себе свой дальнейший путь. Получив модель внешней среды, наши предки имели возможность мысленно рассмотреть ее, чтобы найти лучший маршрут.

Вторая способность заключается в том, что мы учимся на своих ошибках.

Обратите внимание: История атомной промышленности СССР. Военные против ученых..

Без этого было бы невозможно отличить причину от следствия. Мы представляем себе альтернативное прошлое и делаем выводы о причинах произошедших событий. Это еще одно решение проблемы распределения кредитов. Причинно-следственная связь — это конструкция в нашем мозгу, которая позволяет нам учиться на альтернативных сценариях прошлого.

Третье: мы обретаем эпизодическую память. Но вот что интересно: представляем ли мы будущее или вспоминаем прошлое, мы моделируем его в своем уме. Это подтверждается тем, что функционируют одни и те же нейроны. Мы не помним, мы воображаем. Любой, кто регулярно обращается в суд, знает о недостоверности показаний свидетелей. 77% ошибочно обвиненных становятся жертвами. Гиппокамп играет важную роль в эпизодической памяти. Он отвечает за запоминание, но не за воспроизведение заученного. Это потому, что эволюция приспособила его к новым проблемам. Помимо распознавания образов, он также отвечает за быструю память. Однако он не может построить модель. Неокортекс может моделировать, но, наоборот, не может быстро запомнить новые изображения. Их взаимодействие дает нам новый способ решения проблемы катастрофического забывания: запоминая старые и новые события одновременно, гиппокамп может помочь неокортексу интегрировать новые события, не разрушая память о старых событиях.

Процесс моделирования прошлого и будущего имеет сходство с системами искусственного интеллекта, основанными на обучении с подкреплением моделей. Эти системы прогнозируют возможные будущие ситуации, прежде чем принимать решения. Это обеспечивает гибкость, но предполагает решение сложных проблем при построении модели. Выбор того, что моделировать, также сложен (так называемая проблема поиска). Поэтому большинство известных алгоритмов искусственного интеллекта работают без моделей. Они ответили сразу и без колебаний.

Разработчики системы искусственного интеллекта AlphaZero столкнулись с проблемой поиска во время игры в Го. Она рассчитала ходы в модели, но вариантов было так много, что ей пришлось выбирать, исходя из системы приоритетов. Выберите несколько многообещающих инициатив и игнорируйте остальные. AlphaGo Zero была первой программой, которая обыграла человека в игре Го. Но его успех не следует переоценивать. Конечно, Go во многом отличается от реального мира, но это не главное. Ключевым моментом является то, что мозг млекопитающих способен менять свой подход к планированию в зависимости от ситуации. AlphaZero всегда ищет одинаково.

неокортекс всех млекопитающих состоит из двух половин. На спине расположены сенсорные зоны: зрительная, слуховая, соматическая. Будь то посредством восприятия или моделирования, модели окружающего нас мира копируются. Но есть еще и лобный неокортекс. Она состоит из трех областей: моторной коры, гранулярной и незернистой префронтальной коры (gPFC и aPFC). Интересно, что в aPFC отсутствуют нейроны слоя IV, хотя причина этого неясна. Это старейшая область лобной доли, общая для всех млекопитающих.

Основная часть префронтальной коры

Очевидно, что задача лобной неокортекса — управлять моделью, то есть решать, когда и что представлять. Крысы с повреждением этой области больше не думают, куда идти на развилке дорог, всегда выбирают путь наименьшего сопротивления, имеют проблемы с запоминанием и становятся более импульсивными. Аналогично люди испытывают кризис намерения после инсульта в этой области. Они ничего не хотят. Очевидно, что лобный неокортекс делает то же самое, что и другой неокортекс: моделирует. Но он формирует не окружающий мир, а собственное тело. Его входы связаны не с сенсорными системами, а с гиппокампом, миндалевидным телом и гипоталамусом. Поэтому вместо того, чтобы интерпретировать реальность, он глубоко углубился в свои собственные желания. Он также пытается их предсказать и объяснить свои действия за что? Сделайте правильный выбор.

столбец aPFC находится в противоречивом состоянии, когда принимаемое решение неочевидно. Прогнозы из разных регионов противоречивы. Видимо, эта неопределенность и спровоцировала симуляцию. В этом случае aPFC может приостанавливать работу организма посредством прямой связи с базальными ганглиями. Мышь замерла на развилке лабиринта.

далее следует второй шаг алгоритма: aPFC не вычисляет каждый вариант, а выбирает из предсказанных вариантов из разных столбцов. Последствия моделирования этих вариантов хорошо видны в деятельности прилежащего сенсорного неокортекса, который в данном случае работает синхронно с лобными долями. Возможно, aPFC пытается предсказать, что произойдет, если будет выбран конкретный вариант. А может, именно базальные ганглии определяют варианты моделирования.

Наконец, примите решение. Науке пока известно об этом очень мало, но можно предположить, что базальные ганглии аккумулируют все плюсы и минусы индивидуального выбора. Ведь они еще к этому не привыкли. Выберите вариант, который вас больше всего волнует. Будь то вода или еда, все, что вызывает больше волнения и крыс, пойдет туда. Базальные ганглии не знают, моделирует ли сенсорный неокортекс фантазию или реальный мир. Все, что они знают, это то, что если вы пойдете налево, они будут стимулированы. Этого достаточно.

Если этот выбор повторяется много-много раз (около пятисот раз), базальные ганглии больше не нуждаются в коре для принятия решения. Сигналы от датчиков автоматически преобразуются в двигательные реакции. Привычка формируется. Мы не думаем о том, куда поставить ногу, когда идем, и не думаем о том, как произносить слова, когда говорим. Ну и мы тоже листаем ленты в соцсетях не задумываясь. Мы экономим время и силы. Двойственность между сознательными решениями и привычным поведением присутствует повсюду. Канеман описал эти две системы (Медленную и Быструю) в своем бестселлере «Думай медленно… Принимай решения быстро».

в психологии эти два основных поведения называются целенаправленным поведением и привычным поведением. Млекопитающие — первые животные, у которых есть намерения. Базальные ганглии не служат никакой цели. Они просто учатся повторять поведение, которое подкрепляется. Но у префронтальной коры есть цель: добраться до холодильника или выпить воды. Конечным результатом будущего моделирования всегда является целевое состояние, которого необходимо достичь aPFC конструирует намерение и пытается предсказать действия, которые приведут к его реализации. Каким бы тернистым ни был путь, цель должна быть достигнута. Поэтому не имеет значения, насколько текущее поведение соответствует намерению. Следовательно, нейроны четвертого слоя не нужны.

цели строятся на основе поведения, усвоенного в базальных ганглиях. Первоначально они служат учителями префронтальной коры, но по мере развития млекопитающих роль меняется, и кора начинает направлять ганглии. Это подтверждается медленной атрофией нейронов 4-го слоя aPFC в процессе роста и развития животных.

нейробиология предполагает, что функции лобной коры — планирование, внимание, рабочая память — все реализованы в aPFC, поскольку, в принципе, это один и тот же процесс: попытка убедить базальные ганглии, показывая им, что они выбирают модель для осуществления выбора. В результате животные делают более разумный выбор. Он может выбирать между намеренными действиями и привычками. Потому что у него есть цель. Ящерица не имеет целей и поэтому обречена на вечность проб и ошибок в поисках выхода из лабиринта. Но нельзя позволить мышке сбиться с пути. Это может подавить врожденные предпочтения.

помимо aPFC и gPFC, в префронтальной коре есть еще моторный отдел. Судя по названию, можно было бы ожидать, что это будет контроллер движений, как и предполагали предыдущие поколения исследователей. Но это не так. Карл Фристон предложил альтернативное объяснение: вместо того, чтобы отдавать команды, он выдавал прогнозы, основанные на анализе сигналов близлежащих сенсорных кортикальных слоев. Эти прогнозы передаются в спинной мозг и контролируют наши движения. Режим работы такой же, как у aPFC, но вместо прогнозирования выбора пути он прогнозирует движение отдельных конечностей. Если у кошки повреждена моторная кора, она не сможет ходить по ветвям деревьев, осторожно перешагивать через препятствия, осваивать новые движения. Это говорит нам о том, что моторная кора изначально участвует в планировании, а не в контроле движения. Ведь вам нужно выбрать, где расположить когти, и заранее представить себе весь процесс. Для действий, которые уже освоены, кора головного мозга не нужна: в дело вступает привычка, и за это отвечают базальные ганглии. Идея Фристона подтверждается экспериментальными данными. Премотор и моторная кора человека возбуждаются не только во время реального движения, но и во время воображаемого движения. Таким образом, с помощью воображения и планирования наши предки решали задачу развития точных движений, учились лазать по деревьям и т д.

как все это работает вместе? В конце концов, каждая часть мозга имеет свою собственную установку целей. Конечно, цели имеют свою иерархию. Помимо этого, существует aPFC, которая генерирует такие намерения, как «выпить воды». Эти цели передаются в соседние премоторные области, которые конструируют вторичные цели, чтобы отправить их дальше в моторную кору, которая, в свою очередь, разбивает их на движения частей тела. Это действительно так: главнокомандующий не должен интересоваться задачей одного взвода. Все эти области мозга также связаны с базальными ганглиями, что обеспечивает их автоматическое функционирование. У каждой цели уровня есть «бессознательная», но быстрая соответствующая цель, которую можно запускать автоматически. Повреждение aPFC оставляет нас без намерения, а повреждение моторной коры лишает нас возможности нормально двигать конечностями: иерархическая структура нарушается, и пациент может быть неспособен двигаться или может совершать непроизвольные движения. Что ж, повреждение базальных ганглиев может привести к отказу от укоренившихся привычек, как полезных, так и вредных. Например, избавиться от наркозависимости.

[Мои] Книги Рецензии на книги Эволюция Млекопитающие Мозговой интеллект Искусственный интеллект Нейронные сети Наука Наука Популярная документальная литература Длинные статьи 0

Больше интересных статей здесь: Новости науки и техники.

Источник статьи: Краткая история интеллекта (4).