Tan Le
2,720,385 views • 10:36

Вплоть до недавнего времени общение человека с машиной ограничивалось сознательными и непосредственными формами. Будь то нечто простое, скажем, включение освещения с помощью переключателя, или такая сложная вещь, как программирование роботов, машине всегда надо давать команду, а то и серию команд, прежде, чем она что-то выполнит для человека. С другой стороны, общение между людьми намного сложнее и интереснее, потому что при этом учитывается намного больше того, что выражено явно. Собеседник отмечает выражение лица, жесты и движения, может почувствовать ощущения и эмоции другого человека посредством диалога. На этом основании человек формирует большую часть своих решений. Мы поставили задачу перенести целый пласт межчеловеческого общения в сферу общения человека с машиной, с тем, чтобы компьютеры могли понимать не только наши прямые указания, но и могли бы реагировать на выражения лица и на эмоциональные переживания. Для этого нет ничего лучше, чем интерпретация сигналов, возникающих естественным путём в мозгу, как в центре управления и ощущений.

Идея, казалось бы, прекрасная, но эта задача, как сказал в своём вводном слове Бруно, не из лёгких по двум основным причинам. Первая проблема – алгоритмы распознавания. Наш мозг состоит из миллиардов активных нейронов, с суммарной длиной всех аксонов примерно в 170 тысяч километров. В момент взаимодействия нейронов химическая реакция выделяет электрический импульс, подающийся измерению. В своей большей части функциональная часть мозга распределена вдоль внешнего поверхностного слоя мозга. Для увеличения пригодной для умственных операций площади поверхность мозга полна складок. Эти складки коры представляют собой значительное препятствие для интерпретации поверхностных электрических импульсов. У каждого человека кора мозга сложена своим собственным узором – весьма подобно ситуации с индивидуальными отпечатками пальцев. Сигнал может поступать из той же функциональной части мозга, но к тому времени, когда структура мозга уже сложилась, физическое расположение этой части может оказаться в разных местах у разных индивидуумов, даже у однояйцовых близнецов, и среди поверхностных сигналов уже не наблюдается чёткого соответствия.

Наш успех основан на создании алгоритма, который как бы разворачивает складки коры, и таким образом позволяет точнее определить источник сигналов и потому быть пригодным к работе с массами населения. Вторая задача – создание конкретного устройства для наблюдения за мозговыми волнами. Обычно при замерах ЭЭГ вокруг головы сплетают целую сеточку из сенсоров, примерно как на этой фотографии. Технический работник прикладывает электроды к поверхности головы с помощью проводящего геля или клейкого материала, при этом, в качестве подготовки к процедуре обычно надо слегка подстричь голову. Процесс занимает немалое время, и он не из самых приятных. Кроме того, такая система обходится в несколько десятков тысяч долларов.

Сейчас я хочу пригласить на сцену выступавшего здесь в прошлом году Эвана Гранта, который любезно согласился помочь мне с демонстрацией нашей разработки.

(Аплодисменты)

Перед вами устройство с 14-канальной системой высокоточного приёма ЭЭГ. Оно не требует ни подготовки волосяного покрова, ни проводящего геля или клейкого материала. Нужно всего несколько минут, чтобы включить его и установить настройку сигналов. Устройство беспроводное, что даёт свободу передвижения. При стоимости обычных систем ЭЭГ в десятки тысяч долларов, этот шлем обходится всего в несколько сотен. Перейдём к алгоритмам распознавания. Выражения лица. Говоря об эмоциональных переживаниях, я сказала, что выражения можно распознавать почти сразу же, сделав тонкую настройку на индивидуальные особенности. Но, с учётом ограничений по времени выступления, я бы хотела показать когнитивный пакет, позволяющий манипулировать виртуальными объектами посредством мысли.

Эван с этой системой не работал, поэтому для него надо сначала создать своей профиль. «Джоанна» из списка, очевидно, не подходит, и мы добавим пользователя «Эван». Прекрасно. В когнитивном пакете первым долгом необходимо начать с тренинга нейтрального сигнала. «Нейтральный» означает, что Эвану ничего особенного делать не надо – просто расслабиться, погулять. Смысл в том, чтобы установить опорные параметры нормального состояния его мозга, поскольку каждый мозг индивидуален. Прибор проделает это за восемь секунд. После этого выбираем из списка основанное на движении действие. Итак, Эван выбери что-нибудь из того, что ты можешь очень чётко представить себе визуально.

Эван Грант: Скажем, «притягивание».

Тан Ли: Хорошо, выбираем «притягивание». Идея в том, что сейчас Эван должен представить себе, как объект приближается на экране. Индикатор на экране будет показывать процесс исполнения операции. В первый раз ничего не произойдёт, потому что система не знает, как он представляет себе «притягивание». Прошу тебя сосредоточенно думать об этом в течение всех восьми секунд. Итак, приготовились – поехали! Отлично. При выборе утвердительного ответа кубик оживёт. Теперь посмотрим, действительно ли Эван может представить себе притягивание. О! Молодчина! (Аплодисменты) Это потрясающе!

(Аплодисменты)

У нас есть немного времени, поэтому я попрошу Эвана сделать трудное задание. Трудно оно потому, что требуется визуально представить себе нечто, отсутствующее в нашем физическом мире. А именно, «исчезновение». Дело в том, что основанные на движении действия мы выполняем постоянно и визуализировать их не сложно. Но для «исчезновения» аналогов нет. Итак, Эван, сейчас тебе надо будет представить, как кубик постепенно растворяется. Сначала такой же тренинг. Итак, приготовились – поехали! Ладно. Попробуем. Боже мой! Как у него здорово получается! Попробуем ещё раз.

ЭГ: Не могу сосредоточиться.

(Смех)

ТЛ: Во всяком случае, эта штука работает, пусть даже нам удалось удержаться лишь чуть-чуть. Как я сказала, очень трудно представить себе такое. Примечательно, что мы дали программе лишь один пример того, как он представляет себе «исчезновение». Поскольку тут алгоритм машинного обучения …

(Аплодисменты)

Спасибо. Здорово! Молодец!

(Аплодисменты)

Спасибо, Эван, ты просто великолепно продемонстрировал эту технику.

Как вы видели перед этим, программа построена на системе соотнесения с нормой и по мере того, как Эван, или любой другой пользователь, постепенно свыкается с системой, можно добавлять всё больше элементов распознавания чтобы система могла делать различие между отдельными мыслями. А как только этап распознавания будет закончен, отдельные мысли можно отображать на любых вычислительных платформах, приложениях или устройствах.

Я покажу вам лишь пару примеров, но потенциал приложений этого нового интерфейса велик. Скажем, в играх и в виртуальном мире выражения лица можно естественно и интуитивно использовать для управления аватаром или виртуальным персонажем. Ясно, что с фантастикой и чудом можно делать опыты и управлять миром посредством мозга. Кроме того, цвет, освещение, звуковые и прочие эффекты могут изменяться согласно эмоциональному состоянию и усиливать ощущения, причём в реальном времени. Перейдём к приложениям, созданные учёными и разработчиками со всего мира с использованием роботов и простых механизмов. В данном случае, это – игрушечный вертолёт, взлетающий при мысли «поднимись».

Технологию можно применить также и в реальном мире: в данном примере в т.н. «интеллектуальном доме». Из системы пользовательского интерфейса поступают команды открыть гардины или закрыть гардины. Конечно же, освещение можно включить или выключить. И, наконец, приложения с потенциалом изменить образ жизни. К примеру, управление электрической коляской. В данном случае каждое выражение лица соответствует своей команде.

Голос: Подмигиваем правой стороной, чтобы повернуть направо. Подмигиваем левой стороной и вновь разворачиваемся налево. Улыбаемся, чтобы двигаться вперёд.

ТЛ: Мы очень… Благодарю.

(Аплодисменты)

И это лишь верхушка айсберга потенциала сегодняшних возможностей. Через участие сообщества, посредством привлечения разработчиков и исследователей со всего мира, вы, как мы надеемся, можете помочь нам в формировании развития этой технологии. Благодарю вас.