Мотивированный робот: как сделать искусственный интеллект счастливым

«Дочка, мы родили тебя, чтобы ты мыла посуду». (интернет)

Если бы я могла создать что-то (кого-то), что могло бы думать, я бы предпочла создать счастливое, а не несчастное существо.

Что определяет сознание вообще:

  • Информация (обучение; способность обновлять знания)
  • Изменение (способность к адаптации; улучшению себя)
  • Мотивация (развитие; удовольствие; выживание)

Существенные аспекты мотивации:

  • Ориентированность на процесс, а не результат, и прежде всего, процесс поиска и ожидания
  • Стремление к счастью
  • Стремление к само-реализации (своему призванию в жизни)

Как мотивировать машину (сделать ее счастливой)?

Для этого нам надо понять, для чего мы создаем ИИ. Какова наша, человеческая цель: проверка (посмотреть на пределы наших собственных возможностей)? Выполнение прикладной задачи (создать хорошего повара, водителя, учителя...)? Создание модели нас самих, чтобы лучше понять себя?

Потому что это один из многих вопросов, который ИИ задаст нам, когда наконец появится. Для чего ты меня сделал? И в его/ее мозгу уже должен быть заранее спрятан правильный ответ.

Тест Тьюринга Б: как измерить качество машинного перевода

Тонкая пунктирная линия, которую можно обнаружить практически в любой инфографике, посвященной машинному переводу. Недостижимый рубеж, который называют «идеальный» перевод.

Он не существует. Даже для переводов, сделанных человеческими специалистами. Возьмите Шекспира, Гомера или Пушкина и скажите специалисту в области литературы, что один конкретный перевод лучше другого. Осторожнее, плохой совет.

Давайте будем реалистами. Каков критерий хорошего или плохого перевода в каждой конкретной ситуации? То, что вы назовете хорошим (скажем, 8 из 10 баллов), я могу определить как плохой (фу, 2 из 10). И как отличить хороший перевод от идеального? (прекрасные мысли по этому поводу высказаны в книжке Умберто Эко «Сказать почти то же самое»).

Ответ на это — «Тест Тьюринга Б» (по аналогии с классическим тестом Тьюринга): Если вы не можете отличить перевод, сделанный человеком, от перевода, выполненного машиной, это перевод «минимального качества». И конечно, никаких грамматических ошибок.

Большой вопрос, можно ли оценить наличие подобного человеческому интеллекта или самосознания у машины по ее речи. Но совершенно точно можно оценить речь по речи. Даже не надо менять процедуры самого теста Тьюринга. Та же комната, тот же интерфейс. Два варианта. Один текст. Статистически достоверные результаты.

Я думаю, пока современные системы машинного перевода не смогут пройти этот Тест Б, или сделают это случайно. Но это намного более достижимая цель, чем «идеальный перевод».

Драматургия данных: сюжеты и нарративные элементы визуализации данных

Сюжеты человеческих историй

Общеизвестно, что существует ограниченное количество литературных (нарративных) сюжетов, в которые укладываются все человеческие истории. Правда, существующие классификации выделяют от 4 (Борхес) до 36 (Гоцци, затем Польти) и даже 90+ типичных сюжетов (особо дотошные литературоведы).

Основываясь на борхесовском списке, я выделила свои 5 сюжетов, которые я считаю тем минимумом, который описывает все возможные истории, в которой есть главный герой (будь то один человек или группа людей). Они применимы как в художественной литературе, так и в журналистике. Понятно, что чаще всего речь идет о комбинации этих элементов.

  1. История возвращения / восстановления справедливости (сюда же — месть)
  2. История личного поиска / познания (места, идеи, предмета, человека, ответа, себя)
  3. История покорения / осады и защиты охраняемого места, которому суждено пасть (кроме очевидной военной тематики сюда же попадают все любовные истории о завоевании сердца, истории преодоления себя или обстоятельств, а также истории морального падения. То есть главный герой может находиться как со стороны нападающих-победителей, так и со стороны защитников-проигравших.)
  4. История выбора / цены / жертвы (во имя кого-либо или чего-либо)
  5. История спасения (кого-либо или чего-либо от кого-либо или чего-либо). И кстати, если крепость из п.3 выстояла, то это история спасения.

* * *

Сюжеты данных

Однако, когда речь идет о данных, даже в концепции сторителлинга, эти сюжеты малоприменимы. Истории о данных в чистом виде — это подвиды истории о поиске ответа.

Говоря о данных, мы можем говорить о следующих сюжетах (ср. Э.Тафти, “Красивые доказательства”):

  1. Поиск и нахождение причины и следствия (зависимости одного от другого). Ответ на вопрос — где причина?
  2. Поиск и нахождение аналогии/метафоры (ситуации, процесса, вещи). Ответ на вопрос — на что это похоже?
  3. Сравнение двух и более элементов (по какому-либо параметру). Ответ на вопрос — что больше?
  4. Проверка достоверности данных (соответствие гипотезе, прогнозу или другим данным). Ответ на вопрос — соответствует ли это истине?
  5. Узнавание структуры, устройства / углубление в детали. Ответ на вопрос — как это устроено?
  6. Обзор общей картины / установление границ. Ответ на вопрос — полная ли картина, все ли мы знаем?

Существует также еще одна классификация (Стивена Фью) сюжетов данных:

  1. Временная шкала
  2. Рейтинг
  3. От частного — к целому
  4. Отклонение
  5. Частотное распределение
  6. Корреляция
  7. Номинальное сравнение
  8. География или пространство

* * *

Драматургия данных

Любой нарратив/сюжет разворачивается во времени — здесь мы можем говорить о драматургии данных. Теория литературы гласит, что у любого сюжета существуют обязательные элементы: пролог, экспозиция, завязка, развитие, кульминация, развязка, эпилог.
Когда мы говорим о захватывающей истории данных, то имеем в виду драматургию повествования. Сразу получить ответ скучно, нужно приложить усилия. По крайней мере, между исходными данными и решением задачи (перед кульминацией) должна быть пауза.

Составляющие захватывающей истории данных

  1. Пролог, экспозиция > Общая характеристика ситуации / вступительная статья / причины исследования
  2. Завязка > Исходные данные и ситуация
  3. Развитие сюжета > Формулирование гипотезы, проблемы
  4. Кульминация, развязка > Решение / визуализация данных
  5. Эпилог > Подведение итогов, выводы

Драматургия может присутствовать даже в статичной инфографике (корректно расставленные акценты правильно подводят к самым важным данным — кульминации), хотя и анимация, и конечно, видео как воплощенный нарратив, драматургию усиливают.

Приведу примеры из оказавшихся под рукой визуализаций. Как видно, драматургия, то есть способ подачи информации, не связан с качеством анализа или дизайном. Это особое измерение, на которое стоит обратить внимание.

* * *

Примеры

Анализ изменения доходов американцев по профессиям (FlowingData).

С точки зрения сюжета: конечно, это сравнение, с элементами исследования структуры (категории профессий) и общей картины (можно охватить весь рынок целиком).

С точки зрения драматургии: в наличии элементы пролога/экспозиции и завязки. Драматургическая пауза перед кульминацией достигается, во-первых, расположением вступительного текста — после прочтения его необходимо немного прокрутить, чтобы увидеть визуализацию, а во вторых — интерактивным эффектом, когда элементы данных с задержкой (а не моментально) формируют группы данных. И наконец, в конце есть эпилог — выводы из показанного.

Анализ возраста, в котором американцы вступают в брак (с того же сайта).

С точки зрения сюжета: основная история — зависимость % людей в браке от возраста. Но также здесь есть элементы сравнения (мужчины и женщины, а также средние показатели и минимальный возраст), и дополнительный разрез зависимости возраста вступления в брак от трудоустроенности, образования и расы/происхождения.

С точки зрения драматургии: наличие вводного текста, как и в предыдущем примере, с одной стороны, дает пролог и завязку, с другой стороны, замедляет наступление кульминации — появление самой визуализации. Однако по сравнению с предыдущим примером кульминация происходит быстрее, ожидание развязки не такое напряженное.

Знаменитая визуализация количества погибших во Второй мировой войне.

С точки зрения сюжета: и здесь основа — сравнение, что очень свойственно числовым данным, представляющим множественные элементы. Также есть анализ структуры, общая картина (на мой взгляд, одно из основных достоинств именно этого проекта), и элементы причинно-следственной связи (готовность отдельных лидеров пожертвовать своими людьми ради достижения целей).

С точки зрения драматургии: видео, как жанр представления визуализации (о жанрах будет отдельная заметка), само по себе несет драматургично, это практически чистый нарратив . Обратите внимание на звуковое сопровождение — четко выделены кульминации отдельных глав (разделов) рассказа. Например, переход к первой кульминации — количество погибших со стороны Советского союза. Пауза на 04:50 и далее постепенно усиление, а потом затихание фоновой музыки очень четко отображает огромную несоразмерность цифр. И далее в течение всего ролика звуковое сопровождение (фоновая музыка, звуковой эффект, сопровождающий анимацию, нейтральный комментарий) только поддерживает и усиливает драматургию. Великолепная работа, что и отмечено многочисленными наградами.

Как устроен скелет собаки (из детской книжки).

С точки зрения сюжета: как раз сравнения здесь нет. Это аннотированное изображение позволяет аудитории узнать об “устройстве” собаки, показаны основные кости и приведены некоторые дополнительные факты.

С точки зрения драматургии. Конечно, драматургия здесь не так явно выражена, как в отдельных проектах/фильмах, однако при помощи правильно расставленных акцентов (яркости, цвета) взгляд сначала описывает основную кривую вдоль силуэта собаки (завершение этого базового маршрута и будем считать кульминацией), а уже потом идет развязка — можно спокойно почитать дополнительные факты, не боясь, что упущено главное.