Вы когда-нибудь мечтали по-настоящему поговорить с NPC в видеоигре? Не просто один диалог в дереве заранее определенных ответов, а реальный разговор, проводимый посредством спонтанных действий и реакций? Недавно небольшая группа исследователей и разработчиков парижской студии Ubisoft в сотрудничестве с приложением Audio2Face от Nvidia и моделью большого языка Inworld (LLM) экспериментировала с генеративным искусственным интеллектом, пытаясь превратить эту мечту в реальность. Их проект NEO NPC использует GenAI, чтобы расширить возможности взаимодействия игрока с NPC, не нарушая при этом аутентичности ситуации, в которой он находится, или характера самого NPC.
Учитывая это слово — аутентичность — проект должен был стать плодом сотрудничества представителей художественных и научных дисциплин. Генеративный ИИ — горячая тема для разговоров в индустрии видеоигр, и старший вице-президент по технологиям производства Гиймет Пикард стремится подчеркнуть, что цель всех проектов genAI в Ubisoft — принести пользу игроку; а это означает, что нужно продолжать фокусироваться на человеческом творчестве за кулисами. «То, как мы работали над этим проектом, всегда учитывало интересы наших игроков и разработчиков», — говорит Пикард. «Помня об игроках, мы знаем, что разработчики и их творческий потенциал по-прежнему должны стимулировать наши проекты. Генеративный ИИ имеет ценность только в том случае, если он имеет ценность для них».
Персонажи, а не программы.
На практике это означает, что личности этих NPC создаются не машиной, а писателем, который формирует их характер, предысторию и стиль разговора, а затем продолжает корректировать, как только модель изучения языка начинает импровизировать диалоги. . Нарративный директор Виржини Моссер последние полтора года потратила на создание персонажей для проекта NEO NPC и нашла это полезным, хотя и совершенно новым, опытом. «Я привык создавать предысторию персонажей, их надежды и мечты, опыт, который сформировал их личность, и использовал всю эту информацию, чтобы подготовиться к написанию диалогов», — объясняет Моссер. Теперь она строит предысторию персонажа, его надежды и мечты, опыт, который сформировал его личность, и использует всю эту информацию для создания модели.
«Это совсем другое», — говорит она. «Но впервые в жизни я могу поговорить с персонажем, которого создал. Я мечтал об этом с детства». На протяжении всего проекта рядом с Моссером была специалист по данным Мелани Лопес Мале, которая учит модель вести себя так же, как оригинальное творение Моссера, с помощью систем ограждений, анализа ввода игрока, трехмерной среды и текстовых инструкций. Малет, который раньше преподавал литературу в средней школе и по-прежнему вдохновляется хорошим рассказыванием историй, так же, как и Моссер, был заинтересован в создании неигровых персонажей, которые реагируют как настоящие персонажи, созданные людьми.
Всегда повторяющаяся
языковая модель, объясняет Малет, представляет собой большую коробку, полную концепций и статистических данных, которые создают слова, которые могут сочетаться друг с другом, на основе общего сосуществования определенных слов. Итак, если бы вы разговаривали с базовой языковой моделью, она давала бы скучные, роботизированные ответы. Заставляя статистику в модели двигаться в желаемом направлении на основе предыстории, личности и стиля диалога, как это задумал автор, она начинает понимать, чего вы ожидаете.
«Задача модели заключается в следующем: я должен изобразить этого персонажа», — говорит Малет. «Для нас действительно важно, чтобы он вел себя так же, как персонаж, которого создала Виржини. Поэтому, разговаривая с ним, мы спрашиваем себя: «Это Лиза? Сказала бы Лиза это?» и если ответ отрицательный, нам нужно вернуться и выяснить, что произошло внутри модели, чтобы она отклонилась от видения Вирджини».
Придерживаться сценария
Такое итеративное создание персонажей также помогает структурировать любое поведение игрока, которое может нарушить, скажем, тон конкретного сценария или цель, которую он в конечном итоге хочет от вас достичь. Персонажи запрограммированы реагировать на подсказки игрока определенным образом или не реагировать, в зависимости от их личности. «Мусор на входе и на выходе», — говорит Малет об игроках, вводящих бессмысленные подсказки. «Но это также волшебство внутри и снаружи. А когда игрок создает свою сцену и все щелкает? Для них это невероятный опыт».
Есть и другие ограждения; у команды есть множество фильтров, которые, например, улавливают токсичность и неуместные действия со стороны игрока. «Мы провели различие между игроком, враждебно настроенным по отношению к NPC, и оскорблением его, чтобы мы могли правильно определить, что является токсичным», — говорит Малет. Затем модель создается так, чтобы реагировать на указанную токсичность: она больше не будет совместной. «Для нас важно еще раз подчеркнуть, что у этих персонажей нет свободы воли», — говорит Моссер. «Они здесь, чтобы сыграть свою роль в истории. У них есть сюжетная линия».
Улавливая предвзятость
Пока мы говорим, команда продолжает возвращаться к аутентичности – или душе, как выразился Моссер – как путеводной звезде для всего, к чему они прикасаются. В LLM существует острая чувствительность к предвзятости и стереотипам, а также к их влиянию на дизайн и поведение персонажей. («Мы создали физически привлекательного женского персонажа, — объясняет Малет, — и его ответы становились кокетливыми и соблазнительными, поэтому нам пришлось его перепрограммировать»). Существует также твёрдое убеждение в том, что человеческая деятельность является незаменимой частью создания правдоподобного персонажа. «Чтобы создать по-настоящему выразительного персонажа, — говорит Малет, — вам нужен очень выразительный актер».
Конечная цель и дальнейшие шаги
Проект NEO NPC — это всего лишь прототип, и еще предстоит пройти путь, прежде чем его можно будет реализовать в игре. Конечная цель — сохранить его как гибкий инструмент, столь же полезный для небольших проектов Ubisoft, как и для ААА-проектов. «Вам не нужно быть первоклассным разработчиком, чтобы внедрить эту технологию и подарить своим игрокам новый опыт», — говорит Пикард. «С NEO NPC открывается масса возможностей для игрового процесса».
Команда использует GDC 2024 для презентации проекта , а также в качестве контрольной точки для подведения итогов отзывов отрасли и накопления своих знаний о том, что эта технология означает для них и их игроков в будущем. Малет и Моссер также хотят воспользоваться возможностью, чтобы подчеркнуть, что в пространстве генеративного ИИ есть место для творчества, что данные и рассказывание историй могут сосуществовать бок о бок. «Я творческий человек», — говорит Моссер. «И каждый день с тех пор, как я начал работать над этим проектом, я творил».