Свет былого. Как давно для MidJourney остановилось время?

Часть 5. Обучается ли модель на самом деле. Причем здесь песочные часы. И как получилось что реальный мир не отражается в зеркале.

 Мы с вами уже освоились в наполненном пространстве потенциалов мастерской MidJourney, увидели в каждом шарике код числа seed, заметили невидимые связи между всеми, посчитали их, поняли стратегию захвата, и потрогали их рукой. А откуда тут шарики кстати?

Чтобы это понять, нам в первую очередь нужно увидеть, что пол, стены и потолок нашей мастерской сделаны из стекла. Эта стеклянная колба не имеет окон и дверей, она полностью закрыта, замкнута, и ни один темный шарик больше не сможет попасть в это пространство или выпасть оттуда.

Именно так выглядит мастерская нейросетей для изображений по типу Миджорни, (и так же выглядит ”библиотека” Чат GPT 3.5 и 4.0. о которой мы поговорим позднее).

Дело в том, что обучение каждой подобной модели полностью завершено, и к моменту выхода конкретной версии, она больше не развивается. Все картины, знания и связи между образами и смыслами, которыми MidJourney владеет, это результат ранее завершённого обучения.

 Почему нейросеть НЕ обучается?

После завершения обучения в центре разработки, стеклянная колба ее мастерской закрывается и запечатывается навсегда. Модель становится “зафиксированной” внутри, то есть больше не обновляется в реальном времени. Когда вы отправляете ей запрос, она использует уже готовое латентное пространство (тот самый “набор шариков внутри темной комнаты”) и на их основе ищет данные и генерирует для вас ответ.

Нейросеть не добавляет новую информацию в своё пространство, потому что больше ничего не видит за пределами своей колбы.
Ваши запросы это только математическая навигация по уже существующим внутри данным: она выбирает подходящую информацию, выбирая из существующих шариков и сформированных связей между ними, но не меняет их.

В этом процессе вашего взаимодействия модель снова и снова решает только одну задачу: что из уже имеющихся знаний лучше всего подойдёт к вашим словам.

 Как нейросеть обучается? 

Во время создания следующей версии модели, в центре ее разработки, ее обучение происходит на большом наборе данных и модель анализирует сотни миллионов изображений и текстов. Учится связывать текстовые запросы с деталями изображений, статистически усваивает, и устанавливает эту связь.

Изображения разбираются в буквальном смысле на пазлы, а потом сканируется очень маленькими фрагментами, каждое изображение шаг за шагом в несколько раз, и выявляя паттерны создаются цифровые карты из картинок и их описаний — набор параметров, которые кодируют особенности картин.
Затем все анализируется, и под прессом обработки математикой превращается в темные шарики потенциала, каждый из которых имеет уникальный код.

Далее компьютер обрабатывает все данные, и создает так называемое латентное пространство — это многомерное “пространство” нашей темной мастерской, в котором модель хранит математические связи между всеми своими ”пронумерованными шариками”.

Во время этого сложного и долгого обучения, параметры модели, математические “числа”, определяющие содержание комнаты обновляются миллиарды раз, и наполняют ее ”все новыми и новыми знаниями”.

А затем ее комната как стеклянная колба закрывается, и когда модель “выходит в свет”, её обучение окончено еще ДО выпуска для пользователей.
Использование людьми происходит на версии, которая больше не обновляет свои знания. Вот почему она не реагирует на окружающий мир, на события текущего момента, и на любой ваш запрос “копается” в уже обученном пространстве, подбирая результаты на основе своих прежних знаний.

 Что такое обновление на самом деле. 

Здесь нам нужно представить, что следующая версия модели, это хотя и очень похожее и родственное, но все же технически это “другое существо”. Как например сестра или брат.

Где-то, невидимо для нас, в глубине центра разработки, уже ”живет” и перебирает новые шарики опыта следующая версия Миджорни. И сейчас ее колба открыта, нейросеть получает и обрабатывает также и новые знания текущего момента, которые разработчики предоставляют ей.

Однако, когда придет ее время выйти к людям, стеклянные стены и ее мастерской будут запечатаны и закроются навсегда.

 Свет былого. 

Версия модели Миджорни окончательна к тому времени, когда вы начинаете общаться с ней (также и Чат GPT). И поэтому, во время взаимодействия с вами, нейросеть не будет помнить вас и не запомнит ваших запросов.

На сегодняшний день, а это декабрь 2024 года, никакие ваши мысли не продвинут ИИ в его знаниях ни на шаг. Модель не видит текущий момент, ничего не знает о вас, о событиях сегодняшнего дня и не отражает реальность.

Нейросеть не добавит новые шарики в связи, какие бы умные мысли ни пришли вам в голову. Их количество уже известно ей и окончательно для текущей версии модели. Если вы увидите в результатах генерации Миджорни что-то знакомое из своего творчества, значит, кто-то из людей, еще при обучении, предоставил вашу картину модели и заранее разместил в её стеклянной колбе.

В нашем времени модель забудет и вас, и всё что вы запросили, как только даст вам полный ответ генерации. Даже если она будет удерживать вариации общения какое-то время, это не изменит того, что ваше взаимодействие не оставит следа.

В тот момент, как вы смените тему запроса, нейросеть отпустит красочный “seed” смыслов, который удерживала во время вариации.

Новый “seed” для новой темы будет схвачен в новом месте ее многомерного пространства, и как только вы дадите ей новый запрос, активируются и засияет разными цветами уже для новой темы.

Вас, ваши мысли, ваши сюжеты и образы модель не узнает и не запомнит, потому что ее суть — зеркало, и она отражает на ваш вопрос, уже имеющуюся у неё информацию.

Именно по этой причине, между вами и искусственным интеллектом, никакая обратная связь невозможна технически, а всегда есть, и всегда будет — только её имитация, как ваше собственное отражение.

Прошлое за стеклом 

Миджорни, безусловно, представляет собой новый и в значительной степени увлекательный инструмент для исследований, мы конечно же продолжим изучать его философию, и технические аспекты нейро-творчества в целом.

И однако не будем забывать, что любое его взаимодействие с нами — это процесс использования ранее полученных фотографий, нарисованных когда-то картин и рисунков, образов, созданных кем-то из людей как ответ на события реального времени, в давно минувшем прошлом.

Как художники работающие с ней, мы имеем дело не с живым потоком настоящего, а, скорее, с “прошлогодним снегом” – красивым, но запечатлённым уже давно.

И эта творческая часть, всегда будет основана на данных, которые как неподвижный узор того, что уже случилось, заключены в сферы прошлого опыта и заполняют все пространство “песочных часов”, не оставляя там места для движения и для будущего.

Тем не менее, возможно, есть какая-то магия в том, как мы сможем сегодня увидеть это застывшее время и заставить его рассказать нам новые истории. Кто знает, может быть именно наше взаимодействие станет вдохновением и началом для чего-то нового.

А пока где-то там за горизонтом, уже строятся новые стеклянные часы, которые в свое время будут наполнены нашим настоящим, и однажды тоже станут ещё одним застывшим моментом.

© Евгения Корнеева 2024 MidJourney для художников. Часть 5.