Как черный горох вероятности превращается в звезды. Тайна числа Seed.

MidJourney для Художников.

Часть 4. Как мы уже увидели, Миджорни пришел “в мастерскую художника в которой выключен свет”, потревожил темное пространство скрытого потенциала, протянул руку куда-то, случайно и одновременно управляемо, и схватил число seed. Что же схватил Алгоритм? И означает ли это, что нейросеть уже получила что-то, выбрала начальную точку до того, как промт прозвучал?
Ответ — да, и это буквально “схватывание” возможности, которая уже заранее находится в общем математическом вычислительном поле.

Чтобы понять это, представим: всё пространство нашей темной мастерской “с понятиями о материалах” заполнено “невидимым черным горохом”. И эта пустота, в самом ближайшем к нам смысле, полна черным горохом “во всем ее объеме”.

 Каждая горошина это не просто координаты материалов, а возможные точки пространства, из которых формируются потенциальные решения. Это прежде всего поле решений, которое уже готово стать чем-то, быть преобразованным во что-то, при соответствующих условиях взаимодействий, но сейчас это еще не определено.

 По сути, Миджорни схватил свою первую горошину как “координаты именно этого исходного материала” в общем пространстве потенциалов, которые смогут принять конечное значение при определенных условиях и взаимодействиях.

 То есть буквально взял единицу того, что ещё ничем не стало, но уже содержит всю свою определенную возможность в потенциальном поле, и может быть проявлено в мир через алгоритм при вашем запросе.

Для нас, художников, это выбранный ”именно этот” неопределенный кусок чего-то, из ”наполненного заранее пространства художественной мастерской”, который ожидает от нас своих инструкций. И он связан именно вон с той кистью, и именно с этой краской, которые тоже лежат где-то здесь.

Это “управляемая случайность” полученный своего рода “код доступа”, говорящий алгоритму, с чего начинать. И уже заложены правила, по которым определится будущая форма, и запустится активность математики, но сейчас наш горошек ещё в состоянии до результата.

Потенциальная структура “готова стать чем-то” при взаимодействии с текстом, но до того, как будет озвучен промт, это действительно определенная неопределённость.
Миджорни схватил одну из страниц, какой-то пустой холст, но уже с определенным потенциалом содержания. С первого шага страница начнет заполняться, как только вы активируете её своим запросом.

 Что же происходит, когда Миджорни берет первую горошину?

Для алгоритма это представляет собой точку в многомерном пространстве мастерской на “складе представлений”. Это вся структура, которая была сформирована во время обучения модели.

Захват условной горошины с начальным числом seed определит стартовую точку в многомерном пространстве. После этого другие точки, близкие к ней, активируются, и будет запущен переход от потенциала к изображению.

 Представим машину на парковке. Она не обладает какими-то особыми свойствами из-за номера. Это просто первая выбранная точка, уникальный номер первой машины, выбранной для старта. Например: “Давайте начнём с машины с номером 12345.”
Остальные машины рядом не случайные объекты, а те, которые математически “ближе всего” к первой, согласно правилам, заложенным в системе.

Но важно понимать: другие точки не зависят от номера первого seed. Это ”математическое сходство”. Поэтому дело не в номере как таковом, а в том, как точки расположены относительно друг друга в этом абстрактном математическом пространстве парковки.

Если вы выберете другую начальную машину, то у вас будет другое значение seed. Алгоритм переместится в другое место на “парковке” и начнет с новой точки. Вокруг неё уже окажутся другие ближайшие машины, но принципы выбора останутся.

Таким образом, seed определяет лишь стартовую точку, с которой всё начинается, но сама структура парковки и расположение машин задаётся изначально и не меняется.

 Когда MidJourney начинает читать текст запроса:

Эта первая “горошина” как точка активации, становится ключом для запуска еще нескольких “горошин” из темной комнаты. Они активируются в зависимости от заданного направления и вашего текста.

Первая горошина вместе с её уникальным числом seed задает общее направление для взаимодействия ближайших активированных элементов, тех, что найдены в многомерном пространстве.

На этом этапе нейросеть отбирает среди “темной массы гороха” те компоненты, которые максимально соответствуют вашему запросу — будь то, звезды, черный фон или сам горох. Этот процесс можно воспринимать как “взгляд” модели, охватывающий всё пространство и выбирающий нужное.

MidJourney таким образом связывает ваш текст с “темной комнатой” с пространством решений, заранее сформированным в процессе обучения.
Эти найденные близкие “темные горошины” начинают проявляться сначала как нефизический потенциал света, а в ходе дальнейшего преобразования раскрывается их скрытая форма, смысл, цвет и визуальный образ.

 И вот как произойдет превращение:

 До чтения промта: Захваченный горошек seed представляет только возможность. Только набор уже закодированных данных. Темная горошина существует, но это только потенциал.

 Во время чтения промта: Потенциальный свет, но он ещё не физический. Текст вашей задачи заставляет Миджорни анализировать, и обводя взглядом мастерскую, сравнивать, и активацией превращать захваченную горошину в задачу найти сходство в других.
Ваш запрос направляет алгоритм к активации тех точек пространства, которые наиболее соответствуют заданному тексту. Эти точки активируются на основе обученных закономерностей.

 И после прочтения: Результат, проявленный как визуальное изображение. Теперь наш условный черный горох становится физическим светом который полностью “выражен”, а затем набором пикселей картины. Каждый штрих, каждый ее цвет и форма теперь связаны с интерпретацией вашего текста.

 Любое из этих состояний подразумевает, что эта темная горошина уже имела свой потенциал, но её “судьба” была установлена только через взаимодействие с вашим текстом. Эти шаги работают благодаря миллионам связей внутри алгоритма, который был заранее обучен распознавать правила, заложенные на основе текстов и изображений.

 Черный горох вероятностей это не пустота, а скрытый в коде потенциал, готовый к раскрытию через анализ текста. Всё это время он ждал взаимодействия, прикосновения художника к холсту.

 Когда художник взаимодействует с алгоритмом, он не просто генерирует условную случайность, он задает ключ, который открывает уже существующий потенциал и направляет его преобразование.

То же самое можно сказать о творческом акте в целом: замысел нуждается в намерении, инструменте, энергии. И тогда его ‘потенциальная вероятность’ превращается в реальный свет. 

Евгения Корнеева 2024 MidJourney для Художников: Часть 4.