Stable Diffusion тред X+82 ====================================== Предыдущий тред >>714946 (OP)https://arhivac.top/?tags=13840 ------------------------------------------ схожие тематические треды - NAI-тред (аниме) >>719192 (OP) - технотред >>639060 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Полный функционал в локальной установке (см. ниже)
>>720595 Я вот так. Конкретно у тебя как будто лорка не применяется. Нойзмод два режима разные результы дает кста, как у автоматика берет с карты, цпу дефолт комфи берет с цпу.
>>720629 У этих лор баг в описании, не указано что это сдхл лора, и в каломатике поэтому надо ей мануально выбрать сдхл. Возможно в комфи тож чет такое, но у меня скачанная лора на 4 шага без каких либо изменений запустилась и работает.
Народ, подскажите какие имеются альтернативы по инпейнту SDXL моделями кроме фукуса? Тырнет шерстил, хотелось бы иметь возможность инпейнта пони моделями, в два прохода фукус это делает, может быть есть другие варианты?
>>720701 Пещера. Баба в пещере находится в кубической клетке в эротическом бикини, а снизу стоят кыштымские инопланетные карлики потирающие лапки и расчехляя свои инопланетные пинусы, всё это снимает Питер Гриффин на большую видеокамеру. Вот если так сможет, то это будет вин, а иначе нахуй не упало.
>>720703 Инпент модели и не нужны, уже имеются инпейнт контрол нет. Повторюсь поней можно инпейнтить даже на фото через фукус, там своя инпейнт модель, но первых проход факапит качество, приходится проходится повторно с денойзом 0.5 и отрубленным инпейнт движком и получается вери гуд.
>>720717 Спасибо! Правда вроде как софт инпейнт лишь помогает избавится от швов между оригиналом и инпейнтом и не позволяет понимать, что творится в кадре. Похоже пора перекатываться в комфи, уж больно много фишек.
>>720629 Сорян, можешь не переустанавливать Комфи. Я сам только закончил пересобирать у себя все тут >>720711 и понял что это из-за режима fp8 все, без него HyperSD работает. Какой же фейл.
приветствую всех кроме секты свидетелей флекси Хача, вопрос к анонам может кто провести краткий ликбез по актуальным моделям, а то я застрял во временной петле, где 1.5 топчик за свои деньги, кста, что случилось с 2.1, она мертворожденная чтоль была? а то вроде и была, а кастом чекпоинтов не было практически, а сейчас смотрю - какие-то пони, ХЛы, как и с чем это хавать не понятно немного, - короче хотелось бы краткую инфу по отличиям современных баз, ипримеров хорошых чекпоинтов под реализм, стилизацию и анимеху
>>720757 Ты гений. Не судьба получается потестить. Так как без фп8 на моих 6гб видеопамяти пони не заработает.
И этот прикол от нвидии дерьмо редкостное кстати. Он в дефолтных позах работает, но если заставить порнуху любую генерить или сложные позы на разных моделях, превращает всё в кашу.
>>720791 2.1 была жирная и неповоротливая. Хл долго разгонялся, пока выходили кнеты и нормальные тюны моделей. Сейчас там много думать не надо, открываешь топ по сивит и качаешь. Можешь установить fooocus, он всю базу тебе сам выдаст.
>>720791 Есть Пони для всего что связано с людьми. Она лучшая и в реализме и в почти любых стилях. Но нужно лору на стиль подключать всегда. Все её модификации убирают гибкость, поэтому советую юзать оригинальную. При этом единственная её проблема в бэкграундах, она в них не умеет.
Есть все остальные модели, которые со времён 1.5 никак не продвинулись. Поэтому для всего остального, бери любую, каких-то выделяющихся нет.
>>720797 ну, fooocus пока не буду пока что ставить, у меня пока из тулзов автоматик и комфи (для случаев когда воркфлов чуть менее линеен чем сгенерить просто картинку)
>>720802 понял, пони как минимум стоит посмотреть в оригинале
остался не закрытым только вопрос по чекпоинтам под XL - (под 1.5 насклько я понимаю особо нового ничего не выкатилось, достаточно апдейтов на популярные скчать, типа того же реалистик вижена) под ХЛ видел в топе вроде Джагер - насколько я понимаю это под реализм, может что лучше есть из реалистичного ну и под арты из более менее универсального что есть хотелось бы узнать, чтобы весь Цивит не перекапывать, тем более модельки то тяжелее стали, и так не размахаешся уже как с 1.5
>>720847 Я не знаю сколько там видеопамяти нужно. Я все в фп8 кручу. Если не нравится скорость, всегда можно пожертвовать качеством, заюзав Hyper-SD/Lightning/AYS scheduler
>>720856 а с этого момента поподробней: это в параметрах задавать надо или модельку конвертить? скорость проседает потому что в шаред мемори вываливается при чем даже на базовой модели, не говоря уже про загрузку контролнетов и анимейт дифьюженов....
открой список моделей поставь в фильтрах пони, лоры, срок месяц и отсортирую по популярности там будет две: "виксон" и "пони стаилы (ноу артистс)" - обе это большие наборы разных стилей
>>720878 А в чем проблема инпейнтинга безо всей этой ебли с контролнетами и особыми моделями? Я в автоматике просто инпейнчу Пони обычным образом, оно работает, я особых проблем не вижу. Может я че-то не догоняю, конечно, хз.
>>720791 >провести краткий ликбез по актуальным моделям, а то я застрял во временной петле, где 1.5 топчик за свои деньги, кста, что случилось с 2.1, она мертворожденная чтоль была? а то вроде и была, а кастом чекпоинтов не было практически, а сейчас смотрю - какие-то пони, ХЛы, как и с чем это хавать не понятно немного, - короче хотелось бы краткую инфу по отличиям современных баз, ипримеров хорошых чекпоинтов под реализм, стилизацию и анимеху
кароче 2 и 2.1 мертворожденные по параметрам, считай их полторашкой но с другим датасетом sdxl 0.9 нинужна sdxl 1.0 - база, может в большие размеры из коробки и имеет большее количество параметров, вследствие чего гибче, но нет трансформера концептов, как и со всеми предыдущими sdxl LCM - версия прекол для быстрого LCM семплера (который не особо умеет в детали по дефолту) шоб генерить картинки в меньше шагов, но LCM существует в виде лоры, так что можно любую модель превратить в LCM sdxl turbo - файнтюн сдхл чтобы генерить быстрее и генерить на турбо семплерах, опять же есть отдельная лора превращающая любой сдхл в турбо sdxl lightning - очередной файнтюн чтобы генерить быстро, от одного шага и повыше, есть лоры каскад - уменьшенное в 2 раза количество параметров чем у сдхл, но зато работает на архитектуре Würstchen и работает быстро и не требует много ресов, умеет в текст, по факту состоит из трех моделей которые надо соединять вместе плейграунд - модель натренная с нуля под continuous edm планировщик от разрабов сервиса плейгарунд аи, релизнули веса в паблик чтобы микрочелики могли играться с настоящей моделью конкурентом миджорнея и дали, есть стандартная лимитированность по части трансформинга концептов из-за архитектуры сдхл, в общем это сдхл здорового человека если бы стабилити не клали хуищи на датасет базовой модели пони - модель натренненая с нуля простым фурриёбом со стаком карт A100 на собственном гигантском датасете, ультра нсфв без каких либо ограничений, вследствие чего стада стандартом порно картинок, не реалистик, там максиум 2.5д, челик уже заявил что будет тренить для сд3 сд3 - первая модель с концепт трансформером чтобы миксить концепты наканецта от стабилити индусов, есть онлайн на ранних чекпоинтах можно потрогать, веса еще не релизнулись
>>720887 То есть можешь взять условно фото, нарисовать маску, выставить денойз выше 0.75 и он у тебя всё в тему заинпейнтит? Чет попахивает наебаловом, если ты понявые картинки инпейнтишь то я бы наверное понял, но сторонние это прямо очень сомнительно
>>720982 В таком случае вполне реально, но я именно в фотках пытался делать инпейнт, фукус так может со своим движком, но первая итерация получается как набросок, но сохраняет все пропорции и вписывает пропорционально (сиси, попы итд), потом ещё раз с отключенным движком проходишься на денойзе той же поней 0.5 денойза и получается гуд ваще
>>720874 >Я на 8Гб генерю 1200х1800 полностью в видеопамяти. Ты че ахуел там? Оно в таком разрешении даже на комфи пикает под 10-11, а уж в каломатиках и подавно.
>>721067 ну вот у тя есть два концепта, которые знает сд, в сд текущего поколения концепты не смешиваются и инферируют последовательно, в сд3 концепты складываются создавая новый концепт на основе двух известных, то есть да, сд3 может не знать концепта "отражение в зеркале", но может соединить "отражение + зеркало" и получить искомый результат
>>721107 так это больше от творческого потенциала и умения писать промты зависит... а трешняка нагенерируют независимо от того что из инструментов в наличии
>>721112 >умения писать промты "умение писать промты" это как вера в божественное для текущих сд я бы еще понял если бы ты скозал умение работать с промтингом через регионы
>>721153 Но в промпте нет ничего про костюм. Ты хочешь сказать, что CLIP сам добавляет одежду, чтобы сделать мадам ананаса? Тогда чем штуковина в сд3 принципиально лучше?
>>721143 >>721169 >баба стоит по бедра на бекграунде >креатура сидит на бекграунде Ебани-ка в этом говне раяна гослинга ковыряющегося в носу и смотрящего в зеркало.
Аноны, увидел на циве как какой-то чел намутил лору Поднебесного, может у него попросить нашего хача натренировать ради прекола? civitai.com/models/426465
>>722139 Почитал каменты. Оказывается, что у чела, который бесплатно создал для всех одну из лучших моделей, есть буйные хейтерки. Ебанутым нет покоя. Но зато узнал от них, что в Поне на самом деле ЕСТЬ тэги для художников, только аффтор их зашифровал, чтобы нельзя было копировать стиль, просто введя имя художника. Не знаю, нахуя, может каких-то исков боялся, учитывая, что модель очень популярная и заметная. В любом случае, прикольно. Там же нашел ссылку на таблицу с шифрами и их описанием: https://lite.framacalc.org/4ttgzvd0rx-a6jf Реально работает, рисует как у художников.
>>722213 >Оказывается, что у чела, который бесплатно создал для всех одну из лучших моделей, есть буйные хейтерки. Ну да, шизы угарающие по этичности и всякие борцуны с нсфв жестко горят от пони. В посте от цивитая про "а теперь мы будем фильтровать калтент чтобы никто не пострадал ментально" предлагали сносить пони и всё нефильтрованное онеме типа cuteyuki.
Привет, анончики! Помогите пожалуйста инфой/советом. Раньше, еще в 2023 году - я очень любил генерировать пикчи, но так уж вышло что из-за депрессухи, бытовухи, заебов по работе и просто лени я все это дело дропнул. Последний раз генерировал еще во времена 1.5, прямо вот когда sdxl только выходил и были первые его чекпоинты. Сейчас хочу снова вкатиться, но всё так изменилось, что я немного теряюсь. Можете пожалуйста кратенько ввести в курс дела, можно просто ссылки на какие-нибудь актуальные статьи скинуть - англюсик тоже норм. 1. Генерация в SDXL и прочих новых моделях как-то принципиально отличается от того, что было во времена 1.5? Тогда я помню всё было довольно просто - подрубил adetailer и, опционально, контролнет, хайрезфикс - на сколько видеопамять позволяет - и потом еще при желании сверху каким-нибудь апскейлером прошелся. Сейчас все примерно так же, или есть какие-то серьезные отличия? Вот в SDXL вроде есть какой-то Refiner, но он вроде как опциональный? Нужно его использовать? Не нужно? Какие-то еще подводные камни? 2. Можете подкинуть названия / ссылки топовых NSFW чекпоинтов? 2.5d, 2d и/или реалистик - мне всё нравится. Хотя больше всего 2.5d пожалуй. 3. Расширения... Раньше я помню мастхевом был adetailer, controlnet, и что-нибудь для апскейла типо multidiffusion-upscaler или ultimate-upscale. Это всё еще актуально? Есть какие-то новые расширения, которые прямо очень нужно и вообще мастхев?
И да, я понимаю что всю эту инфу я и сам наверное могу найти гуглом и методом проб и ошибок, но всё же буду благодарен если вы меня направите и подскажите, я себя чувствую потерянным после примерно 8 месяцев вне этой темы и не уверен даже с чего начать.
>>722282 >1. Генерация в SDXL и прочих новых моделях как-то принципиально отличается от того, что было во времена 1.5? Ничем. ХЛ лучше понимает описательные промты, и иногда с их помощью можно добиться лучшего результата, чем с тэгами через запятую ,но в целом можно и так и так, можно смешивать, как хочешь. >подрубил adetailer и, опционально, контролнет, хайрезфикс Все по-прежнему актуально, только контролнету нужны отдельные ХЛ-модели на каждую функцию, увы. >2. Можете подкинуть названия / ссылки топовых NSFW чекпоинтов? 2.5d, 2d и/или реалистик - мне всё нравится. Хотя больше всего 2.5d пожалуй. Топовый НСФВ чекпоинт у нас один - это Pony Diffusion, а так же сотни мерджей с ним на любой вкус и цвет, на цивитае даже специальный тег ввели наравне с SD 1.5 и SDXL, он так и называется - Pony. Посмотри модели с этим тэгом, выбери, че больше нравится.
>>722282 > Генерация в SDXL и прочих новых моделях как-то принципиально отличается от того, что было во времена 1.5? Фактически нет. Есть свои нюансы для натрененных с нуля моделях типа пг2.5 и пони. Ну еще есть модели типа каскада или пиксарта прикольные, но тебе они нинужны. По моделям кратенько вот есть псто >>720932 >подрубил adetailer и, опционально, контролнет, хайрезфикс >Сейчас все примерно так же, или есть какие-то серьезные отличия? Ну в принципе да, насчет лиц как юзался адетайлер так и юзается. Контролнетов официальных нет, поэтому там тонна кала натренированного сообществом и нужно искать работающие нормально. Хайрезфикс есть на месте, если ты любишь сидеть в вебуях, для комфи есть отдельная нода. >Вот в SDXL вроде есть какой-то Refiner, но он вроде как опциональный? Нужно его использовать? Рефинер опционален, в качестве рефайнера можно использовать любую модель. Просто две модели будут последовательно работать, первая модель генерирует из латент спейса, вторая модель берет промт и промежуточное изображение от первой модели и типа делает его лутше. >Какие-то еще подводные камни? Ну шедулеры разные есть, мокрописьки всякие убыстряющие генерацию. >Можете подкинуть названия / ссылки топовых NSFW чекпоинтов? 2.5d, 2d и/или реалистик - мне всё нравится. Хотя больше всего 2.5d пожалуй. Топ по нсфв это PonyXL и его ретрейны. 2.5д и околореал все мерджи что базированы на PonyXL, ну типа https://civitai.com/models/365041/real-pony и какойнибудь эверклир ретрейн. На пони трудно тренить фул реал, единственную бета модель которая была тренена реалистичными фотками которую я знаю только понипанг. >3. Расширения... Смотря какой интерфейс юзаешь. Я полностью перекатился в комфи из-за пг2.5 и шедулеров новых, там вообще ебанешься с нодами и неограниченным функционалом. Есть типа оптимизнутый вебуй под названием forge, у него все нужное искаропки есть с интеграцией, но не работают некоторые кастомные расширения типа супермерджера по части плюсования лор к модели, или там тушот чтобы сегмент промптингом заниматься не работает. >Раньше я помню мастхевом был adetailer, controlnet, и что-нибудь для апскейла типо multidiffusion-upscaler или ultimate-upscale. Это всё еще актуально? Ну да. Ну вот у меня в обычном 1111 стоит пик1, в форже нихуя не стоит, в комфи пик2 паки нод >Есть какие-то новые расширения, которые прямо очень нужно и вообще мастхев? Мастхевом я бы назвал только кастомные щедулеры на данный момент - AYS, TCD, EDM, SGM. Но в вебуях на которые ты очевидно пойдешь есть только SGM. Моделей для апскейлинга тоже много, большинство юзает NMKD, контролнетовские апскейлеры и допустим SUPIR для комфи. Еще мастхев это хупер лора https://huggingface.co/ByteDance/Hyper-SD , возможно DPO лоры тоже мастхев для использования. Возможно если юзер хайрезфикса, то можно еще накатить аддон для хайрезфикса который типа фикс для хайрезфикса лол, не помню как он называется, есть в табе с экстеншенами. >я себя чувствую потерянным после примерно 8 месяцев вне этой темы и не уверен даже с чего начать Ниче особо не поменялось, сдхл просто может генерить большие картинки. Вот ждем сд3, там ривалюция будет.
>>722315 Спасибо за подробный ответ! > Есть свои нюансы для натрененных с нуля моделях типа пг2.5 и пони. Какие например для пони? Или кратко не описать? > Контролнетов официальных нет, поэтому там тонна кала натренированного сообществом и нужно искать работающие нормально. А если они работают нормально - то они будут работаь нормально под любой ХЛ моделью или тут как в лорами - с какими-то моделями норм, с какими-то говно? И еще - для пони и для ХЛ используются одни и те-же или разные модели контролнет? >Рефинер опционален, в качестве рефайнера можно использовать любую модель. Просто две модели будут последовательно работать, первая модель генерирует из латент спейса, вторая модель берет промт и промежуточное изображение от первой модели и типа делает его лутше. Понял! Ну тогда сначала наверное попробую без рефайнера, а там уж посмотрим. > Смотря какой интерфейс юзаешь. Всегда сидел на A1111. Комфи для меня слишком СЛОЖНА, мне плохо от одного взгляда на местные спагетти. Но попробовать другой вебуй я не против. >Есть типа оптимизнутый вебуй под названием forge Оптимизнутый в каком плане? Быстрее работает? Меньше видеопамяти / оперативки жрёт? > или там тушот чтобы сегмент промптингом заниматься не работает. Сегмент промптинг звучит очень интересно. Вроде что-то такое было еще когда я генерил. Но как-то в свое время руки не дошли...
>>722334 >Какие например для пони? Или кратко не описать? Пони натренен на буровских тэгах, поэтому для лучшего понимания нужно именно их использовать. >И еще - для пони и для ХЛ используются одни и те-же или разные модели контролнет? Одни и те же, это ведь ХЛ модель в своей основе.
>>722334 > Какие например для пони? Или кратко не описать?
По-моему лучше в начале ванильной поней, а потом уже при апскейпе использовать модель по вкусу или обмазывать лорами. У меня рандомные наркоманские промпты только чистая пони пытается изобразить. Остальные модели на них гонят одно и тоже хоть и результат может быть красивее. На SDXL есть AnythingXL которая вообще буквально мои промпты изображала но вместо реализма рисовала как в пейнте так что даже для набросков не подходит.
>>722334 >Какие например для пони? Или кратко не описать? Качественный скоринг, который аналог мастерпись. Можно без скоринга и более консистентная генерация будет (в смысле выдача желаемого), но качество так скажем рисовку будет оставлять желатель лучшего, т.к. датасет ну очень вариативный был, там буквально рисунки из пеинта в наличии. Можно скоринги пихать в конец или через ембединг юзать, чуть получше консист будет. Плюс у пони протегировано по типу score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up, just describe what you want, tag1, tag2, то есть пони не особо любит сложносочиненные промты потому что не настроена на это, это скорее генератор конкретных фетишей, а благодаря тому что в архитектуре сд нет трансформера концептов все твои попытки расширить запрос будут приводить к непредсказумым результат добавления концептов к инференсу и может возникать ситуация когда ты делал бабу первыми токенами, а в конце получается условно футанари, и чтобы фиксануть это надо снова бахать в конце токен с вуман, то же самое с комплекциями тел. >А если они работают нормально - то они будут работаь нормально под любой ХЛ моделью или тут как в лорами - с какими-то моделями норм, с какими-то говно? Ну конкретно под пони все контролнеты сосут жопу, есть гдето на хаге перетрененные под пони канни и глубина, но я не чекал результат. По факту контролнет на пони не работает, зато работает базированный скетчинг и имг2имг, то есть ты можешь нарисовать палочкочеловечков и получить идеальный результат практически, потому что хороший датасет был использован в котором позволялось ненатуральность объектов относительно друг друга. Кароче если юзать модели натрененные на базовом сдхл то там контролнеты работают, если сделаныне модели с нуля то там готовые контролнеты под сдхл не работают. >Комфи для меня слишком СЛОЖНА, мне плохо от одного взгляда на местные спагетти. Ну и зря на самом деле, оно еще и ресов жрет порядочно меньше. Там ниче сложного, все что надо куда подключать подсвечивается и есть готовые воркфлоу на любой пук чтобы загрузил и работаешь. >Оптимизнутый в каком плане? Быстрее работает? Меньше видеопамяти / оперативки жрёт? Да, и быстрее работает, и код переписан, и меньше пикает чем 1111, тут кароч почитай https://github.com/lllyasviel/stable-diffusion-webui-forge >Сегмент промптинг звучит очень интересно. Вроде что-то такое было еще когда я генерил. Но как-то в свое время руки не дошли... Ну вот хуйня как на пике это сегмент промптинг.
>>722372 Sampler:dpmpp_2m_sde_gpu Scheduler: karras Cfg: 7 Мои карасы не карасы, а дипиэмы не дипиэмы, угадал? Пробовал на Euler и на: dpmpp_sde_gpu результат однохуйственный, макс вес, без пепелища: 0.2 это не работа)
>>722385 >Мои карасы не карасы Так да, ты далабеб на карасе. Одна из проблем. > а дипиэмы не дипиэмы Тоже да. А еще у тебя далбаеб цфг 7.
Учу: шедулер AYS/TCD/Uniform, семплеры DPM но без мультистепов 2M и 3M. Цфг не выше 5, потому что вопервых пони само по себе не любит 5, а во вторых хупер не работает на высоких цфг, там другую лору под высокие цфг делают жди ее если надо. Ну и можно все комбинировать по разному и сигмы еще смешивать.
>>722400 Так это что-то типа LCM сэмплера + Kohya Deep Shrink в одном флаконе. Апскейлит во время генерации. Для всякой художественно мазни норм подходит, для фото - не оче.
>>722370 Я честно говоря даже не в курсе что такое скоринг. Я не очень шарю в технических аспектах. Собственно говоря, потому мне и Комфи не очень подходит - я все равно не разберусь в этом достаточно, чтобы сделать свой собственный воркфлоу или даже суметь самостоятельно понять какой из готовых воркфлоу хорош, а какой нет (разве что по результатам, но результаты - это дело такое - они ведь от огромного множества факторов зависят). А вот Forge звучит очень интересно, надо попробовать! >Ну конкретно под пони все контролнеты сосут жопу Даже на позу? Это ведь, по сути, тоже просто набор палочек и контрольных точек в итоге?
>>722390 Ласточка моя, в фокусе ЭТО не работает, я не могу понижать гайденс, только для того, чтобы твоя драгоценная лора работала на полную шкалу, у меня из-за этого сдуются другие Лоры, и полетит в пизду вся композиция, поменяется сид. Для того что-бы травка была зеленее а облачкаьпопушистей мне всего-то нужно поднять гайденс на 1 еденицу, и никаких имба-лор для этого не требуется.
>>722419 >Я честно говоря даже не в курсе что такое скоринг. Это вот эти score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up, автор так протегировал качество в датасете. Без них будет ну скажем пикр - пик1 голая пони без скоринга, пик2 голая пони без скоринга но с хупером, пик3 скоринг включен, пик4 скоринг, хупер, лора стиля. То есть пони лучше юзать как минимум под лорами стиля, чтобы сильно не трахаться с базовомой моделью по части расписывания качества. >мне и Комфи не очень подходит - я все равно не разберусь в этом достаточно, чтобы сделать свой собственный воркфлоу или Я тоже так думал, а потом как передумал. Он простой, единственное что надо запоминать ноды что конкретно делают и в какой пайплайн их сувать. >даже суметь самостоятельно понять какой из готовых воркфлоу хорош Дело наживное. >Даже на позу? Это ведь, по сути, тоже просто набор палочек и контрольных точек в итоге? Даже на позу. Пони это совершенно отличная по внутренностям от сдхл базовая модель, поэтому не работает.
>>722389 >>722400 А я вообще не апскейлю, в этом нет необходимости, меня вполне устраивает та деталировка что есть. Я на своем 27' ничего нетрастягиваю в 300% что-бы типа рассмотреть, мне выёбываться не перед кем)
>>722419 > суметь самостоятельно понять какой из готовых воркфлоу хорош Лучший тот, в котором ты точно знаешь, что там происходит. Соответственно, делать нужно самому. Начни с дефолта. Потом можешь начать куски тырить из чужих, но лучше сперва разобраться, что эти куски делают. И соответственно сравнивать воркфлоу по результату тоже нет особого смысла, т.к. результат зависит от сида в первую очередь. >>722428 Ок. Никто не заставляет же.
>>722469 >что за _up? от 4 до 5, от 5 до 6 и так далее, астралайт писал что уже на полпути тренировки понял что можно было скоринг получше сделаоть чтобы не городить скор тегов подряд постоянно, но было уже поздно >А если оценка 10? нету >Где оценивалось? автором
>>722472 Ну теперь хоть стало понятно. Лучшая опенсорсная сеть, которую мы заслужили.
А есть возможность генерировать одного и того же человека в одной и той же одежде? Только тренировкой лоры? Нет желания весь технотред перелопачивать, а потом пердолится с лорой
>>722478 >А есть возможность генерировать одного и того же человека в одной и той же одежде? Ну мне сразу на ум пришел зеро шот трейнинг на лету, но это в комфи ток https://www.youtube.com/watch?v=4OHzY_dayeU
Фукусер — ты обосрался с фукусом и теперь выёбываешься в треде, Но ты ничего не понимаешь в стабильной диффузии — Ты делаешь какую-то хуйню на премейд настроечках для школьников из миджорни, А мы настоящие мастера генерации.
Вали нахуй из сд треда — Здесь одни комфиюзеры, тебе здесь не место, Тебе надо во FLEXY, там одни еуропеан вумен — ведь ты еуропеан вумен!
>>722393 >А еще у тебя далбаеб цфг 7. >>722428 А ещё долбаёб считает, что кто-то еще сидит на полторахе обмотавшись разноцветными проводами. Ты понимаешь, каким ты себя идиотом вставляешь? Все твои советы ты можешь себе же в жопу и засунуть, это больше никому не нужно. Ты безнадежно устарел, вместе со своей технологией удаления гланд через жопу)
>>722750 > У людей уже совсем-совсем идеи кончились? А че ты хочешь? Качество уже и так есть, закономерно что теперь будут ебаться с возможностью генерить йобу на лоу степах. И это хорошо, 4090 юзеры должны терпеть.
>>722751 > не опция, а требование У меня жуткий пиздец без рескейла с 5.0 CFG. Смена сэмплера/планировщика нихуя не делает. AYSS нету, его проверить не могу.
>>722770 Проверь на dpmpp_2m_sde smg_uniform, если не влом. Может они эту лору к железу нвидии как-то привязали, или к торчу 2.0 и выше, или еще какую хуйню перемудрили.
Аноны, как в комфи сделать батч процесс, чтобы апскейлить из папки с пиучами? Я нашел load_Image_batch, но там надо менять картинки в батчеиндекс руками
>>722761 Что мешает запустить AYSS на АМД? Это же просто изменение шагов семплинга.
>>722814 судя по первым отзывам у кого-то работает а у кого-то нет. У меня только с AYSS работает, хотя другие пишут что у них с дефолтным воркфлоу запускается. Хз как они умудрились сделать зависимой лору от хуй знает чего.
>>722814 >>722787 >>722784 Кароче пик1 2м сде + юниформ 7цфг, терпимо, но чучуть жарить начинает. Пик2 2м сде + айс - убивает зажаром. Перекатывайся на семплеры без мультистепа кароч. >Так у меня euler и ddim такую же хуйню творят. Эйлер + айс пик3, эйлер + юниформ пик 4. Ддим юниформ тож ок.
>>722824 > Что мешает запустить AYSS на АМД? Хуй знает. Я пробовал, у меня получались недоделки типа пик2.
>>722824 > у кого-то работает а у кого-то нет >>722828 Видимо какая-то магия, потому что у меня явно жарит безбожно. C TCD такая же хуйня, кстати. С рескейлом не жарит, но выглядит так, будто шагов не хватает.
>>722794 >Что за Eta noise? A stochastic parameter used to control the stochasticity in every step. When eta = 0, it represents deterministic sampling, whereas eta = 1 indicates full stochastic sampling.
>>722835 >Видимо какая-то магия, потому что у меня явно жарит безбожно. Может проблема в модели, мне лень кочять хелловорлд этот. Вижу у тя стайлеры подключены, попробуй все лишнее повырубать.
>>722846 >>722846 ну я кароч скочял леосам этот, видимо он жестко надрочен к шедулерам, семплерам и количеству шагов, в примерах там вообще рестарт ебучий суют, хупер неюзабелен, только на мелком весе иногда, ощущение как после дефолтного использования пироснсфв лол >реалвистурбо Ну тут у тебя и так турба (хотя реалвис же это лайтнинг), зачем тут хупер
>>722882 > хупер неюзабелен 4step хупер юзабелен с 1 cfg и до 2.5 с рескейлом. > и так турба Автор обосрался, когда имена им давал. Это обычная, а у турбы дважды туробо в файлнейме.
>>722882 >хупер неюзабелен подрочил без AYS на классических шедулерах, ну видно что хупер пытается, но ему что-то мешает в четкость, как будто на последних степах инференс по пизде идет
>>722897 >>722901 >>722902 Так и в AYSS для SDXL и SD1.5 так и так разницы почти нет, просто таймстепы чуть по другому расположены и все. Это как если бы ты удивлялся тому, что karras работает как в SDXL так и в SD1.5.
>>723015 Ты не понил. Хупер типа сдхл лора, с поней она ок работает что на тцд, что на ays. Но не работает с сдхл трейнами (ну конкретно допустим этот леосам) на полном весе с цфг 5-8 как обозначено под AYS SDXL и любыми другими стандартными семплерами и планировщиками. Да и голый планировщик AYS SDXL не работает с леосамом нормально. Но стоит переключить планировщик на AYS SD1 как оно всё начинает работать. Вывод? Почему-то для леосама через планировщик AYS подходят уровни шума и индексы шума подобранные челиками кожанки под SD1.
Вобщем одина модель, сид и промпт и три варианта: 1. дефолт без еллы. 2. стандартная элла 3. элла комбинированием кондишина - продублирвоана последняя nsfw строчка из промпта
Промпт ебанутый, но иначе я бы вообще этим не занимался:
rating_explicit, very detailed, masterpiece, high resolution, ultra detailed, 8K, 16K, beautiful, very aestheti,
__bo/scenes/random-city__, BREAK,
({full body shot|front view|side view|back view|from above|from below|from behind}:1.5),
(attractive beautiful skinny young girl:1.3), (asian:0.7), long legs, __haircolor__ __hairstyles__, ({flat breasts|small breasts|medium breasts|big breasts}:1.4),
rating_explicit, very detailed, masterpiece, high resolution, ultra detailed, 8K, 16K, beautiful, very aestheti,
mythical landscapes parapet, BREAK,
(front view:1.5),
(attractive beautiful skinny young girl:1.3), (asian:0.7), long legs, cosmic coral quad tails, (small breasts:1.4),
resentful, (delighted:0.7),
Jumping with arms forming a 'Y' shape, diamond face shape with angular cheeks ,
snug full body clothing, boat neck, cybernetic material, flutter sleeves, mini length, drop waist, pencil skirt, lace-up back, sheer panels, tie closure,,
>>723166 Не сама ELLA а скорее языковая модель FLAN-T5 от Гугла, которую они используют.
Имена знаменитостей не воспринимает, но можно скомбинировать ELLA и CLIP через специальную ноду, чтобы то, что не знает T5 могло компенсироваться промптом для CLIP.
>>723174 >>723177 В обоих случаях, у тебя неправильный промпт. ELLA умеет работать только с естественным языком, а ты ставишь везде запятые (они для CLIP, который не умеет в контекст).
А вы прям на пони генерите или на аутизме/другое? У меня на пони чёт значительно хуже получается чем на аутизме и чем то что люди постят и говорят что пони.
После ее установки можно будет картинки сделанные на Автоматике1111 сразу закидывать в Комфи и он построит воркфлоу для воспроизведения такой же картинки.
>>723232 В основном прям в Пони, мне его около-реалистичный картинный стиль (который там обычно по дефолту выходит) больше всего нравится. Его ещё и лорами можно усилить, а на других моделях, куда уже свой стиль впаян, лоры работают гораздо хуже. Ещё иногда использую MFCG PDXL для стабильного мультяшного стиля без лишнего промтинга. И everclear для 3д-реализма.
>>720590 (OP) >Для тех, у кого видеокарта не тянет - ускоренная генерация на ЦПУ >https://github.com/rupeshs/fastsdcpu Только вкатываюсь. Чтобы начать генерировать, достаточно только по этой ссылке скачать? Или надо еще что-то ставить предварительно?
>>723427 Без токсичности. Просто совет, цп это еще хуже чем 1060 на 3 гигабайта, там хотя бы можно по 30 сек пикчу в 512x768 генерить на сд 1.5, а при особых ухищрениях даже на сдхл. А на цп только вечность смотреть на рендеринг длинною в 20 минут на пикчу.
>>723427 >>723364 А бля, я ссылку не открыл. Не ну если конкретно это говно на 1степ лцм и всяких 1 степ хуперах, то в принципе да, можно и на других веб мордах тоже самое сделать, не обязательно эту мокропиську именно по ссылке кочят. Ток 1степ это костыль максимальный, слишком мало шагов для генерации адекватных результатов, но за неимением видевокарты почему бы и нет.
>>723450 >Core i7-12700 генерит 512x512 мыльное говно на рандоме перескакивая инференс за счет латентной привязки степов к сиду за 1 секунду фикс
>>723455 Надо установить Python версии 3.10. Уметь клонировать репозиторий Запустить установку Скачать правильную [!] модель Понять куда ее поставить (тут никто не сидит на ЦПУ и соответственно на этом UI, поэтому не подскажут) Научиться пользоваться интерфейсом (опять при условии, что этим костылем никто тут не пользуется).
>>723458 спасибо за уточнение Генерит говно, да, но быстро, а самое главное генерит.
>>723455 >А почему в описании написано, что рендирит за 0,8 секунд? Потому что ванстеп. >Есть 1050, она рендирит по 60 сек. Можно конечно так работать. Но я думал цп то посильнее будет. Цп не предназначен для работы с вычислениями нейронок. >Ну вот, круто же. Ну итт щас дрочат на хупер, там тоже есть 1степ. Под лцм нужен лцм семплер, а он каловый и в детали не может нихуя. Опенвино я даже не ебу что это, какая-то хуйня для цп которая никому нинужна.
>>723455 >Есть 1050, она рендирит по 60 сек. Можно конечно так работать. Чел ало, ты на 1050 с тем же хупером/лцм/лайтингом/хуяйтингом с теми же ван-фор-эйт степами будешь генерить еще быстрее и в большем размере при этом. Брось это дело с цп пытаться чето.
>Автоматик Я как в прошлом пользователь трехгигового говна на каломатике могу сказать что твоя 1050 если она 4 кека вытянет каломатик спокойно. Но можно сразу идти на фордж. А лучше сразу в комфи, он вообще ресурсов сверхмеры не жрет и можно будет дышать почти полной грудью. >Фокус Даже не думай. >Или к ним потом еще стили надо качать? В комплекте не идет? Их миллиарды. Ты можешь скачать любую лору стиля и приебашить ее к модели прям в вебморде. >И проще через Шедеврум на яндексе хуярить. Ну там есть трансформер концептов, больше плюсов в шедевруме нет.
Сап, нужна видимокарта для относительно простых задач в сд Генерация по тегам + контрульнет + лора + sdxl на бейсд модели пони xl Разрешение 512х768 + апскейл 1.5 - 2. Я сам особо не шарю какие нужны спеки для сдшки, у меня просто 4080 так шо работает и так как надо. Насколько я понял желательно чтобы было видимопамяти и куда ядер побольше. Бюджет 20к, только вторичка или алик, сейчас присматриваюсь к 3050 на 8гб.
>>723479 8 гигов такое себе, 3060 12 гигов бери, платина, можно найти на лохито по 17-20к, конкретно видел анус феникс одновентильный вентиль заебись, но так как он один то карта орет, но зато не греется
>>723364 Так то можно запустить и обычный a1111 webui в режиме CPU, и навернуть лсм-like лор. И все фичи будут. На сколько я знаю, в этом фаст сд цпу поддерживается режим опен вино, для использования встройки интел. Но и это можно на автоматик навернуть, по тем же гайдам, что и для Intel arc. В общем не вижу смысл использовать этот фастсдцпу
>>723209 Фокус скачай и нормальную модель реалпони там или опендалле, а то говно какое-то на твоих пиках. Впрочем, от красноглазого пердолика ничего иного и не ожидаешь. Много часов рассуждений про пердолинг чтоб на выходе был пук.
>>723954 Ну тебя же с твоими каловыми высерами не даванули. Хотя тред про картинки, а не про обсуждения пердолей, которые высирают в своем гомфи качество уровня 1,5 даже из иксел моделей.
>>723948 >В генерациях сделанных в Пони 6 в кожа очень пластиковая Потому что там "реалистик" это 3Д рендеры. Там неоткуда натуральной коже взятся без мерджей.
>>723974>>723981 >Ну тебя же Ты меня с кем-то путаешь, шизло. >Хотя тред про картинки, а не про обсуждения пердолей Поэтому ты тут ньюфагам в уши ссышь о том какой чпокус ахуенный? хотя любой более менее в теме чел буквально за 5 минут поймет что чпокус скатывает сд до уровня кандинского, если не ниже.
>>723974 >Хотя тред про картинки Тред про сд, далбаеб. >которые высирают в своем гомфи качество уровня 1,5 даже из иксел моделей. Сачала хотел обиснить, что выставлять слово "качество" как меру превосходства фукуса это мягко говоря тупо и профанация, но потом понял что общаюсь с брейнлесс фукусером, поэтому вот:
ПИК 1 ЛОРЕС 8 ШАГОВ БЕЗ АПСКЕЙЛОВ, ПИК 2 ЛОРЕС 20 ШАГОВ БЕЗ АПСКЕЙЛА @ ХУЙНЯ ГОВНО КАЧЕСТВО 1.5 МАМА СКОЖИ ИМ @ ПИК 2 МИЛЛИАРД ЛЕТ ОЖИДАНИЯ КВОЛИТИ ОБМАЗАННОГО СТИЛЯМИ @ ОМ НОМ НОМ КАКОЙ ЖЕ КАЙФ 40 МИНУТ РЕНДЕРА 60 СТЕПОВ С КВАЛИТИ ПРЕСЕТОМ НА ПОДКАПОТНОМ ГАВНЕ ДЛЯ ХЛЕБУШКОВ ИЗ МИЖОРНЕЙ И НЕКОНТРОЛИРУМЫМИ 180 СТИЛЯМИ ЧТОБЫ МЕНЬШЕ ДУМОТЬ ОЙ ЗАБЫЛ ЕЩЕ НАДА АПСКЕЙЛ НА ДЖВА ЧАСА ВКЛЮЧИТЬ ФАКАСС ТОП
У фукуса безусловно есть плюс - инпаинт модель, которую можно спиздить в человеческий воркфлоу, больше плюсов у фукуса нет.
>>724040 а еще в факассе на спид моде стоит лцм лорка, какой дебил это придумал неясно, наверно чтобы у факасеров отложилось что картинки в качестве это тормозной семплер и 100500 шагов онли мижорни экспириенс
>>723996 Такого уровня кожу там можно на пони сделать, я делал в фокусе. Просто пару тегов конкретно на кожу споры и так далее. Но я на инпейнте, как при генерации с нуля не знаю.
>>720590 (OP) Анончи, не заходил хз сколько много, облачную генерацию сделали обратно или продолжать копить на 5090? Мне нужно в основном что-то где в чем бы я смог генерить имж2имж с дополнительными апскейлом
>>724253 Бля, а разве нет какого-то онлайн редактора, который в один клик из обычной картинки, стерео делает? искаробки-не может, мож есть лоры какие-нибудь или модели в контролнете по это заточенные, хотя вряд-ли
Моча решила окончательно утвердить этот тред, как тред пиздабольства и перекидывания какахами, где запрещен сгенерированный контент? Или это она и строчит всю эту хуйню?
>>724402 Есть лошки которые привязываются к софту и конкурирующий софт начинают обсирать. По сложности я бы сказал что даже проще так как есть возможность повторить воркфлоу 1 в 1 что в начальных этапах с разрешением и настройками cfg бывает затруднительно. Ну я уже не говорю про лишнюю возню с совместимостями, full-precision и прочее техническое дерьмо. в forge и А1111 так и не хочет у меня ставится xformer уже год прошел, а они так и не исправили.
>>724448 >>724453 В консоль загляните. Во вторых ишью в гитхабе все еще открыто. В-третьих у меня 2 версии комфи одна старая, другая новая обе голубые выдают одну и ту же ошибку.
>>724445 УМВР. Ты напрямую подключаешь дефолтными нодами или кастомами? Твои логи похожа на хуйню, которая вылезает на импакт свиче с select_on_execution, например. >>724449 Слухов много, но конкретно сложность комфи - это самый распространенный слух.
Как работает нода CLIPTextEncodeSDXL? Понивские скоры в какую дыру sdxl промтов пихать G или L? Зачем размеры два раза? Везде где видел или они ли точно такие же или 4х.
>>724461 > Везде где видел или они ли точно такие же или 4х Ставь в обе хуйни размеры равные латенту. Если эти target_width и прочее что-то и делали на базе, то на кастомах они в большинстве случаев ухудшают результат, если туда пихать значения отличающиеся от латента. Впрочем и саму эту ноду нет необходимости использовать, т.к. большинство кастомов всё равно предпочитают одинаковый промпт в g и l, тем более пони с её тегами.
>>724445 Была, вроде бы, такая же фигня после обновления комфи или нодов. Тогда я погуглил и кажется обновил какие-то "site-packages" в глубине директории комфи.
Попробуй "pip install diffusers" прописать в "..\ComfyUI\venv\Lib\site-packages" в cmd. Перед этим удали там две папки diffusers если версия меньше 0.27.2. (Возможно удалять не обязательно, я не ебу как эти pipы работают)
Опять кучу тредов просрал потому что сообщения текут быстрее чем успеваю отслеживать Отчет делавшим мне картинки: По хоррору - 4 главы набросал 20 000 знаков. Планирую сделать 100 000 и выложить. По мехам soviet style пока только общий план сюжет решаю концепцию. Может по итогам разобью вообще на 2 смежных цикла.
Короче анончики сорян я работаю, но слежу за вашими трудами. Какой текущий положняк треда? Что с СД3?
кароче, артефакты хуперацфг решаются внезапно двумя способами - контролнетом (да, прикиньте, с хупером контролнеты для обычного сдхл начинают адекватно работать на поне, берите на заметку), можно пустить аутпут в контролнет еще и снова прогнать на тех же шагах, но тогда как бы вся фишка хупера по пизде идет и шагов становится 16, либо апскейлом в тот же размер то есть вывод: нужна рефайнирующая модель поверх хупера или какой-то легкий дополнительный гайдлайнер мнение чем можно заменить контролнет/апскулер?
>>724509 venv diffusers Нет таких папок вообще в ComfyUI. Зашел (\ComfyUI\python_embeded\Lib\site-packages) Прописал в ней "pip install diffusers" говорит все удовлетворено дефузеры в моей папке лежат (\Program Files\Python3.10.9\Lib\site-packages) удалил оттуда две папки, прописал команду "pip install diffusers" установилась новая версия 0.27. Ошибки так и остались.
>>724537 Понятно. Если что, я через Stability Matrix ставил комфи и обновляю через него комфи. Ещё с помощью ComfyUI-Manager устанавливаю ноды и обновляю их.
>>724601 Раньше я тоже был за демократию. Тоже не хотел с а1111 уходить, но на комфи прикольные штуки выходят, а в а1111 они не работают, или работают но не сразу, или работают но криво. Короче вынудили.
Попробовал я эту вашу нвидивскую приблуду. Чет разница минимальна на 50 шагах и cfg 4 . Если заниматься аутотреннигом, то можно заметить лучше прорисованные детальки. Но они не стабильны. То они есть, то их нет.
Можно ли как-то промтом описать, чтобы рисуемый обьект был только в нижней правой части картинки, а все остальное пространство занимал фон? И как это правильно сделать? Модель пони если что.
>>724633 Хуйня получится, сложные маленькие объекты всрато выходят. Проще всего, наверно набросок сделать от руки, чтобы модель поняла где и что распологается, и подобрать подходящий деноиз в имг2имг. После этого или вместо этого можно поебаться с инпеентами или аутпеентами. Или сегмент промтинг как анон сверху написал, я его не юзал, но там вроде выделяешь области и даёшь им разный промпт, по сути инпеент.
>>724629 >Чет разница минимальна на 50 шагах и cfg 4 . Ого, так я не тестил. А может поэтому под AYS хуперцфг плывет? Ну типа шедулер высчитывает оптимальный путь независимо от цфг.
>>724612 >в а1111 они не работают, или работают но не сразу, или работают но криво Например? Утечка памяти во первых фиксится за секунду, во вторых, чтобы ее заметить, нужно генерировать сидеть беспрерывно часа 3.
>>724647 >Например? Всякие семплеры новые, в основном. Заебался ждать и спрашивать как какую-то фишку из комфи в а1111 использовать. Плюс блогер Olivio Sarikas по комфи только гайды делает. Хач ваще с ума сошёл, от него тем более гайдов с новыми фишками на а1111 не дождёшься. Короче я бы и рад не соединять эти ёбаные квадратики, но...
>>724649 >Всякие семплеры новые, в основном. А в них какой-то смысл есть, кроме чисто технического любопытства посмотреть, че там новенького? Пока никаких прорывных технологий в этом плане не видно. Чтоб прям страдать без них.
>>724651 >А в них какой-то смысл есть, кроме чисто технического любопытства посмотреть, че там новенького? Бля, вопрос уровня "а зачем мне хавать белок, если я хожу делать силовые?". Ты без едм шедулера вообще пг2.5 не запустишь например. > Пока никаких прорывных технологий в этом плане не видно. Чтоб прям страдать без них. Конечно не видно, ты ж ни AYS, ни TCD, ни EDM не трогал, сидишь там со своими дпм++2м с каррасом и говоришь что нинужно. Только не говори, что ты на фукусе.
Лора имитирующая движение
Аноним03/05/24 Птн 15:44:24№724780390
Существует некий худ. приём при котором движущиеся предметы, части тела в частности специально блурятся, двоятся-троятся создавая иллюзию интенсивного движения в кадре.
>>724856 Пиздец че этот А1111 долбаеб курит раз SDXL Distilled не помещается 32 гб рам? И скорость у sd1.5 даже с xformers хуже чем в комфи. normalvram/medvram 512x512 комфи 2.09it/s (промпт) А1111 1.72it/s (пустой промпт)
>>724978 > ТП решила сделать фоточку для инсты Так и есть. >>724972 Но на фоне нихуя не петрович и она про него еще не знает, т.к. без вспышки не видно нихуя.
>>724995 Да. Поликарп Осипович Михалыч - пропал без вести за неделю до закрытия шахты в конце 19-го века. Мутная история короче, не стоит вскрывать. Но всякие тп теперь ходят фоткаться.
Извиняюсь я нуфак точнее за полтора года третий раз пытаюсь вкатиться после неуспехов Скажите про аткой момент по промтам - я заметил, что картина меняется, если слова переставлять местами, и вроде как ВАЖНО что в начале учитывается, и что в конце. То есть мне не показалось программа как художник рисует вначале общий скетч - позу, ракурс и композицию, затем лайн четче и черты всякие, потом ерндеры допиливает и т.п. Т.е. я правильно понял сперва надо прописывать позу, ракурс и действие (если это персонаж), затем черты персонажа, его одежду, а уж в конце стилистику, всякие теги гримдакр стиль, хай рез, кволити и т.п.?
Но если так, то как в паре с этим программа обрабатывает негативные промты? Там тоже надо порядок учитывать? И куда лучше прописывать лору - в начале или в конце?
А ещё я заметил, что если тег удаляшь, например зелёные глаза, и даже если их не было на пикче в рендерах, то пикча после этого изменится и надо писать чтоли на место удалённого тега какую-то пустую заглушку чтоб всё кардинально не менялось? Можно так?
>>720795 >Так как без фп8 на моих 6гб видеопамяти пони не заработает. В последней версии HyperSDXL (которая поддерживает высокие CFG) этот баг исправили и теперь можно на fp8 генерить.
Только я что-то не понимаю, оно вообще дает что-то, так как и без него можно генерить на 10 шагах + апскейл, кажется выдает почти такой же результат.
В общем хз, это плацебо или нет.
>>725028 >программа как художник рисует вначале общий скетч - позу, ракурс и композицию, затем лайн четче и черты всякие, потом ерндеры допиливает и т.п. нет
>>725028 >сперва надо прописывать позу, ракурс и действие (если это персонаж), затем черты персонажа, его одежду, а уж в конце стилистику, всякие теги гримдакр стиль, хай рез, кволити и т.п. не обязательно, но порядок слов влияет на их вес в промпте + каждое последующее слово влияет на предыдущие слова
>>725040 Что нет? Погоди ты же пишешь, что порядок слов влияет на последующие. Значит влияет всё-таки? А если какая-то модели выработанная у комунити что сперва значит надо писать? Я просто из-за этого думаю что всякие всратости происходят типо кривых пальцев и когда например лицо детализированное, а губы будто в пеинте нарисовали. Это так?
>>725028 В начале есть латентный шум из сида. С каждым шагом сетка пытается в шуме увидеть хоть чего-нибудь. CFG направляет это что-нибудь в сторону токенов (слов) в промпте. Все токены применяются одновременно. При этом у токенов разный вес - в начале промпта вес больше, в конце - меньше. Как-то так.
>>724638 >А может поэтому под AYS хуперцфг плывет? Скорее всего просто не укладывается математика в такие узкие рамки хупера. >Ну типа шедулер высчитывает оптимальный путь независимо от цфг. Нвидивцы так и пишут, что согласованность деталей на картинке должна быть лучше. И это вроде как даже работает. Но эффект прям совсем точечный, что надо присматриваться. Надо протестить с апскейлом.
>>725044 >Значит влияет всё-таки? У каждого слова есть свой вес и каждое слово влияет на результат. Также, слова влияют друг на друга, к примеру beautiful sky в конце промпта влияет на a young woman в начале промпта. При этом, все слова по умолчанию влияют на генерацию (но это не означает, что то, что ты описываешь ими будет сгенерировано).
>Я просто из-за этого думаю что всякие всратости происходят типо кривых пальцев и когда например лицо детализированное, а губы будто в пеинте нарисовали. Это так? То, чего небыло в датасете картинок для SD при его тренировке (или чего было недостаточно), не будет нормально генерироваться. Лица детализируются по количеству пискелей на одно лицо (в принципе все остальное тоже) и еще это зависит от дотренировки каждой кастомной модели (на что их тренировали вообще - реализм, аниме и т.д.) Самый простой способ увеличить качество лица - либо генерить на более высоком разрешении (затратно по времени), либо делать инпейнтинг only masked зоны лица на более высоком разрешении (быстро).
Поставил автоматик с злуда по гайду с ютюба Генерит 8 секунд 512х512, 15 секунд 512х768 (хайресфикс х2 вылетает с ошибкой под самый конец) Чета сделал не так, или 8гб амд недостаточно для 1024х1536? В целом разница ощутима, стало значительно быстрее по сравнению с тем что было раньше без этих злуда Мейби тут есть радеон господа у которых успешный успех и все получилось? В целом меня уже все устраивает, но хочется максимум из максимума возможностей. Дайте гайд где нажать одну кнопку и стало КРУТО Бтв в гайде сказали ниче не прописывать в батнике, но без --use-zluda отказывалось генерить и не надо мне говорить про нвидиа
>>725058 А кстати, про затрату времени - я заметил моя видюха при генерации вообще не шумит как в йоба играх, что как бы мне кажется всё генерируется либо на проце, либо не в полную силу как мне кажется и поэтому долго. Как это проверить генерируется видюхой в полную силу или нет?
>>725059 Примеры твоей скорости генерации очень туманны. Ты не указываешь, какой сэмплер используешь, от него зависит скорость. Сколько шагов генерации и какой у тебя cfg, соответственно, чем больше, тем медленее генерация.
rx6700xt с 12 гигами на борту. Лично у меня на sdxl моделе в разрешении 832x1216, при cfg=7, на DPM++ SDE Karras, при 25 шагах, примерно 1 минута 20 сек. Хайрез могу на 1.7 сделать, а дальше ловлю ошибку с нехваткой памяти.
Пробовал automatic1111, но с ним были постоянные ошибки с недостатком памяти, если генерировать в разрешений sdxl. Потом перешел на forge. С ним генерация стала стабильной.
Конечно скорость проигрвыает, если сравнивать с картами от зеленых. Но если нет других вариантов, то и так нормально. Для развлечения и теста промтов я использую lightning модели или лоры, если у необходимой модели нет лайтниг версии. Тогда можно уменьщить cfg и количество шагов. У меня получается выжать с приемлемым результатом на том же разрешении - 15-20 сек.
Для апскейла я использую скриптовый апскейил, который тайлит изображение. Там вообще можно скейлить до бесконечности, но со своими тонкостями.
>>724975 >32 гб рам На самом деле 24гб рам + 8гб подкачки. Но даже так в комфи я могу спокойно смотреть ютуб в браузере и генерировать пикчи на SSD-1B модели.
>>725089 Хуй знает, если умеешь питон читать, можешь репы автоматика посмотреть, может там где-то алгоритм написан (в sd_hijack_clip.py что-то про веса есть, но возможно это только те, что вручную выставляешь), или может в оригинальных репах Stability AI или CompVis есть. Разница не то, чтобы гигантская, перемещение hairty pussy меняет немного, а вот перемещение woman меняет дохуя. И это даже с нихуя CFG. И с увеличением CFG и длины промпта разница растет.
>>720590 (OP) Чем отличаются sd 1.5 и sdxl? По генерации тяночек примерно одно и тоже выходит, причем sd 1.5 даже лучше, но это можно списать что я больше к полторашке успел придрочиться
И ещё что за пони такая что ей дали отдельный тег и чем она от предыдущих двух отличается?
>>725357 >Чем отличаются sd 1.5 и sdxl? количеством параметров и возможностью генерить картинки выше разрешением >И ещё что за пони такая что ей дали отдельный тег и чем она от предыдущих двух отличается? натренированная с нуля нсфв иллюстративная модель на архитектуре сдхл без нсфв фильтров и широким набором фетишей >>725359 увеличивает/уменьшает вес токена
>>725396 Алсо нашел багулю с ним, если выставить в некоторых лоадерах -1 на клипскипе (а иногда там дефолт -1) то потом генерит шумы, и изменение клипа не помогает, так что осторожнее. Фиксится построением нового пайплайна или вроде релоадом модели на другую.
>>725116 768x768, cfg=7, на Euler A, 20 шагов, примерно 15-17 секунд, без злуды там генерило бы 30-40 сек, + сильно ограничивали в разрешении, даже меньше чем сейчас Делаю 512х768, а потом либо хайрез 1.3 / скразу скрипт два раза Для апскейла тоже юзаю ультимейт сд апскейл, но так и не понял зачем там в контрлнет подрубать tile, просто делаю по гайду
SDXL модели можно в автоматике юзать? Чем они координально отличаются? Тупа лучше и старые нет смысла уже юзать? Я один раз попробовал, но там вылетало и аж комп зависал. Мб вопрос странный, я просто из пещеры вылез
Аноны, а есть способ сначала проимпейнтить в 512х768, а потом уже хайрезфикс сделать? А то большие картинки долго импейнтятся... В тексттуимг есть кнопочка "криэйт апскейлед юзед хайресфикс параметрс"
>>725426 По ощущением отличается, в хайрезфиксе денойз 0.7 стоит и он почти не меняет картинку, а в имг2имг с таким денойзом сделает вообще другое, а с маленьким будет не так круто как хайрезфикс делает Ну или я чета не так тыкаю где то, мб есть какой то аналог хайрезфикса отдельным экстеншеном Помогите...
>>725428 Это потому что у тебя апскейлеры разные в хацрезе и имг2имг. В настройки зайди, поройся, там вроде менять это можно. Хотя я хз как он у тебя на 0.7 денойза картинку не меняет "почти", это огромный денойз нах.
Насколько глупая идея юзать хайрезфикс без апскейла (значение 1)? Что то то он делает, даже с пустым изначальным промтом как будто лучше становится, детали прорисовываются даже с мелким денойзом Генерирую 512х768, выбираю понравившуюся, потом жму хайрезфикс с х1, денойзом 0.3 и таким промпом "best quality, HDR, ultra detailed, detailed background", получаю на выходе пик 2, ну вроде лучше стало? Лицо потом в фш лучшее выбрать (без адетейлера делал) Потом несу в имг2имг и апскейлю скриптом два раза х2
>>725474 Делает, конечно. Он тебе картинку зашумливает, а потом из шума по новой рисует, что-то немного меняя в процессе. К качеству это отношения не имеет, ты себе какое-то плацебо выдумываешь.
>>725413 >SDXL модели можно в автоматике юзать? Да. >Чем они координально отличаются? От полторашек? Ну, очевидно, разрешением картинок на которых их тренировали. Если друг от друга, то каждый чекпоинт тренируют для разных вещей: есть универсальные, Джаггернаут например, он генерит много разных стилей и аниме, и фотореализм, и иллюстрации, в сайфай сеттинге, в фэнтези, в киберпанк, в средневековом сеттинге и т.д., а есть чекпоинты заточеные подо что-то конкретное, например под генерацию реалистичных сэлфи, или под аниметяночек с большими сиськами и письками.
какая моделька будет способна генерить в широкоформатном, чтобы в ней был один человек? Все модели, что пока использовал, генерят стабильно по 2 или даже по 5 человек в кадр. Хотя в промте четко написано, что 1human, 1woman, alone woman...и в негативе тоже прописал, чтобы не было больше двух и более.
Может я что-то не то делаю? Или не ту модель использую?
>>725543 SDXL должна уметь с таким разрешением работать.
SD 1.5 может работать нормально с разрешением до 768x768, дальше начинается дублирование объектов или мутации. Можно правда подключить hires от Kohya, чтобы во время семплинга происходил апскейл латента или просто генерить сначала на маленьком разрешении и апскейлить результат.
>>725186 >а вот перемещение woman меняет дохуя То что в начале промта имеет большую значимость. Ты запросил в первую очередь шерстяную киску, а в последнюю вуман - тебе и выдало шерстяную киску, в чём трабла?
>>725569 > То что в начале промта имеет большую значимость > в чём трабла? Без понятия, я так и написал изначально. > в начале промпта вес больше, в конце - меньше
>>725516 >Чета сделал не так, или 8гб амд недостаточно для 1024х1536?
Выше по треду чел на карте с 8гб генерит в комфе 1200х1800 типа полностью в видеопамяти говорит.
>Понял, пасиба. Тада не буду пробовать, я амуде Есть форк каломатика с директмлом уже, но ты можешь и комфи поднять под виндой на радевоне по тому же принципу что каломатик, комфи в любом случае не потребляет столько ресурсов и не настолько выебистый как каломатик.
>Чем они координально отличаются? Тупа лучше и старые нет смысла уже юзать? Больше параметров внутри архитектуры помещается -> больше разнообразие и точность, больше размер картиночек можно делать, оно и так полторахе дает пососать, но еще есть с нуля натрененные серьезные модели, которые еще больше дают пососать.
>на Euler A, 20 шагов Можно значительно уменьшить количество шагов и скорость увеличить, надо просто хупер/лцм/турбо/лайтнинг/дпо и кастомные семплеры с шедулерами юзать, я вот на 8 шагах все делаю теперь, генерация примерно 4-6 секунд на зеленой карте.
А вообще я бы на твоем месте перекатился под линукс (даже в виртуалку с пробросом карты просто можно попробовать), там амдшный rocm в полную силу нативно работает практически.
>>725641 >Впрочем, как обычно. В этом ты прав, шиза на секунду-другую высунулась и пизданула что-то нечленораздельное, а затем съебалась обратно в шкаф с проводами)
>>725186 >а вот перемещение woman меняет дохуя Токены woman/girl/man и так далее имеют огромный вес в модели, поэтому они влияют всегда в любом положении в промте. >Скажите про аткой момент по промтам - я заметил, что картина меняется, если слова переставлять местами, и вроде как ВАЖНО что в начале учитывается, и что в конце. У текущих сд нет концептуального трансформера и сд не понимает хуман лагвидж, поэтому сборка картинки из латента происходит только итеративным путем, где ты перечисляешь концепты через запятую и в зависимости от веса токена получается какая-то картинка собранная по пути сида шедулером. Есть всякие приколы конкретно в поломатике типа [token1:token2:step] которые имитируют концепт трансформинг, и теоретически при луне в седьмом доме можно получить из [pig:woman:0, где ноль рестарт концепта на каждом шаге] свиноженщину натуральную, но это такое себе, такую хуйню больше используют в качестве гайда на похожие концепты чтобы сд не теряла консистентность типа [woman:mature fat body:step]. Еще есть такой оператор как AND, который две генерации в одну соединять пытается при одном инференсе. Ну и оператор промт матрикс через | который типа тоже чето комбинирует. Кароче по дефолту сд берет все концепты которые ты перечислил в порядке слева-направо и ищет по латенту кал который удовлетворит весам токенов, и положение токена действительно влияет на его силу при инференсе, если конечно это супер базовый токен типа woman. Отсюда же проистекает прикол с пони, где в базе без скор тегов пони очень хорошо понимает концепты, но если добавлять скор теги в начале, то они имеют большую силу и позволяют игнорировать последующие теги, генерируя больше качество, чем то, что прописано после скор тегов; но если поставить наоборот скор теги в конец, то будет генерировать лучше то, что тебе требуется и пытаться отполировать скор тегами качества.
>>725654 >в шкаф с проводами) Бля братан, провода уже давно только у тебя в жопе, вон есть https://github.com/chrisgoringe/cg-use-everywhere и https://github.com/yolain/Comfyui-Easy-Use Если тебе конкретно нодовая структура не нравится, то вообще-то ноды это база. Нет ансрил енжина или нюки в реализации для дебилов фукусеров, весь проф софт имеет ноды на борту или плогены добавляющие ноды, потому что ноды это удобно и быстро.
>>725474 Вообще не глупая идея, по сути это тоже самое, что прогонять детали в img2img только без необходимости перетаскивать в img2img, даже если разрешения остается прежним ты можешь улучшать детали, считай рефайнер. Особенно интересно, если в настройках хайреза поставить галку где ты можешь выбрать другую модель и семплер для хайреза, то по сути можно из аниму моделей генерить аниму картинку прогонять реалистик моделью и получать 2.5D с хорошим качеством.
Для пони есть фотореалистичные модели? Пока нашел только ponyrealism и для заготовки оно норм, но потом приходится доделывать эпикреализмом, а для него нужно отдельную лору перса делать
>>725474 >Насколько глупая идея юзать хайрезфикс без апскейла (значение 1)? Не глупая. Это тоже самое что апскейл в тот же размер, давняя фишка, еще для инпеинта юзается чтобы убрать границы инпеинта.
>>725719 >Для пони есть фотореалистичные модели? Пони ретрейн на фото? Это сложно и никто не хочет заниматься, есть тестовый понипанг2 как показ возможностей пони и там на азиатках натренино. Есть еверклир, и еще пара типа ретрейнов. И есть еще мерджи с реалистиками (с тем же понипангом тоже) достаточно успешные я даже фоточки натуральные вытаскивал при цфг 0 и хупере оттуда, но оно так не контролируемо вообще. Все на цивитае лежит, кроме понипанга.
>>725726 Так я и не про скорость. У хупера/лайтнинга больше резкости по сравнению с базой ХЛ, в том числе пони. И хупер похоже тренировался в основном фотками, т.к. добавляет искомого тобой фотореализма в ponyrealism.
>>725735 >НАИ это платная хуйня, в которую бабла немеряно вложили Причём, которую ещё и слили незаконно. Кстати, как я понимаю, всякие миксы с ней (типа Anything, OrangeMix и т.д.) также являются незаконными?
>>725761 >Особенно, если тот, кто выкладывал модель, прямо описал, что с чем мешал. У новелаи есть тос, там только про их сервис. Тос на модель не было и нет, потому что модели в свободном доступе "не существует", следовательно состава преступления нету. Очевидно наи похуй, они уже с того момента триста раз ее перетренили и улучшили, а холопы пусть дальше ебутся с ранним чекпоинтом.
>>725765 А и кстати еще один момент. Наи базед на собственности стабилити, а у стабилити есть тос на базовую модель, и они по факту опенсурс если не получаешь с них дохода. Так что все схвачено.
>>725771 Причем тут программирование? Речь про граф/видео/композинг/3д софт, потому что сд это софт для графики по факту, везде ноды ебать, кроме исключительных моментов типа афтерэффекта, но где есть экстеншоны на ноды популярные.
Кстати, ещё вопрос: как относятся к дополнительным моделям (Lora и иже с ними), натренированных на датасетах, полученных не совсем честным путём (к примеру, на картинках, нагло слизанных из поисковой выдачи Google)?
анон выше по-делу написал: >>725727 >Это сложно и никто не хочет заниматься
куда важнее качество пикч, чем количество. лучше 500 отобранных и отредактированных вручную пикч, чем 5000 хуйни с фотостоков и автоматическими кэпшенами
>>725779 >Кстати, ещё вопрос: как относятся к дополнительным моделям (Lora и иже с ними), натренированных на датасетах, полученных не совсем честным путём (к примеру, на картинках, нагло слизанных из поисковой выдачи Google)? Терпимо в целом. Это можно же преподнести как научно-исследовательскую деятельность не направленную на получение выгоды.
Если брать конкретно кейс пиздинга, то автор картинки если сможет доказать что спиздили его картинку и использовали в датасете для обучения, то креатор модели типа должен в досудебное урегулирование лайоном или любой другой мокрописькой вычистить концепт. Судебной практики по такой хуйне кот наплакал, хуйдожникам по большей части похуй и лень ебаться с таким, но стабилити перестраховываются и обещают только легаси художников/фотографов юзать, который давно в гробах лежат.
Если использовались вообще незаконные изображения (ну ты понял какие например, какие в ранних чекпоинтах сд стабилити типа случайно юзали, типа процессоры в выдаче гугла лежат правда правда), то это обычно палится случайно (через ватермарки фоток и лого допустим помню был прецедент), ну и тогда модели/лоры удаляют оттуда где они лежат админы сервиса. Но опять же само по себе наличие концепта в латент спейсе лоры/модели это не наличие самих картинок, ножом тоже можно преступления совершать, но ножи не запрещают.