Погружение в 90е

Для ностальгирующих по эстетике 90х. После пары недель экспериментов с kohya_ss и подробом параметров зарелизил вторую версию LoRa для создания картинок в стиле фотографий на мыльницы со вспышкой. Скачать для экспериментов можно на Civitai. По сравнению с первой версией эту лору можно использовать с большей strength не ломая изображение. В последний заход потратил часов восемь на тренировку и около 80 эпох. По факту оказалось, что после 5-6 эпох LoRa уже сильно перетренирована, хотя Loss так и не достиг минимума и продолжал уменьшаться....

Controlnet для тг-бота pixelmuse

Добавил новую функцию для telegram-бота @pixelmuse_bot. Теперь на вход ему можно отправить кривой рисунок с командой в описании /imagine2 текст запроса и на выходе получить что-то осмысленное и даже красивое. Как это работает под капотом. Никакой магии, для управления нейросетью используем controlnet. Controlnet заставляет нейросеть использовать информацию о границах объектов как опору для создания нового изображения. После получения изображения от пользователя обрабатываем его с помощью cv2.Canny для определения краев. Тут пришлось поэксперементировать с параметрами чтобы края определялись в том числе на фотографиях, где переходы, например на лице, могут быть плавными, а потеря этих границ даёт модели слишком много свободы для творчества....

Красивая девушка с сухими цветами в волосах

Telegram-бот для создания изображений нейросетью

В общем, кому не хватало Midjourney у нас дома - добро пожаловать в @pixelmuse_bot. Что бот умеет на данный момент: Создавать картинки по текстовому запросу Используется автоматический машинный перевод текста на английский, поэтому запрос может быть практически на любом языке Можно выбрать из 5 моделей: реализм, аниме, киборги, sci-fi окружение, стикеры (по факту под капотом две модели + разные LoRa) Можно загрузить свою фотографию для обработки img2img Можно сделать апскейл результата x1....

Искусство и Stable Diffusion

Поэксперементировал с генерацией изображений нейросетью Stable Diffusion. Сеть умеет text-to-image - создавать изображения по текстовому описанию. Очень забавно. Выше мои попытки “нарисовать” что-то. Попробовать и посмотреть творчество других людей можно тут https://www.mage.space/ Сначала хотел написать, что нейросеть это не искусство, что это просто результат сложного бросания кубиков. Кроме того, сеть обучена на большом количестве фото, картин и рисунков разных авторов без их разрешения. С другой стороны, живые люди так же учатся глядя на картины, смотря фильмы, постановки которые были созданы кем-то другим, вдохновляются этим, подсматривают идеи и приёмы....

Прерафаэлиты

Газета.ру продолжает поставлять интересную информацию про живописцев. Сегодня узнал, что было такое направление во второй половине 19-го века в Англии, как прерафаэлиты. Создали его несколько отщепенцев от классической школы живописи. Довольно интересная история, хоть и короткая. Собственно название направление означает, что они брали пример с художников писавших до Рафаэля и Микеланджело, которых они считали основателями классицизма и академической школы. А привлекала их ранняя флорентийская живопись с её простотой. Ну вот, и тут мы подходим к одной из особенностей этого направления, к образу женщины....

Раку-яки

Раку-яки — это особый вид японской керамики, выполненной в духе ваби-саби (простота, ржавчина, скромность), короче эстетика дзен: неправильная форма чашки, подтёки глазури и трещинки. Традиционно используется в японских чайных церемониях. Википедия по этому поводу сообщает: “Ваби-саби трудно объяснить, используя западные понятия, но эту эстетику порой описывают как красоту того, что несовершенно, мимолётно или незаконченно. По сути, ваби-саби это понятие, характеризующие присущий японцам эстетический вкус, способность воспринимать прекрасное и предметы искусства в своём естестве, неподдельности и без излишеств....