Od Midjourney do DALL·E 2: To najlepsze generatory obrazów AI

Możliwości narzędzi do generowania obrazów sztucznej inteligencji (AI) rosną w zastraszającym tempie. Są to jedne z najlepszych na rynku.

Jeśli rok 2023 ma jakieś ostateczne modne hasło, musi to być „generatywna sztuczna inteligencja”.

Eksplozja zainteresowania chatbotem ChatGPT OpenAI przygotowała grunt pod rok, w którym miliony ludzi po raz pierwszy zaczęły korzystać z generatywnych narzędzi AI.

Chociaż za pomocą prostych podpowiedzi tekstowych można wygenerować całe artykuły lub prace egzaminacyjne, podpowiedzi tekstowe można również wykorzystać do wygenerowania obrazów. Pojawiło się wiele platform, które pozwalają użytkownikom tworzyć dzieła sztuki, plakaty, logo, prezentacje i fotorealistyczne obrazy, karmiąc ich zaledwie kilkoma słowami.

Mogą to zrobić dzięki uczeniu maszynowemu. Sieci neuronowe trenują na ogromnych zbiorach danych, ucząc się identyfikować wzorce i cechy na obrazach. Następnie algorytm wykorzystuje zdobytą wiedzę do przewidywania, czego szuka zachęta tekstowa.

Przyjrzymy się niektórym z najpopularniejszych dostępnych obecnie narzędzi do generowania obrazów. Przed przystąpieniem do korzystania z platform warto zwrócić uwagę na sytuację dotyczącą praw autorskich do obrazów generowanych przez sztuczną inteligencję. Toczy się już wiele procesów sądowych, w których artyści domagają się odszkodowania od firm, których platformy AI zostały, ich zdaniem, przeszkolone w oparciu o ich materiały chronione prawem autorskim.

Rzućmy okiem na pięć najlepszych dostępnych obecnie generatorów obrazów.

W połowie podróży

Podpowiedź: „Mag mocy rzucający zaklęcie”

Midjourney, jeden z pierwszych generatorów obrazów AI, który odniósł ogromny sukces, przyciągnął na swoją platformę miliony użytkowników, którzy byli zachwyceni jego możliwościami i zwabieni bezpłatną wersją próbną.

Ta bezpłatna wersja próbna już nie istnieje, więc aby wypróbować ją samodzielnie, musisz teraz zapłacić za subskrypcję, a ceny zaczynają się od 8 USD (9,33 EUR) miesięcznie.

Proces ten może być skomplikowany, ponieważ działa poprzez Discord, a nie samodzielną platformę. Metodą prób i błędów lub biorąc lekcje z licznych przewodników dostępnych w Internecie, szybko przekonasz się, jak potężna jest Midjourney, tworząc według własnego uznania fotorealistyczne obrazy, grafiki, kreskówki i szkice.

Nic dziwnego, że ma już ponad 15 milionów użytkowników.

DALL·E 2

Podpowiedź: „Malowanie samolotu startującego o zmierzchu w stylu Vincenta van Gogha”.

Kolejnym popularnym narzędziem do tworzenia obrazów jest DALL·E 2 autorstwa firmy stojącej za niezwykle popularnym ChatGPT.

Użytkownicy mogą generować wiele obrazów w ramach bezpłatnego planu i będą musieli zarejestrować się w płatnym planie, aby móc to zrobić zbiorczo. Platforma może pochwalić się milionami użytkowników, chociaż nie wydaje się działać tak dobrze, jak Midjourney w przypadku obrazów w stylu fotorealistycznym. To, w czym się specjalizuje, to dzieła sztuki, z talentem do kopiowania stylu znanych malarzy.

I tak jak GPT-4 OpenAI obsługuje chatbota AI wyszukiwarki Microsoft Bing, tak DALL·E 2 obsługuje także narzędzie do generowania obrazów Bing.

DreamStudio (stabilna dyfuzja)

Podpowiedź: „Kubek parującej herbaty na rustykalnym drewnianym stole. W tle za oknem widać drzewa”.

Kolejny z wczesnych hitów, Stable Diffusion to popularny model generowania obrazu z bezpłatnym narzędziem w przeglądarce internetowej. DreamStudio korzysta z modelu Stable Diffusion i posiada szereg opcji oraz profesjonalny interfejs użytkownika.

Kiedy się zarejestrujesz, otrzymasz określoną liczbę darmowych kredytów, a następnie będziesz musiał zapłacić, aby je uzupełnić. Wyniki są imponujące, zwłaszcza przy generowaniu ludzkich twarzy – choć podobnie jak wszystkie te generatory obrazów, wydaje się, że ma on szczególny problem z ludzkimi rękami.

Sen autorstwa WOMBO

Podpowiedź: „Obca stacja kosmiczna”

Nastawiony na generowanie dzieł sztuki, podobnie jak inne platformy, wystarczy wpisać prosty tekst, a wyświetli się obraz wymyślony przez algorytmy. Jak sama nazwa wskazuje, tworzone przez niego obrazy są nieco oniryczne, z abstrakcyjnymi i często przerażającymi wynikami.

Dziesiątki stylów artystycznych do wyboru (w tym takie jak „bad trip” czy „steampunk”) to prawdziwy plac zabaw dla twórczości artystycznej. Jest dostępny jako aplikacja internetowa i aplikacja mobilna.

Canva

Podpowiedź: „Mężczyzna jadący supersamochodem drogą z Wieżą Eiffla w tle.”

Popularna platforma do projektowania graficznego, która jest w dużej mierze wykorzystywana do tworzenia postów i prezentacji w mediach społecznościowych, wkroczyła w generatywną sztuczną inteligencję obiema nogami.

Umieściliśmy ten program na szczególną uwagę, ponieważ jego możliwości w zakresie generowania wyżej wymienionych typów multimediów są naprawdę imponujące. Posiada również bezpłatną sztuczną inteligencję do tworzenia obrazów, która jest obecnie być może nieco mniej wyrafinowana.

Ma dość rygorystyczne zasady dotyczące typów obrazów, które będzie tworzyć.

Na przykład nie chciał przedstawiać Emmanuela Macrona jadącego Ferrari po Polach Elizejskich, więc zamiast tego musieliśmy zadowolić się „mężczyzną jadącym supersamochodem drogą z Wieżą Eiffla w tle”.

Wygląda na to, że jest on wciąż w fazie prac.