Openai ujawnia Dall-e 3, generator obrazu oparty na Chatgpt, Dall-E 3: Fusion między Chatgpt a generowaniem obrazów, które wstrząsają Midjourney

Dall-E 3: Fuzja między Chatgpt a generowaniem obrazów, które wstrząsają Midjourney

Integrując Dall-E w Chatgpt, Openai wzmacnia swoją pozycję lidera w generatywnym świecie AI. Chatgpt i Dall-e 3 razem obiecują odstraszyć granice AI.

Openai ujawnia Dall-e 3, generator obrazu oparty na Chatgpt

Najnowsza wersja modelu jest oparta na GPT, aby ułatwić tworzenie złożonych i spójnych obrazów.

Openai, firma stojąca za niezbędnym GPT, właśnie ujawniła swój najnowszy jak dotąd model generatywny. I tym razem znowu obraz jest w centrum uwagi; Oddziały Sama Altmana ujawniły trzecią wersję generatora obrazu Dall-E. On obiecał Więcej odcieni, detali i złożoności.

Pierwszym punktem podkreślonym przez Openai jest dokładność podpowiedź. Nawet najlepsze generatory w tej chwili, takie jak Midjourney lub Dreamstudio, cierpią na wspólny problem: mają oni tendencja do ignorowania niektórych słów żądania tekstu.

Aby uzyskać najlepsze wyniki, jest to konieczne Empirycznie naucz się komunikować z algorytmem. Oznacza to dokonanie wielu testów na słownictwo i zwrócenie się do znalezienia tych, którzy najprawdopodobniej zostaną poprawnie interpretowani. Jest to ćwiczenie, które może być delikatne, gdy użytkownik czeka na bardzo konkretny wynik, stąd termin ” Szybka inżynieria »».

Chatgpt zmobilizowany do składu podpowiedź

Z Dall-e 3, Openai chce zakończyć ten stan rzeczy. „” Współczesne systemy tekstowe do obrazu mają tendencję do ignorowania słów lub opisów, które tworzą użytkownika, aby nauczyć. Dall-e 3 reprezentuje duży krok naprzód w naszej zdolności do generowania obrazów, które przylegają dokładnie do dostarczonego tekstu „Wskazuje firmę.

Aby to zrobić, firma ma już idealne narzędzie: Chatgpt. Nowa wersja modelu dyfuzji 3 to ” Natywnie zbudowane »Wokół chatbota. Teraz służy jako pośrednik Interpretuj każdy szczegół żądania. Model języka może również pomóc użytkownikowi generować podpowiedź niezwykle szczegółowe, aby Dall-e dokładnie rozumie, czego się od niego oczekuje, nie stosując technik Szybka inżynieria zaawansowany.

A jeśli początkowy wynik nie jest odpowiedni, że nie jest. Chatgpt wystarczy znowu, aby ubiegać się o precyzyjne zmiany pod względem koloru, kształtu, stylu, szczególnego szczegółu … Innymi słowy, Openai umieścił małe potrawy w dużych, aby zaoferować Maksymalny stopień kontroli z Minimum wysiłku i wiedzy technicznej.

Na przykładach zaproponowanych przez Openai należy również zauważyć, że Dall-E 3 jest w stanie generować spójne teksty. To jest coś, co do tej pory generatory obrazów miały wiele problemów. Na przykład najnowsza wersja Midjourney zawsze wytwarza wystarczająco … egzotyczne wyniki, gdy poproszono o zaangażowanie się w to ćwiczenie.

Chronić liczby publiczne

Firma nadal nałożyła szereg limitów na tę trzecią wersję. Na przykład inżynierowie skonsolidowali zabezpieczenia już obecne na Dall-E i Dall-E 2, które uniemożliwiają użytkownikowi generowanie treści ” brutalne, dorosłe lub nienawistne »».

Ponadto Dall-E 3 ma na celu odmowę wniosków o wyraźne wspomnienie o liczbie publicznej. Celem jest zapobieganie jej stosowaniu do celów propagandowych lub dezinformacyjnych.

Szanuj własność intelektualną

Innym ważnym punktem tej aktualizacji jest to, że Optai wydaje się odnotować wiele krytyków, które zostały skierowane do różnych generatorów obrazów na temat własności intelektualnej. Dall-e idzie Odrzuć prośby, które proszą go o naśladowanie stylu żywego artysty. To powinno zamknąć drzwi do licznych podrabianych prób.

Z drugiej strony ten system ochrony z pewnością będzie niedoskonały. Precyzja tej trzeciej wersji to miecz o podwójnie podsumowany. Teoretycznie wystarczająco spostrzegawczy użytkownik może zawsze uzyskać dość bliski wynik. Będziesz musiał po prostu być w stanie opisać styl ukierunkowanego artysty bardzo precyzyjnie bez wyraźnego nazwy.

Openai oferuje również dwa rozwiązania, które pozwalają artysty odmówić, że jego praca jest używana do szkolenia Dall-e. Pierwszym z nich jest wypełnienie formularza pod tym adresem. Ale jeśli chcesz chronić dużą liczbę, podobnie jak te, które trzymasz w portfolio online, ideałem jest zakaz dostępu do Crawler GPTBOT. Aby to zrobić, po prostu postępuj zgodnie z instrukcjami dostępnymi pod tym adresem.

To znacznie ograniczy zdolność Dall-E 3 do naśladowania przedmiotowych prac. Przynajmniej, jeśli nie zostały jeszcze przekazane do rolki. I niestety niemożliwe jest ustalenie w praktyce, ponieważ dane źródłowe nie są przechowywane po zintegrowaniu z modelem.

Dall-E3 zostanie oficjalnie uruchomione w październiku dla klientów ofert Chatgpt Plus i Chatgpt.

Dall-E 3: Fuzja między Chatgpt a generowaniem obrazów, które wstrząsają Midjourney

Openai, spółka macierzysta matki, nie jest już prezentowana. Po zaoferowaniu nam Chatgpt, teraz ogłasza zdolność tego ostatniego do generowania precyzyjnych zdjęć, dzięki połączeniu Dall-E i Chatgpt w Dall-E.

Frandroid, Dla tych, którzy obserwują, użyj narzędzia do generowania obrazu: Midjourney. Jeśli ten instrument okazał się potężny i innowacyjny w świecie generowania obrazów, Dall-E z Openai również był na torze, z równie imponującym kursem. I nowy opus Ryzyko Dall-E 3 Cóż, aby zmienić sytuację.

Według demonstracji udostępnionych przez Openai jasne jest, że Dall-E 3 odróżnia się od swoich poprzedników i konkurentów. Gdzie Midjourney przoduje w restytucji fotorealistycznej, ale nadal wymaga wielu manipulacji, Dall-e 3 obiecuje znacznie bardziej wydajne i mniej błędne generowanie obrazu. Znaczący wyczyn, zwłaszcza biorąc pod uwagę fakt, że jest to poważny postęp w porównaniu z Dall-e.

Ponadto to nowe narzędzie wydaje się opracować szczególne kompetencje do zarządzania tekstem na obrazach, przekraczając zdolności niektórych jego konkurentów, takich jak stabilna dyfuzja XL i Deepfloyd. W szczególności Openai podkreśla jej zdolność do tworzenia przekonujących obrazów liter, postaci, a nawet ludzkich rąk (prawdziwa trudność dla tych narzędzi).

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Dall-e 3 // Źródło: Openai

Integrując Dall-E w Chatgpt, Openai wzmacnia swoją pozycję lidera w generatywnym świecie AI. Chatgpt i Dall-e 3 razem obiecują odstraszyć granice AI.

Chatboty będą nie tylko rozmawiać w prawie ludzki sposób, ale także wyobrażać sobie i tworzyć obrazy z prostych opisów. Nie możemy się doczekać, aby przetestować.

Jeśli chcesz przetestować Dall-E 3, będzie on dostępny dla użytkowników Chatgpt Plus i Enterprise. Co jest o wiele łatwiejsze w użyciu niż Midjourney … gdzie potrzebujesz klienta niezgody.

Chatgpt

Do kogo wygenerowały obrazy ?

Pytanie o prawa autorskie powiązane z obrazami wygenerowanymi przez AI jest obecnie gorącym tematem. Obecne przepisy sugerują, że obrazy IA wchodzą do domeny publicznej. Jednak Openai wyraźnie oświadcza, że ​​własność obrazów wyprodukowanych przez Dall-e 3 powraca do swoich twórców. I to kolejna debata w sektorze.

Bing Cat ma również prawo do Dall-e 3

W czwartek, 21 września, Microsoft odbył konferencję, aby ogłosić następne przybycie Copilota, ale także nową zasięg powierzchni. Równolegle firma przekazała po przybyciu modelu Dall-E 3 w Bing Image Creator. Przypomnienie, jest to narzędzie do tworzenia zdjęć bing. Według Microsoft, Bing Image Creator ” Rozumie również, o co prosisz, co pozwala uzyskać bardziej precyzyjne obrazy. »»

Microsoft mówi również, że idź dalej, dodając ” Cyfrowy znak wodny niewidoczny dla wszystkich obrazów generowanych przez sztuczną inteligencję w Bing, w tym godzinę i datę ich stworzenia. „Trudno wiedzieć, jak potężny będzie ten znak wodny, ani jak możemy sprawdzić jego obecność, czy nie, ale jest to pierwszy krok.

Aby nas śledzić, zapraszamy do pobrania naszej aplikacji na Androida i iOS. Możesz przeczytać nasze artykuły, pliki i oglądać nasze najnowsze filmy z YouTube.