Kod

Przykłady zastosowań sieci neuronowych: jak tworzyć przerażające horrory za pomocą sztucznej inteligencji

Przykłady zastosowań sieci neuronowych: jak tworzyć przerażające horrory za pomocą sztucznej inteligencji

Jak szybko zarabiać w IT w 2025 Spróbuj swoich sił w różnych dziedzinach IT i zrób pierwszy krok w kierunku nowej, zdalnej kariery!

Dowiedz się więcej

Sztuczna inteligencja potrafi wiele: może prowadzić rozmowy, zapewniać opiekę medyczną, gotować posiłki, a nawet tworzyć zdjęcia kotów. Jednak, aby naprawdę przestraszyć lub zaskoczyć ludzi, potrzeba czegoś więcej niż tylko technologii; potrzeba kreatywnego podejścia i głębokiego zrozumienia psychologii. Nauczyliśmy się tego jako dzieci, zwłaszcza ci z nas, którzy spędzali czas na obozach letnich.

Naukowcy poczynili znaczne postępy w tworzeniu generatorów neuronowych, które generują niesamowite i przerażające obrazy. Zapraszamy w ekscytującą podróż przez najciemniejsze i najbardziej przerażające aspekty nauki o danych. Spodziewaj się momentów, które mogą wydawać się przerażające. Uważaj na swój stan emocjonalny.

W ciemnym jak smoła domu jest ciemny jak smoła pokój…

Cień za mną. Poczułem, jak czyjaś ręka chwyta mnie za kostkę i wciąga jeszcze głębiej w kurz. To mógłby być początek nowej, wciągającej historii Stephena Kinga. Jednak ten tekst jest dziełem sieci neuronowej. W świecie, w którym sztuczna inteligencja coraz częściej wykorzystuje środki literackie, granice między autorstwem ludzkim a maszynowym zacierają się. Sieci neuronowe potrafią tworzyć wciągające historie, prowokując dyskusje na temat przyszłości literatury i kreatywności.

Naukowcy z MIT Media Lab, specjalizujący się w sztucznej inteligencji, obchodzili Halloween w 2017 roku w oryginalny sposób. Na cześć tego święta zaprezentowali sieć neuronową Shelley, zaprojektowaną do tworzenia strasznych historii. Projekt nazwano na cześć Mary Shelley, słynnej autorki gotyckiej powieści „Frankenstein”. Sieć neuronowa Shelleya demonstruje potencjał sztucznej inteligencji w dziedzinie kreatywności i literatury, łącząc technologię i sztukę, aby tworzyć wyjątkowe treści, które mogą zainteresować fanów gatunku horroru.

Zdjęcie: MIT Technology Review

Aby zrealizować projekt, programiści zebrali zbiór danych 140 000 przerażających historii opublikowanych na Reddicie. W szczególności, w jednym z wątków dyskusji o nazwie NoSleep, użytkownicy dzielą się swoimi własnymi historiami grozy, przypominającymi te, które opowiadaliśmy znajomym w krótkie czerwcowe noce. Historie te stały się źródłem inspiracji dla wielu projektów twórczych i badań w dziedzinie literatury i psychologii strachu.

Do tych historii dodano dziesiątki kultowych powieści grozy, które stały się podstawą do wytrenowania sieci neuronowej Shelley. Wykorzystując algorytmy głębokiego uczenia maszynowego, sieć neuronowa nauczyła się analizować strukturę utworów grozy i odtwarzać charakterystyczne elementy podczas tworzenia nowych tekstów. Pozwala to Shelley generować unikalne historie, zachowując atmosferę i napięcie właściwe klasycznym utworom grozy.

Shelley, sztuczna inteligencja, nie jest jeszcze w stanie samodzielnie napisać powieści, a nawet opowiadania od początku do końca. W odpowiedzi opublikowano wiadomość na koncie @shelley_ai na Twitterze, gdzie każdy może pomóc sztucznej inteligencji w tworzeniu nowych horrorów. Ta inicjatywa łączy ludzką kreatywność z technologią, otwierając nowe horyzonty dla gatunku horroru. Użytkownicy mogą proponować pomysły i fabuły, dzięki czemu proces tworzenia jest wyjątkowy i interaktywny.

Współpraca twórcza między ludźmi a siecią neuronową przebiegała w następujący sposób. Najpierw sztuczna inteligencja Shelley wygenerowała krótki fragment tekstu o długości do 140 znaków, oznaczając go hashtagiem #yourturn. Następnie użytkownicy retweetowali ten fragment i sugerowali własne kontynuacje. Sieć neuronowa wybrała najodpowiedniejszą opcję i na jej podstawie wygenerowała kolejny fragment tekstu. Rezultatem był unikalny format „bouts-rimé”, inspirowany wizerunkiem Freddy'ego Kruegera. Ten proces pokazuje, jak współpraca człowieka i sztucznej inteligencji może prowadzić do kreatywnych i interesujących rezultatów.

Shelley pracowała przez około miesiąc, publikując nowe fragmenty tekstu co godzinę. Pinar Yanardag z MIT Media Lab zauważyła, że ​​kluczem do wydajności sztucznej inteligencji jest użycie wydajnych kart graficznych zarówno do trenowania sieci neuronowej, jak i jej późniejszego działania. Karty te zapewniają wysoką prędkość przetwarzania, umożliwiając sztucznej inteligencji generowanie materiałów tekstowych z większą wydajnością i jakością.

Shelley musi szybko reagować na sugestie użytkowników Twittera, dlatego szybkość jest kluczowym czynnikiem. Tę wydajność zapewniają karty graficzne NVIDIA Titan X, które umożliwiają przetwarzanie danych z wysoką wydajnością.

Współpraca między ludźmi a sztuczną inteligencją zaowocowała powstaniem ponad 450 wciągających i trzymających w napięciu historii, wymagających jedynie minimalnej korekty literackiej. Eksperci docenili wysoką jakość powstałych dzieł, z których wiele dorównuje twórczości współczesnych autorów horrorów. Historie te otwierają nowe horyzonty dla pisarzy i fanów gatunku, pokazując możliwości synergii między ludzką kreatywnością a technologią.

Historia, opracowana na podstawie tekstów wygenerowanych przez sieć neuronową Shelleya, jest wyjątkowym doświadczeniem w dziedzinie Sztuczna inteligencja i literatura. Sieć neuronowa Shelley, zaprojektowana do tworzenia dzieł literackich, jest w stanie generować oryginalne teksty, poruszające różnorodne tematy i gatunki. Teksty te świadczą zarówno o kreatywności, jak i o postępie technologicznym w przetwarzaniu języka naturalnego. Analiza dzieł Shelley otwiera nowe horyzonty dla zrozumienia interakcji między ludźmi a maszynami w dziedzinie kreatywności. Każdy wygenerowany tekst jest wynikiem złożonych algorytmów i analizy dużych ilości danych, co czyni go interesującym zarówno dla czytelników, jak i badaczy. Zastosowanie sieci neuronowych w literaturze stale poszerza naszą wiedzę na temat kreatywności we współczesnym świecie i oferuje nowe perspektywy dla przyszłych badań w tej dziedzinie.

W ciszy mojej sypialni nocą czułem narastający niepokój. Ogarnął mnie strach i nie wiedziałem, jak sobie z nim poradzić. Zdałem sobie sprawę, że ktoś mnie obserwuje, a w ciemności dostrzegłem niewyraźne kontury. Dreszcz przebiegł mi po kręgosłupie, potęgując uczucie niepokoju i niepewności.

Poczułem, że coś do mnie wyciąga rękę. Nikogo nie było w pobliżu, a stworzenie ledwo przypominało człowieka. Włosy miała związane w kok i owinięte zakrwawionym ręcznikiem. Twarz wykrzywiona ponurym grymasem, odzwierciedlającym strach i cierpienie. W tym momencie zdałam sobie sprawę, że znalazłam się w dziwnej i przerażającej sytuacji, gdzie każdy szczegół mógł mieć znaczenie.

Wyciągnęła zdjęcie z nieczytelnymi bazgrołami. Wyrwałam jej je z rąk. Było to zdjęcie mnie i nieznajomej kobiety. Nie mogłam jej rozpoznać.

Zamarłam ze strachu, niezdolna do poruszenia się ani wypowiedzenia słowa, mimo że we mnie szalała chęć krzyku o pomoc. Ogarnęła mnie panika, ale moje ciało ani drgnęło. Koc, pod którym leżałam, był przesiąknięty krwią, która powoli spływała mi po nogach. Poczułam zimny oddech na policzku, a całe moje ciało zadrżało z przerażenia.

Uszczypnęłam się i poczułam, jak coś dotyka moich ramion. Nagle ciemność spowiła moje oczy. Kiedy odzyskałam przytomność, znalazłam się w swoim łóżku. Leżąc tam, próbowałem przypomnieć sobie sen, który miałem przed utratą przytomności. Ten moment zapoczątkował moje refleksje nad tym, co dzieje się w świecie snów i jak wpływają one na nasze postrzeganie rzeczywistości. Sny bywają tajemnicze i czasem przerażające, ale zawsze pozostawiają ślad w naszej świadomości.

Oczywiście, chętnie pomogę. Proszę o podanie tekstu źródłowego, który wymaga edycji i optymalizacji pod kątem SEO.

Podczas realizacji projektu prawdopodobnie wykorzystano rozwiązania sprzętowe i programowe firmy NVIDIA. W szczególności wykorzystano bibliotekę głębokich sieci neuronowych NVIDIA CUDA (cuDNN), która znacząco zoptymalizowała procesy obliczeniowe i zwiększyła wydajność modeli. Wykorzystanie cuDNN zapewnia efektywne wykonywanie operacji wymaganych do trenowania i wnioskowania sieci neuronowych, co stanowi kluczowy aspekt pomyślnej implementacji projektu.

Shelley to unikalne połączenie wielowarstwowej rekurencyjnej sieci neuronowej i algorytmu uczenia się online. Takie podejście pozwala jej dostosowywać się i doskonalić swoje umiejętności w oparciu o opinie użytkowników. Im bardziej Shelley angażuje się w interakcję ze swoimi odbiorcami, tym lepsze i bardziej wciągające stają się jej historie. Dzięki ciągłemu uczeniu się i interakcji z ludźmi, Shelley jest w stanie tworzyć oryginalne i angażujące historie, co czyni ją wyjątkowym narzędziem dla miłośników literatury i kreatywności.

Pinar Yanardag jest głównym badaczem w MIT Media Lab. Jego praca koncentruje się na interakcji technologii ze społeczeństwem, analizując, jak nowe formaty mediów wpływają na zachowania i percepcję użytkowników. Yanardag aktywnie uczestniczy w opracowywaniu innowacyjnych rozwiązań mających na celu poprawę jakości życia za pomocą technologii. Jego badania obejmują szeroki zakres tematów, w tym kulturę cyfrową, media społecznościowe i etyczne aspekty technologii. MIT Media Lab, znane z nowatorskich pomysłów, zapewnia platformę dla takich badań i promuje rozwój interdyscyplinarnych podejść w przedsięwzięciach naukowych.

Badacze z MIT Media Lab wierzą, że Shelley stanie się podstawą przyszłych modeli sztucznej inteligencji zdolnych do generowania treści wywołujących określone emocje, takie jak strach. Ten rozwój może mieć znaczący wpływ nie tylko na literaturę i dziennikarstwo, ale także na marketing i reklamę, otwierając nowe perspektywy tworzenia treści o silnym ładunku emocjonalnym. Wykorzystanie sztucznej inteligencji w tych obszarach umożliwi skuteczniejsze angażowanie odbiorców i tworzenie niezapomnianych wrażeń.

Sztuczna inteligencja była mała, a Święty Mikołaj okazał się dziwny

Zainspirowani pracą swoich kolegów z dziedziny nauki o danych, dziennikarze z MIT Technology Review, Will Knight i Karen Hao, postanowili poeksperymentować z sieciami neuronowymi. Przed rokiem 2019 postawili sobie za cel wyszkolenie sztucznej inteligencji w tworzeniu oryginalnych fabuł do filmów świątecznych. Projekt ten nie tylko demonstruje możliwości nowoczesnej technologii, ale także otwiera nowe horyzonty dla kreatywnych treści w branży filmowej.

Aby osiągnąć ten cel, zebrali streszczenia 360 noworocznych hitów z Wikipedii i wczytali je do rekurencyjnej sieci neuronowej textgenrnn. Ta sieć neuronowa jest w stanie analizować i generować informacje tekstowe, co pozwala jej tworzyć nowe i oryginalne opisy w oparciu o istniejące dane dotyczące popularnych filmów noworocznych.

Po treningu sztuczna inteligencja wygenerowała liczne historie, ale większość z nich stanowiła niespójny bełkot zdań. Tylko kilka tekstów zawierało elementy zdrowego rozsądku, ale przypominały one bardziej fabułę horrorów niż lekkich komedii noworocznych. Historie te często wspominały o terrorystach, morderstwach i bójkach, co ewidentnie nie pasowało do świątecznej atmosfery.

Naukowcy, z którymi skontaktowali się Knight i Hao, wyjaśnili przyczyny niedociągnięć w swoim badaniu. Po pierwsze, zbiór danych składający się z 360 rekordów jest zbyt mały, aby w pełni wytrenować sieci neuronowe. Dla porównania, Shelley wykorzystała 140 000 przykładów, co znacznie zwiększa jakość generowania tekstu. Po drugie, sieci neuronowe, takie jak textgenrnn, nie są w stanie odpowiednio ocenić spójności fabuły w generowanych przez siebie długich tekstach. Twórcy Shelley'a częściowo rozwiązali ten problem, dzieląc opowieści na fragmenty i angażując użytkowników Twittera jako współautorów. Ta współpraca pomaga poprawić jakość generowanych treści i uczynić je bardziej spójnymi i logicznymi.

Sieć neuronowa tworzy każde kolejne słowo na podstawie prawdopodobieństwa jego wystąpienia po poprzednim. Proces ten można porównać do korzystania z technologii T9 podczas pisania tekstu. Wiąże się to z ryzykiem utraty logiki i spójności gramatycznej. Sieci neuronowe, mimo że potrafią generować tekst, często napotykają trudności w utrzymaniu spójnej i logicznej narracji, co może prowadzić do niejasnych i mylących rezultatów.

Karen Hao, dziennikarka MIT Technology Review, przedstawia wnikliwą analizę najnowszych trendów technologicznych i ich wpływu na społeczeństwo. Jej artykuły podkreślają kluczowe aspekty innowacji, badając, jak technologia kształtuje przyszłość. Hao koncentruje się na kwestiach etycznych i społecznych implikacjach związanych z rozwojem nowych technologii. Czytelnicy mogą oczekiwać rzetelnych danych i wnikliwych komentarzy, które pomogą im zrozumieć złożone współczesne problemy.

Knight i Hao poszli o krok dalej i postanowili wykorzystać sztuczną inteligencję do rozwiązania prostszego zadania: generowania tytułów do nowych filmów. W rezultacie sieć textgenrnn była w stanie wygenerować kilkadziesiąt oryginalnych tytułów, idealnych do noworocznych filmów akcji i horrorów. To odkrycie dowodzi potencjału sztucznej inteligencji w dziedzinach kreatywnych i jej zdolności do inspirowania nowych pomysłów w branży filmowej. Dziennikarze zidentyfikowali trzy kluczowe filmy: „To: Święty Mikołaj”, „Mila Świąteczna” i „Fight Christmas”. W ramach badania autorzy poprosili projektantów, którzy nie korzystają ze sztucznej inteligencji, o stworzenie plakatów do tych filmów. Podkreśla to znaczenie ludzkiej kreatywności w wizualnej prezentacji kina i jej rolę w promowaniu noworocznego tematu.

Plakaty filmowe z tytułami wymyślonymi przez sztuczną inteligencję Zdjęcie: MIT Technology Review
Plakaty filmowe z tytułami wymyślonymi przez sztuczną inteligencję Zdjęcie: MIT Technology Review
Plakaty filmowe z tytułami wymyślonymi przez sztuczną inteligencjęZdjęcie: MIT Technology Review

Maszyna grozy

Elon Musk, omawiając potencjalne zagrożenia ze strony technologii, zauważył, że rozwijając sztuczną inteligencję, ludzkość może stanąć w obliczu poważnych ryzyk. W odpowiedzi na jego ostrzeżenie, naukowcy z MIT Media Lab postanowili stworzyć projekt znany jako Nightmare Machine. To innowacyjne narzędzie ma na celu zbadanie granic sztucznej inteligencji i jej wpływu na społeczeństwo, podnosząc ważne pytania dotyczące bezpieczeństwa i etyki technologii.

Grupa naukowców pod kierownictwem profesora Iyada Rahwana, w ramach projektu Nightmare Machine, opracowała system sztucznej inteligencji zdolny do przekształcania zdjęć miast w przerażające, postapokaliptyczne krajobrazy. Twórcy twierdzą, że jest to pierwsza na świecie sztuczna inteligencja zaprojektowana w celu wywoływania u ludzi strachu. Projekt otwiera nowe horyzonty w badaniach nad emocjami i percepcją, pokazując, jak nowoczesne technologie mogą wpływać na ludzkie odczucia i postrzeganie rzeczywistości.

Amerykańscy naukowcy zastosowali algorytm Nightmare Machine do przetwarzania zdjęć znanych atrakcji turystycznych. Wśród nich znalazły się Wieża Eiffla, Statua Wolności, Tadż Mahal, Koloseum i Sobór Wasyla Błogosławionego w Moskwie. Algorytm stworzył osiem unikalnych wzorców „koszmaru”, z których każdy otrzymał zapadającą w pamięć nazwę: „Nawiedzony dom”, „Noc grozy”, „Rzeźnia”, „Toksyczne miasto”, „Miasto duchów”, „Piekło”, „Potwór z mackami” i „Inwazja obcych”. Wzorce te reprezentują zniekształcone i przerażające wersje znanych miejsc, oferując unikalną i niepokojącą perspektywę na znane atrakcje turystyczne. Badanie podkreśla, w jaki sposób technologia może zmienić nasze postrzeganie otaczającego nas świata i zmusić nas do eksploracji ukrytych aspektów znanych ikon kulturowych.

Animacja pokazująca krok po kroku działanie Nightmare Machine, na przykładzie zastosowania stylu „Nawiedzony dom” do zdjęcia Zamek Neuschwanstein (Niemcy). Źródło: MIT Media Lab

Nightmare Machine opiera się na technologii Neural Style Transfer (NST). Pierwszy udany algorytm NST został zaprezentowany w artykule naukowym z 2015 roku przez naukowców z Uniwersytetu w Tybindze w Niemczech. Pokazali oni, jak sztuczne sieci neuronowe mogą przekształcać zwykłe fotografie w dzieła sztuki stylizowane na dzieła takich mistrzów jak Van Gogh, Edvard Munch i Pablo Picasso. Technologia ta otwiera nowe horyzonty w dziedzinie sztuki cyfrowej, umożliwiając tworzenie unikalnych obrazów i inspirując artystów do nowych eksperymentów.

Twórcy projektu Nightmare Machine wykorzystali splotową sieć neuronową wykorzystującą algorytm Neural Style Transfer (NST). Dzięki swojej wielowarstwowej architekturze sieć ta skutecznie rozróżnia treść obrazu (co jest przedstawione) od jego stylu (jak jest przedstawione) podczas procesu uczenia. Umożliwia to tworzenie unikalnych efektów wizualnych poprzez łączenie elementów różnych stylów i przekształcanie w ten sposób oryginalnych obrazów w nowe dzieła sztuki.

Zewnętrzne warstwy sieci konwolucyjnej zawierają informacje o stylu rysunku, a głębsze są trenowane w celu oddzielenia istoty obrazu. Jeśli przepuścisz zdjęcie przez zewnętrzne warstwy sieci wytrenowanej na przykład na obrazach Van Gogha, obraz nabierze cech przypominających jego dzieła. Sieć neuronowa VGG-19 wykorzystana w badaniu składa się z 19 warstw. < ... Wykorzystanie niekonwencjonalnych źródeł danych poszerza horyzonty sztucznej inteligencji i otwiera nowe możliwości kreatywności i analizy.

Używamy algorytmów głębokiego uczenia, aby wytrenować sieć neuronową w rozpoznawaniu obrazów nawiedzonych domów, opuszczonych miast i krajobrazów zanieczyszczonych Toksyczne emisje. Algorytm analizuje obrazy treningowe, wyodrębniając elementy stylistyczne, takie jak ponura paleta kolorów, i przenosi je na zwykłe fotografie. Tworzy to unikalne efekty wizualne i poprawia zrozumienie różnych typów środowisk.

Pinar Yanardag jest głównym badaczem w MIT Media Lab. Jego badania koncentrują się na interakcji technologii i społeczeństwa, a także na wpływie technologii cyfrowych na życie codzienne. Yanardag aktywnie pracuje nad projektami, które badają, jak innowacje mogą zmienić sposób, w jaki postrzegamy informacje i wchodzimy z nimi w interakcje. Wkład Pinar w dziedzinę mediów i technologii nadal przyciąga uwagę naukowców i specjalistów, którzy chcą zrozumieć, jak dzisiejsze technologie kształtują przyszłość.

Czteroosobowy zespół Iyada Rahwana był w stanie opracować „Nightmare Machine” w zaledwie dwa tygodnie, wykorzystując istniejące technologie. To osiągnięcie podkreśla znaczenie wykorzystania istniejących technologii i rozwiązań w szybkim tworzeniu innowacyjnych projektów.

Wynik przetwarzania zdjęcia przez sieć neuronową Nightmare Machine: Koloseum („Potwór z mackami”). Zdjęcie: MIT Media Lab
Wynik przetwarzania zdjęcia przez sieć neuronową Nightmare Machine: Kapitol („Toksyczne Miasto”). Zdjęcie: MIT Media Lab
Wynik przetwarzania zdjęcia przez sieć neuronową Nightmare Machine: Tadż Mahal („Rzeźnia”). Zdjęcie: MIT Media Lab
Wynik przetwarzania zdjęcia przez sieć neuronową Nightmare Machine: Nowy Jork („Inwazja obcych”). Zdjęcie: MIT Media Lab
Wynik przetwarzania zdjęcia przez sieć neuronową Nightmare Machine: Palmyra („Miasto duchów”). Zdjęcie: MIT Media Lab
Wynik przetworzenia zdjęcia przez sieć neuronową Nightmare Machine: Wieża Eiffla („Fright Night”) Zdjęcie: MIT Media Lab

Zespół MIT Media Lab pod kierownictwem Rahwana kontynuował prace nad algorytmami Nightmare Machine w ramach nowego projektu o nazwie Deep Empathy. Celem tego projektu jest badanie i rozwój technologii, które ułatwiają interakcję emocjonalną i porozumienie między ludźmi za pośrednictwem platform cyfrowych. Wykorzystując algorytmy z poprzednich badań, zespół dąży do stworzenia narzędzi, które pomogą użytkownikom głębiej zrozumieć uczucia i doświadczenia innych, co stanowi kluczowy krok w rozwoju inteligencji emocjonalnej w erze cyfrowej.

W ramach tego projektu naukowcy wyszkolili sztuczną inteligencję, wykorzystując zdjęcia syryjskich miast zniszczonych przez wojnę domową. W rezultacie sieć neuronowa uzyskała zdolność do przenoszenia obrazów miast dotkniętych wojną na obrazy miast na całym świecie. Ten projekt podkreśla znaczenie wykorzystania sztucznej inteligencji do analizy i wizualizacji skutków konfliktów oraz lepszego zrozumienia skali zniszczeń i ich wpływu na środowisko miejskie.

Wykorzystując transfer stylu, algorytm Deep Empathy nasyca fotografię kwitnącego Bostonu w USA cechami zniszczonego syryjskiego miasta Homs. Zdjęcie: MIT Media Lab

Projekt ma na celu wzbudzenie empatii społecznej dla ofiar konfliktów zbrojnych. Specjaliści z MIT Media Lab wykorzystali sieć neuronową Deep Empathy do przetworzenia zdjęć takich miast jak Londyn, Paryż, Amsterdam, Boston i Moskwa. Zdjęcia te pozwalają mieszkańcom zamożnych miast zrozumieć skalę zniszczeń i cierpienia związanego z wojną. To innowacyjne podejście do wizualizacji pozwala na głębsze zrozumienie konsekwencji konfliktu i sprzyja większej empatii dla osób dotkniętych przemocą i zniszczeniem.

Projekt Deep Empathy został opracowany przy udziale UNICEF. Strona projektu zachęca widzów do przekazywania darowizn na rzecz inicjatyw ONZ mających na celu pomoc syryjskim dzieciom. Darowizny zostaną przekazane na projekty zapewniające dostęp do edukacji, opieki medycznej i podstawowych zasobów dzieciom dotkniętym konfliktem w Syrii. Twój wkład może znacząco odmienić życie tych dzieci i pomóc im odzyskać nadzieję na przyszłość.

Aby zwiększyć skuteczność sieci neuronowej, na stronie internetowej projektu uruchomiono ankietę, w której użytkownicy mogą wybrać jedno z dwóch zdjęć, które wywołuje u nich najsilniejszą reakcję emocjonalną. To podejście pozwala nam zbierać dane, które pomogą udoskonalić algorytmy przetwarzania obrazu i zwiększyć wydajność sztucznej inteligencji.

Zdjęcia ulic Amsterdamu, Bostonu i Londynu po przetworzeniu przez sieć neuronową Deep Empathy. Po lewej — widok oryginalny, po prawej — po dodaniu zniszczeń. Zdjęcie: MIT Media Lab
Zdjęcia ulic Amsterdamu, Bostonu i Londynu po przetworzeniu przez sieć neuronową Deep Empathy. Po lewej — widok oryginalny, po prawej — po dodaniu zniszczeń. Zdjęcie: MIT Media Lab
Zdjęcia ulic Amsterdamu, Bostonu i Londynu po przetworzeniu przez sieć neuronową Deep Empathy. Po lewej – widok oryginalny, po prawej – po dodaniu zniszczenia. Zdjęcie: MIT Media Lab

Jak kodować duchy i zombie

Studenci MIT Media Lab, Ziv Epstein i Matt Groh, kontynuując badania swoich starszych kolegów, opracowali sieć neuronową zdolną do generowania obrazów duchów. Obecnie technologia ta jest wykorzystywana wyłącznie do tworzenia fotografii.

Projekt, który początkowo był nieszkodliwą inicjatywą, został pomyślany przez Epsteina i Groha w celu stworzenia sztucznej inteligencji, która mogłaby usuwać pojedyncze osoby ze zdjęć i przywracać tło. Funkcja ta miała potencjał, aby być użyteczna dla tych, którzy chcieliby pozbyć się wizerunków przyjaciół i znajomych ze starych fotografii, z którymi relacje stały się napięte. Rozwój takiej sztucznej inteligencji otwiera nowe horyzonty w edycji obrazów, umożliwiając użytkownikom łatwą modyfikację wspomnień wizualnych, aby dopasować je do ich obecnego życia.

Program opracowany przez studentów okazał się mniej skuteczny, niż się spodziewali. Zamiast wyraźnych obrazów, w miejscu usuniętych obiektów pozostały jedynie rozmyte sylwetki. To skłoniło studentów do rozważenia wykorzystania sieci neuronowych do rozwiązania problemu odwrotnego – nie usuwania, a dodawania do obrazów rozmytych, widmowych postaci. W ten sposób otworzyli nowe horyzonty dla wykorzystania technologii przetwarzania obrazu, co może prowadzić do interesujących i kreatywnych rozwiązań w sztuce cyfrowej i projektowaniu.

Projekt „AI Spirits”, zaprezentowany przez Epsteina i Groha w 2018 roku, stanowił znaczący krok w dziedzinie sztucznej inteligencji i sztuki generatywnej. Wykorzystując generatywne sieci neuronowe, AI Spirits potrafi przetwarzać zdjęcia pustych krajobrazów – czy to wybrzeża, ciemnego lasu, czy pola pszenicy – ​​i dodawać humanoidalne sylwetki i cienie. Ten proces tworzy unikalne efekty wizualne, wywołując poczucie obecności i interakcji z przestrzenią. Projekt ilustruje potencjał sztucznej inteligencji (AI) w zakresie tworzenia nowych form sztuki i poszerzania granic postrzegania rzeczywistości.

Niektóre z duchów wygenerowanych przez sieć neuronową AI Spirits Źródło: MIT Media Lab
Niektóre z duchów wygenerowanych przez sieć neuronową AI Spirits Źródło: MIT Media Lab
Niektóre z duchów wygenerowanych przez sieć neuronową AI Spirits Źródło: MIT Media Lab

Po przeszkoleniu na bazie danych zawierającej około 5000 zdjęć ludzi, sztuczna inteligencja opanowała podstawowe zasady kompozycji stosowane przez profesjonalnych fotografów. Gra AI Spirits umieszcza duchy w miejscach, w których nasz mózg spodziewa się je zobaczyć, na przykład na leśnej ścieżce. Dzięki temu fantomy tworzone przez sieć neuronową są rzeczywiście w stanie wywołać strach i niepokój u widzów.

Model został wytrenowany poprzez porównywanie zdjęć ze zdjęciami ludzi i podobnymi zdjęciami, z których osoby te zostały usunięte za pomocą sztucznej inteligencji. Algorytm integruje „duchy” w oczekiwanych lokalizacjach, bazując na zrozumieniu standardowego rozmiaru i rozmieszczenia postaci ludzkich na obrazach. Sieć neuronowa nadaje tym „duszom” kolor i teksturę na podstawie otaczającego krajobrazu widocznego w pozostałej części fotografii. Tworzy to iluzję obecności, co może być przydatne w różnych dziedzinach, takich jak reklama, film i sztuka cyfrowa.

Matt Groh, badacz z MIT Media Lab, zwrócił uwagę na znaczenie innowacji w nowoczesnych technologiach. Jego badania koncentrują się na interakcji człowiek-komputer, która otwiera nowe horyzonty dla rozwoju doświadczenia użytkownika. Groh podkreśla, że ​​innowacyjne podejścia w tej dziedzinie mogą znacząco zmienić nasze postrzeganie technologii i jej wpływu na codzienne życie. Cytat z wywiadu na platformie Digg podkreśla jego dążenie do tworzenia bardziej intuicyjnych i przystępnych interfejsów, co jest szczególnie istotne w kontekście szybkiego postępu technologicznego.

Młodzi naukowcy zaprezentowali swój wynalazek, aby zademonstrować potencjał sztucznej inteligencji, który wielu wciąż niedocenia. Epstein i Groh zauważają, że sieci neuronowe, w trakcie treningu, są w stanie nabyć unikalne cechy natury ludzkiej, których nawet sami ludzie mogą nie być świadomi. To odkrycie podkreśla znaczenie sztucznej inteligencji w naszym społeczeństwie i jej zdolność do ujawniania ukrytych aspektów ludzkich zachowań.

Sztuczna inteligencja nie jest złowrogą siłą, ale jej możliwości mogą budzić obawy, zwłaszcza gdy otrzymuje niewłaściwe dane. Bez odpowiednich kontroli i nadzoru, korzystanie z modeli uczenia maszynowego może prowadzić do poważnych negatywnych konsekwencji. Ważne jest zrozumienie ryzyka związanego z wdrażaniem sztucznej inteligencji i opracowanie strategii zapewniających jej bezpieczne i etyczne wykorzystanie.

Matt Groh, badacz z MIT Media Lab, aktywnie bada nowe technologie i ich wpływ na społeczeństwo. Jego praca koncentruje się na interakcji człowiek-maszyna oraz sposobach poprawy doświadczeń użytkowników. Groh podkreśla znaczenie innowacji w mediach cyfrowych i ich potencjał w transformacji naszego podejścia do informacji i komunikacji. Badania prowadzone w MIT Media Lab mają na celu stworzenie bardziej intuicyjnych i dostępnych technologii, które mogą znacząco poprawić jakość życia.

Oprócz duchów, sieci neuronowe potrafią również tworzyć zombie. Jest to możliwe dzięki algorytmowi Nightmare Machine, opracowanemu w MIT Media Lab. Narzędzie to potrafi nadać przerażający styl nie tylko obrazom miast, ale także fotografiom ludzi, zamieniając ich w żywe trupy. To pokazuje, jak nowoczesne technologie mogą zmieniać postrzeganie rzeczywistości i tworzyć unikalne obrazy wizualne.

Aby wytrenować sztuczną inteligencję w tej złożonej umiejętności, naukowcy wykorzystali zdjęcia znanych osobistości. Sieć neuronowa została wytrenowana poprzez nałożenie na zdjęcia cech zombie. Naukowcy nie ujawnili jednak źródła, z którego uzyskali wymaganą liczbę zdjęć nieumarłych do wytrenowania sztucznej inteligencji. W niniejszym badaniu wykazano, w jaki sposób nowoczesne technologie łączą elementy sztuki i fikcji, otwierając nowe horyzonty w dziedzinie komputerowego widzenia i przetwarzania obrazu.

Sieć neuronowa Nightmare Machine była w stanie przekształcić Brada Pitta, Marilyn Monroe, Donalda Trumpa i Hillary Clinton a nawet zabawny Kermit Żaba z The Muppet ShowImage: MIT Media Lab
Sieć neuronowa Maszyny Koszmarów była w stanie zamienić Brada Pitta, Marilyn Monroe, Donalda Trumpa, Hillary Clinton, a nawet zabawnego Kermita Żabę z The Muppet ShowImage: MIT Media Lab
Sieć neuronowa Maszyny Koszmarów była w stanie zamienić Brada Pitta, Marilyn Monroe, Donalda Trumpa, Hillary Clinton, a nawet zabawnego Kermita Żabę z The Muppet ShowImage: MIT Media Lab
< Żaba z Muppet Show przemieniona w zombie. „The Muppet Show”Zdjęcie: MIT Media Lab
Sieć neuronowa Nightmare Machine była w stanie zamienić Brada Pitta, Marilyn Monroe, Donalda Trumpa, Hillary Clinton, a nawet zabawną żabę Kermita z „The Muppet Show” Sieć neuronowa „Maszyny koszmarów” była w stanie zamienić Brada Pitta, Marilyn Monroe, Donalda Trumpa, Hillary Clinton, a nawet zabawnego Kermita Żabę z „Muppet Show” Pokaż"Zdjęcie: MIT Media Lab

Programiści z MIT Media Lab, badając możliwości generatywnych sieci adwersaryjnych (GAN), opracowali unikalny model, opisany w artykule naukowym. Sieć ta nauczyła się tworzyć abstrakcyjne twarze, które po nałożeniu na nie zombie przypominają postacie z kultowych filmów George'a Romero, jakby uciekły ze swoich ponurych grobów, by zrobić sobie ostatnie selfie. Badanie pokazuje potencjał sieci GAN w dziedzinie generowania treści wizualnych i ich zastosowanie w sztuce i rozrywce.

Algorytm najpierw nauczył się, jak wygląda twarz, co zostało osiągnięte poprzez przetworzenie 100 000 obrazów twarzy sławnych osób. Następnie algorytm nauczył się samodzielnie generować nowe obrazy. Tworząc unikalne twarze, Nightmare Machine wykorzystuje specjalny algorytm, który pozwala mu „zombifikować” te twarze, imitując cechy prawdziwego zombie. To połączenie technologii i kreatywności otwiera nowe horyzonty w dziedzinie generowania obrazu i animacji.

Pinar Yanardag, czołowy badacz w MIT Media Lab, aktywnie bada nowoczesne technologie i ich wpływ na społeczeństwo. Jego praca obejmuje różne aspekty mediów, komunikacji cyfrowej i innowacyjnych rozwiązań, co czyni go ważną postacią w dziedzinie badań. Yanardag koncentruje się na tym, jak technologia może poprawić jakość życia i ułatwić zmiany społeczne. W ramach swoich badań analizuje interakcje człowieka z platformami cyfrowymi i ich wpływ na codzienne życie. MIT Media Lab, znane z nowatorskich rozwiązań, zapewnia platformę do wdrażania jego pomysłów i projektów.

Projekt wykorzystuje dwie sieci neuronowe. Pierwsza sieć odpowiada za generowanie realistycznych ludzkich twarzy, a druga przekształca te twarze w potwory. Dzięki takim technologiom możliwe jest tworzenie unikalnych i różnorodnych obrazów do różnych celów.

Naukowcy uruchomili system głosowania na stronie internetowej Nightmare Machine, umożliwiając każdemu udział w szkoleniu „Nightmare Machine”. Użytkownicy wybierają najstraszniejsze obrazy spośród dziesięciu, po czym otrzymują „nagrodę” w postaci 36 obrazów, które według sieci neuronowej mają największy wpływ na ich percepcję. Ten interaktywny udział pomaga udoskonalić algorytmy generowania szokujących treści i zapewnia głębsze zrozumienie, które obrazy wywołują silne emocje u widzów.

Wyniki głosowania odgrywają kluczową rolę w szkoleniu sieci neuronowej, przyczyniając się do tworzenia coraz bardziej realistycznych i imponujących obrazów. Każdy głos modyfikuje algorytm sztucznej inteligencji, kierując go w stronę określonych cech: zwiększenia liczby zębów, rozjaśnienia skóry lub przyciemnienia tła. W głosowaniu wzięło już udział ponad dwa miliony osób, co świadczy o wysokim poziomie zainteresowania i zaangażowania w rozwój tej technologii.

Czy projekty AI Spirits i Nightmare Machine mają praktyczne zastosowania? Ich twórcy twierdzą, że tak. Podkreślają, że prace te mają na celu nie tylko wywoływanie strachu, ale także realizację poważniejszych celów. Projekty te mają na celu zbadanie relacji między sztuczną inteligencją a ludzkimi emocjami, a także zbadanie granic percepcji. Twórcy wierzą, że takie eksperymenty mogą pogłębić nasze zrozumienie technologii i jej wpływu na społeczeństwo.

Badania koncentrowały się na powodach, dla których ludzie reagują strachem na określone obrazy. Zrozumienie tych czynników może odegrać znaczącą rolę w zmniejszeniu efektu doliny niesamowitości, który od lat nęka twórców robotów i sztucznej inteligencji. Problem ten ma znaczący wpływ na postrzeganie technologii i jej interakcji z ludźmi, co czyni go istotnym dla dalszych badań i zastosowań praktycznych.

Zjawisko doliny niepokoju jest od dawna badane przez naukowców. Opisuje uczucia strachu i obrzydzenia, których ludzie doświadczają podczas interakcji z robotami, które wyglądają niemal jak prawdziwi ludzie, ale mimo to wyraźnie się od nich różnią. Zastanawialiśmy się zatem, czy sztuczna inteligencja mogłaby celowo wywoływać podobne negatywne emocje, podobne do tych, których doświadczają widzowie oglądający horrory. Wyniki naszych badań dały jasną odpowiedź na to pytanie.

Pinar Yanardag jest głównym badaczem w MIT Media Lab. Jego badania koncentrują się na nowoczesnych technologiach i ich wpływie na społeczeństwo. Yanardag aktywnie pracuje nad projektami badającymi interakcje między ludźmi a technologią oraz ich rolę w kształtowaniu zmian kulturowych i społecznych. W MIT Media Lab wnosi znaczący wkład w rozwój innowacyjnych rozwiązań, które mogą poprawić jakość życia i dać użytkownikom poczucie sprawczości.

Uwaga: możesz mieć dziś trudności z zasypianiem. Ostrzegaliśmy Cię z wyprzedzeniem.

Czytaj również:

  • Kim jesteś?! Funkcje sieci neuronowych, które zaskoczyły nawet ich twórców
  • Zniszczenie Matrixa w zarodku: 7 argumentów za dyskusją z fanem AI
  • Czym jest uczenie maszynowe i czy warto się go uczyć?