Razem: 0,00 zł
Sztuczna inteligencja w ostatnich latach nie przestaje zaskakiwać. Przy jej pomocy można już nie tylko prowadzić zaawansowane analizy danych i próbować na tej podstawie przewidywać przyszłości, ale również tworzyć prawdziwe dzieła sztuki czy wymagające formy pisemne. Czym są i jakie możliwości niosą za sobą sieci generatywnych przewodników (GAN)? Gdzie znajdują dziś zastosowanie i jak zmieniają otaczającą nas rzeczywistość?
Czym jest sieć generatywnych sieci kontradyktoryjnych (GAN)?
Technologia sieci generatywnych przeciwników (ang. generative adversarial network), zwana też technologią generatywnych sieci kontradyktoryjnych lub generatywnych sieci współzawodniczących, wbrew pozorom nie jest niczym nowym. Powstała w 2014 roku, a jej pomysłodawcą jest informatyk i inżynier Ian Goodfellow oraz grupa jego kolegów. Sięgnęli oni po dwie niezależne głębokie sieci neuronowe, które następnie wykorzystali do generowania danych podobnych do tych, na jakich były trenowane. Idea GAN polega na tym, że obie sieci ze sobą rywalizują, jednak pojedynek wygrywa jedna z nich.
Źródło: https://stock.adobe.com/pl/images/big-data-technology-and-data-science-illustration-data-flow-concept-querying-analysing-visualizing-complex-information-neural-network-for-artificial-intelligence-data-mining-business-analytics/552748421?asset_id=552748421
Generative Adversarial Network – czym jest i jak działa?
Pierwsza z sieci neuronowych to tzw. generator. Jest ona zdolna do uczenia się i generowania obrazów czy dźwięków, które początkowo nie wyglądają lub nie brzmią realistycznie, jednak zmienia się to wraz z biegiem czasu i postępowaniem procesu uczenia się.
Jak długo trwa taki proces? O tym decyduje druga sieć neuronowa, czyli tzw. dyskryminator. Generator fałszuje rzeczywistość do momentu, gdy dyskryminator uzna, że stworzonego przez niego obrazu lub dźwięku nie sposób odróżnić od rzeczywistych dźwięków i obrazów. Na tym właśnie polega rywalizacja między głębokimi sieciami neuronowymi. Są one od siebie zależne i rywalizują na skuteczność działania. Pojedynek ten nie trwa jednak wiecznie. W momencie, gdy generator jest przeszkolony do tego stopnia, że jest w stanie oszukać dyskryminator, może on już działać bez dyskryminatora. Jest bowiem na tyle dobry, że można go skutecznie stosować do celu, do którego był trenowany.
Generator jest w stanie fałszować rzeczywistość na podstawie danych wejściowych, czyli przygotowanych dla niego zdjęć czy plików audio. Analizuje dane wejściowe i na tej podstawie próbuje wygenerować podobną do nich instancję. Dyskryminator dokonuje następnie jej weryfikacji. W jaki sposób? Działa analogicznie jak generator – on również jest trenowany na pewnych danych wejściowych (tj. rzeczywistych obrazach i plikach dźwiękowych) i na tej podstawie bada czy dostarczona mu instancja danych jest prawdziwa czy fałszywa. Wygrywa tak długo, jak długo generator nie jest w stanie go oszukać.
Jakie zastosowanie znajduje dziś generatywna sieć przeciwników?
Generatywna sieć przeciwników to technologia, która przy pierwszym kontakcie może wydawać się bardzo abstrakcyjna i trudna do osadzenia w otaczającej nas rzeczywistości. Okazuje się jednak, że wielu z nas miało już okazję korzystać z możliwości, jakie za sobą niesie. Mowa chociażby o popularnej swego czasu aplikacji FaceApp, która potrafi przerobić dostarczone zdjęcie zgodnie z życzeniami użytkownika – odmłodzić lub dodać lat, zmienić kolor oczu czy fryzurę, dodać zarost, wąsy itd. To właśnie dzięki rywalizującym ze sobą sieciom neuronowym efekt takiej transformacji jest niezwykle realistyczny.
Możliwości GAN, przedstawione obrazowo na przykładzie FaceApp, w dużej mierze odpowiadają na pytanie, gdzie i w jaki sposób można dziś stosować tę technologię. Doskonałym przykładem może być chociażby branża wnętrzarska. Tu również z pomocą telefonu i odpowiedniej aplikacji można sprawdzić, czy planowany kolor ścian pasuje do konkretnego pomieszczenia, czy wymarzona sofa odnajdzie się w salonie, a nawet czy całościowa aranżacja pomieszczenia w konkretnym stylu ma szansę spełnić nasze oczekiwania.
Technologia generatywnych sieci kontradyktoryjnych może również istotnie ułatwić pracę marketerów czy osób działających w branży e-commerce. W jaki sposób? W sprzedaży niezwykle istotną rolę odgrywa prezentacja towaru. Odpowiednie zdjęcia mogą skutecznie zwiększyć konwersję i wygenerować satysfakcjonujące obroty. Organizacja profesjonalnej sesje zdjęciowej czy kampanii wizerunkowej niesie jednak za sobą ogromne koszty. Co więcej, wymaga też czasu. I właśnie tu z pomocą przychodzi GAN. W zaledwie kilka chwil wygeneruje obrazy, na których całkowicie wyimaginowany model lub modelka będą prezentować oferowane w sklepie okulary, biżuterię czy akcesoria.
Sieci generatywnych przeciwników mogą zdziałać wiele również w obszarze muzyki czy kina. Za ich pomocą można tworzyć nie tylko realistyczne obrazy, ale również utwory muzyczne czy filmy. Problemem nie będzie również przeskalowanie starych gier wideo o niskiej rozdzielczości i przeniesienie ich na poziom, jakiego obecnie oczekują gracze. Spore możliwości zastosowania GAN dostrzega również szeroko rozumiana branża naukowa, medyczna czy przemysłowa. Technologia ta może bowiem skutecznie wspierać leczenie i diagnozowanie pacjentów, a także tworzyć zaawansowane modele 3D maszyn czy urządzeń.