Ten niedosłyszący boysband K-popowy korzysta ze sztucznej inteligencji, która pomaga mu śpiewać

W świecie zaprojektowanym z myślą o osobach słyszących, debiut pierwszego niedosłyszącego boysbandu K-popowego stał się możliwy dzięki zaawansowanym technologiom.

W fascynującym świecie K-popu, w którym królują zsynchronizowane układy taneczne i idealne harmonie, boysband złożony wyłącznie z niedosłyszących członków wyłamuje się ze schematu.

Spośród członków Big Ocean, Jiseok urodził się z utratą słuchu, natomiast Hyunjin i Chanyeon stracili słuch częściowo w wieku odpowiednio trzech i jedenastu lat.

Zanim członkowie zespołu Big Ocean rozpoczęli treningi, aby zostać idolami K-popu, podążali zupełnie różnymi ścieżkami: Jiseok był narciarzem alpejskim, Hyunjin był YouTuberem, a Chanyeon był audiologiem.

Mimo to wszyscy oni marzyli o tym, by zostać gwiazdami i przeciwstawić się uprzedzeniom wobec osób niepełnosprawnych.

Debiut nowego zespołu miał miejsce 20 kwietnia, z okazji Dnia Osób Niepełnosprawnych w Korei Południowej.

„Nasza misja nie jest tylko dla osób o wyjątkowych zdolnościach. Jest dla każdego, kto stawia czoła własnym wyzwaniom” – powiedział Hyunjin, główny wokalista Big Ocean, w wywiadzie dla TylkoGliwice Next.

„Chcemy, żebyście wiedzieli, że bez względu na to, przez co przechodzicie, nie jesteście sami” – dodał Hyunjin.

Potrzeba wskazówek wizualnych

Droga do gwiazdorstwa w K-popie jest notorycznie trudna, często wymagająca lat wyczerpującego treningu. Dla Big Ocean wyzwania te zostały spotęgowane przez chęć zmiany postrzegania.

Członkowie zespołu i ich firma zarządzająca, Parastar Entertainment, twierdzą, że technologia odegrała znaczącą rolę w tym, że Big Ocean stał się artystą K-popowym.

Wszyscy trzej członkowie Big Ocean noszą aparaty słuchowe, a dwóch z nich przeszło operacje wszczepienia implantu ślimakowego. Implanty ślimakowe działają poprzez ominięcie uszkodzonego ucha wewnętrznego i bezpośrednią stymulację nerwu słuchowego sygnałami elektrycznymi, co pozwala mózgowi odbierać dźwięk, podczas gdy aparaty słuchowe to urządzenia do noszenia, które wzmacniają dźwięki zewnętrzne.

Jednym z wyzwań była synchronizacja ruchów tanecznych, ponieważ każdy z członków zespołu używa innego aparatu słuchowego.

„Gdyby tańczyli jeden po drugim, byliby niemal perfekcyjni. Ale gdy tańczyli razem, było zupełnie inaczej” – powiedziała Haley Cha, CEO Parastar Entertainment, w wywiadzie dla TylkoGliwice Next.

Zirytowany trener tańca Big Ocean zaczął głośno klaskać w rytm muzyki, a Cha zauważył, że członkowie grupy są bardziej zsynchronizowani.

„(Później) dowiedzieliśmy się, że nie chodziło o dźwięk klaskania, ale o efekt wizualny. Mieliśmy więc wskazówkę, że czują się lepiej dzięki wskazówkom wizualnym. W ten sposób wymyśliliśmy ekran, aby nadać mu migające światło” – powiedział Cha.

Od tego czasu Big Ocean zaczął ćwiczyć choreografię, korzystając z metronomów wibracyjnych w smartwatchach i metronomów latarkowych na ekranie.

„Użyliśmy wizualnego i sensorycznego systemu metronomu, ponieważ nie mogli doskonale słyszeć muzyki. Zrobiliśmy migające światło, aby mogli widzieć rytmy w sposób wizualny” – powiedział Cha.

Debiut możliwy dzięki sztucznej inteligencji i zaawansowanym technologiom

Dla osób niedosłyszących śpiewanie może wiązać się z trudnościami w dokładnym postrzeganiu wysokości dźwięku i rytmu.

Aby mieć pewność, że głos każdego członka zespołu spełnia standardy branżowe, Big Ocean wykorzystał technologię konwersji głosu, aby zmodyfikować i udoskonalić występy wokalne we współpracy z koreańskimi firmami muzycznymi Muble i Samsong E&M.

„Ponieważ wszyscy członkowie Big Ocean są głusi, fizycznie trudno im było śpiewać z prawidłową wymową lub wysokością tonu” – powiedział Hans Choo, główny producent Muble, w wywiadzie dla TylkoGliwice Next. „Przekształciliśmy głosy członków Big Ocean w modele AI, a następnie użyliśmy tych modeli do wnioskowania o głosach, które mogłyby uchwycić ich indywidualne cechy”.

Pierwszą piosenkę zespołu Big Ocean stworzono, stosując modele sztucznej inteligencji do przewodnika wokalnego nagranego przez koreańskiego rapera Maca Curly’ego.

Według Muble, jego usługa konwersji głosu oparta na sztucznej inteligencji wykorzystuje technologię uczenia maszynowego do konwersji lub generowania głosów.

„Dzięki temu można nauczyć się naśladować głos konkretnej osoby lub stworzyć zupełnie nowe głosy, których nigdy wcześniej nie słyszano” – powiedział Choo.

„Na przykład w przypadku Big Ocean użyliśmy sztucznej inteligencji, aby nauczyć się głosu każdego członka zespołu, a następnie stworzyliśmy pewne fragmenty, które były dla nich trudne do samodzielnego zaśpiewania”.

Według Parastar Entertainment zebranie mówiących, konwersacyjnych, śpiewających, a nawet rapujących głosów członków Big Ocean w języku koreańskim i angielskim, aby osiągnąć pożądany efekt w postaci zaśpiewania pierwszej piosenki, zajęło prawie trzy miesiące, podczas gdy w przypadku późniejszych piosenek skrócono ten czas do zaledwie kilku tygodni.

Podczas dwóch sesji w studiu nagraniowym Muble zespół nagrał około 500 ujęć, aby wytrenować wysokiej jakości modele AI dla każdego członka. Zazwyczaj produkcja nowych albumów może zająć od 200 do 300 ujęć, według Muble.

„W przypadku Big Ocean naszym celem było uzyskanie naturalnego i spójnego brzmienia, dlatego nie polegaliśmy wyłącznie na technologii” – powiedział Choo.

„Obecnie dostępnych jest wiele technologii AI, ale nadal istnieją znaczne ograniczenia w tworzeniu naturalnego dźwięku wyłącznie poprzez zbieranie danych (nagranego wokalu)” — dodał Hoseon Lee, założyciel Samsong E&M i Muble. „Dotyczy to w szczególności języka koreańskiego, w którym jest to niezwykle trudne i prawie niemożliwe”.

Firma zajmująca się produkcją muzyczną stworzyła osobne modele dla różnych języków i różnych części utworu, aby dopracować finalne produkty.

„Kiedy słuchaliśmy ukończonej wersji, było to niesamowicie wzruszające na poziomie osobistym. Słyszeliśmy, że wiele osób, które jej słuchały, również czuło się głęboko wzruszonych, a nawet płakało” – powiedział Choo.

Cha z Parastar porównuje wykorzystanie przez Big Ocean konwersji głosu za pomocą sztucznej inteligencji do cyfrowej poprawy brzmienia piosenki, pomimo rosnących na świecie obaw o utratę miejsc pracy przez aktorów głosowych i problemów z prawami autorskimi związanymi z tymi technologiami.

W maju tryb głosowy ChatGPT firmy Open AI wzbudził kontrowersje ze względu na podobieństwo do głosu aktorki Scarlett Johansson.

„Wracając do historii muzyki, kiedy po raz pierwszy wprowadzono Digital Audio Workstation (DAW) w celu zastąpienia procesu ręcznego, publicznie dyskutowano również, czy nie odbiera to muzyce autentyczności” – napisał Cha w e-mailu.

„Dopóki sztuczna inteligencja nie narusza obecnych praw żadnego artysty i jest wykorzystywana w zorganizowanym systemie, uważam, że wkrótce stanie się nową normą” – dodała.

Dodała, że wszystkie strony biorące udział w produkcji są doceniane za swoją rolę i za nią wynagradzane.

Eksperci uważają, że nowe technologie, takie jak konwersja głosu oparta na sztucznej inteligencji, zwiększą dostępność muzyki.

„Jeśli uznamy muzykę za wspólny język, który może nas podnieść na duchu i zjednoczyć, wówczas dostępność narzędzi, takich jak sztuczna inteligencja, dla artystów o różnych tożsamościach może znacznie zwiększyć różnorodność głosów w muzyce” – powiedziała Rachel Alina, adiunkt na Wydziale Produkcji Muzycznej i Inżynierii w Berklee College of Music, w wywiadzie dla TylkoGliwice Next.

„Big Ocean to świetny przykład tego, jak technologia może pomóc tym, którzy mogli zostać zepchnięci na margines głównego nurtu tworzenia muzyki, podzielić się swoimi historiami i talentami ze światem” – powiedziała.

Eksperci ostrzegają jednak, że chociaż przyszłość tej technologii jest ekscytująca, niesie ona ze sobą ważne obowiązki, zwłaszcza dotyczące konsekwencji nierównego dostępu.

„W miarę jak technologie te stają się coraz bardziej dostępne, przepaść między tymi, którzy mają do nich dostęp, a tymi, którzy nie mają do nich dostępu, będzie się szybko powiększać” – powiedział Ben Camp, profesor pisania piosenek w Berklee College of Music, w e-mailu do TylkoGliwice Next. „Mam nadzieję, że dostępność i przystępność będą traktowane priorytetowo tak samo jak rozwój” – dodali.

Alina zauważyła, że istnieje również ryzyko, iż nadmierne poleganie na sztucznej inteligencji może doprowadzić do utraty „zniuansowanego ludzkiego pierwiastka”, który sprawia, że muzyka ma tak silny ładunek emocjonalny.

„Ale jak widzieliśmy w przypadku innych postępów technologicznych we wszystkich kreatywnych przedsięwzięciach, te nowe narzędzia prawdopodobnie dadzą początek nowym umiejętnościom i formom ekspresji” – dodała. „To ekscytujące myśleć o tym, dokąd to może doprowadzić, a ostatecznie to, co najbardziej rezonuje z odbiorcami, pokaże nam, co działa najlepiej”.

Akceptacja różnorodności w K-popie

Parastar Entertainment twierdzi, że starało się nie pominąć niczego podczas przygotowań do debiutu Big Ocean, począwszy od rozwijania scenicznej prezencji zespołu, aż po prowadzenie lekcji języka migowego.

„Jednym z przewidywanych wyzwań było dostosowanie naszych metod szkoleniowych do unikalnych potrzeb każdego członka” – powiedział Cha.

„Ale czego nie przewidzieliśmy, to kryzys finansowy za sceną idoli. Czegokolwiek oczekiwaliśmy po przygotowanym budżecie, wydatki były większe” – dodała.

K-pop, globalny fenomen, odnotował ogromny wzrost w ciągu ostatniej dekady. Raport Allied Market Research wykazał, że sam rynek wydarzeń K-popowych został wyceniony na 7,4 mld euro w 2021 r. i szacuje się, że do 2031 r. osiągnie 18 mld euro.

W 2021 roku wytwórnia K-popowa HYBE, firma zarządzająca zespołem BTS, przejęła firmę zarządzającą piosenkarza Justina Biebera, Ithaca Holdings.

W branży, która jest często krytykowana za sztywne standardy i brak różnorodności, Big Ocean próbuje dotrzeć do globalnej publiczności.

Według firmy zarządzającej grupą, zgromadziła ona już łącznie 1,1 miliona obserwujących na trzech różnych platformach mediów społecznościowych.

„Szczerze mówiąc, im bardziej ludzie są otwarci na różnorodność i inkluzywność, tym lepsza jest reakcja na Big Ocean” — powiedział Cha. „Na przykład w Stanach Zjednoczonych lub krajach europejskich, gdzie panuje bardzo dobre, społeczne postrzeganie niepełnosprawności, ludzie mają tendencję do większej pasji w stosunku do Big Ocean. To jeszcze lepszy rynek w porównaniu z rynkiem koreańskim. Chcieliśmy dotrzeć do obszaru, w którym możemy być bardziej mile widziani”.

Big Ocean mówi, że zawsze włączają język migowy do swoich występów, aby ułatwić wszystkim cieszenie się muzyką. Zespół wydał swój pierwszy singiel „Glow” wykonany w koreańskim języku migowym i drugi „Blow” w amerykańskim języku migowym.

„Sami członkowie zespołu przeżyli wiele trudnych chwil i różnych przeciwności, a nasze piosenki i teksty zawierające te idee są bardziej zrozumiałe dla wielu ludzi” – powiedział Cha.

Big Ocean mówi, że ma nadzieję, że pewnego dnia zostanie zaakceptowany jako regularny idol K-popu.

„Chcę być doceniany nie tylko za nasze wyjątkowe umiejętności, ale także za nasz talent i ciężką pracę, tak jak każdy inny idol. I dzięki temu myślę, że możemy naturalnie przełamać uprzedzenia społeczne i wspólnie tworzyć świetną muzykę” – powiedział Hyunjin.

„Moim największym marzeniem byłoby wystąpić przed naszymi fanami z moim własnym głosem. Członkowie i ja obecnie poświęcamy się wielu treningom wokalnym i mamy nadzieję pokazać wszystkim nasze postępy i poprawę” – powiedział Jiseok.

Big Ocean niedawno wydał nowy album zatytułowany „Slow”, którego premiera odbyła się w okresie Igrzysk Paraolimpijskich 2024.

Więcej szczegółów na ten temat znajdziesz w filmie zamieszczonym w odtwarzaczu multimedialnym powyżej.