Generatywny model wideo Google Veo 3 ma problem z napisami
Gdy tylko Google uruchomił swój najnowszy model AI generujący wideo pod koniec maja, kreacje rzuciły się, by przejąć go w kroku. Wydany zaledwie kilka miesięcy po swoim poprzedniku, Veo 3 pozwala użytkownikom po raz pierwszy generować dźwięki i dialog. Wywołało to mnóstwo hiperrealistycznych ośmiosekundowych klipów zszytych w reklamę, filmy ASMR, wyobrażone zwiastuny filmowe i humorystyczne wywiady uliczne.
Ale inni szybko odkryli, że pod pewnymi względami narzędzie nie zachowało się zgodnie z oczekiwaniami. Kiedy generuje klipy, które obejmują dialog, Veo 3 często dodaje bezsensowne, zniekształcone napisy, nawet gdy podpowiedzi zostały wyraźnie podane, proszą o brak podpisów lub napisów. A pozbycie się ich nie jest proste – lub tanie. Przeczytaj całą historię.
—Rhiannon Williams
MIT Technology Review Opowiadano: Ten meta metal ziem rzadkich pokazuje nam przyszłość zasobów naszej planety
Jesteśmy w trakcie potencjalnie transformacyjnego momentu. Materiały, których potrzebujemy do zasilania naszego świata, zaczynają przesuwać się z paliw kopalnych na źródła energii, które nie wytwarzają emisji gazu cieplarnianego zmieniającego nasz klimat. Metale odkryte zaledwie ponad sto lat temu obecnie leżą u podstaw technologii, na których polegamy na czystszej energii, a brak ich wystarczającej ilości może spowolnić postęp.
Weźmy na przykład neodym. Jego potencjalna przyszłość ujawnia wiele wyzwań, przed którymi prawdopodobnie staną się łańcuch dostaw materiałów w nadchodzącym stuleciu i poza nią.
To nasza najnowsza historia, która zostanie przekształcona w opowiadany podcast z recenzji technologii MIT, który publikujemy co tydzień na podcastach Spotify i Apple. Po prostu przejdź do recenzji technologii MIT opowiadanej na obu platformie i śledź nas, aby uzyskać wszystkie nasze nowe treści podczas jej wydania.
