Na obzoru může být právní bitva gigantů. Ač Google zatím vysílá směrem ke společnosti OpenAI poněkud nesmělé signály, jejich sdělení je jasné: jestli trénujete modely, jako jsou Sora a Whisper, na obsahu z YouTube, tak toho okamžitě nechte.
Na začátku byla neschopnost ředitelky OpenAI pro technologie Miry Murati odpovědět v rozhovoru s The Wall Street Journal na otázku, na jakých datech společnost trénuje svůj „text-to-video“ model Sora. „Používáme veřejně dostupná a licencovaná data,“ odpověděla. „Takže videa z YouTube?“ reagoval moderátor. „No, vlastně si tím nejsem jistá,“ odvětila.
Podle aktuálního vyjádření CEO YouTube Neala Mohana pro Bloomberg si ani v Googlu nejsou jistí tím, zda OpenAI zneužívá jejich obsah pro trénování generativní AI. Pokud tak ale činí, bylo by to podle něj jasné porušení pravidel platformy. „Tvůrce, který si k nám nahraje obsah, má nějaká očekávání. A jedním z nich je to, že budou dodržovány podmínky služby. Že nedojde k věcem, jako jsou transkripty nebo stahování částí videí,“ uvedl Mohan a dodal, že Google na videích trénuje svůj model Gemini, ale jen když to jejich tvůrci smluvně umožní.
Nejde však jen o generátor videí Sora. Deník The New York Times, který koncem minulého roku OpenAI žaloval kvůli porušování autorských práv, přišel o víkendu se zjištěním, že technologická společnost využila přes milion hodin obsahu na YouTube, aby na něm trénovala transkripční model Whisper. Zástupci OpenAI měli vědět, že to je právně sporné, nicméně to nakonec posoudili jako férové užití obsahu. Podle Times se na shromažďování videí měl osobně podílet i prezident OpenAI Greg Brockman.
„Google provádí technická a právní opatření, aby takovému neoprávněnému použití zabránil, a to pokud k tomu má jasný právní nebo technický důvod,“ uvedl mluvčí společnosti Matt Bryant pro The Verge.