Zatímco v zahraničí blokuje AI „crawlery“ zhruba polovina zpravodajských webů, české mediální domy jsou v této činnosti daleko benevolentnější. I tomu se věnuje hlavní téma MAM 13/2024, které mapuje, jak české redakce adoptují umělou inteligenci.
Patnáct nejnavštěvovanějších zpravodajských webů v deseti zemích analyzoval Reuters Institute, na top 100 amerických a britských stránek se zaměřila Press Gazette – konkrétně tedy na jejich URL stránky s koncovkou robots.txt. Bota společnosti OpenAI pro ChatGPT od shromažďují data z webových stránek k trénování modelu či získávání informací v reálném čase blokuje 48, respektive 52 procent webů.
Z šesti českých mediální domů, které poskytly odpovědi, tak činí jen TV Nova a v případě obsahu za paywallem také Economia. „Blokování má několik důvodů. Například některé zdroje, které využíváme, si nepřejí, aby byly jejich výstupy propojovány s umělou inteligencí,“ vysvětluje Vladimír Rosol, šéfredaktor zpravodajství na Nově. Ta „crawlery“ na webu Tn.cz vítá hláškou „Welcome, dear robots, but not all of you!“ a kromě bota ChatGPT se snaží znesnadnit práci i například chatbotu Claude AI.
Český rozhlas a Czech News Center/Active Radio ještě v blokování „škrábalů“ obsahu neučinily definitivní rozhodnutí. „Omezení v robots.txt jsou spíše prosbou, jak si přejeme, aby boti s našimi weby pracovaly, než že by jim to v činnosti bránilo. Efektivně to nejde zakázat,“ tvrdí Martina Říhová, CEO Active Radio i CNC.
To, které nástroje AI se dnes v českých redakcích využívají, jak se k umělé inteligenci staví novináři a na která rizika mediální domy v souvislosti s AI upozorňují, najdete v aktuálním vydání MAM a to zde.
