Redacción
La compañía de investigación e implementación de inteligencia artificial, OpenAI ha creado un nuevo programa llamado ‘Whisper’ para extraer texto de más de un millón de horas de videos de YouTube con el objetivo de proporcionar datos de entrenamiento para el modelo de generación de texto GPT-4, el modelo más avanzado disponible para el público, detalló el New York Times.
El equipo detrás de Whisper, liderado por el presidente de la compañía, Greg Brockman, se enfrentó a un debate interno sobre si la extracción de texto de los videos de YouTube violaba los términos y condiciones de uso de la plataforma propiedad de Google.
En 2021, OpenAI consideró la posibilidad de obtener datos de entrenamiento de YouTube, podcasts o audiolibros para mejorar sus modelos de generación de lenguaje, conocidos como LLM.
Neal Mohan, consejero ejecutivo de YouTube, declaró que si OpenAI utilizó videos de la plataforma para entrenar al modelo ‘Sora’ -que genera de vídeos realistas- estaría violando los términos de servicio.