La IA GPT de OpenAI bajo sospecha: más de la mitad de sus respuestas contienen plagios

A pesar de todas las ventajas que nos proponen los diferentes modelos de lenguaje y aplicaciones centradas en la IA, también están apareciendo ciertas preocupaciones en cuanto a su uso. Uno de los grandes problemas que muchos expertos apuntan, tienen algo que ver con el plagio de contenidos originales.
Ya sea a la hora de generar textos de forma automática, imágenes o incluso música, las fuentes que utilizan estas inteligencias artificiales ya existen. Esto quiere decir que utilizan como base de sus respuestas, contenidos generados en algún momento por otros en el pasado. De ahí precisamente la preocupación existente acerca de los plagios que se realicen en los resultados obtenidos de las diferentes IA.
De hecho, en un reciente estudio se ha podido demostrar gran parte de estos temores. El mismo llega de la mano de la empresa especializada en la detección de plagios Copyleaks. Pues bien, basándose en una serie de pruebas realizadas, se ha podido comprobar que alrededor del 60% de las respuestas generadas por el modelo GPT-3.5 de OpenAI contienen algún tipo de plagio. Este es un descubrimiento que ha puesto en el punto de mira a la popular Inteligencia Artificial generativa de la empresa.
Todo ello en un momento en un momento en el que todo tipo de creadores de contenido están empezando a llevar algunos casos a los tribunales. En realidad nos referimos al uso de esta tecnología por procesar material protegido por derechos de autor y reproducir copias exactas. Evidentemente y como hemos comentado antes, esto alcanza a todo tipo de contenidos.
Así son los plagios de GPT 3.5
Si ahondamos un poco más, la mencionada firma Copyleaks con amplia experiencia en el análisis de textos generados por IA, ha analizado miles de respuestas generadas por GPT-3.5. Los resultados muestran altas tasas de texto idéntico. Por ejemplo el estudio revela que el 45,7% de las respuestas contenían texto idéntico, mientras que el 27,4% presentaban algunos cambios.
Para ser más exactos, estas pruebas en busca de plagios se han llevado a cabo en múltiples áreas como la psicología, la tecnología, la física o el arte. De este modo y basándonos en los hallazgos comentados, OpenAI ha defendido sus modelos del lenguaje, como no podía ser de otro modo. La empresa menciona que los mismos se han entrenado para aprender conceptos y ayudar a resolver problemas.
Además, aseguran que estos modelos disponen de medidas para limitar la memorización y que sus términos de uso prohíben la copia directa de contenidos.
Y parece ser que todo esto no ha hecho más que empezar, ya que las tecnologías IA están en sus primeros pasos. De ahí que, para muchos, los creadores de contenido, las grandes tecnológicas implicadas y los legisladores deberían establecer una serie de directrices para llevar a cabo un uso responsable de la IA generativa. Cada vez hay una mayor preocupación respecto a la protección de los derechos de autor en este sentido.
Ahora se ha puesto la mira en el modelo de lenguaje de OpenAI GPT-3.5, pero es más que probable que casos similares se vean con otros modelos en meses venideros, algo para lo que se tendrán que tomar medidas.