El fabricante de chatgpt sospecha que se construyeron los modelos de AI profundos y baratos de China utilizando datos de OpenAI, y la ironía no se pierde en Internet

Feb 27,25

Operai sospecha que los modelos de AI profundos de China, significativamente más baratos que las contrapartes occidentales, pueden haber sido entrenados utilizando datos de OpenAI, generos de controversia y agitación del mercado. La aparición de Deepseek, y su modelo R1 específicamente, causaron una caída dramática en los precios de las acciones de las principales empresas relacionadas con la IA, con Nvidia experimentando su mayor pérdida de la historia de un solo día. Deepseek afirma que el bajo costo de capacitación de su modelo ($ 6 millones) y las necesidades computacionales reducidas se deben a su base de código abierto Deepseek-V3.

Este desarrollo ha generado preocupaciones sobre las inversiones masivas que las compañías tecnológicas estadounidenses están llegando a la IA, lo que provocó la aprehensión de los inversores. La popularidad de Deepseek, que rápidamente superó a los gráficos de descarga de la aplicación, alimentó aún más estas ansiedades. Operai y Microsoft están investigando si Deepseek violó los términos de servicio de OpenAI al emplear una técnica llamada "destilación", extrayendo datos de modelos más grandes para capacitar a los más pequeños, utilizando la API de OpenAI. Operai confirmó su conciencia de tales intentos por parte de los chinos y otras compañías de replicar modelos de IA de EE. UU. Y declaró su compromiso de proteger su propiedad intelectual.

El asesor de IA de Donald Trump, David Sacks, corroboró las sospechas de Openai, lo que sugiere que las acciones de Deepseek involucraron la extracción no autorizada de conocimiento de los modelos Operai. Anticipa que las principales compañías de IA implementarán medidas para evitar futuras instancias de destilación de datos.

La situación destaca una ironía significativa: OpenAi ha enfrentado acusaciones de usar material con derechos de autor sin autorización en el desarrollo de ChatGPT. Esta hipocresía se ha observado ampliamente en las redes sociales, con los críticos que señalan la afirmación previa de Openi de que crear herramientas de IA como ChatGPT sin material con derechos de autor es "imposible". Operai ha defendido sus prácticas, citando el uso extenso del material con derechos de autor según sea necesario para capacitar a grandes modelos de idiomas y argumentando que su uso constituye "uso justo". Este reclamo se está impugnando actualmente en las demandas presentadas por el New York Times y 17 autores, alegando infracción de derechos de autor. El paisaje legal que rodea los datos de capacitación de IA y los derechos de autor sigue siendo altamente disputado, particularmente a la luz de una decisión de la Oficina de Derechos de Autor de los Estados Unidos de 2018 de que el arte generado por IA no es elegible para la protección contra los derechos de autor.

Deepseek está acusado de usar el modelo de OpenAI para capacitar a su competidor utilizando la destilación. Crédito de la imagen: Andrey Rudakov/Bloomberg a través de Getty Images.

Las noticias más importantes
Más
Copyright © 2024 kuko.cc All rights reserved.