Chatgpt Maker soupçonne que les modèles de l'IA profonde de terre chinoise pas cher ont été construits à l'aide de données Openai - et l'ironie n'est pas perdue sur Internet

Feb 27,25

OpenAI soupçonne que les modèles d'IA profonde de la Chine, nettement moins chers que les homologues occidentaux, peuvent avoir été formés à l'aide de données OpenAI, déclenchant la controverse et les troubles du marché. L'émergence de Deepseek, et son modèle R1 spécifiquement, a provoqué une baisse spectaculaire des cours des actions des grandes sociétés liées à l'IA, NVIDIA subissant sa plus forte perte d'une journée de l'histoire. Deepseek affirme que le faible coût de formation de son modèle (6 millions de dollars) et les besoins de calcul réduits sont dus à sa fondation Open source Deepseek-V3.

Cette évolution a soulevé des préoccupations concernant les investissements massifs que les entreprises technologiques américaines affluent dans l'IA, ce qui invite à l'appréhension des investisseurs. La popularité de Deepseek, qui nous a rapidement dépassé les graphiques de téléchargement d'applications, a encore alimenté ces angoisses. OpenAI et Microsoft étudient si Deepseek a violé les conditions de service d'OpenAI en utilisant une technique appelée "distillation" - extraire les données de modèles plus grands pour former des plus petits - en utilisant l'API d'Openai. OpenAI a confirmé sa conscience de ces tentatives de chinois et d'autres sociétés de reproduire les modèles d'IA à la tête et a déclaré son engagement à protéger sa propriété intellectuelle.

Le conseiller de l'IA de Donald Trump, David Sacks, a corroboré les soupçons d'Openai, suggérant que les actions de Deepseek impliquaient l'extraction non autorisée des connaissances des modèles Openai. Il prévoit que les principales sociétés d'IA mettront en œuvre des mesures pour empêcher de futurs cas de distillation des données.

La situation met en évidence une ironie importante: Openai lui-même a été confronté à des accusations d'utilisation du matériel protégé par le droit d'auteur sans autorisation dans le développement de Chatgpt. Cette hypocrisie a été largement notée sur les réseaux sociaux, avec des critiques pointant vers l'affirmation précédente d'Openai selon laquelle la création d'outils d'IA comme Chatgpt sans matériel protégé par le droit d'auteur est "impossible". OpenAI a défendu ses pratiques, citant l'utilisation approfondie du matériel protégé par le droit d'auteur, si nécessaire pour former des modèles de gros langues et faire valoir que son utilisation constitue une «utilisation équitable». Cette réclamation est actuellement contestée dans les poursuites intentées par le New York Times et 17 auteurs, alléguant une violation du droit d'auteur. Le paysage juridique entourant les données de formation de l'IA et le droit d'auteur reste très contesté, en particulier à la lumière d'un bureau de droit d'auteur américain de 2018, la décision de l'art généré par l'AI n'est pas éligible à la protection du droit d'auteur.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov/Bloomberg via Getty Images.

Actualité à la Une
Plus
Copyright © 2024 kuko.cc All rights reserved.