Les Pays-Bas font la promotion des accords avec les éditeurs pour développer Amnesty International pour leur état

Les Pays-Bas représentent un tournant dans le développement de l’intelligence artificielle. Jeudi, le gouvernement néerlandais s’est rendu compte que le modèle de langue de l’État, GPT-NL, a besoin d’une autorisation explicite des auteurs d’utiliser leurs textes dans le processus de formation. Une étape qui peut redéfinir les règles du jeu dans le secteur de l’intelligence artificielle, en particulier dans le domaine public.
L’autorité exécutive néerlandaise a été l’une des premières à parier sur les modèles d’intelligence artificielle qui ont été promus par le public, comme alternative aux géants spéciaux américains et chinois: Chatgpt, Gemini ou Deepseek. Une route peu de temps après que le gouvernement espagnol a suivi avec CouchéSon projet de «protéger l’espagnol». Les deux modèles, comme garantis par leurs promoteurs, sont formés à des « données de haute qualité ». Mais maintenant la distance de la marque néerlandaise.
« Contrairement à certains modèles internationaux qui utilisent » une copie d’Internet « comme matériel de formation, le GPT-NL recueille les données protégées par le droit d’auteur de manière précise et morale, et récompense ceux qui contribuent à leur contenu. » Détermination des sites qui laissent d’autres développements généraux qui n’ont pas encore montré comment ils ont obtenu des données pour alimenter leurs modèles. L’un d’eux est l’espagnol, déjà sous un verre élargi pour les organisations qui garantissent la propriété intellectuelle.
N’oubliez pas les spécifications techniques des ensembles de données du projet ALIA utilisés pour former le formulaire. Parmi les sources susmentionnées figurent Github, Wikipedia et Eurlex, ainsi que l’empiètement commun, une base de données qui a suscité de fortes critiques de la collecte d’un énorme contenu Internet sans autorisation. « Oui, le gouvernement l’a utilisé et le reconnaît publiquement sur ses sites Web », a déclaré l’avocat de la propriété intellectuelle d’Eva Maraga, lors de l’apparition du Parlement en juin. « L’empiètement commun collecte du contenu sans autorisation préalable », a-t-il ajouté. Néanmoins, les responsables officiels affirment qu’il s’agit « d’un référentiel géré par une organisation à but non lucratif, qui a été mise à jour mensuelle et distribuée dans le cadre d’une licence de terrain public CC0 1.0 ».
En janvier 2025, Cedro (le centre espagnol a lancé les droits de re -photographe) a annulé la rampe conjointe qui a annulé le contenu éditorial espagnol de son entrepôt, réalisant ainsi que son inclusion était au moins le problème. Cependant, à ce moment-là, la formation a déjà été terminée – ou du moins préventive – des modèles. « Qui regarde le garde? » Plusieurs membres du Sénat ont été demandés.
La lutte pour le droit d’auteur
De plus en plus d’utilisateurs recourent à Openai ou Google Gemini pour des réponses immédiates. Derrière cette interaction simple, il existe des centaines de règles sportives, de modèles statistiques et de réseaux nerveux formés avec d’énormes tailles textuelles.
Ces groupes de données couvrent tous les types de problèmes, de la santé et de la science à l’économie et à la politique. Les symboles sont extraits – mots ou paroles de ponctuation – provenant de sources originales à travers des techniques abstraites, c’est-à-dire des informations automatiques sur Internet. Dans la plupart des cas, ce processus est effectué sans approbation ni compensation pour l’auteur de contenu.
Les Pays-Bas cherchent avec précision pour inverser cette logique. « Nous avons conclu des accords pour que les éditeurs reçoivent une compensation suffisante lorsque le modèle est lancé sur le marché », explique le PDG. « Cela garantit le respect des réglementations européennes, y compris le droit de l’intelligence artificielle », ajoute-t-il.
La reconnaissance officielle du gouvernement néerlandais ajoute une pression sur les pays qui ont renforcé les modèles d’intelligence artificielle du public. Le problème apparaît sur l’origine des données et le respect du droit d’auteur comme l’un des principaux défis organisationnels dans la publication de ces technologies. Dans le même temps, la discussion reste ouverte dans les parlements et entre les développeurs.