Le premier nouveau nouveau poids ouvert d’Opanayin en six ans

Pour la première fois GBD -2 en 2019OPE OUVERTISSE Les nouveaux modèles de grands modèles de langue. C’est une grande étape pour une entreprise Accusé de plus en plus Son fortifié La tâche énoncée d’origine « L’intelligence générale artificielle profite à toute l’humanité. » Maintenant, après de nombreux retards pour des tests de sécurité et une raffinerie supplémentaires, GPT -SS-20B et GPT -SS-20B sont disponibles pour le téléchargement Câlin.
Avant de continuer, il vaut la peine de prendre un moment pour clarifier ce que fait l’AIA ouvert ici. La société ne publie pas de nouveaux échantillons open source, y compris le code de base et les données utilisés par la société pour s’entraîner. Au lieu de cela, il partage des poids – c’est-à-dire les valeurs de nombre appris à attribuer aux entrées pendant leur formation – qui transmettra de nouveaux paramètres. Étude Benjamin C. LeeProfesseur d’ingénierie et d’informatique à l’Université de Pennsylvanie, des modèles de poids ouvert et open source aident deux fins différentes.
« Un modèle de chargement ouvert fournit les valeurs apprises lors de l’exercice d’un modèle de langue large et leur permettre d’utiliser le modèle. Vous pouvez utiliser le modèle à partir de la boîte, ou le redéfinir pour une certaine utilisation ou le modifier pour une certaine utilisation », a-t-il déclaré. Si les modèles commerciaux sont une boîte noire complète et que le système d’ouverture permet une personnalisation complète et un changement, les AIS de poids ouvert sont quelque part au milieu.
Obanai ne publie pas d’échantillons open source car un concurrent peut utiliser les données de formation et l’index pour modifier sa technologie. « Plus qu’un poids de modèle d’ouverture. Il comprend également le code utilisé pour exécuter le processus de formation », a déclaré Lee. Dans la pratique, la personne moyenne n’obtient pas davantage d’utiliser le modèle open source si la personne moyenne n’a pas la ferme de Nvidia GPS qui gère ses factures d’électricité. (Ils sont utiles pour les chercheurs qui souhaitent en savoir plus sur les données utilisées pour former ses échantillons, et il existe quelques modèles open source tels que Mistral Nemo et Mistral Small 3.)
Lorsqu’il ne parte pas, la principale différence entre le GPT -S-120B et le GPT -SS-20B est le nombre de paramètres que chacun offre. Si vous n’êtes pas au courant de ce mot, les paramètres peuvent modifier les systèmes qui peuvent vous donner une réponse à un modèle grand langage. La dénomination est légèrement confuse ici, mais le modèle GPT -OS -120B 117 milliards de paramètres, tandis que son petit frère est de 21 milliards.
En pratique, c’est-à-dire que le GPT -oss -120b est requis pour que le matériel plus puissant fonctionne, et l’IA ouvert recommande un 80 Go de GP pour une utilisation efficace. La bonne nouvelle est que tout ordinateur moderne avec 16 Go de RAM peut exécuter GPT -OS -20B. En conséquence, vous pouvez utiliser un petit modèle pour faire quelque chose comme le code de vipe sur votre propre ordinateur sans connexion à Internet. Et de plus, disponible en ouvrant avec des échantillons d’Opanai Apache 2.0 La licence offre plus de flexibilité aux gens pour changer les organisations pour leurs besoins.
Bien qu’il ne s’agisse pas d’une nouvelle version commerciale, les nouveaux modèles sont comparables à ses organisations de confidentialité à bien des égards. Ce qui est une gamme de modèles OSS, c’est qu’ils ne fournissent pas d’entrée de modèle multiple, ce qui signifie que les images, la vidéo et la voix ne peuvent pas être traitées. Pour ces compétences, vous devez revenir aux échantillons commerciaux du cloud et à l’ouverture de l’Open, et les nouveaux systèmes de poids ouvert peuvent être configurés. Cependant, malgré cela, ils offrent de nombreuses compétences, notamment une utilisation rationnelle et rationnelle en chaîne. Cela signifie que les modèles peuvent faire face aux problèmes les plus complexes en se séparant en petites étapes, et s’ils ont besoin d’une aide supplémentaire, ils savent comment utiliser des langages Web et index de type Python.
De plus, Opanai a formé des échantillons en utilisant les techniques utilisées précédemment O3 et ses autres systèmes frontaliers récents. Dans l’indice au niveau de la compétition, seule la pire teinte du GPT -S – 20B O3, le modèle rationnel artistique actuel de l’Opanaya a reçu une partition, tandis que le GPT -S-20B a atterri entre O3-Mini et O4-MinI. Bien sûr, deux nouveaux modèles doivent attendre le test du monde réel pour voir comment les offres commerciales d’Opanayi et de ses concurrents se comparent.
Open Open Open EKA, l’option évidente vient après avoir signé la méta Mark Zuckerberg pour doubler la libération et un poids ouvert du GPT -OSS -120B et GPT -OSS -20B Libérez les systèmes inférieurs comme celui-ci au public. Le degré à l’ouverture était auparavant au centre du journal de Jucarberg sur les efforts de l’IA de son entreprise, et le PDG a une fois examiné les systèmes de mula fermés. Dans la section des amateurs techniques qui veulent bricoler avec des LLM, le temps, que ce soit ou non, est quelque peu gêné par la méta.
« On peut faire valoir que les modèles les plus importants et les plus efficaces pour ceux qui n’ont pas ces centres de données hypercale massifs avec un grand nombre de médecins généralistes », a déclaré le professeur Lee. « Il permet aux gens d’utiliser des publications ou des produits d’un processus de formation d’un mois dans un grand centre de données sans investir dans cette infrastructure. Du point de vue de quelqu’un qui veut démarrer un modèle vraiment efficace, je veux créer des applications.
Openai a déjà trié ses propres versions de ces modèles en conjonction avec différents paramètres Oh SuèdeLe centre national du pays pour la demande AI. Lors d’une conférence de presse tenue avant l’annonce d’aujourd’hui, l’équipe, qui a travaillé au GPT -oss -12p et GPT -20b, a déclaré qu’elle considérerait les deux modèles comme une expérience; L’Open consiste à publier des échantillons de poids ouverts à l’avenir, si plus de personnes les utilisent.