Monde

Le modèle plus petit que le Deesik R1 a été mis à jour et a été populaire. Gemini 2.5 Flash sur les tests standard – Computer.

Le début de la Chine Deeseek continue d’ajuster leurs modèles d’intelligence artificielle, qui sont raffinés R1, qui ont été mis à jour. Ce modèle est appelé deesik-r1-0528-qwen3-8b et a souligné que plus petit et plus court cependant, les résultats du test standard AIME 2025 montrent que c’est Très efficace et comptez sur OpenAI 03, qui est supérieur à la dernière version de Google, Gemini 2.5 Flash en efficacité.

Parfois, la chose la plus surprenante est Deeseek R1. Ce modèle a besoin de moins de ressources matérielles pour fonctionner. suivre TechCrunchCe R1 utilise QWEN3-8B ​​d’Alibaba et a besoin de Nvidia H100 pour fonctionner avec un seul GPU avec RAM 40 Go pour fonctionner.– Comparez en fonction de la plate-forme cloud ModificationLe modèle Full Deepsek R1 a besoin de GPU 80 Go pour fonctionner.

Critères standard comme 2025

AIME 2025 Standard, pas de teste do Modelo deeseek-R1-0528-QWEN3-8B

« Data -Title = » Benchmark Aime 2025 – La version plus petite de Deesek R1 a été mise à jour et trouvée avec Gemini 2.5 Flash. Pour tester Bennam Mark – Tek Frog « >

Critères standard comme 2025 AIME 2025 Standard, pas de teste do Modelo deeseek-R1-0528-QWEN3-8B

Deeseek Nouveau modèle de formation en utilisant le texte créé par la version R1 mise à jour pour personnaliser à Commencer, ne pas expliquer Embrassez votre visage Cette mise à jour améliore la profondeur du raisonnement et la capacité d’influencer considérablement.En profitant de l’augmentation des ressources de calcul et de l’introduction de mécanismes pour augmenter l’efficacité de l’algorithme après l’exercice

Oh Le nouveau modèle montre des performances élevées entre différentes évaluations standard, y compris les mathématiques, la programmation et la logique.– « Vos performances globales approchent des modèles principaux tels que O3 et Gemini 2.5 Pro ». Il souligne son impression. Il indique également que Deesik-R1-0528-QWEN3-8B ​​peut être utilisé dans les enquêtes académiques, tant sous la forme d’un raisonnement et d’un développement industriel qui se concentre sur les petits modèles

Veuillez noter que le modèle peut être utilisé via le fichier. Licence MITPeut être utilisé dans les produits commerciaux sans limitesSoulignez uniquement la responsabilité de l’utilisation.

Source link

Articles similaires

Bouton retour en haut de la page