Minimifimax M1: en ny Utmare until Deepseek-R1 Med Häften av Beräknnskrafk

Shanghai-Baser Rade-Startupen Minimax Harnadader För ResonemangSmangeller AV Ma.
Minimax Som Banas Av Tencent Och Alibaba Posentoerrar Sig En Stirk Konkrent aill deepseek på Företaget Hävdar att m1 ÖVerträffar Alla Stängda Kinesska KonKursenter i Flera Benchmarks.
Men Det Finns Också Begränsgar. Simple Benchmark, Bong Testar Faktakunskap PrerterRam M1 Beydligt Sämre ÄN Deepsek-R1 Med Bara 18,5% jämfört Med 30,1%. Visar Visar Attlen Intelling är Fefekt På Alla Områnen.
Teknisk Arkitektur och fefektivitet
- Bygger På Namam X-text-01 Med 456 Miljarder Paramet
- A mixture of hybrid-of-professional ANGän (MOE) Arkitektur
- Rebooting “Lightning” Mechanism För Snabbare Beräknang
- Aktiveer Eastast 45.9 mjarda Paramet by Token För Optimad Effektivitet
PresaJämförelserer
| Aspekt | Namax-M1 | Deepseek-R1 |
|---|---|---|
| Beräknskraft (100k tokens) | 25% AV Deepseek-R1 | 100% |
| SammanhangSlängd | 1 Miljon Tokens | 125 000 tokens |
| UttatakaChatet | 80 000 tokens | 64,000 tokens |
Trännnningskostad och fefektivitet
- Total Träningskostad: $ 534,700
- Använde Filest 512 Nvidi H800 GPU-Enheter under TRE Vecker
- MPREDERAR en TYYANDE KSTNADSBESBesBesBering Jämfört Med Deepseek-R1 kostade $ 5-6 Miljoner Atch Thäna
Tillgänggligt och framtid
Minimali Har Gjort M1 Tillgängglig som öppen Källkod with Gitpen Och Goting TVå Version – En Med 40k “Thinking” Discourse “. Det Betder Att Utvecklare Och Forskare Kan Experiment Medi Med Modellen Utan AP ÖRA Bethala För api-ätkomst.
Modellen Finns Ockänglig with VLM För Producitionscion, Vilket Gör Det Encarware Företag Ant INNE system.


