12. dubna12. dub Shrnutí: Microsoft uvedl Maia 200, nový čip navržený hlavně pro inference, tedy provoz hotových AI modelů. Firma slibuje lepší ekonomiku generování tokenů a staví na 3nm výrobě od TSMC, podpoře FP8/FP4 a výrazně posílené paměťové části s HBM3e a velkou on-chip SRAM. Proč je to zajímavé: Inference je dnes pro provoz AI služeb často dražší a škálovatelnější problém než samotné trénování. Pokud Maia 200 splní sliby, může Microsoft snížit náklady na běh modelů a lépe konkurovat Nvidii i dalším dodavatelům AI hardwaru. Ukázka originálu: Today, we’re proud to introduce Maia 200, a breakthrough inference accelerator engineered to dramatically improve the economics of AI token generation. Maia 200 is an AI inference powerhouse: an accelerator built on TSMC’s 3nm process with native FP8/F... Zdroj: Microsoft AI BlogČas: 26.01.2026 17:00
Zapojte se do konverzace
Můžete odeslat příspěvek nyní a zaregistrovat se později. Máte-li účet, přihlaste se nyní a přispívejte pod svým účtem.