14. dubna14. dub Shrnutí: Release candidate Ollama v0.20.8-rc0 přináší podporu modelu Gemma 4 v prostředí MLX, zatím pro textový runtime. Součástí jsou také dvě optimalizace výkonu při prefill fázi a routování expertů, které mají zrychlit běh modelu. Proč je to zajímavé: Pro uživatele MLX a Gemma 4 to může znamenat rychlejší inference a efektivnější využití výkonu, hlavně u náročnějších běhů. Jde sice o release candidate, ale změny míří na praktické zlepšení latence a režie výpočtu. Ukázka originálu: gemma4: implement Gemma 4 model for MLX (text-only runtime) gemma4: two MoE + SWA prefill perf fixes Two performance optimizations in the gemma4 forward pass Memoize the sliding-window prefill mask across layers. Softmax only over the selected experts in Ro... Zdroj: Ollama ReleasesČas: 14.04.2026 01:36
Zapojte se do konverzace
Můžete odeslat příspěvek nyní a zaregistrovat se později. Máte-li účet, přihlaste se nyní a přispívejte pod svým účtem.