Ollama v0.22.1-rc0 přidává podporu modelů laguna a upravuje práci s FP8

28. dubna28. dub

Shrnutí: Release candidate Ollama v0.22.1-rc0 rozšiřuje podporu o modely laguna v mlx i ggml a zároveň vylepšuje převod safetensors do GGUF, hlavně pro FP8. Oprava se týká i serveru, kde se při generate nově zachovají logprobs i v případech, kdy vestavěný parser průběžně bufferuje viditelný obsah.

Proč je to zajímavé: Prakticky to znamená spolehlivější převod a kvantizaci novějších modelů, hlavně pokud pracují s FP8 vahami. Pro vývojáře, kteří sledují logprobs nebo staví vlastní nástroje nad generate, je důležitá i oprava chování serveru.

Ukázka originálu:

mlx: add laguna model support convert: support fp8 safetensors import Decode HF F8_E4M3 safetensors with block scale companions into GGUF-supported tensor types, and record which output tensors came from FP8 source weights. Use that source-precision metadat...

Zdroj: Ollama Releases
Čas: 28.04.2026 20:50

Citovat

Ollama v0.22.1-rc0 přidává podporu modelů laguna a upravuje práci s FP8

Vybrané odpovědi

Zapojte se do konverzace

Účet

Navigace

Hledat

Nastavit push oznámení v prohlížeči

Chrome (Android)

Chrome (Desktop)

Safari (iOS 16.4+)

Safari (macOS)

Edge (Android)

Edge (Desktop)

Firefox (Android)

Firefox (Desktop)