Ornith 1.0 35B Q8_0 (GGUF)

Ornith 1.0 35B ist DeepReinforces RL-Fine-Tune auf Gemma 4 und Qwen 3.5 unter MIT-Lizenz, ein agentisches Coding-Modell, das seine eigene Arbeitsweise im Training mitlernt. Das Open-Weight-MoE bündelt 35 Mrd. Gesamt- bei nur etwa 3 Mrd. aktiven Parametern pro Token und liefert damit Workstation-Leistung. 262.144 Tokens Kontext, natives Thinking und Tool-Calling ergänzen das Profil, Q8-Quantisierung bringt das Modell nahe an Vollpräzision.

DeepReinforce Version 1.0 Kommerzielle Nutzung erlaubt MoE 35 B (3 B aktiv) 262 K Context

Open Weights
Workstation
SPRK
Text
Interactive

Sovereign Risk: LOW DeepReinforce ist eine US-basierte RL-Forschungsorganisation. Das Modell ist unter MIT-Lizenz ohne regionale Einschränkungen auf Hugging Face verfügbar. Kein chinesisches NSL-Risiko, kein US-CLOUD-Act-Risiko für Gewichte (Open-Weight-Modell, lokal betreibbar). Einziger Vorbehalt: die Basis-Architektur (Qwen 3.5 + Gemma 4) stammt von chinesischen und US-amerikanischen Organisationen.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver: 75.87

Routine: 46.66
Reasoning: 29.21

Rank #13

LLM Judge Avg: 3.88; 100 Coverage

Avg Task Duration: 39.35; ️ Interactive

Token Rate: 49.59; Output Rate

P95 Latency: 118.21; Top 5 %

Total Tokens: 109300; Output Volume

Cost per 1K: Lokal getestet; USD / 1K Requests

Benchmark Cost: Lokal getestet; Total · 109300 tok

Benchmark-Module

10 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Ornith 1.0 35B Q8_0 (GGUF) Bestes Modell Ø Alle Modelle

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Ornith 1.0 35B Q8_0 (GGUF)

Schlüsselmetriken

Benchmark-Module

Token-Effizienz & Latenz

Token-Verbrauch pro Modul

Performance-Profil