Ornith 1.0 35B Q8_0 (GGUF)
Ornith 1.0 35B ist DeepReinforces RL-Fine-Tune auf Gemma 4 und Qwen 3.5 unter MIT-Lizenz, ein agentisches Coding-Modell, das seine eigene Arbeitsweise im Training mitlernt. Das Open-Weight-MoE bündelt 35 Mrd. Gesamt- bei nur etwa 3 Mrd. aktiven Parametern pro Token und liefert damit Workstation-Leistung. 262.144 Tokens Kontext, natives Thinking und Tool-Calling ergänzen das Profil, Q8-Quantisierung bringt das Modell nahe an Vollpräzision.
- Open Weights
- Workstation
- SPRK
- Text
- Interactive
Sovereign Risk: LOW DeepReinforce ist eine US-basierte RL-Forschungsorganisation. Das Modell ist unter MIT-Lizenz ohne regionale Einschränkungen auf Hugging Face verfügbar. Kein chinesisches NSL-Risiko, kein US-CLOUD-Act-Risiko für Gewichte (Open-Weight-Modell, lokal betreibbar). Einziger Vorbehalt: die Basis-Architektur (Qwen 3.5 + Gemma 4) stammt von chinesischen und US-amerikanischen Organisationen.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 75.87
- Routine
- 46.66
- Reasoning
- 29.21
- LLM Judge Avg
- 3.88 / 5
- 100 Coverage
- Avg Task Duration
- 39.35s
- ️ Interactive
- Token Rate
- 49.59tok/s
- Output Rate
- P95 Latency
- 118.21s
- Top 5 %
- Total Tokens
- 109300
- Output Volume
- Cost per 1K
- Lokal getestet
- USD / 1K Requests
- Benchmark Cost
- Lokal getestet
- Total · 109300 tok
Benchmark-Module
10 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian