Ornith 1.0 35B Q8_0 (GGUF)

Ornith 1.0 35B ist DeepReinforces RL-Fine-Tune auf Gemma 4 und Qwen 3.5 unter MIT-Lizenz, ein agentisches Coding-Modell, das seine eigene Arbeitsweise im Training mitlernt. Das Open-Weight-MoE bündelt 35 Mrd. Gesamt- bei nur etwa 3 Mrd. aktiven Parametern pro Token und liefert damit Workstation-Leistung. 262.144 Tokens Kontext, natives Thinking und Tool-Calling ergänzen das Profil, Q8-Quantisierung bringt das Modell nahe an Vollpräzision.

DeepReinforce Version 1.0 Kommerzielle Nutzung erlaubt MoE 35 B (3 B aktiv) 262 K Context

  • Open Weights
  • Workstation
  • SPRK
  • Text
  • Interactive

Sovereign Risk: LOW DeepReinforce ist eine US-basierte RL-Forschungsorganisation. Das Modell ist unter MIT-Lizenz ohne regionale Einschränkungen auf Hugging Face verfügbar. Kein chinesisches NSL-Risiko, kein US-CLOUD-Act-Risiko für Gewichte (Open-Weight-Modell, lokal betreibbar). Einziger Vorbehalt: die Basis-Architektur (Qwen 3.5 + Gemma 4) stammt von chinesischen und US-amerikanischen Organisationen.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
75.87
Routine
46.66
Reasoning
29.21

Rank #13

LLM Judge Avg
3.88
100 Coverage
Avg Task Duration
39.35
️ Interactive
Token Rate
49.59
Output Rate
P95 Latency
118.21
Top 5 %
Total Tokens
109300
Output Volume
Cost per 1K
Lokal getestet
USD / 1K Requests
Benchmark Cost
Lokal getestet
Total · 109300 tok

Benchmark-Module

10 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Ornith 1.0 35B Q8_0 (GGUF) Bestes Modell Ø Alle Modelle
Code Quality 73.68
CLI Benchmark 93
Logical Reasoning 77.75
UX Writing 69.09
Documentation 71.71
Content Transform. 77.8
Cultural Intelligence 76.6
Synthesis Quality 60
Tool Execution 89.17
ToolUse Score 73.83
Benchmark Cost Lokal getestet

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil