Tagged "model-scaling"

Qwen 3.5 397B emerges as top-performing local coding model 21 March 2026
Mamba 3: State Space Model Architecture Optimized for Inference 18 March 2026
Sarvam Open-Sources 30B and 105B Reasoning Models 11 March 2026
Sarvam Open-Sources 30B and 105B Reasoning Models 9 March 2026
Running Local AI Models on Mac Studio 128GB: 4B, 20B & 120B Tested 2 March 2026
Qwen 3.5-27B Demonstrates Exceptional Performance with Thoughtful Prompt Engineering 28 February 2026
Krasis: Hybrid CPU/GPU MoE Runtime Achieves 3,324 Tokens/Second Prefill on RTX 5080 28 February 2026
GLM-5 Technical Report: DSA Innovation Reduces Training and Inference Costs 18 February 2026
Context Management Identified as Real Bottleneck in AI-Assisted Coding 14 February 2026
GLM-5 Released: 744B Parameter MoE Model Targeting Complex Tasks 12 February 2026