Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

735

Base only

Active filters: modelopt

nvidia/GLM-5.2-NVFP4

Text Generation • 381B • Updated 6 days ago • 160k • 203

nvidia/Qwen3.6-27B-NVFP4

Text Generation • 18B • Updated 2 days ago • 27.2k • 192

nvidia/Qwen3.6-35B-A3B-NVFP4

Text Generation • 19B • Updated 20 days ago • 6.03M • 413

nvidia/MiniMax-M3-NVFP4

Text Generation • 247B • Updated 6 days ago • 40.7k • 45

0xSero/GLM-5.2-504B-Nvidia

Text Generation • 293B • Updated 6 days ago • 685 • 19

nvidia/Mistral-Medium-3.5-128B-NVFP4

Text Generation • 84B • Updated about 22 hours ago • 80 • 16

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Text Generation • 335B • Updated 8 days ago • 472k • • 233

OpenYourMind/GLM-5.2-abliterated

432B • Updated 3 days ago • 18

0xSero/GLM-5.2-504B

Text Generation • 290B • Updated 7 days ago • 17.1k • 27

nvidia/Gemma-4-26B-A4B-NVFP4

Text Generation • 14B • Updated May 11 • 2.21M • 107

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated May 1 • 947k • 374

williamliao/Qwen3.6-27B-NVFP4-GGUF

Text Generation • 27B • Updated 2 days ago • 301 • 8

nvidia/diffusiongemma-26B-A4B-it-NVFP4

Text Generation • 14B • Updated 22 days ago • 1.31M • 90

nvidia/Qwen3.5-122B-A10B-NVFP4

Text Generation • 65B • Updated 30 days ago • 57.3k • 27

DJLougen/Qwable-5-27B-Coder-NVFP4

Text Generation • 15B • Updated 9 days ago • 748 • 10

stepfun-ai/Step-3.7-Flash-NVFP4

Image-Text-to-Text • 104B • Updated Jun 1 • 299k • 58

madeby561/GLM-5.2-NVFP4-REAP-504B-term

Text Generation • 290B • Updated 2 days ago • 1.67k • 16

sakamakismile/Krea-2-Turbo-NVFP4-AWQ

Text-to-Image • Updated 7 days ago • 126 • 3

Luni/Ornith-1.0-9B-NVFP4-AWQ

Text Generation • 6B • Updated 6 days ago • 2.36k • 3

nerkyor/Qwen3.6-27B-DSV4Pro-Thinking-Distill-NVFP4

Text Generation • 19B • Updated 4 days ago • 275 • 3

AEON-7/supergemma4-26b-abliterated-multimodal-nvfp4

Text Generation • 15B • Updated 11 days ago • 224 • 6

nvidia/MiniMax-M2.7-NVFP4

Text Generation • 116B • Updated Apr 24 • 158k • 61

AEON-7/gemma-4-31B-it-speculator.eagle3-NVFP4

Text Generation • 2B • Updated 11 days ago • 391 • 5

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-NVFP4

Any-to-Any • 18B • Updated May 5 • 2.05M • 148

lukealonso/MiMo-V2.5-NVFP4

179B • Updated May 11 • 29.8k • 22

nvidia/GLM-5.1-NVFP4

Text Generation • 382B • Updated May 27 • 120k • 39

natfii/Qwen3.6-27B-VLM-NVFP4-MTP

Image-Text-to-Text • 17B • Updated 22 days ago • 3.11k • 5

lukealonso/GLM-5.2-NVFP4

Text Generation • 432B • Updated 15 days ago • 79.9k • 28

Mapika/GLM-5.2-NVFP4

Text Generation • 379B • Updated 15 days ago • 11k • 5

brandonmusic/GLM-5.2-NVFP4-REAP-Recall-N172

Text Generation • 296B • Updated 5 days ago • 2.34k • 6