Inference Optimization

community

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

RelaxingSnorlax updated a dataset about 7 hours ago

inference-optimization/Qwen3.5-4B-responses

RelaxingSnorlax published a dataset about 7 hours ago

inference-optimization/Qwen3.5-4B-responses

nm-research updated a model about 10 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step21k

View all activity

Collections 6

View 6 collections

models 378

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step21k

2B • Updated about 10 hours ago

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt2

0.6B • Updated about 10 hours ago

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt1-20260609-0052

0.6B • Updated 1 day ago • 5

datasets 23

inference-optimization/Qwen3.5-4B-responses

Viewer • Updated about 6 hours ago • 7.47k

inference-optimization/Qwen3.5-0.8B-responses

Viewer • Updated 6 days ago • 7.47k • 45

inference-optimization/Qwen3.5-9B-responses

Viewer • Updated 6 days ago • 7.67k • 38

inference-optimization/Qwen3-8B-Regenerated-Collection

Preview • Updated 8 days ago • 182

inference-optimization/Qwen3-30B-A3B-responses

Preview • Updated 8 days ago • 60

inference-optimization/Qwen3-32B-responses

Preview • Updated 8 days ago • 38

inference-optimization/ctest-Qwen3.6-27B-speculator-dataset

Viewer • Updated 13 days ago • 5.61k • 32

inference-optimization/Gemma4-Responses-Nemotron

Viewer • Updated 20 days ago • 762k • 59 • 1

inference-optimization/Longbench_Samples_Specdec

Viewer • Updated 22 days ago • 160 • 65

inference-optimization/ctest-subset-Qwen3.5-397B-A17B-FP8-dynamic-speculator-dataset

Viewer • Updated 22 days ago • 10k • 74

View 23 datasets

Inference Optimization

AI & ML interests

Recent Activity

Collections 6

inference-optimization/gemma-4-1B-0.8B-tiny

inference-optimization/DSV4-tiny-empty

inference-optimization/Qwen3-1.6B-A0.9B

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-heuristic

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-hybrid

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-noise

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-heuristic

inference-optimization/gemma-4-1B-0.8B-tiny

inference-optimization/DSV4-tiny-empty

inference-optimization/Qwen3-1.6B-A0.9B

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-heuristic

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-hybrid

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-noise

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-heuristic

models 378

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step21k

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt2

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt1-20260609-0052

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-ep0p11

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt1

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt0.5

inference-optimization/Qwen3-8B-speculator.dflash.swa.unified-ep0p28

inference-optimization/Qwen3-8B-speculator.dflash.swa.unified-ep0p19

inference-optimization/DFlash-SWA-Causal-Qwen3-8B-Magpie-Ultrachat

inference-optimization/DFlash-SWA-Causal-Qwen3-8B-PerfectBlend

datasets 23

inference-optimization/Qwen3.5-4B-responses

inference-optimization/Qwen3.5-0.8B-responses

inference-optimization/Qwen3.5-9B-responses

inference-optimization/Qwen3-8B-Regenerated-Collection

inference-optimization/Qwen3-30B-A3B-responses

inference-optimization/Qwen3-32B-responses

inference-optimization/ctest-Qwen3.6-27B-speculator-dataset

inference-optimization/Gemma4-Responses-Nemotron

inference-optimization/Longbench_Samples_Specdec

inference-optimization/ctest-subset-Qwen3.5-397B-A17B-FP8-dynamic-speculator-dataset

AI & ML interests

Recent Activity

Team members 19

Collections 6

models 378 Sort: Recently updated

datasets 23 Sort: Recently updated

models 378

datasets 23