Vision
updated
liuhaotian/llava-v1.6-34b
Image-Text-to-Text
• 35B • Updated • 21.3k
• 363
deepseek-ai/deepseek-vl-7b-base
7B • Updated • 94
• 65
deepseek-ai/deepseek-vl-7b-chat
Image-Text-to-Text
• 7B • Updated • 2.61k
• 270
HuggingFaceM4/idefics2-8b
Image-Text-to-Text
• 8B • Updated • 99k
• 621
HuggingFaceM4/idefics2-8b-chatty
Image-Text-to-Text
• 8B • Updated • 152
• 95
HuggingFaceM4/idefics2-8b-base
Image-Text-to-Text
• 8B • Updated • 1.29k
• 28
google/paligemma-3b-pt-896
Image-Text-to-Text
• 3B • Updated • 575
• 124
microsoft/Phi-3-vision-128k-instruct
Text Generation
• Updated • 160k
• 971
Image-Text-to-Text
• 7B • Updated • 143k
• 200
microsoft/Phi-3.5-vision-instruct
Image-Text-to-Text
• Updated • 1.65M
• 733
meta-llama/Llama-3.2-11B-Vision
Image-Text-to-Text
• 11B • Updated • 13k
• 586
meta-llama/Llama-3.2-11B-Vision-Instruct
Image-Text-to-Text
• 11B • Updated • 132k
• 1.59k
meta-llama/Llama-3.2-90B-Vision
Image-Text-to-Text
• 89B • Updated • 2.69k
• 134
meta-llama/Llama-3.2-90B-Vision-Instruct
Image-Text-to-Text
• 89B • Updated • 12.5k
• 356
meta-llama/Llama-Guard-3-11B-Vision
Image-Text-to-Text
• 11B • Updated • 5.56k
• 72
Image-Text-to-Text
• 73B • Updated • 3.7k
• 298
Image-Text-to-Text
• 8B • Updated • 39.9k
• 566
Image-Text-to-Text
• 8B • Updated • 675
• 163
Image-Text-to-Text
• Updated • 6.41k
• 157
Text-to-Video
• Updated • 8.47k
• • 1.32k
Image-Text-to-Text
• Updated • 259
• 1.71k
Image-to-Video
• Updated • 473k
• • 2.17k