DynamiCrafter_1024

Model card Files Files and versions

xet

Community

pharaouk

Doubiiu commited on Mar 16, 2024

Commit

8069fab

verified ·

0 Parent(s):

Duplicate from Doubiiu/DynamiCrafter_1024

Browse files

Co-authored-by: Jinbo Xing <Doubiiu@users.noreply.huggingface.co>

Files changed (5) hide show

.gitattributes +45 -0
DynamiCrafter-1024-21.webp +3 -0
DynamiCrafter-10241.webp +3 -0
README.md +66 -0
model.ckpt +3 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,45 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+bike_chineseink.gif filter=lfs diff=lfs merge=lfs -text
+firework03.gif filter=lfs diff=lfs merge=lfs -text
+girl07.gif filter=lfs diff=lfs merge=lfs -text
+isometric.gif filter=lfs diff=lfs merge=lfs -text
+robot01.gif filter=lfs diff=lfs merge=lfs -text
+ship02.gif filter=lfs diff=lfs merge=lfs -text
+DynamiCrafter-1024-2.webp filter=lfs diff=lfs merge=lfs -text
+DynamiCrafter-1024.webp filter=lfs diff=lfs merge=lfs -text
+DynamiCrafter-1024-21.webp filter=lfs diff=lfs merge=lfs -text
+DynamiCrafter-10241.webp filter=lfs diff=lfs merge=lfs -text

DynamiCrafter-1024-21.webp ADDED Viewed

Git LFS Details

SHA256: 080fea5d83648388cbf1588a26518c7ea4626166a1287deaf0b14a6801a1c99d
Pointer size: 132 Bytes
Size of remote file: 1.89 MB

DynamiCrafter-10241.webp ADDED Viewed

Git LFS Details

SHA256: ff1254c9ed1ac932040b7dbedb8ff4be0e8b37f2d43e33a42d8406b70163378d
Pointer size: 132 Bytes
Size of remote file: 1.69 MB

README.md ADDED Viewed

	@@ -0,0 +1,66 @@

+---
+# For reference on model card metadata, see the spec: https://github.com/huggingface/hub-docs/blob/main/modelcard.md?plain=1
+# Doc / guide: https://huggingface.co/docs/hub/model-cards
+{}
+---
+# DynamiCrafter (576x1024) (text-)Image-to-Video/Image Animation Model Card
+![row01](DynamiCrafter-1024-21.webp)
+![row02](DynamiCrafter-10241.webp)
+<!-- Provide a quick summary of what the model is/does. -->
+DynamiCrafter (576x1024) (Text-)Image-to-Video is a video diffusion model that <br> takes in a still image as a conditioning image and text prompt describing dynamics,<br> and generates videos from it.
+## Model Details
+### Model Description
+<!-- Provide a longer summary of what this model is. -->
+DynamiCrafter, a (Text-)Image-to-Video/Image Animation approach, aims to generate <br>
+short video clips (~2 seconds) from a conditioning image and text prompt.
+This model was trained to generate 16 video frames at a resolution of 576x1024 <br>
+given a context frame of the same resolution.
+- **Developed by:** CUHK & Tencent AI Lab
+- **Funded by:** CUHK & Tencent AI Lab
+- **Model type:** Generative (text-)image-to-video model
+- **Finetuned from model:** DynamiCrafter (320x512)
+### Model Sources
+<!-- Provide the basic links for the model. -->
+For research purpose, we recommend our Github repository (https://github.com/Doubiiu/DynamiCrafter), <br>
+which includes the detailed implementations.
+- **Repository:** https://github.com/Doubiiu/DynamiCrafter
+- **Paper:** https://arxiv.org/abs/2310.12190
+- **Demo1:** https://huggingface.co/spaces/Doubiiu/DynamiCrafter
+- **Demo2:** https://replicate.com/camenduru/dynami-crafter-576x1024
+## Uses
+<!-- Address questions around how the model is intended to be used, including the foreseeable users of the model and those affected by the model. -->
+### Direct Use
+<!-- This section is for the model use without fine-tuning or plugging into a larger ecosystem/app. -->
+We develop this repository for RESEARCH purposes, so it can only be used for personal/research/non-commercial purposes.
+## Limitations
+<!-- This section is meant to convey both technical and sociotechnical limitations. -->
+- The generated videos are relatively short (2 seconds, FPS=8).
+- The model cannot render legible text.
+- Faces and people in general may not be generated properly.
+- The autoencoding part of the model is lossy, resulting in slight flickering artifacts.
+## How to Get Started with the Model
+Check out https://github.com/Doubiiu/DynamiCrafter

model.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:97181be1431cc1c08fe31f8d0385a43c2beb1c7f36d25d2df301636f0c4f20f2
+size 10437549158