Vision-language-model-fertigung