蚂蚁集团CodeFuse-VLM开源，支持多模态多任务预训练/微调

5月3日 203

这家伙很懒，什么都没有留下...

2022年2月5日报道：CodeFuse-VLM是一个框架，支持多种视觉模型和语言大模型，用户可以根据自己的需求选择不同的视觉编码器和大语言模型。

CodeFuse-VLM-14B模型在多个一般和编码任务方面的性能均优于LLAVA-1.5和Qwen-VL。

这个框架还可以进行高效的PEFT微调，能够显著加快微调训练速度并减少资源需求。

另外，CodeFuse-VLM还被应用于训练用于生成网页图片到前端代码的多模态大模型，从而提升了前端工程师的开发效率。蚂蚁集团CodeFuse-VLM开源，支持多模态多任务预训练/微调 CodeFuse-MFT-VLM 项目链接:

CodeFuse-VLM-14B型号的位置是:

晓语台-先进的点击式文本生成平台