2022年2月5日报道:CodeFuse-VLM是一个框架,支持多种视觉模型和语言大模型,用户可以根据自己的需求选择不同的视觉编码器和大语言模型。
CodeFuse-VLM-14B模型在多个一般和编码任务方面的性能均优于LLAVA-1.5和Qwen-VL。
这个框架还可以进行高效的PEFT微调,能够显著加快微调训练速度并减少资源需求。
另外,CodeFuse-VLM还被应用于训练用于生成网页图片到前端代码的多模态大模型,从而提升了前端工程师的开发效率。CodeFuse-MFT-VLM 项目链接:
请访问以下网址查看更多信息:https://github.com/codefuse-ai/CodeFuse-MFT-VLM
CodeFuse-VLM-14B型号的位置是:
请访问以下链接以查看CodeFuse的VLM-14B文件:https://modelscope.cn/models/ss41979310/CodeFuse-VLM-14B/files