蚂蚁集团CodeFuse-VLM开源,支持多模态多任务预训练/微调

2022年2月5日报道:CodeFuse-VLM是一个框架,支持多种视觉模型和语言大模型,用户可以根据自己的需求选择不同的视觉编码器和大语言模型。

CodeFuse-VLM-14B模型在多个一般和编码任务方面的性能均优于LLAVA-1.5和Qwen-VL。

这个框架还可以进行高效的PEFT微调,能够显著加快微调训练速度并减少资源需求。

另外,CodeFuse-VLM还被应用于训练用于生成网页图片到前端代码的多模态大模型,从而提升了前端工程师的开发效率。蚂蚁集团CodeFuse-VLM开源,支持多模态多任务预训练/微调CodeFuse-MFT-VLM 项目链接:

请访问以下网址查看更多信息:https://github.com/codefuse-ai/CodeFuse-MFT-VLM

CodeFuse-VLM-14B型号的位置是:

请访问以下链接以查看CodeFuse的VLM-14B文件:https://modelscope.cn/models/ss41979310/CodeFuse-VLM-14B/files

 

举报

上一篇

OpenAI Sora官方技术报告中文版:《作为世界模拟器的视频生成模型》

下一篇

商汤日日新SensNova 4.0正式发布
相关推荐
晓语台-先进的点击式文本生成平台
Google 发布 Gemini 1.5 Pro,支持原生音频理解
写作宝AI:一站式AI写作和内容生成工具
AI一键论文-AIPaperPass
巨人网络游戏大模型GiantGPT完成备案
字节Coze国内版正式上线,30秒创建你的AI机器人
评论(0)
游客的头像
表情
全部评论 只看作者
最新热门
  1. 暂时还没有评论哦