智源联手多所顶尖高校发布的多模态向量模型BGE-VL,重塑了AI检索领域的游戏规则。它凭借独创的MegaPairs合成数据技术,在图文检索、组合图像检索等多项任务中,横扫各大基准刷新SOTA。
BGE系列模型自发布以来广受社区好评。 近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。
BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。
BGE-VL借助大规模合成数据MegaPairs训练而成。这一设计具备以下两大核心优势: 优异的可扩展性:
MegaPairs 结合多模态表征模型、多模态大模型和大语言模型,在海量图文语料库中高效挖掘多模态三元组数据。
其算法能够以极低成本持续生成多样化且高质量的多模态三元组。本次发布的版本涵盖 2600 万条样本,为多模态检索模型的训练提供了大规模、高价值的数据支持。
卓越的数据质量:相较于传统多模态数据,MegaPairs 仅需1/70的数据量即可实现更优的训练效果。利用该合成数据,智源训练了多模态检索模型BGE-VL,显著提升了多个主流多模态检索基准的性能。 BGE-VL的技术报告已发布,相关数据、模型及代码资源将陆续向社区全面开放。
论文地址:[2412.14475] MegaPairs: Massive Data Synthesis For…
没有回复内容