有大佬做了多模态 结合知识库 在经过大模型的吗

多模态是文件和图片,用4v ,langchain retriever