如何解决在问答系统中使用向量数据库匹配短问题的挑战

向量数据库问题和答案比例, 如果问题字数比例较短, 打分就会很高(0.36); 我的代码是分数低于0.3就走向量数据库回答, 高于0.3就走普通的gpt问答; 我的期望结果是分数低于0.3,有没有办法解决短问题无法匹配的问题

例子:贵不贵 ? 回答: 婴宝宝金装幼儿奶粉668一罐,这两天促销搞活动打八折

用户问了贵不贵? , 虽然和向量数据库中的问题完全一样, 但是.similarity_search_with_score()的分数太高了, 因为问题在问答句子所占的比例太少了

问题的点不在于上下文,我只想知道怎么让短问题匹配得分更低,看看还有没有其他简单的方式能够解决这个问题

端问题的匹配度分数为什么要更低这是啥意思,没有明白。你问题的本质是不是还是“怎么让通过向量DB检索出的结果跟真实匹配分数更准确?” 如果是这样的话,你要做的目标应该是怎么让query更丰富。