如何解决在问答系统中使用向量数据库匹配短问题的挑战

test · 2023 年9 月 1 日 07:47

向量数据库问题和答案比例, 如果问题字数比例较短, 打分就会很高(0.36); 我的代码是分数低于0.3就走向量数据库回答, 高于0.3就走普通的gpt问答; 我的期望结果是分数低于0.3，有没有办法解决短问题无法匹配的问题

例子：贵不贵 ? 回答: 婴宝宝金装幼儿奶粉668一罐，这两天促销搞活动打八折

用户问了贵不贵? , 虽然和向量数据库中的问题完全一样, 但是.similarity_search_with_score()的分数太高了, 因为问题在问答句子所占的比例太少了

问题的点不在于上下文，我只想知道怎么让短问题匹配得分更低，看看还有没有其他简单的方式能够解决这个问题

admin · 2023 年9 月 3 日 10:19

端问题的匹配度分数为什么要更低这是啥意思，没有明白。你问题的本质是不是还是“怎么让通过向量DB检索出的结果跟真实匹配分数更准确？” 如果是这样的话，你要做的目标应该是怎么让query更丰富。