我们最近交付的一个语义搜索服务在内部测试时表现尚可,但上线后,随着查询复杂度和并发量的增加,P95 延迟开始频繁触及告警阈值。服务本身并不复杂:一个 FastAPI 接口接收查询文本,使用 Scikit-learn 加载的 TfidfVec
2023-10-27