Jina 在本项目中用于抓取增强、深度检索、向量化与重排。
在 trendpublish.config.ts 中设置:
providers: {
fetch: {
jina: {
apiKey: "your_jina_api_key",
},
},
}未设置时,相关模块会报 providers.fetch.jina.apiKey is not set。
- Reader 抓取
- DeepSearch 深度检索
- Embedding 向量生成
- Reranker 结果重排
- Reader:
src/integrations/fetch/providers/jina/jina-reader-scraper.ts - DeepSearch:
src/integrations/fetch/providers/jina/jina-deepsearch-scraper.ts - Embedding:
src/integrations/vector/providers/jina/jina-embedding-provider.ts - Reranker:
src/integrations/vector/providers/jina/jina-reranker-provider.ts
- 抓取网页正文时,优先走 Jina Reader。
- 搜索类问答场景,使用 DeepSearch 获取汇总答案和来源。
- 需要语义相关性排序时,先 Embedding 再 Reranker。
- 检查
providers.fetch.jina.apiKey是否正确、是否过期。
- 缩小输入文本长度。
- 降低并发。
- 增加上游网络重试机制。
- 优先改输入内容质量。
- 按场景切换不同模型。
- 在业务侧增加规则过滤,再交给模型处理。
- Jina 官网: https://jina.ai/?sui=apikey
- Jina 文档: https://docs.jina.ai/