本篇文章实现了一个 从零开始构建的多模态检索增强生成(RAG)系统,融合了 BM25 语义检索 + Dense 向量检索 + Cross-Encoder 重排序 + LLM 回答生成 的完整流程。
目标是模拟真实生产中的 RAG 管线,实现一个可复用的、轻量级的本地 RAG 框架。
本篇文章实现了一个 从零开始构建的多模态检索增强生成(RAG)系统,融合了 BM25 语义检索 + Dense 向量检索 + Cross-Encoder 重排序 + LLM 回答生成 的完整流程。
目标是模拟真实生产中的 RAG 管线,实现一个可复用的、轻量级的本地 RAG 框架。
最基础的 RAG 实现:TF-IDF 与 BM25 检索器解析
容器化部署DOJ项目时遇到的各种坑与解决方案实录,涵盖从打包、内存管理、Nginx配置到Docker-in-Docker的方方面面,帮助开发者顺利完成微服务架构的容器化转型。
本文深入探讨常用排序算法的原理、实现及其优缺点,面试专用。
Kubernetes 的高可用(High Availability, HA)集群设计旨在确保集群在面对节点故障、网络分区或其他意外情况时,仍能持续提供服务。本文将详细介绍 K8S 的核心组件及其高可用实现方式。
讲解了K8S集群中运维相关的补充知识,包括网络策略、外部服务暴露、资源限制等内容。
讲解了K8S集群中资源监控系统Prometheus的原理和部署方法。
讲解了K8S集群中日志收集与分析系统Loki的原理和部署方法。