JOURNAL

这里放的是我平时写下来的技术思考。

有些文章是为了把一个问题讲透，有些是为了整理我自己在 AI、Agent、RAG 这些方向上的理解。它们更像是我的长期笔记：一边学习，一边拆解，一边把复杂问题说明白。

文章目录

为分类任务微调表示模型

25 分钟

构建文本嵌入模型

25 分钟

多模态大模型

45 分钟

语义搜索与RAG

30 分钟

高级文本生成技术与工具

40 分钟

提示工程

35 分钟

文本聚类和主题建模

25 分钟

文本分类

20 分钟

LLM的内部机制

50 分钟

词元和嵌入

30 分钟

大模型简介

20 分钟

RAG 面试八股文完全指南

40 分钟

AI Agent 面试八股文完全指南

35 分钟

AI2025-04-01

为分类任务微调表示模型

深入讲解为分类任务微调表示模型的完整流程：分类头设计、全量微调 vs LoRA 的选择、小样本场景下的 SetFit 方案，以及过拟合防范与模型评估。

微调文本分类面试

阅读全文25 分钟

构建文本嵌入模型

从 Sentence-BERT 到对比学习（SimCSE），再到 Matryoshka 嵌入和 MTEB 基准评估——系统讲解如何构建和优化高质量文本嵌入模型。

打开文章25 分钟

AI2025-03-30

多模态大模型

解析多模态大模型的核心架构：CLIP 的对比学习、ViT 图像 patch 编码、图文跨模态对齐机制，以及 VQA、图像描述等多模态任务的技术方案。

打开文章45 分钟

AI2025-03-29

语义搜索与RAG

从稀疏检索（BM25）到稠密向量检索，再到混合检索与 Reranking——系统梳理语义搜索与 RAG 的完整技术栈，以及实际工程中的优化策略。

打开文章30 分钟

AI2025-03-28

高级文本生成技术与工具

深入解析高级文本生成技术：结构化输出与约束解码、Beam Search 与采样策略的权衡、RLHF 与 DPO 的对比，以及 Function Calling 的工程实现。

打开文章40 分钟

AI2025-03-27

提示工程

系统整理提示工程核心技巧：Few-Shot 与 Zero-Shot 的选择、CoT 思维链的触发条件、System Prompt 的设计原则、提示注入防御，以及 Temperature/Top-P 参数的调控逻辑。

打开文章35 分钟

AI2025-03-26

文本聚类和主题建模

对比 LDA 与 BERTopic 的核心差异，解析 K-Means、层次聚类在文本上的适用场景，以及 UMAP 降维如何配合向量嵌入做高效主题发现。

打开文章25 分钟

AI2025-03-25

文本分类

从传统机器学习到 BERT 微调再到零样本分类，梳理文本分类的完整技术路线：何时用规则、何时微调、何时用大模型，以及多标签场景的处理方法。

打开文章20 分钟

AI2025-03-24

LLM的内部机制

全面拆解 LLM 内部机制：自注意力计算、KV Cache 原理、RoPE 位置编码、GQA 优化、MoE 架构、量化推理——覆盖面试最高频的底层原理题。

打开文章50 分钟

AI2025-03-23

词元和嵌入

深入解析分词器原理（BPE、字节级BPE）、静态词嵌入与上下文嵌入的本质区别、负例采样的作用，以及嵌入技术在推荐系统中的实际应用。

打开文章30 分钟

AI2025-03-22

大模型简介

从 Transformer 编解码器架构、GPT 与 BERT 的设计取舍，到上下文长度限制、推理延迟指标、预训练与微调范式——系统梳理大模型的基础概念。

打开文章20 分钟

AI2025-03-21

RAG 面试八股文完全指南

全面解析 RAG 技术栈：从基本原理、检索与生成流水线、切块与嵌入策略，到 GraphRAG、多轮检索、幻觉防治，以及 Transformer、Function Call、MCP 等相关知识点。

打开文章40 分钟

AI2025-03-20

AI Agent 面试八股文完全指南

系统梳理 AI Agent 核心概念：从定义与组件、ReAct/CoT/ToT 等推理框架、Memory 与 Tool Use 设计，到多智能体协作、安全对齐与框架选型，覆盖面试高频考点。

打开文章35 分钟