JOURNAL

这里放的是我平时写下来的技术思考。

有些文章是为了把一个问题讲透,有些是为了整理我自己在 AI、Agent、RAG 这些方向上的理解。它们更像是我的长期笔记:一边学习,一边拆解,一边把复杂问题说明白。

为分类任务微调表示模型
AI2025-04-01

为分类任务微调表示模型

深入讲解为分类任务微调表示模型的完整流程:分类头设计、全量微调 vs LoRA 的选择、小样本场景下的 SetFit 方案,以及过拟合防范与模型评估。

微调文本分类面试
阅读全文25 分钟

更多文章

AI2025-03-31

构建文本嵌入模型

从 Sentence-BERT 到对比学习(SimCSE),再到 Matryoshka 嵌入和 MTEB 基准评估——系统讲解如何构建和优化高质量文本嵌入模型。

打开文章25 分钟
AI2025-03-30

多模态大模型

解析多模态大模型的核心架构:CLIP 的对比学习、ViT 图像 patch 编码、图文跨模态对齐机制,以及 VQA、图像描述等多模态任务的技术方案。

打开文章45 分钟
AI2025-03-29

语义搜索与RAG

从稀疏检索(BM25)到稠密向量检索,再到混合检索与 Reranking——系统梳理语义搜索与 RAG 的完整技术栈,以及实际工程中的优化策略。

打开文章30 分钟
AI2025-03-28

高级文本生成技术与工具

深入解析高级文本生成技术:结构化输出与约束解码、Beam Search 与采样策略的权衡、RLHF 与 DPO 的对比,以及 Function Calling 的工程实现。

打开文章40 分钟
AI2025-03-27

提示工程

系统整理提示工程核心技巧:Few-Shot 与 Zero-Shot 的选择、CoT 思维链的触发条件、System Prompt 的设计原则、提示注入防御,以及 Temperature/Top-P 参数的调控逻辑。

打开文章35 分钟
AI2025-03-26

文本聚类和主题建模

对比 LDA 与 BERTopic 的核心差异,解析 K-Means、层次聚类在文本上的适用场景,以及 UMAP 降维如何配合向量嵌入做高效主题发现。

打开文章25 分钟
AI2025-03-25

文本分类

从传统机器学习到 BERT 微调再到零样本分类,梳理文本分类的完整技术路线:何时用规则、何时微调、何时用大模型,以及多标签场景的处理方法。

打开文章20 分钟
AI2025-03-24

LLM的内部机制

全面拆解 LLM 内部机制:自注意力计算、KV Cache 原理、RoPE 位置编码、GQA 优化、MoE 架构、量化推理——覆盖面试最高频的底层原理题。

打开文章50 分钟
AI2025-03-23

词元和嵌入

深入解析分词器原理(BPE、字节级BPE)、静态词嵌入与上下文嵌入的本质区别、负例采样的作用,以及嵌入技术在推荐系统中的实际应用。

打开文章30 分钟
AI2025-03-22

大模型简介

从 Transformer 编解码器架构、GPT 与 BERT 的设计取舍,到上下文长度限制、推理延迟指标、预训练与微调范式——系统梳理大模型的基础概念。

打开文章20 分钟
AI2025-03-21

RAG 面试八股文完全指南

全面解析 RAG 技术栈:从基本原理、检索与生成流水线、切块与嵌入策略,到 GraphRAG、多轮检索、幻觉防治,以及 Transformer、Function Call、MCP 等相关知识点。

打开文章40 分钟
AI2025-03-20

AI Agent 面试八股文完全指南

系统梳理 AI Agent 核心概念:从定义与组件、ReAct/CoT/ToT 等推理框架、Memory 与 Tool Use 设计,到多智能体协作、安全对齐与框架选型,覆盖面试高频考点。

打开文章35 分钟