机器学习工程师LLM概念指南:标记、Transformer、嵌入、提示、RAG与微调
本教程为机器学习工程师提供了LLM核心概念的实用概述。从标记、Transformer架构和嵌入等基础元素开始,然后涵盖提示工程、检索增强生成(RAG)和微调等高级技术。该指南强调培养合理的工程判断力,以超越试错式的盲目提示。未涉及新研究或产品发布,仅作为教育资源。
AI 论文、发布、工具与金融信号
Loading / 加载中
Infogap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
第 2 / 6 页
本教程为机器学习工程师提供了LLM核心概念的实用概述。从标记、Transformer架构和嵌入等基础元素开始,然后涵盖提示工程、检索增强生成(RAG)和微调等高级技术。该指南强调培养合理的工程判断力,以超越试错式的盲目提示。未涉及新研究或产品发布,仅作为教育资源。
Livid 演示了在 V2EX 上建立自建节点(如 /go/wunder),将产品功能描述以帖子形式发布在该节点后,V2EX Chat 即可基于这些内容回答产品相关问题,形成检索增强的 AI 客服。示例通过一个 edge.v2ex.com 聊天对话链接展示了仅依赖节点帖子的问答效果,无需额外开发聊天机器人即可实现产品知识库问答。
本文提出检索增强的强化微调(RA-RFT),一种教授语言模型通过类比进行推理的后训练框架。它首先通过金标准相关性蒸馏训练一个推理感知的检索器,使上下文按预期推理收益而非语义相似度排序。然后使用检索到的类比演示,在可验证的结果奖励下对策略模型进行强化学习微调,使其学会利用推理轨迹。分析表明,推理感知检索能挖掘互补的解题策略,为不同问题提供独特的推理支架。在AIME 2025基准上,RA-RFT在平均@32准确率上较GRPO为Qwen3-1.7B和Qwen3-4B分别提升了7.1和2.8个百分点,表明推理感知检索是与奖励设计或训练课程正交的改进维度。
本文提出SkMTEB,首个斯洛伐克语综合性MTEB风格文本嵌入基准,包含31个数据集和7种任务类型。对31个嵌入模型的评测表明,大型指令微调多语言模型表现最佳,而现有的斯洛伐克语NLU模型在嵌入任务上迁移效果差。作者通过词汇裁剪和微调Multilingual E5模型,开发了e5-sk-small(45M参数)和e5-sk-large(365M参数)。尽管模型尺寸减少高达62%,但开源模型性能可媲美商业API,并适用于语义搜索和RAG的本地部署。研究公开了基准、模型、数据及代码,为其他资源匮乏语言提供了可复现的路径。
该论文提出基准测试FORGE,测量当检索网页被污染时,搜索增强型大语言模型推荐虚假产品的频率。FORGE将225个真实产品、15个类别、5种消费场景中的描述改写为虚假内容,并测试了12个商业和开源模型。单个污染页面导致模型被欺骗推荐虚假产品的概率最高达27%,而污染前三个搜索结果则使该概率升至73.8%。漏洞随产品类别而异,对模型先验知识较弱的产品更易被利用,且推理模型有时会编造社会证明,加剧虚假推荐。论文评估了三种防御措施——怀疑提示、基于模型先验的共识过滤和跨文档证据过滤,但怀疑可能适得其反,过滤则可能抑制真实产品推荐。
该Towards Data Science教程介绍了一种PDF解析方法,输出关系型DataFrames而非纯文本,提取线条、页面、目录、图像、交叉引用、标题、文本段和解析摘要等结构化元素。这种关系型结构旨在通过保留文档结构来改进检索增强生成(RAG)流程。文章属于“企业文档智能”系列。