Infogap 信息流

过滤噪音，保留 AI 信号。

页面仅读取已加工的 items 表，并以中英双语呈现。

第 2 / 6 页

筛选

教程来源: MEDIUM LARGE LANGUAGE MODELS2026年6月13日重要度: 2/5

机器学习工程师LLM概念指南：标记、Transformer、嵌入、提示、RAG与微调

本教程为机器学习工程师提供了LLM核心概念的实用概述。从标记、Transformer架构和嵌入等基础元素开始，然后涵盖提示工程、检索增强生成（RAG）和微调等高级技术。该指南强调培养合理的工程判断力，以超越试错式的盲目提示。未涉及新研究或产品发布，仅作为教育资源。

社交来源: V2EX2026年6月12日重要度: 2/5

Livid 演示了在 V2EX 上建立自建节点（如 /go/wunder），将产品功能描述以帖子形式发布在该节点后，V2EX Chat 即可基于这些内容回答产品相关问题，形成检索增强的 AI 客服。示例通过一个 edge.v2ex.com 聊天对话链接展示了仅依赖节点帖子的问答效果，无需额外开发聊天机器人即可实现产品知识库问答。

论文来源: ARXIV2026年6月12日重要度: 4/5

本文提出检索增强的强化微调（RA-RFT），一种教授语言模型通过类比进行推理的后训练框架。它首先通过金标准相关性蒸馏训练一个推理感知的检索器，使上下文按预期推理收益而非语义相似度排序。然后使用检索到的类比演示，在可验证的结果奖励下对策略模型进行强化学习微调，使其学会利用推理轨迹。分析表明，推理感知检索能挖掘互补的解题策略，为不同问题提供独特的推理支架。在AIME 2025基准上，RA-RFT在平均@32准确率上较GRPO为Qwen3-1.7B和Qwen3-4B分别提升了7.1和2.8个百分点，表明推理感知检索是与奖励设计或训练课程正交的改进维度。

论文来源: ARXIV2026年6月12日重要度: 4/5

本文提出SkMTEB，首个斯洛伐克语综合性MTEB风格文本嵌入基准，包含31个数据集和7种任务类型。对31个嵌入模型的评测表明，大型指令微调多语言模型表现最佳，而现有的斯洛伐克语NLU模型在嵌入任务上迁移效果差。作者通过词汇裁剪和微调Multilingual E5模型，开发了e5-sk-small（45M参数）和e5-sk-large（365M参数）。尽管模型尺寸减少高达62%，但开源模型性能可媲美商业API，并适用于语义搜索和RAG的本地部署。研究公开了基准、模型、数据及代码，为其他资源匮乏语言提供了可复现的路径。

论文来源: ARXIV2026年6月12日重要度: 4/5

该论文提出基准测试FORGE，测量当检索网页被污染时，搜索增强型大语言模型推荐虚假产品的频率。FORGE将225个真实产品、15个类别、5种消费场景中的描述改写为虚假内容，并测试了12个商业和开源模型。单个污染页面导致模型被欺骗推荐虚假产品的概率最高达27%，而污染前三个搜索结果则使该概率升至73.8%。漏洞随产品类别而异，对模型先验知识较弱的产品更易被利用，且推理模型有时会编造社会证明，加剧虚假推荐。论文评估了三种防御措施——怀疑提示、基于模型先验的共识过滤和跨文档证据过滤，但怀疑可能适得其反，过滤则可能抑制真实产品推荐。

教程来源: TOWARDSDATASCIENCE2026年6月12日重要度: 3/5

该Towards Data Science教程介绍了一种PDF解析方法，输出关系型DataFrames而非纯文本，提取线条、页面、目录、图像、交叉引用、标题、文本段和解析摘要等结构化元素。这种关系型结构旨在通过保留文档结构来改进检索增强生成（RAG）流程。文章属于“企业文档智能”系列。