Pinecone 与 Pulumi 将于 6 月 18 日在纽约举办 AI 基础设施讲座,涵盖向量搜索与 RAG
Pinecone 与 Pulumi 将于 6 月 18 日下午 5 点在纽约联合举办一场晚间技术讲座。活动将探讨向量搜索与检索增强生成(RAG)背后的基础设施、基础设施即代码(IaC)实践,并演示一个集成现实世界数据到模型上下文中的 Slack AI 跑步教练机器人。活动包含演示、问答环节和社交聚会。
Thinkgap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
6 条内容
Pinecone 与 Pulumi 将于 6 月 18 日下午 5 点在纽约联合举办一场晚间技术讲座。活动将探讨向量搜索与检索增强生成(RAG)背后的基础设施、基础设施即代码(IaC)实践,并演示一个集成现实世界数据到模型上下文中的 Slack AI 跑步教练机器人。活动包含演示、问答环节和社交聚会。
不同于大多数每会话重置的 AI 智能体,Jenova AI 智能体可持久化用户上下文,最长会话达 1600 万 token。通过 Pinecone 向量检索,所有数据可在 10 毫秒内查取。这一持久化知识层帮助公司实现年经常性收入超 100 万美元、用户超 20 万,并在 5 个月内收入增长 10 倍,几乎全部为自然增长。创始人 Boris Wang 表示,Pinecone 知识层是决定用户留存的基础和产品的护城河。
Pinecone分享了一个使用Apify、Pinecone和Gemini构建RAG管道的n8n模板。该管道自动抓取网站内容,将其索引为Pinecone中的向量嵌入,并检索相关上下文以生成答案。这使得支持聊天机器人能够保持数据实时更新,无需手动处理。模板链接以及Apify的深入博客文章均在本帖中提供。
在四周内,三个企业客户表现出相同模式:大部分推理开销用于检索循环。通用索引缺乏领域知识、查询类型和任务结构,导致检索循环在模型推理之前运行。Pinecone的Nexus在查询前编译知识以解决此低效问题。完整结果可通过提供的链接获取。
Pinecone在MSBuild上宣布其知识引擎Pinecone Nexus与Microsoft OneLake集成。该集成允许用户在OneLake或Fabric中的结构化数据上构建可靠的生产级知识层。员工数据工程师Simon Lu在快速演示中展示了操作方法。完整公告和演示可通过提供的链接获取。
LlamaIndex宣布其PDF解析功能,并在旧金山展开高调广告牌宣传。该公司投入了七位数资金进行营销。这凸显了他们为大型语言模型应用提供文档解析的专注。这是来自其官方账号的推广推文。