MARKTECHPOST · 2026年6月13日 · 重点
月之暗面发布了 Kimi K2.7-Code,一款基于 Modified MIT 许可的开源代码专用代理模型。它采用混合专家架构,总参数 1 万亿,每令牌激活 32B,包含 384 个专家(每步选 8+1 共享),使用 MLA 注意力、SwiGLU 前馈网络和一个 400M 参数的 MoonViT 视觉编码器。模型支持 256K 上下文窗口,原生 INT4 量化,强制开启思考模式并固定采样参数(温度 1.0、top_p 0.95、n 1)。公司公布的基准测试显示,K2.7-Code 在 Kimi Code Bench v2 上得分为 62.0(相对 K2.6 提升 21.8%),在 MCP Mark Verified 上得分为 81.1(超过 Claude Opus 4.8 的 76.4),推理 token 消耗比 K2.6 减少约 30%,在代理工作流中降低成本和延迟。模型权重约 595 GB,已发布在 Hugging Face,可通过 vLLM、SGLang 或 KTransformers 自托管;API 使用 kimi-k2.7-code 模型名,兼容 OpenAI 接口。
MARKTECHPOST · 2026年6月13日
该教程构建了一个完整的空间图学习流程,使用city2graph库收集东京涩谷周边OpenStreetMap的真实POI和街道网络数据(含合成聚类备用方案),并设计局部密度、街道距离等空间特征。构建了六类邻近图(KNN、Delaunay、Gabriel、RNG、EMST、Waxman)以比较不同图拓扑,随后在齐次KNN图上训练两层GraphSAGE模型,根据空间结构和节点特征预测城市功能类别(餐饮、零售、教育、健康),并给出了测试准确率和宏观F1分数。流程还展示了利用桥梁边构建异构图类型,并通过PyTorch Geometric的to_hetero运行异构图神经网络前向传播,同时使用PCA可视化学到的嵌入和地理预测图。
MARKTECHPOST · 2026年6月12日 · 重点
Zyphra 发布了 Zamba2-VL 视觉语言模型系列,包含 1.2B、2.7B 和 7B 三种参数规模。每个模型采用混合 Mamba2 状态空间模型与少量共享 Transformer 块相结合的架构,取代密集注意力以实现近线性推理扩展。该模型使用 Qwen2.5-VL 视觉编码器与此骨干配合,支持单图、多图理解及定位。在 14 项基准测试中,Zamba2-VL 在视觉计数和文档理解方面表现强劲(例如 2.7B 模型 DocVQA 得分 90.9),但在知识密集型推理(如 MMMU 和 MathVista)上落后于更大基线。其最大优势是相比同等 Transformer VLM 首 token 时间降低约一个数量级,尤其有利于长多模态输入和端侧部署。权重以 Apache 2.0 协议在 HuggingFace 开源,并提供推理代码。
MARKTECHPOST · 2026年6月9日
本教程逐步讲解如何在Colab笔记本中设置NVIDIA cuTile Python,检查GPU/CUDA/驱动兼容性,并使用直接加载/存储、gather/scatter和矩阵乘累加实现向量加法、矩阵加法和矩阵乘法的分块内核。它提供了当cuTile不可用时回退到PyTorch的包装函数,并通过正确性检查验证输出与PyTorch操作的一致性。工作流程还包括对标内核性能与等价PyTorch操作,并可视化中位数运行时间,然后建议进一步的实验,如分块大小调优、精度比较和操作融合。即使没有所需的cuTile运行时,该笔记本也完全可在Colab中执行。
MARKTECHPOST · 2026年6月8日 · 重点
小米的MiMo-V2.5-Pro-UltraSpeed在商用GPU上以每秒超过1000 tokens的速度运行万亿参数MoE模型,这是该规模下的里程碑。速度提升来自三项协同技术:仅应用于MoE专家的FP4量化、可并行预测整个token块的DFlash推测解码,以及针对微秒级操作优化的TileRT运行时。拒绝采样确保无损解码,同时保持输出质量。该系统在单台8-GPU节点上运行,并通过2026年6月9日至23日的有限API试用提供。
MARKTECHPOST · 2026年6月8日 · 重点
微软AI发布了MAI-Transcribe-1.5,这是一款更新的自动语音识别模型,支持43种语言并使用单一系统。它在Artificial Analysis排行榜上实现了2.4%的词错误率,并在FLEURS基准上声称达到最佳准确率。该模型在长音频转录上速度提升高达5倍,能在15秒内转录一小时音频。新增的关键词偏置功能可将领域特定术语的错误率减少多达30%。MAI-Transcribe-1.5已集成到Copilot、Teams和Dynamics 365等微软产品中,并通过Azure AI Foundry提供。