Tag: LLM
All the articles with the tag "LLM".
-
AI 大模型对比 2026 年中版:blog080 写完两个多月,模型层换了一轮
blog080 写于 2026 年 3 月初。两个多月过去,GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro 全部发布,开源旗舰 GLM-5.1/Qwen 3 Coder 缩到闭源 5-15 分。这是 5 月升级版:变了什么、3 月选型怎么换。
-
AI Agent 持久记忆架构对比:file-based vs 向量检索,blog-preflight Subagent 实测
把同一个 Subagent 同时接 Claude Code 自带 file-based memory 和 mem0 向量检索,对比 token 消耗、召回质量、跨会话学习效果。给出"什么数据规模用哪种"的具体阈值,并讨论 procedural memory 这个最弱但最有潜力的方向。
-
GPT-5.5 vs Claude Opus 4.6 vs Gemini 2.5 Pro 编程能力对比 2026
2026 年主流大模型编程能力横评:GPT-5.5、Claude Opus 4.6、Gemini 2.5 Pro 的 Benchmark 数据、定价、实际编程表现全面对比,帮你找到最适合日常开发的模型。
-
Flash-MoE:在 MacBook 上跑 397B 参数大模型,4.4 token/s
一个开发者用 24 小时写出了 Flash-MoE,在 48GB MacBook Pro 上以 4.4 token/s 运行 397B 参数的 Qwen3.5 模型。只用约 6GB 内存,不需要云端 GPU。拆解它的技术原理:SSD 流式加载、Metal 着色器优化、MoE 稀疏激活。
-
MCP 2026 路线图解读:从本地工具到生产级 Agent 基础设施
MCP(Model Context Protocol)发布 2026 路线图,四大优先方向:传输层演进、Agent 通信、治理成熟化、企业就绪。从技术角度解读每个方向的具体问题和解决思路。
-
2026 AI 大模型全景对比:国内外 12 款主流模型实测
实测 12 款 AI 大模型(GPT-4o、Claude 3.5、Gemini 2.0、Qwen 2.5、GLM-4、Kimi 等),覆盖代码生成、中文写作、推理 6 大场景。附性能跑分、月费对比和选型决策树,帮你选出最适合的模型。
-
构建具有长期记忆的 AI Agent:从设计模式到生产实践
深入探讨如何为 AI Agent 构建情景记忆、语义记忆、过程记忆三种长期记忆系统,包含完整技术架构设计、代码实现和生产优化方案。
-
AI Agent 记忆系统实战:OpenClaw Memory 最佳实践
深入解析 OpenClaw 的记忆系统架构,从文件结构到检索优化,提供可落地的 AI Agent 记忆管理最佳实践