Tag: LLM

All the articles with the tag "LLM".

AI 大模型对比 2026 年中版：blog080 写完两个多月，模型层换了一轮✓

15 May, 2026

blog080 写于 2026 年 3 月初。两个多月过去，GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro 全部发布，开源旗舰 GLM-5.1/Qwen 3 Coder 缩到闭源 5-15 分。这是 5 月升级版：变了什么、3 月选型怎么换。
AI Agent 持久记忆架构对比：file-based vs 向量检索，blog-preflight Subagent 实测✓

2 May, 2026

把同一个 Subagent 同时接 Claude Code 自带 file-based memory 和 mem0 向量检索，对比 token 消耗、召回质量、跨会话学习效果。给出"什么数据规模用哪种"的具体阈值，并讨论 procedural memory 这个最弱但最有潜力的方向。
GPT-5.5 vs Claude Opus 4.6 vs Gemini 2.5 Pro 编程能力对比 2026✓

29 Apr, 2026

2026 年主流大模型编程能力横评：GPT-5.5、Claude Opus 4.6、Gemini 2.5 Pro 的 Benchmark 数据、定价、实际编程表现全面对比，帮你找到最适合日常开发的模型。
Flash-MoE：在 MacBook 上跑 397B 参数大模型，4.4 token/s✓

31 Mar, 2026

一个开发者用 24 小时写出了 Flash-MoE，在 48GB MacBook Pro 上以 4.4 token/s 运行 397B 参数的 Qwen3.5 模型。只用约 6GB 内存，不需要云端 GPU。拆解它的技术原理：SSD 流式加载、Metal 着色器优化、MoE 稀疏激活。
MCP 2026 路线图解读：从本地工具到生产级 Agent 基础设施✓

16 Mar, 2026

MCP（Model Context Protocol）发布 2026 路线图，四大优先方向：传输层演进、Agent 通信、治理成熟化、企业就绪。从技术角度解读每个方向的具体问题和解决思路。
2026 AI 大模型全景对比：国内外 12 款主流模型实测✓

6 Mar, 2026

实测 12 款 AI 大模型（GPT-4o、Claude 3.5、Gemini 2.0、Qwen 2.5、GLM-4、Kimi 等），覆盖代码生成、中文写作、推理 6 大场景。附性能跑分、月费对比和选型决策树，帮你选出最适合的模型。
构建具有长期记忆的 AI Agent：从设计模式到生产实践✓

2 Mar, 2026

深入探讨如何为 AI Agent 构建情景记忆、语义记忆、过程记忆三种长期记忆系统，包含完整技术架构设计、代码实现和生产优化方案。
AI Agent 记忆系统实战：OpenClaw Memory 最佳实践✓

23 Feb, 2026

深入解析 OpenClaw 的记忆系统架构，从文件结构到检索优化，提供可落地的 AI Agent 记忆管理最佳实践

Tag: LLM

AI 大模型对比 2026 年中版：blog080 写完两个多月，模型层换了一轮✓

AI Agent 持久记忆架构对比：file-based vs 向量检索，blog-preflight Subagent 实测✓

GPT-5.5 vs Claude Opus 4.6 vs Gemini 2.5 Pro 编程能力对比 2026✓

Flash-MoE：在 MacBook 上跑 397B 参数大模型，4.4 token/s✓

MCP 2026 路线图解读：从本地工具到生产级 Agent 基础设施✓

2026 AI 大模型全景对比：国内外 12 款主流模型实测✓

构建具有长期记忆的 AI Agent：从设计模式到生产实践✓

AI Agent 记忆系统实战：OpenClaw Memory 最佳实践✓