Tag: AI
All the articles with the tag "AI".
-
Flash-MoE:在 MacBook 上跑 397B 参数大模型,4.4 token/s
一个开发者用 24 小时写出了 Flash-MoE,在 48GB MacBook Pro 上以 4.4 token/s 运行 397B 参数的 Qwen3.5 模型。只用约 6GB 内存,不需要云端 GPU。拆解它的技术原理:SSD 流式加载、Metal 着色器优化、MoE 稀疏激活。
-
工具指南17-AI Token计数器
详解 AI Token 计数器的使用方法和技术原理,帮助开发者精确估算 GPT、Claude 等大模型的 Token 消耗,优化 API 调用成本。
-
GitHub Squad:把 AI 开发团队直接塞进你的仓库
开源项目 Squad 让你用两条命令在仓库里初始化一支 AI 开发团队——架构师、前端、后端、测试各司其职,基于 Copilot 协作开发。聊聊它的架构设计、实际体验和背后的多 Agent 协作模式。
-
Computer-Use:当 AI Agent 不再需要 API
AI Agent 正在学会像人一样操作电脑——看屏幕、点鼠标、敲键盘。从 Anthropic Claude Computer Use 到 Microsoft CUA 再到 OpenAI Operator,Computer-Use 正在重新定义"软件集成"的含义。
-
Google Stitch 大更新:用自然语言做 UI 设计,Figma 该紧张了?
Google Stitch 迎来重大更新,从简单的 prompt-to-mockup 工具进化为 AI 原生设计画布。无限画布、语音交互、DESIGN.md 设计系统、MCP 集成——一次性发了五个大功能。免费、基于 Gemini,直接对标 Figma Make。
-
Karpathy 的 AutoResearch:让 AI Agent 自主跑完 700 个 ML 实验
解读 Karpathy 开源的 AutoResearch 项目:一个 630 行的 Python 脚本如何让 AI agent 在单 GPU 上自主进行 ML 实验,两天累计完成 700 个实验并找到 20 个有效优化。从架构设计到实际应用,分析这个"Karpathy Loop"模式为什么值得每个开发者关注。
-
MCP 2026 路线图解读:从本地工具到生产级 Agent 基础设施
MCP(Model Context Protocol)发布 2026 路线图,四大优先方向:传输层演进、Agent 通信、治理成熟化、企业就绪。从技术角度解读每个方向的具体问题和解决思路。
-
MiroFish:一个大四学生用 Vibe Coding 10天做出的群体智能预测引擎
深度解析 MiroFish 群体智能预测引擎的技术架构与设计思路。一个大四学生用 Vibe Coding 10天开发,登顶 GitHub Trending,获盛大3000万投资。从技术角度看它做对了什么。