<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>AionDocs</title><link>https://hiraethecho.github.io/docs/tags/ai/</link><description>Recent contentinAionDocs</description><generator>Hugo --0.152.2</generator><language>en</language><managingEditor>wyz2016zxc@outlook.com(Hiraeth)</managingEditor><webMaster>wyz2016zxc@outlook.com(Hiraeth)</webMaster><lastBuildDate>Mon, 16 Mar 2026 15:39:39 +0800</lastBuildDate><atom:link href="https://hiraethecho.github.io/docs/tags/ai/index.xml" rel="self" type="application/rss+xml"/><item><title>探索ai时遇到的混乱</title><link>https://hiraethecho.github.io/docs/dev/opencode/</link><pubDate>Wed, 30 Jul 2025 00:00:00 +0000</pubDate><author>wyz2016zxc@outlook.com(Hiraeth)</author><guid>https://hiraethecho.github.io/docs/dev/opencode/</guid><description>玩llm，agent，mcp，感到一些混乱</description><content:encoded><![CDATA[<h1 id="一团乱麻的ai">
  <a class="anchor inpage" href="#%e4%b8%80%e5%9b%a2%e4%b9%b1%e9%ba%bb%e7%9a%84ai">#</a>一团乱麻的ai</h1>
<h2 id="cli">
  <a class="anchor inpage" href="#cli">##</a>cli</h2>
<p>在搞一些cli下的agent，发现一个开源的opencode，以及它在nvim的插件。结果</p>
<ul>
<li>两个不同的插件都叫<code>opencode.nvim</code>，于是lazyvim对同名插件支持有问题。用<code>name</code>修改其中一个为<code>opencode-nvim</code>后，似乎<code>require(&quot;opencode.nvim&quot;)</code>会出问题。disable掉其中一个都不行，必须去掉一个插件，并且手动删除插件，重新下载才行。</li>
<li>发现其中一个<code>opencode.nvim</code>是用<code>goose.nvim</code>改的，<code>goose</code>是另一个cli的agent，但是aur里<code>goose</code>包是个<code>Database migration tool written in Go</code>，我要的<code>goose</code>包名是<code>codename-goose</code></li>
<li>再之后发现还有另一个<code>opencode-ai/opencode</code>，一开始找的有插件的是<code>sst/opencode</code>，以及7/30突然前者<code>archive</code>停止开发了。</li>
<li>吃了个瓜发现一开始是<code>opencode-ai/opencode</code>，后来其中一批人想卖给公司，虽然承诺继续开源；另一批人不愿意，跑出去做了<code>sst/opencode</code>。再之后前者又搞了个新的<code>crush</code></li>
</ul>
<h2 id="llm">
  <a class="anchor inpage" href="#llm">##</a>llm</h2>
<p>我的llm来源，有个本地拉跨的ollama，然后deepseek充值了巨资五元人民币。还有<code>openroute</code>一堆免费模型，但是似乎额度在变少。<code>通义灵码</code>似乎免费开放了某个版本的<code>qwen3-coder</code>，刚出来的时候有人在吹，过两天又有人喷。我最好用的是github-copilot，教育优惠爽啊</p>
<h2 id="ide">
  <a class="anchor inpage" href="#ide">##</a>ide</h2>
<p>nvim上好几个，都用起来有点费劲。</p>
<p>vscode上有官方的copilot，然后有好用的cline。还有个ali的通义灵码，在我家目录拉屎，有点烦。</p>
<h2 id="mcp">
  <a class="anchor inpage" href="#mcp">##</a>mcp</h2>
<p>配置有两三种格式，而且还不太方便放在一个位置，有点烦</p>
<p>uvx和npx都产生好多cache类的东西，赛博洁癖感到痛苦</p>
<h2 id="app">
  <a class="anchor inpage" href="#app">##</a>app</h2>
<p>chatbox 和 cherrystudio，都是home到处拉屎，烦人</p>
<p>provider也不好配，mcp也不好配</p>
]]></content:encoded></item><item><title>大模型使用概览</title><link>https://hiraethecho.github.io/docs/dev/ai-overview/</link><pubDate>Tue, 22 Jul 2025 00:00:00 +0000</pubDate><author>wyz2016zxc@outlook.com(Hiraeth)</author><guid>https://hiraethecho.github.io/docs/dev/ai-overview/</guid><description>&lt;h1 id="概览"&gt;
&lt;a class="anchor inpage" href="#%e6%a6%82%e8%a7%88"&gt;#&lt;/a&gt;概览&lt;/h1&gt;
&lt;p&gt;使用大模型的能力，根据用户提供的知识库，调用某些工具，来实现用户的需求。
他们合为一个智能体（agent）。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;使用大模型的能力，需要一个LLM&lt;/li&gt;
&lt;li&gt;获取用户的知识库，需要RAG&lt;/li&gt;
&lt;li&gt;调用工具（function call），可以用mcp&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="agents"&gt;
&lt;a class="anchor inpage" href="#agents"&gt;##&lt;/a&gt;agents&lt;/h2&gt;
&lt;h3 id="cli-tools"&gt;
&lt;a class="anchor inpage" href="#cli-tools"&gt;###&lt;/a&gt;CLI Tools&lt;/h3&gt;
&lt;p&gt;命令行环境&lt;/p&gt;</description><content:encoded><![CDATA[<h1 id="概览">
  <a class="anchor inpage" href="#%e6%a6%82%e8%a7%88">#</a>概览</h1>
<p>使用大模型的能力，根据用户提供的知识库，调用某些工具，来实现用户的需求。
他们合为一个智能体（agent）。</p>
<ul>
<li>使用大模型的能力，需要一个LLM</li>
<li>获取用户的知识库，需要RAG</li>
<li>调用工具（function call），可以用mcp</li>
</ul>
<h2 id="agents">
  <a class="anchor inpage" href="#agents">##</a>agents</h2>
<h3 id="cli-tools">
  <a class="anchor inpage" href="#cli-tools">###</a>CLI Tools</h3>
<p>命令行环境</p>
<ul>
<li>private
<ul>
<li>gemini-cli Google Gemini 命令行工具，支持多模态交互与自动化。</li>
<li>claude code Anthropic Claude CLI，适用于安全高效的对话与文档处理。</li>
<li>qwen code开源了</li>
</ul>
</li>
<li>opensource
<ul>
<li>opencode 
</li>
<li>crush 
 这两个本来
，然后分支了，后者被<code>charm</code>买了。</li>
<li>
</li>
</ul>
</li>
</ul>
<p>基本上每个开发团队都有它们自己的cli，当然也主要对接自家llm。至于开源的三个，支持的模型和provider各不相同。<code>crush</code>暂时还不支持<code>github copilot</code>，但是可以配置<code>lsp</code>，比较有特色。</p>
<ul>
<li>goose</li>
<li>opencode</li>
<li>gemini</li>
<li>claude</li>
<li>crush</li>
<li>codex</li>
<li>aichat</li>
<li>auggie</li>
<li>cursor-agent</li>
</ul>
<h3 id="ides">
  <a class="anchor inpage" href="#ides">###</a>IDEs</h3>
<table>
  <thead>
      <tr>
          <th></th>
          <th>nvim</th>
          <th>vscode</th>
          <th>cursor</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td>native</td>
          <td>用内置terminal</td>
          <td>copilot</td>
          <td>yes</td>
      </tr>
      <tr>
          <td>plugin</td>
          <td>avante, CodeCompanion</td>
          <td>cline, ligma</td>
          <td></td>
      </tr>
      <tr>
          <td>cli</td>
          <td>opencode, goose</td>
          <td></td>
          <td></td>
      </tr>
  </tbody>
</table>
<p>nvim的
</p>
<h3 id="desktop-applications">
  <a class="anchor inpage" href="#desktop-applications">###</a>Desktop Applications</h3>
<p>桌面客户端。</p>
<ul>
<li>cherry studio 
。自带一些ai网站，deepseek之类的。但是用electron，有点难受。</li>
<li>chatbox 
。和cherry studio差不多</li>
<li>dify 开源 AI 应用开发与管理平台。特色是低代码。官网：
</li>
<li>open-webui：支持多模型的开源 Web UI，需要浏览器。为ollama设计。
</li>
</ul>
<h2 id="llm-large-language-models">
  <a class="anchor inpage" href="#llm-large-language-models">##</a>LLM (Large Language Models)</h2>
<h3 id="developers-and-models">
  <a class="anchor inpage" href="#developers-and-models">###</a>Developers and Models</h3>
<ul>
<li>
<p><strong>Gemini</strong><br>
Google DeepMind 推出的 Gemini 系列是 Google 旗下最先进的大语言模型，具备多模态理解、超长上下文、强推理和代码能力，广泛应用于搜索、助手、开发等场景。Gemini 2.5 Pro/Flash/Flash-Lite 等模型已开放 API 和网页端体验。<br>
官网：
</p>
</li>
<li>
<p><strong>claude</strong><br>
Claude 是由 Anthropic 推出的先进大语言模型，主打安全、可控和高效，广泛应用于对话、代码、文档处理等场景。最新模型包括 Claude Opus 4、Sonnet 4、Haiku 3.5 等，支持 API、网页端和多平台集成。<br>
官网：
</p>
</li>
<li>
<p><strong>openai</strong><br>
OpenAI 是全球领先的人工智能研究与应用公司，推出了 GPT-4o、ChatGPT、Sora 等多项前沿大模型及产品，广泛应用于自然语言处理、代码生成、图像与视频生成等领域。<br>
官网：
</p>
</li>
<li>
<p><strong>deepseek</strong><br>
DeepSeek（深度求索）是中国领先的开源大模型团队，推出 DeepSeek R1、V3、Coder、Math、VL 等多款大语言模型，支持多语言、代码、数学、视觉等多场景，开放 API、网页端和 App。<br>
官网：
</p>
</li>
<li>
<p><strong>kimi</strong><br>
Kimi 智能助手由 Moonshot AI（月之暗面）推出，主打超长上下文、强推理和多模态能力，适用于文档解析、知识问答、写作、代码等多场景，支持网页端和 API。<br>
官网：
</p>
</li>
<li>
<p><strong>qwen</strong><br>
通义千问是阿里云推出的多模态大模型，具备文本、图像、音频等多种能力，广泛应用于办公、开发、教育等领域，支持 API、网页端和企业集成。<br>
官网：
</p>
</li>
</ul>
<h3 id="providers">
  <a class="anchor inpage" href="#providers">###</a>Providers</h3>
<ul>
<li>多模型合集
<ul>
<li>OpenRouter 是一个统一的 LLM API 聚合平台，支持 OpenAI、Google、Anthropic、DeepSeek、Moonshot 等数百种主流大模型，提供统一接口、灵活计费和高可用性，适合开发者和企业多模型接入。官网：
</li>
<li>硅基流动</li>
<li>github copilot （有大学生认证的话这个最好用）</li>
</ul>
</li>
<li>专用
<ul>
<li>deepseek</li>
<li>gemini之类的</li>
</ul>
</li>
<li>本地
</li>
</ul>
<h3 id="capabilities">
  <a class="anchor inpage" href="#capabilities">###</a>Capabilities</h3>
<ul>
<li>chat：就聊天</li>
<li>coder：为代码编写和调试提供支持，通常包括代码生成、错误修复、代码重构等功能。</li>
<li>completion：代码补全，类似snippet</li>
<li>tool：调用工具，function call。有些纯chat的用不了。</li>
</ul>
<h2 id="mcp">
  <a class="anchor inpage" href="#mcp">##</a>mcp</h2>
<p>mcp-hub 可以把多个mcp整合为一个mcp，这样调用<code>mcp-hub</code>的mcp相当于调用多个mcp。</p>
<ul>
<li>npx</li>
<li>uvx</li>
</ul>
<h2 id="rag">
  <a class="anchor inpage" href="#rag">##</a>rag</h2>
<h2 id="others">
  <a class="anchor inpage" href="#others">##</a>others</h2>
<p>
</p>
<p>用
来把github copilot包装成 OpenAI 或 Anthropic的格式，然后被调用。</p>
]]></content:encoded></item></channel></rss>