Agent TARS CLI 需要 Node.js 作为运行时,你需要安装 Node.js >= 22 版本,推荐使用 Node.js LTS 版本。
使用以下命令检查当前 Node.js 版本:
如果当前环境中没有安装 Node.js,或者安装的版本过低,你可以使用 nvm 进行安装。
以下是通过 nvm 安装的示例:
默认情况下,Agent TARS CLI 启动并控制你的 本地浏览器
,你需要安装 Chrome。
安装最新版本:
Agent TARS 框架设计了一个 Model Provider 机制,允许你自由地使用不同的模型。
目前 Agent TARS 的模型兼容性状态如下:
Model Provider | 模型 | 文本 | 视觉 | 工具调用 & MCP | 视觉定位 |
---|---|---|---|---|---|
volcengine | Seed1.5-VL | ✔️ | ✔️ | ✔️ | ✔️ |
anthropic | claude-3.7-sonnet | ✔️ | ✔️ | ✔️ | 🚧 |
openai | gpt-4o | ✔️ | ✔️ | ✔️ | 🚧 |
Seed1.5-VL 是一个强大且高效的视觉语言基础模型,设计用于高级通用多模态理解和推理,Seed1.5-VL 已部署在火山引擎上,模型 ID 为 doubao-1-5-thinking-vision-pro-250428
,一旦你获得了 API_KEY
,你可以使用下述命令启动 Agent TARS:
Claude 3.7 Sonnet 是 Anthropic 在 2025 年 2 月发布的首个具有混合推理能力的 Claude 模型。一旦你获得了 API_KEY
,你可以快速启动 Agent TARS:
GPT-4o 是 OpenAI 推出的高智能旗舰模型,一旦你获得了 API_KEY
,你可以用单个命令启动:
有关模型支持的更多详情,请查看 Model Provider。
当你使用 agent-tars
启动时:
你将在控制台中看到以下输出:
在浏览器中打开控制台中的链接:http://localhost:8888 ,你可以看到 Web UI:
输入这个 Prompt:
恭喜 🎉!此时,你已成功启动 Agent TARS!
如果你遇到任何问题,请随时在 Github 上向我们报告。
虽然你可以使用 CLI 快速启动,但我们仍然建议创建一个 Global Workspace。这允许你通过配置文件维护配置,以及存储你的文件系统。让我们开始:
接下来,你可以在 Global Workspace 中使用 TypeScript 维护配置,而不是处理 CLI 参数,并且受益于完整的类型检查:
有关完整配置详情,请前往配置,有关 Workspace 的使用细节,请前往Workspace。