昨天开始Manus刷屏了各种渠道。
一个国产、通用型的人工智能产品,自动干活的通用AI助手。
个人感觉有点言过其实了,AI领域Agent这块已经有比较丰富的框架和产品,Manus感觉像是一个缝合怪,整合了一些功能来实现信息收集与处理而已。
Manus官网:https://manus.im/
可以在Discord上蹲邀请码,昨天看已经有抄到10万一个邀请码了。不好评论。今天试试刚开源的OpenManus。
OpenManus
昨天大神们连夜开发出了OpenManus,平替Manus版本。一天时间Github的star数突破9千。
中文文档和仓库地址:https://github.com/mannaandpoem/OpenManus/blob/main/README_zh.md
我下午看的时候还只有8千,真是神奇,迫不急待试玩一下。虽然还有一些Issue,但是基本和架构无关。应该挺好玩。抓紧试用。
下面来安装和使用
试玩第一步:安装MiniConda管理python虚拟环境
当然别的虚拟环境包也可以用。uv、pipenv、virtualenv都是可以的。个人习惯了MiniConda简单方便。
Miniconda是一款小巧的python环境管理工具,安装包大约只有50M多点,其安装程序中包含conda软件包管理器和Python。一旦安装了Miniconda,就可以使用conda命令安装任何其他软件工具包并创建环境等。
Miniconda 是一个 Anaconda 的轻量级替代,默认只包含了 python 和 conda,但是可以通过 pip 和 conda 来安装所需要的包。
https://docs.conda.io/en/latest/miniconda.html
官网安装流程比较简单
https://www.anaconda.com/docs/getting-started/anaconda/install
Mac快速安装如下:粘贴到命令行,回车收工完事
mkdir -p ~/miniconda3
curl https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.sh -o ~/miniconda3/miniconda.sh
bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3
rm -rf ~/miniconda3/miniconda.sh
添加到bash环境中:添加之后可以使用。需要关闭或者新开一个终端才能生效。
~/miniconda3/bin/conda init bash
~/miniconda3/bin/conda init zsh
第二步:安装
1、安装新的python虚拟环境
conda create -n open_manus python=3.12
conda activate open_manus
2、克隆仓库:
git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus
还是老提示,克隆不了https的,走ssh克隆会方便一些。
克隆地址换成:git@github.com:mannaandpoem/OpenManus.git
即可
3、安装依赖:
cd OpenManus # 进入OpenManus目录
# 安装依赖包
pip install -r requirements.txt
第三步:配置大模型
OpenManus 需要配置使用的 LLM API,请按以下步骤设置:
在 config 目录创建 config.toml 文件(可从示例config.example.toml复制):
编辑 config/config.toml 添加 API 密钥和自定义设置:
这里要说明:代码里面使用了Function Call功能,如果是火山引擎的DeepSeek可能用不了。
官网的说是支持Function Call但是常常用不了模型,再不用说Function Call了。直接换GPT-4o-mini把玩一下了
视觉模型选择免费的Google Gemini。
我的配置文件如下:
# Global LLM configuration
[llm]
model = "gpt-4o-mini"
base_url = "https://gpt.xxxx.com/v1"
api_key = "sk-xxx"
max_tokens = 4096
temperature = 0.0
# Optional configuration for specific LLM models
[llm.vision]
model = "gemini-2.0-flash"
base_url = "https://ai-gemini.xxx.com/v1"
api_key = "xx-xx"
土豪可以直接使用GPT-4o或者Claude输出更好的结果。
第四步:开始玩起来
一行命令运行 OpenManus:
python main.py
然后通过终端输入你的创意!
如需体验开发中版本,可运行:
python run_flow.py
官方说明:
OpenManus 主要依赖于几个工具:
1、PythonExecute:执行 Python 代码与电脑系统交互,可以进行文件操作、数据处理、自动化任务等;
2、FileSaver:保存文件到本地,例如 txt,python,html 等;
3、BrowserUseTool:打开,浏览和控制你的浏览器;
4、GoogleSearch:进行网络信息检索。
听说是大神花了3小时手搓出来的。确定挺厉害的。
第五步:开始干个活
搜索今天的AI相关的新闻热点,选择一条进行分析和总结。
英文提示为:
Search for today’s AI-related news highlights, select one for analysis and summary.
然后程序会自动打开一个浏览器,开始进行搜索和查询数据。
这时候开始心疼我的Token来了。。。
干了几分钟之后失败了,原因是某个网页打不开。
换个任务继续干活。
任务:整理一下CrewAI的基础信息,帮我写一份介绍文档。
英文:Organize the basic information of CrewAI and help me write an introduction document.
又开始收集资料 干活了。
最后在生成文件的时候,生成了大部份内容,又是失败,但是好歹有一些结果了。
最后输出的内容基本是来源于搜索结果的总结。
感觉存在的问题
1、单说这个库,使用Google作为搜索数据源,需要电脑使用魔法全局上网。
一般人就不好处理这个东西了。
2、再说获取信息,主要是来源于Google。但是很多信息是登陆才能看到的,所以这2次失败都是这个原因造成的。
第二次抓取的信息需要登陆才能访问,导致不停的重试。造成结果输出差一个文件。
这种情况,短时间也没办法解决的。
3、这个架构可能更适合在开放搜索结果中寻找相关的信息。需要登陆才能访问的,还有一些定向性的网站,还是有难度。
4、整体来看,就是根据提示词,用思维链设计出一套流程
然后使用浏览器获取信息,用大模型 整理信息,再写到文档中。
另一种方向的可能
使用Dify、AutoGen或者CrewAI,加上自定义工具。再加上MCP,理论上也可以实现这套流程,这无非是一套完整的工作流。
还有国内的Coze也是可以实现这套东西的。只是配置和使用会比较复杂一些。
后记
个人认为,Manus就是一个缝合各个功能的Agent智能体。适合的场景还是有限的。
想一步让AI把人的活都干完,应该还有一大段路要走。