773 字
4 分钟
Open-AutoGLM
2025-12-12
无标签

Open-AutoGLM实战——AI手机#

仓库介绍#

Open-AutoGLM 是一个基于 AutoGLM 构建的手机端智能助理框架,主要功能特点包括:

  • 以多模态方式理解手机屏幕内容,通过自动化操作帮助用户完成任务
  • 基于 ADB(Android Debug Bridge)控制设备,结合视觉语言模型进行屏幕感知
  • 支持用户用自然语言描述需求(如 “打开小红书搜索美食”),自动解析意图并执行操作流程
  • 内置敏感操作确认机制,支持登录或验证码场景下的人工接管
  • 提供远程 ADB 调试能力,可通过 WiFi 或网络连接设备实现远程控制

仓库链接:zai-org/Open-AutoGLM: An Open Phone Agent Model & Framework. Unlocking the AI Phone for Everyone

前言准备#

  • 一台 Android 手机(Android 7.0+)作为被控设备——以RedMi K20为例
  • 一台电脑(运行 Agent 代码和连接模型服务)作为控制端——以Windows为例

环境配置#

手机端配置#

  1. 开启开发者模式
    • 打开手机「设置」→「关于手机」→ 连续点击「版本号」N次,直到提示「开发者模式已启用」
  2. 开启 USB 调试
    • 进入「设置」→「开发者选项」→ 勾选「USB 调试」
    • 部分机型(本次实验机型需要)需额外开启「USB 调试(安全设置)」(用于模拟点击等操作)
  3. 安装 ADB Keyboard
    • 下载安装包:ADBKeyboard.apk
    • 安装后在手机「设置」→「语言和输入法」中启用「ADB Keyboard」(启用即可,会自动切换输入法)

电脑端安装 ADB 工具#

  1. 下载 ADB

  2. 配置环境变量

    • Windows:右键「此电脑」→「属性」→「高级系统设置」→「环境变量」,将 ADB 解压路径添加到「Path」
    • macOS/Linux:打开终端,执行 export PATH=$PATH:~/platform-tools(替换为实际路径)
    • 验证 ADB 安装
    Terminal window
    adb version # 输出版本信息即成功

连接手机与电脑#

  1. 用 USB 数据线连接手机和电脑(需要注意数据线支持文件传输)
  2. 手机上会弹出「允许 USB 调试」对话框,勾选「始终允许」并确认
  3. 电脑终端执行以下命令,确认设备连接成功:
Terminal window
adb devices
# 成功会显示:List of devices attached + 设备ID

部署 Agent 代码(电脑端)#

1.克隆仓库#

Terminal window
git clone https://github.com/zai-org/Open-AutoGLM.git
cd Open-AutoGLM

2. 安装依赖#

  1. 建议使用 Python 3.10+,创建虚拟环境
Terminal window
# 创建虚拟环境
python -m venv zhipu
# 激活环境(Windows)
venv\Scripts\activate
# 激活环境(macOS/Linux)
source venv/bin/activate
  1. 在虚拟环境激活状态下,执行以下命令安装项目依赖
Terminal window
# 安装基础依赖
pip install -r requirements.txt
# 安装项目包( editable 模式,方便开发调试)
pip install -e .

开始对话#

智谱API Key 申请平台:https://open.bigmodel.cn/

你也可以自己部署和选取其他API服务,本次以智谱为例

  • 单条输入
Terminal window
python main.py --base-url https://open.bigmodel.cn/api/paas/v4 --model "autoglm-phone" --apikey "youapikey" "打开微信"
  • 对话交互式
zhipu
python main.py \
--base-url https://open.bigmodel.cn/api/paas/v4 \
--model "autoglm-phone" \
--apikey "你的智谱API密钥"
Open-AutoGLM
https://minthana.github.io/posts/open-autoglm/
作者
Mint
发布于
2025-12-12
许可协议
CC BY-NC-SA 4.0