AI 跑到一半卡住等你拍板?手机能救场了
Codex 支持多设备远程交互操作,为什么让我如此兴奋?
痛点
AI Agent 长任务跑到中途,突然甩出一个选项让你拍板:方案 A 还是方案 B?这时候你恰好不在电脑前,它就一直傻等。此时你或许已经安睡,满心希望第二天一早可以看到结果。
清晨,你充满希望回到电脑前,才发现原本预计好几个小时之前就该干完的活儿,其实只用了 5 分钟就卡住了。还得从头再跑俩小时。而 AI Agent 征询你意见的问题,其实根本就不涉及任何重大原则。为了这么个「礼貌性询问」耽误了你工作进度,是不是很崩溃?
或者,有时 AI 主动选择不来烦你,自己做了决策。然后几个小时后,你发现整个儿路径走错了方向,于是不得不推倒重来。如果你足够幸运,前期材料没有被覆盖或者丢弃,还有重来的可能。
你遇到过上述情况吗?
我都遇到过,不止一次。
所以我一直就希望能在手机上随时查看并且干预 AI Agent 工作进度。倒不是咱们人类做「监工」有瘾,只是为了能及时发现和处理这种烦人的小问题。只需要给一个决策,或者纠偏一下,也许整个儿任务就顺利多了。
如果你一直在看我的文章,应该已经知道我尝试过的这些方案。
第一种:tmux + SSH + Termius.
那是 2025 年我自己摸出来的路子。当时我把 Claude Code 或者 Codex 的命令行版(也就是在黑底白字的窗口里敲命令操作的那种)直接跑在远程机器上,用 tmux(一种「让远程程序断网也不会被关掉」的小工具)保住会话不间断,手机上装一个 SSH 客户端来连接。这种方案我在《如何摆脱硬件束缚,随时随地享受「氛围编程」?》里专门为你写过。
这个方案确实解决了「任务不要因为我离开电脑而中断」这件事。毕竟任务运行在云端电脑上。我回头开手机,对话进程还在。
但它的问题也很明显:你在手机上看到的,本质上是一个被缩小过的「黑底白字的命令窗」。上面可能有若干会话。该连接到哪一个?你需要自己记。运行记录要自己翻,AI 中途问「选哪个方案」最要命,因为你得在一个 5 寸左右的小屏幕上,去读一整屏滚动的字……
这不叫「用手机指挥 AI」。这叫「手机当显示器」。它聊胜于无,但是我很快就无法忍受了。
第二种:OpenClaw/Hermes.
OpenClaw,大伙儿更亲切的叫法是「小龙虾」。它最初的设计初衷其实就是咱们刚才提到的痛点。只不过,龙虾的作者 Peter Steinberger 更敢想敢干,硬是凭借自己 + AI 搞定了这个需求。
简单说,最早的 OpenClaw 就是把 AI Agent(当时主要是 Claude Code)接进 WhatsApp、Telegram、Signal 这一类日常聊天入口里去。这部分我也写过两篇文章为你介绍 ——《一个人、一周、三个名字,OpenClaw 到底发生了什么?》和《Claude Code, Codex, OpenClaw,我是怎么让它们配合干活的?》。
小龙虾(OpenClaw)让普通人第一次有机会感受到「像发消息一样让 AI 替我做事」。你不用懂远程登录,不用懂会话保持,不用学命令行操作。你只需要打开 Telegram 或者飞书给一个 bot(机器人账号)发消息就行,门槛一下子降了一大截。
但 OpenClaw 也有问题。毕竟框架做得通用、传播得广,不代表实际工作让人放心。现在这些框架还属于它们的草莽阶段,更新还时不时会把你的工作流系统搞崩溃。弄得经常有网友在升级之前大唱「忐忑」。例如我的好友老范。
另外,很多专业人士都认为,真正硬核的活儿(例如项目级开发),还是要 Claude Code、Codex 这类更成熟的 AI 框架来执行,才真正让人更放心。
其实 3 月份,Claude Code 已经支持在手机端 Claude 遥控干活儿了。我当时还很兴奋地做了测试。
只不过,当时这个远程连接的过程,总是有小问题。有的时候,甚至出现了「串台」现象。而后来发生的事情,你知道的,Claude Code 封号动作愈发频密,甚至就连 OpenClaw 创始人 Peter Steinberger 自己的帐号都被封过。
使用 Claude Code,总会让你有一些不安。毕竟,在沙滩上筑起一座城堡,再漂亮都有可能随时雨打风吹去。
而 OpenClaw 和 Hermes 虽然一直在进步,但是经过我实际测试,做严肃任务,尤其是需要复杂推理的严肃任务,还是差了一点儿火候。毕竟能和 Claude Code 真正掰手腕的 Harness 框架,只有 Codex。可是 Codex 啥时候能在手机上连接使用呢?
好在这时候,我突然看到了 Codex 的更新。
进展
5 月 15 日下午 3 点多,我在手机 ChatGPT 上开了一个新的 Codex 对话窗。
注意 Codex 宣传这个新功能时,原本样例是告诉你如何用手机遥控 MacOS 版本的。只要那台 Mac 上的 Codex 开启了「允许远程指挥」这个开关、且和手机上的 ChatGPT 登录同一个账号,手机就能自动认出并连上它。虽然你后面是在手机「发号施令」,但那台 Mac 才是真正在帮你干活的机器。
不过,你似乎得考虑一下这意味着什么。**那台 Mac 必须一直开机、不能合盖、不能进睡眠、不能关机,Codex 桌面 App 还要一直在跑。**换句话说,你出门也好、出差也好、逢年过节回老家也好,那台 Mac 就得被「留守」在家里 24 小时空转——电费、风扇磨损、续航损耗,都是成本啊。更尴尬的是,你不在家时但凡碰上断电、系统自动更新重启、App 闪退,手机那头的连接当场就断。你正在外面想给它派一个活儿,才发现它已经「失联」,那就只好「空悲切」了。
所以,这次执行任务,目标机器我没指向 Mac,而是选择了我自己的一台 Linux 云主机。
「云主机」其实就是从云服务商那里租来的一台 Linux 服务器,业内叫 VPS(Virtual Private Server,虚拟专用服务器——你不用真买一台机器,机房里给你划一台出来用,按月付钱)。它本职工作就是 7×24 小时在线——风扇是别人的,电费是机房的,网络是骨干的。我这台叫 vps-medium。有了它任劳任怨干活儿,手头儿的 Mac 想关就关、想合盖就合盖,跟任务执行没关系。腾讯、阿里云都有自己的 VPS 提供,每年购物节的时候,还都有优惠。
闲言少叙,这次远程调用 Codex,输入框里我打了一行 /goal(这是 Codex 内置的「派复杂任务」命令,就是告诉它无论如何给我达成这个目标),让它编一个能让学生理解循环神经网络原理的小游戏。推理档位我选择拉到 Extra High(最高),思考速度选 fast,这样执行速度可以快 1.5 倍。
ChatGPT 手机端派完任务,你可以看到执行过程。云端的 Codex 很快调用了 interactive-html 这个合适的技能,把任务拆成 5 步,然后依次执行,且实时汇报进度给你。
不一会儿,结果就出来了。
循环神经网络的学习不是咱们今天的主旨。所以这个游戏如何能辅助你学习,咱们就不展开了。
晚饭以后,我又开了一个新对话窗让它去做一件完全不相关的事 —— 选题挖掘。
这次它又正确调用了 topic-inspiration 选题 Skill,我看后很满意,于是发感慨:
CodeX 远程控制这玩意儿用起来真的比龙虾放心多了,能力又强。如果去年下半年有这东西的话,也就没有龙虾啥事儿了
不过很快有网友指出了我的偏颇:
是啊,这一切的发生,好像都是龙虾作者加盟 OpenAI 之后吧?
这里咱们讨论一下,为什么手机能直接连到且指挥 VPS 上的 Codex 干活儿?以及你该如何设定?
原理
Codex 不挑它自己「住」在哪台机器上。它的工作模式是:在某台机器上一直开着一个 Codex 程序,再让任意一台事先设置过的设备(手机、另一台电脑)通过 OpenAI 提供的安全通道连过去给它派活、看结果。
那台一直开着的机器有个专门的叫法,叫 host(主机,就是真正干活的那台机器)。host 可以是你的 Mac,当然也可以是一台云端 Linux。哦,Windows 很快就能支持了,少安毋躁。
只要这台主机开着 Codex、网络通、你之前授权过,剩下的事 OpenAI 那边的转发通道帮你接好。这条转发通道叫 secure relay——你可以朴素地把它理解成「加密中转站」:手机和 host 之间不直接对话,而是经过 OpenAI 这层中转,且中间任何人都看不到内容。
打通手机 ChatGPT 到 Mac 和 VPS 这两条通路的,是 OpenAI 5 月 14 日刚正式上线的一个能力,叫 Remote SSH(「SSH」是开发者长期用来安全登录别人机器的标准方式——你可以理解成「用一把万能钥匙远程开机器的门」)。它让不同设备上的 Codex 应用能自动认出你机器上已经记好的那些「远程地址」,把那些远程机器也注册成可用的 host。
下面咱们来具体讲讲,如何设置。
Keep reading with a 7-day free trial
Subscribe to Shuyi’s Newsletter to keep reading this post and get 7 days of free access to the full post archives.















