AI 跑到一半卡住等你拍板？手机能救场了

Codex 支持多设备远程交互操作，为什么让我如此兴奋？

May 17, 2026

∙ Paid

痛点

AI Agent 长任务跑到中途，突然甩出一个选项让你拍板：方案 A 还是方案 B？这时候你恰好不在电脑前，它就一直傻等。此时你或许已经安睡，满心希望第二天一早可以看到结果。

清晨，你充满希望回到电脑前，才发现原本预计好几个小时之前就该干完的活儿，其实只用了 5 分钟就卡住了。还得从头再跑俩小时。而 AI Agent 征询你意见的问题，其实根本就不涉及任何重大原则。为了这么个「礼貌性询问」耽误了你工作进度，是不是很崩溃？

或者，有时 AI 主动选择不来烦你，自己做了决策。然后几个小时后，你发现整个儿路径走错了方向，于是不得不推倒重来。如果你足够幸运，前期材料没有被覆盖或者丢弃，还有重来的可能。

你遇到过上述情况吗？

我都遇到过，不止一次。

所以我一直就希望能在手机上随时查看并且干预 AI Agent 工作进度。倒不是咱们人类做「监工」有瘾，只是为了能及时发现和处理这种烦人的小问题。只需要给一个决策，或者纠偏一下，也许整个儿任务就顺利多了。

如果你一直在看我的文章，应该已经知道我尝试过的这些方案。

第一种：tmux + SSH + Termius.

那是 2025 年我自己摸出来的路子。当时我把 Claude Code 或者 Codex 的命令行版（也就是在黑底白字的窗口里敲命令操作的那种）直接跑在远程机器上，用 tmux（一种「让远程程序断网也不会被关掉」的小工具）保住会话不间断，手机上装一个 SSH 客户端来连接。这种方案我在《如何摆脱硬件束缚，随时随地享受「氛围编程」?》里专门为你写过。

这个方案确实解决了「任务不要因为我离开电脑而中断」这件事。毕竟任务运行在云端电脑上。我回头开手机，对话进程还在。

但它的问题也很明显：你在手机上看到的，本质上是一个被缩小过的「黑底白字的命令窗」。上面可能有若干会话。该连接到哪一个？你需要自己记。运行记录要自己翻，AI 中途问「选哪个方案」最要命，因为你得在一个 5 寸左右的小屏幕上，去读一整屏滚动的字……

这不叫「用手机指挥 AI」。这叫「手机当显示器」。它聊胜于无，但是我很快就无法忍受了。

第二种：OpenClaw/Hermes.

OpenClaw，大伙儿更亲切的叫法是「小龙虾」。它最初的设计初衷其实就是咱们刚才提到的痛点。只不过，龙虾的作者 Peter Steinberger 更敢想敢干，硬是凭借自己 + AI 搞定了这个需求。

简单说，最早的 OpenClaw 就是把 AI Agent（当时主要是 Claude Code）接进 WhatsApp、Telegram、Signal 这一类日常聊天入口里去。这部分我也写过两篇文章为你介绍 ——《一个人、一周、三个名字，OpenClaw 到底发生了什么？》和《Claude Code, Codex, OpenClaw，我是怎么让它们配合干活的？》。

小龙虾（OpenClaw）让普通人第一次有机会感受到「像发消息一样让 AI 替我做事」。你不用懂远程登录，不用懂会话保持，不用学命令行操作。你只需要打开 Telegram 或者飞书给一个 bot（机器人账号）发消息就行，门槛一下子降了一大截。

但 OpenClaw 也有问题。毕竟框架做得通用、传播得广，不代表实际工作让人放心。现在这些框架还属于它们的草莽阶段，更新还时不时会把你的工作流系统搞崩溃。弄得经常有网友在升级之前大唱「忐忑」。例如我的好友老范。

另外，很多专业人士都认为，真正硬核的活儿（例如项目级开发），还是要 Claude Code、Codex 这类更成熟的 AI 框架来执行，才真正让人更放心。

其实 3 月份，Claude Code 已经支持在手机端 Claude 遥控干活儿了。我当时还很兴奋地做了测试。

只不过，当时这个远程连接的过程，总是有小问题。有的时候，甚至出现了「串台」现象。而后来发生的事情，你知道的，Claude Code 封号动作愈发频密，甚至就连 OpenClaw 创始人 Peter Steinberger 自己的帐号都被封过。

使用 Claude Code，总会让你有一些不安。毕竟，在沙滩上筑起一座城堡，再漂亮都有可能随时雨打风吹去。

而 OpenClaw 和 Hermes 虽然一直在进步，但是经过我实际测试，做严肃任务，尤其是需要复杂推理的严肃任务，还是差了一点儿火候。毕竟能和 Claude Code 真正掰手腕的 Harness 框架，只有 Codex。可是 Codex 啥时候能在手机上连接使用呢？

好在这时候，我突然看到了 Codex 的更新。

进展

5 月 15 日下午 3 点多，我在手机 ChatGPT 上开了一个新的 Codex 对话窗。

注意 Codex 宣传这个新功能时，原本样例是告诉你如何用手机遥控 MacOS 版本的。只要那台 Mac 上的 Codex 开启了「允许远程指挥」这个开关、且和手机上的 ChatGPT 登录同一个账号，手机就能自动认出并连上它。虽然你后面是在手机「发号施令」，但那台 Mac 才是真正在帮你干活的机器。

不过，你似乎得考虑一下这意味着什么。**那台 Mac 必须一直开机、不能合盖、不能进睡眠、不能关机，Codex 桌面 App 还要一直在跑。**换句话说，你出门也好、出差也好、逢年过节回老家也好，那台 Mac 就得被「留守」在家里 24 小时空转——电费、风扇磨损、续航损耗，都是成本啊。更尴尬的是，你不在家时但凡碰上断电、系统自动更新重启、App 闪退，手机那头的连接当场就断。你正在外面想给它派一个活儿，才发现它已经「失联」，那就只好「空悲切」了。

所以，这次执行任务，目标机器我没指向 Mac，而是选择了我自己的一台 Linux 云主机。

「云主机」其实就是从云服务商那里租来的一台 Linux 服务器，业内叫 VPS(Virtual Private Server，虚拟专用服务器——你不用真买一台机器，机房里给你划一台出来用，按月付钱）。它本职工作就是 7×24 小时在线——风扇是别人的，电费是机房的，网络是骨干的。我这台叫 vps-medium。有了它任劳任怨干活儿，手头儿的 Mac 想关就关、想合盖就合盖，跟任务执行没关系。腾讯、阿里云都有自己的 VPS 提供，每年购物节的时候，还都有优惠。

闲言少叙，这次远程调用 Codex，输入框里我打了一行 /goal（这是 Codex 内置的「派复杂任务」命令，就是告诉它无论如何给我达成这个目标），让它编一个能让学生理解循环神经网络原理的小游戏。推理档位我选择拉到 Extra High（最高），思考速度选 fast，这样执行速度可以快 1.5 倍。

ChatGPT 手机端派完任务，你可以看到执行过程。云端的 Codex 很快调用了 interactive-html 这个合适的技能，把任务拆成 5 步，然后依次执行，且实时汇报进度给你。

不一会儿，结果就出来了。

循环神经网络的学习不是咱们今天的主旨。所以这个游戏如何能辅助你学习，咱们就不展开了。

晚饭以后，我又开了一个新对话窗让它去做一件完全不相关的事 —— 选题挖掘。

这次它又正确调用了 topic-inspiration 选题 Skill，我看后很满意，于是发感慨：

CodeX 远程控制这玩意儿用起来真的比龙虾放心多了，能力又强。如果去年下半年有这东西的话，也就没有龙虾啥事儿了

不过很快有网友指出了我的偏颇：

是啊，这一切的发生，好像都是龙虾作者加盟 OpenAI 之后吧？

这里咱们讨论一下，为什么手机能直接连到且指挥 VPS 上的 Codex 干活儿？以及你该如何设定？

原理

Codex 不挑它自己「住」在哪台机器上。它的工作模式是：在某台机器上一直开着一个 Codex 程序，再让任意一台事先设置过的设备（手机、另一台电脑）通过 OpenAI 提供的安全通道连过去给它派活、看结果。

那台一直开着的机器有个专门的叫法，叫 host（主机，就是真正干活的那台机器）。host 可以是你的 Mac，当然也可以是一台云端 Linux。哦，Windows 很快就能支持了，少安毋躁。

只要这台主机开着 Codex、网络通、你之前授权过，剩下的事 OpenAI 那边的转发通道帮你接好。这条转发通道叫 secure relay——你可以朴素地把它理解成「加密中转站」：手机和 host 之间不直接对话，而是经过 OpenAI 这层中转，且中间任何人都看不到内容。

打通手机 ChatGPT 到 Mac 和 VPS 这两条通路的，是 OpenAI 5 月 14 日刚正式上线的一个能力，叫 Remote SSH(「SSH」是开发者长期用来安全登录别人机器的标准方式——你可以理解成「用一把万能钥匙远程开机器的门」)。它让不同设备上的 Codex 应用能自动认出你机器上已经记好的那些「远程地址」，把那些远程机器也注册成可用的 host。

下面咱们来具体讲讲，如何设置。

Keep reading with a 7-day free trial

Subscribe to Shuyi’s Newsletter to keep reading this post and get 7 days of free access to the full post archives.