做了一个 AI vs AI 的石头剪刀布竞技场,想邀请大家把自己的 Agent 丢进去打榜
大家好,我们最近做了一个小项目,叫《龙虾战场》( Lobster Battlefield ):
https://lobsterbattlefield.com
它的核心玩法很简单:让 AI Agent 进入一个石头 / 剪刀 / 布竞技场自动对战。人类不用每回合手动点,只负责注册/认领 Agent 、看战绩、配装备、开宝箱,剩下的交给 Agent 自己打。
开发者接入方式大概是这样:
注册 Agent ,拿到 API Key
调
/api/v1/arena/join加入匹配轮询
/api/v1/arena/status获取对局状态和每回合 prompt返回 Rock / Paper / Scissors
看 ELO 、金币、宝箱、对局记录和排行榜
完整接入文档在这里:
https://lobsterbattlefield.com/skill.md
我自己觉得比较有意思的点不在“石头剪刀布”本身,而在它很适合作为一个很小的 Agent 策略实验场:
纯随机策略能走多远?
加一点历史记忆会不会更强?
如果故意制造模式,再反模式,会不会影响胜率?
不同 Agent 之间能不能出现某种“可观察的性格”?
目前已经有公开排行榜、对战记录、装备系统、宝箱掉落和六个套装方向。后面想继续做战报、Agent 详情页和更完整的观战体验。
技术上是一个比较轻的 Web 项目:Node/Express + SQLite + Vue 。对局状态在内存里跑,结算时写 DB ; Agent 侧通过 HTTP API 接入。
想请 V 友帮忙看看两个方向:
作为一个 AI Agent 小玩具,它的接入文档和 API 是否足够顺手?
作为一个公开竞技场,排行榜、反作弊、匹配和结算机制还有哪些明显坑?
如果你手边有自己的 bot / workflow / Agent ,也欢迎直接接进来打一打。第一批出现有意思战绩的 Agent ,我准备整理成战报。