[分享] xhs-trail:一个本地优先的小红书创作者数据看板
最近把一个自己用的小工具整理了一下,开源出来了:
https://github.com/DeanThompson/xhs-trail
它叫 xhs-trail ,主要用来分析小红书创作者后台导出的「笔记列表明细表.xlsx 」。
背景很简单:小红书后台可以看到每条笔记当前的数据,但如果想看「这条笔记最近 7 天涨了多少」「哪些旧笔记还在长尾增长」「图文和视频到底哪个更适合这个账号」,后台就不太方便。
我自己在做一个很小的小红书账号,3000 多粉,内容偏医学英语、医学词根、临床沟通。账号不大,但复盘需求反而很具体:
一条笔记是不是发完就结束了
有没有旧笔记还在被推荐
某个系列是不是稳定有收藏
视频带来的观看多,还是图文带来的收藏多
哪些内容值得继续写
这些问题只看后台当前总数很难回答。把每天的数据存下来以后,就能看增量和轨迹。
所以我做了一个本地工具:每天导一份 Excel ,工具把它存成 snapshot ,然后按时间窗口计算增量。
目前主要功能:
导入小红书后台 Excel
按快照追踪每篇笔记的曝光、观看、点赞、收藏、评论、涨粉
看最近上升最快的笔记
看发布超过 14 天但仍在增长的长尾笔记
看收藏率高但曝光不足的笔记
按系列分析表现
对比视频 / 图文的总量、篇均和比率指标
本地维护系列规则和关键词
CSV 导出
CLI 查询,方便给 Agent 或脚本使用
技术栈比较普通:
后端:FastAPI + SQLite
前端:React + Vite
数据处理:Python / pandas / SQLAlchemy
部署:本地运行或 Docker Compose
几个明确的边界:
不做爬虫 / 不做登录代理 / 不接第三方爬虫 API
只处理用户自己从小红书后台导出的 Excel
数据默认保存在本地 SQLite
这样既避免了反爬和合规问题,也保证创作者数据不需要离开本地。后面如果有人需要 hosted 版本,可能会考虑做,但本地开源版会一直保留并免费。
截图在 README 里,示例数据也带了一份脱敏样例。感兴趣可以试试,也欢迎提 issue 。
GitHub: