2026-04-04-content-system-doc-handoff
Yomiya Content System Doc Handoff
Section titled “Yomiya Content System Doc Handoff”文档状态:历史交接快照 当前主入口:
../../../README.md当前任务类型:文档口径校准 + 下一阶段接力
用途:给下一位 AI / 新 session 直接接续本轮关于 Yomiya Content System 的收敛工作
本轮重点:把主目录文档中“系统现实”和“研究流程”之间的混写问题拆开,避免后续继续误把研究态写成现网事实
最后更新:2026-04-04
1. 这次 Session 已经完成了什么
Section titled “1. 这次 Session 已经完成了什么”本轮没有改业务代码,重点做了 3 件事:
- 重新核对
product/YomiyaContentSystem主目录文档与yomiya-service当前仓库现实是否一致。 - 修正文档中对内容处理链路的遗漏和混写。
- 固定一份可直接交给下个 session 的上下文和提示词,防止断流。
本轮已修改的主目录文档:
../../../02-当前系统现实.md../../../03-新资源入库流程.md
本轮新增的交接文档:
./2026-04-04-content-system-doc-handoff.md
2. 这次核对后确认下来的关键现实
Section titled “2. 这次核对后确认下来的关键现实”这些点已经有代码证据支持,后续不要再当成“猜测”或“待讨论”:
- 当前正式主内容对象仍然是
news,不是新的内容主表。 news.source当前只表达进入路径:news / imports,不是平台来源字段。news.type当前现实值域是webpage / video / audio。scene仍是scenes + news_scenes关系层能力,不是news主表字段。- 当前公开 Tag 机制仍只有
level / scene / premium。 - 服务端已经正式区分两条内容进入路径:
collected/newsuser_imported/imports
- 官方供给内容当前会跑:
- 风控
- 难度分析
- scene 分类
- 通知型发布
- 用户导入内容当前会走统一处理流水线,但会跳过:
- 风控
- 难度分析 并使用静默发布
raw_news当前已有risk_check_status,被拦截内容会进入REJECTED / BLOCKED- 前台公开内容读取默认只取
source = news,所以imports不会自动进入官方分发池 - 当前 migration 里仍然没有正式:
collectionscollection_itemsseriestopics
3. 这次为什么要改 02 和 03
Section titled “3. 这次为什么要改 02 和 03”02-当前系统现实.md
Section titled “02-当前系统现实.md”此前版本的问题:
- 只写了对象和字段,没把“官方供给”和“用户导入”两条处理策略差异写进去
- 容易让人误以为 repo 只是做了字段扩充,还没有把风控 / 难度 / scene 这些机制正式落到流水线
这次修正后,02 现在已经明确:
source(news/imports)是进入路径,不是平台来源- 官方供给已有正式处理链路
- 用户导入已有正式处理链路,但策略不同
- 前台默认只分发
source = news
03-新资源入库流程.md
Section titled “03-新资源入库流程.md”此前版本的问题:
- 几处 wording 容易把“研究流程”误读成“现网系统现实”
- “系统实际只保留的 4 个状态”这个说法和真实服务端状态不一致
- 回写路径还残留旧文档名,和当前
01-05入口不完全一致
这次修正后,03 现在已经明确:
- 这是研究 / 补样本 / 数据库判断前流程,不是生产流水线全貌
- 研究状态不是数据库状态
- 回写路径以当前主目录和 archive 实际文件为准
4. 你接下来优先应该做什么
Section titled “4. 你接下来优先应该做什么”下一位 AI 不要重复做“repo 里到底有没有这些机制”的核对,那个问题这轮已经回答了。后续优先级应改成下面 4 件事:
- 继续检查主目录文档中是否还有“研究态写成现实”的残留
- 判断
01 / 04 / 05是否需要因为这次口径校准继续同步 - 把“官方供给扩充”真正转译成下一阶段动作,而不是继续停留在概念争论
- 基于最新口径,推进
Collection / Distribution Eligibility / Source Brand的下一轮文档收敛
建议优先看:
../../../README.md../../../01-当前目标与范围.md../../../02-当前系统现实.md../../../03-新资源入库流程.md../../../04-内容样本池.md../../../05-待决问题.md./2026-04-04-content-system-doc-handoff.md
5. 推荐的下一轮具体动作
Section titled “5. 推荐的下一轮具体动作”动作 A:检查 04-内容样本池.md 是否需要补“官方供给候选”视角
Section titled “动作 A:检查 04-内容样本池.md 是否需要补“官方供给候选”视角”当前 04 更偏研究清单,下一轮应判断是否要补一句清晰边界:
- 样本池里的
source_brand / series_unit仍是研究映射字段 - 它们后续主要服务“官方供给扩源”和“Collection / Series 候选判断”
- 不要把研究字段误读成当前后端已正式落库
动作 B:检查 05-待决问题.md 是否要更明确写出“分发资格”和“source”不是一回事
Section titled “动作 B:检查 05-待决问题.md 是否要更明确写出“分发资格”和“source”不是一回事”当前 repo 现实已经说明:
source = news只能说明是官方供给进入路径- 不能直接说明“可分发”或“可首页推荐”
因此 Distribution Eligibility 作为未决问题,可能需要再写得更尖锐一点。
动作 C:开始写下一轮真正的收敛题
Section titled “动作 C:开始写下一轮真正的收敛题”如果不再做文档校准,下一轮最值得进入的题目是:
CollectionPhase 1 最小模型到底是什么Distribution Eligibility应该先落规则层还是独立状态Source Brand是否先以 YouTube 模式向多平台扩展scene体系在官方供给扩源时如何治理,避免继续脏化
6. 重要证据文件
Section titled “6. 重要证据文件”本轮判断主要来自 yomiya-service 当前 main HEAD:
- Commit:
9efd6d7b4093b20a7379f84305441cfbd0b184fa - Commit time:
2026-04-03 20:59:32 +0900
关键证据文件:
internal/infrastructure/database/migration/20260109120000_create_content_import_tables.sqlinternal/infrastructure/database/migration/20260120000000_add_source_and_type_to_news.sqlinternal/infrastructure/database/migration/20250810115556_add_risk_check_status_to_raw_news.sqlinternal/application/content_processing/profile_resolver.gointernal/application/content_processing/raw_lifecycle.gointernal/application/content_processing/classification/risk_check_service.gointernal/application/content_processing/providers.gointernal/application/content_processing/classification/add_scene_step.gointernal/application/news_scenes.gointernal/repository/news_repo_impl.gointernal/crawler/youtube_channel/youtube_channel_crawler.go
如果下个 session 要重新验证,请先 fresh clone 或直接在 /tmp/yomiya-service 继续核对。
7. 可直接复制给下个 Session 的提示词
Section titled “7. 可直接复制给下个 Session 的提示词”你正在 /Users/cc/Documents/root-remote 继续 Yomiya Content System 文档收敛工作。
先读这些文件,建立上下文:1. product/YomiyaContentSystem/README.md2. product/YomiyaContentSystem/01-当前目标与范围.md3. product/YomiyaContentSystem/02-当前系统现实.md4. product/YomiyaContentSystem/03-新资源入库流程.md5. product/YomiyaContentSystem/04-内容样本池.md6. product/YomiyaContentSystem/05-待决问题.md7. product/YomiyaContentSystem/archive/snapshots/session-handoffs/2026-04-04-content-system-doc-handoff.md
这轮之前已经核对过 yomiya-service main 的现实,关键结论是:- news 仍是正式主内容对象- news.source 只表示 news/imports 进入路径,不表示平台来源- 官方 collected 内容会跑风控、难度、scene- user_imported 内容跳过风控和难度- 前台公开内容默认只取 source = news- 还没有 collections / collection_items / series / topics 正式 DDL
你的任务不是重新证明这些结论,而是继续检查主目录文档还有没有口径漂移,并推进下一步收敛。
优先做:1. 判断 04-内容样本池.md 是否要补“官方供给候选 / source_brand / series_unit 只是研究映射”的边界说明2. 判断 05-待决问题.md 是否要更明确写出 Distribution Eligibility 与 source / visibility 的边界3. 如果主目录文档仍有不合适的地方,直接继续修4. 在不把目标理想写成系统现实的前提下,开始收敛 Collection 和 Distribution Eligibility 的下一轮文档方案
约束:- 不要把研究字段写成现网正式字段- 不要把 source 改写成平台来源- 不要把用户导入链路误写成官方供给扩充链路- 如果要新增结论,先核对 yomiya-service 代码或 migration 证据8. 一句话交接
Section titled “8. 一句话交接”这轮已经把“repo 里其实已有官方供给处理机制”这件事写回主目录文档了;下一轮该做的不是继续争论 intake,而是继续清理主目录口径,然后往 Collection / Distribution Eligibility / Source Brand 这些真正未完成的目标层推进。