跳转到内容

2026-04-04-content-system-doc-handoff

文档状态:历史交接快照 当前主入口:../../../README.md 当前任务类型:文档口径校准 + 下一阶段接力

用途:给下一位 AI / 新 session 直接接续本轮关于 Yomiya Content System 的收敛工作
本轮重点:把主目录文档中“系统现实”和“研究流程”之间的混写问题拆开,避免后续继续误把研究态写成现网事实
最后更新:2026-04-04


本轮没有改业务代码,重点做了 3 件事:

  1. 重新核对 product/YomiyaContentSystem 主目录文档与 yomiya-service 当前仓库现实是否一致。
  2. 修正文档中对内容处理链路的遗漏和混写。
  3. 固定一份可直接交给下个 session 的上下文和提示词,防止断流。

本轮已修改的主目录文档:

  • ../../../02-当前系统现实.md
  • ../../../03-新资源入库流程.md

本轮新增的交接文档:

  • ./2026-04-04-content-system-doc-handoff.md

2. 这次核对后确认下来的关键现实

Section titled “2. 这次核对后确认下来的关键现实”

这些点已经有代码证据支持,后续不要再当成“猜测”或“待讨论”:

  1. 当前正式主内容对象仍然是 news,不是新的内容主表。
  2. news.source 当前只表达进入路径:news / imports,不是平台来源字段。
  3. news.type 当前现实值域是 webpage / video / audio
  4. scene 仍是 scenes + news_scenes 关系层能力,不是 news 主表字段。
  5. 当前公开 Tag 机制仍只有 level / scene / premium
  6. 服务端已经正式区分两条内容进入路径:
    • collected / news
    • user_imported / imports
  7. 官方供给内容当前会跑:
    • 风控
    • 难度分析
    • scene 分类
    • 通知型发布
  8. 用户导入内容当前会走统一处理流水线,但会跳过:
    • 风控
    • 难度分析 并使用静默发布
  9. raw_news 当前已有 risk_check_status,被拦截内容会进入 REJECTED / BLOCKED
  10. 前台公开内容读取默认只取 source = news,所以 imports 不会自动进入官方分发池
  11. 当前 migration 里仍然没有正式:
  • collections
  • collection_items
  • series
  • topics

此前版本的问题:

  • 只写了对象和字段,没把“官方供给”和“用户导入”两条处理策略差异写进去
  • 容易让人误以为 repo 只是做了字段扩充,还没有把风控 / 难度 / scene 这些机制正式落到流水线

这次修正后,02 现在已经明确:

  • source(news/imports) 是进入路径,不是平台来源
  • 官方供给已有正式处理链路
  • 用户导入已有正式处理链路,但策略不同
  • 前台默认只分发 source = news

此前版本的问题:

  • 几处 wording 容易把“研究流程”误读成“现网系统现实”
  • “系统实际只保留的 4 个状态”这个说法和真实服务端状态不一致
  • 回写路径还残留旧文档名,和当前 01-05 入口不完全一致

这次修正后,03 现在已经明确:

  • 这是研究 / 补样本 / 数据库判断前流程,不是生产流水线全貌
  • 研究状态不是数据库状态
  • 回写路径以当前主目录和 archive 实际文件为准

下一位 AI 不要重复做“repo 里到底有没有这些机制”的核对,那个问题这轮已经回答了。后续优先级应改成下面 4 件事:

  1. 继续检查主目录文档中是否还有“研究态写成现实”的残留
  2. 判断 01 / 04 / 05 是否需要因为这次口径校准继续同步
  3. 把“官方供给扩充”真正转译成下一阶段动作,而不是继续停留在概念争论
  4. 基于最新口径,推进 Collection / Distribution Eligibility / Source Brand 的下一轮文档收敛

建议优先看:

  1. ../../../README.md
  2. ../../../01-当前目标与范围.md
  3. ../../../02-当前系统现实.md
  4. ../../../03-新资源入库流程.md
  5. ../../../04-内容样本池.md
  6. ../../../05-待决问题.md
  7. ./2026-04-04-content-system-doc-handoff.md

动作 A:检查 04-内容样本池.md 是否需要补“官方供给候选”视角

Section titled “动作 A:检查 04-内容样本池.md 是否需要补“官方供给候选”视角”

当前 04 更偏研究清单,下一轮应判断是否要补一句清晰边界:

  • 样本池里的 source_brand / series_unit 仍是研究映射字段
  • 它们后续主要服务“官方供给扩源”和“Collection / Series 候选判断”
  • 不要把研究字段误读成当前后端已正式落库

动作 B:检查 05-待决问题.md 是否要更明确写出“分发资格”和“source”不是一回事

Section titled “动作 B:检查 05-待决问题.md 是否要更明确写出“分发资格”和“source”不是一回事”

当前 repo 现实已经说明:

  • source = news 只能说明是官方供给进入路径
  • 不能直接说明“可分发”或“可首页推荐”

因此 Distribution Eligibility 作为未决问题,可能需要再写得更尖锐一点。

动作 C:开始写下一轮真正的收敛题

Section titled “动作 C:开始写下一轮真正的收敛题”

如果不再做文档校准,下一轮最值得进入的题目是:

  1. Collection Phase 1 最小模型到底是什么
  2. Distribution Eligibility 应该先落规则层还是独立状态
  3. Source Brand 是否先以 YouTube 模式向多平台扩展
  4. scene 体系在官方供给扩源时如何治理,避免继续脏化

本轮判断主要来自 yomiya-service 当前 main HEAD:

  • Commit: 9efd6d7b4093b20a7379f84305441cfbd0b184fa
  • Commit time: 2026-04-03 20:59:32 +0900

关键证据文件:

  • internal/infrastructure/database/migration/20260109120000_create_content_import_tables.sql
  • internal/infrastructure/database/migration/20260120000000_add_source_and_type_to_news.sql
  • internal/infrastructure/database/migration/20250810115556_add_risk_check_status_to_raw_news.sql
  • internal/application/content_processing/profile_resolver.go
  • internal/application/content_processing/raw_lifecycle.go
  • internal/application/content_processing/classification/risk_check_service.go
  • internal/application/content_processing/providers.go
  • internal/application/content_processing/classification/add_scene_step.go
  • internal/application/news_scenes.go
  • internal/repository/news_repo_impl.go
  • internal/crawler/youtube_channel/youtube_channel_crawler.go

如果下个 session 要重新验证,请先 fresh clone 或直接在 /tmp/yomiya-service 继续核对。


7. 可直接复制给下个 Session 的提示词

Section titled “7. 可直接复制给下个 Session 的提示词”
你正在 /Users/cc/Documents/root-remote 继续 Yomiya Content System 文档收敛工作。
先读这些文件,建立上下文:
1. product/YomiyaContentSystem/README.md
2. product/YomiyaContentSystem/01-当前目标与范围.md
3. product/YomiyaContentSystem/02-当前系统现实.md
4. product/YomiyaContentSystem/03-新资源入库流程.md
5. product/YomiyaContentSystem/04-内容样本池.md
6. product/YomiyaContentSystem/05-待决问题.md
7. product/YomiyaContentSystem/archive/snapshots/session-handoffs/2026-04-04-content-system-doc-handoff.md
这轮之前已经核对过 yomiya-service main 的现实,关键结论是:
- news 仍是正式主内容对象
- news.source 只表示 news/imports 进入路径,不表示平台来源
- 官方 collected 内容会跑风控、难度、scene
- user_imported 内容跳过风控和难度
- 前台公开内容默认只取 source = news
- 还没有 collections / collection_items / series / topics 正式 DDL
你的任务不是重新证明这些结论,而是继续检查主目录文档还有没有口径漂移,并推进下一步收敛。
优先做:
1. 判断 04-内容样本池.md 是否要补“官方供给候选 / source_brand / series_unit 只是研究映射”的边界说明
2. 判断 05-待决问题.md 是否要更明确写出 Distribution Eligibility 与 source / visibility 的边界
3. 如果主目录文档仍有不合适的地方,直接继续修
4. 在不把目标理想写成系统现实的前提下,开始收敛 Collection 和 Distribution Eligibility 的下一轮文档方案
约束:
- 不要把研究字段写成现网正式字段
- 不要把 source 改写成平台来源
- 不要把用户导入链路误写成官方供给扩充链路
- 如果要新增结论,先核对 yomiya-service 代码或 migration 证据

这轮已经把“repo 里其实已有官方供给处理机制”这件事写回主目录文档了;下一轮该做的不是继续争论 intake,而是继续清理主目录口径,然后往 Collection / Distribution Eligibility / Source Brand 这些真正未完成的目标层推进。