2026-04-04-content-system-doc-handoff

Yomiya Content System Doc Handoff

文档状态：历史交接快照当前主入口：../../../README.md 当前任务类型：文档口径校准 + 下一阶段接力

用途：给下一位 AI / 新 session 直接接续本轮关于 Yomiya Content System 的收敛工作
本轮重点：把主目录文档中“系统现实”和“研究流程”之间的混写问题拆开，避免后续继续误把研究态写成现网事实
最后更新：2026-04-04

1. 这次 Session 已经完成了什么

本轮没有改业务代码，重点做了 3 件事：

重新核对 product/YomiyaContentSystem 主目录文档与 yomiya-service 当前仓库现实是否一致。
修正文档中对内容处理链路的遗漏和混写。
固定一份可直接交给下个 session 的上下文和提示词，防止断流。

本轮已修改的主目录文档：

../../../02-当前系统现实.md
../../../03-新资源入库流程.md

本轮新增的交接文档：

./2026-04-04-content-system-doc-handoff.md

2. 这次核对后确认下来的关键现实

这些点已经有代码证据支持，后续不要再当成“猜测”或“待讨论”：

当前正式主内容对象仍然是 news，不是新的内容主表。
news.source 当前只表达进入路径：news / imports，不是平台来源字段。
news.type 当前现实值域是 webpage / video / audio。
scene 仍是 scenes + news_scenes 关系层能力，不是 news 主表字段。
当前公开 Tag 机制仍只有 level / scene / premium。
服务端已经正式区分两条内容进入路径：
- collected / news
- user_imported / imports
官方供给内容当前会跑：
- 风控
- 难度分析
- scene 分类
- 通知型发布
用户导入内容当前会走统一处理流水线，但会跳过：
- 风控
- 难度分析并使用静默发布
raw_news 当前已有 risk_check_status，被拦截内容会进入 REJECTED / BLOCKED
前台公开内容读取默认只取 source = news，所以 imports 不会自动进入官方分发池
当前 migration 里仍然没有正式：

collections
collection_items
series
topics

3. 这次为什么要改 `02` 和 `03`

`02-当前系统现实.md`

此前版本的问题：

只写了对象和字段，没把“官方供给”和“用户导入”两条处理策略差异写进去
容易让人误以为 repo 只是做了字段扩充，还没有把风控 / 难度 / scene 这些机制正式落到流水线

这次修正后，02 现在已经明确：

source(news/imports) 是进入路径，不是平台来源
官方供给已有正式处理链路
用户导入已有正式处理链路，但策略不同
前台默认只分发 source = news

`03-新资源入库流程.md`

此前版本的问题：

几处 wording 容易把“研究流程”误读成“现网系统现实”
“系统实际只保留的 4 个状态”这个说法和真实服务端状态不一致
回写路径还残留旧文档名，和当前 01-05 入口不完全一致

这次修正后，03 现在已经明确：

这是研究 / 补样本 / 数据库判断前流程，不是生产流水线全貌
研究状态不是数据库状态
回写路径以当前主目录和 archive 实际文件为准

4. 你接下来优先应该做什么

下一位 AI 不要重复做“repo 里到底有没有这些机制”的核对，那个问题这轮已经回答了。后续优先级应改成下面 4 件事：

继续检查主目录文档中是否还有“研究态写成现实”的残留
判断 01 / 04 / 05 是否需要因为这次口径校准继续同步
把“官方供给扩充”真正转译成下一阶段动作，而不是继续停留在概念争论
基于最新口径，推进 Collection / Distribution Eligibility / Source Brand 的下一轮文档收敛

建议优先看：

../../../README.md
../../../01-当前目标与范围.md
../../../02-当前系统现实.md
../../../03-新资源入库流程.md
../../../04-内容样本池.md
../../../05-待决问题.md
./2026-04-04-content-system-doc-handoff.md

5. 推荐的下一轮具体动作

动作 A：检查 `04-内容样本池.md` 是否需要补“官方供给候选”视角

当前 04 更偏研究清单，下一轮应判断是否要补一句清晰边界：

样本池里的 source_brand / series_unit 仍是研究映射字段
它们后续主要服务“官方供给扩源”和“Collection / Series 候选判断”
不要把研究字段误读成当前后端已正式落库

动作 B：检查 `05-待决问题.md` 是否要更明确写出“分发资格”和“source”不是一回事

当前 repo 现实已经说明：

source = news 只能说明是官方供给进入路径
不能直接说明“可分发”或“可首页推荐”

因此 Distribution Eligibility 作为未决问题，可能需要再写得更尖锐一点。

动作 C：开始写下一轮真正的收敛题

如果不再做文档校准，下一轮最值得进入的题目是：

Collection Phase 1 最小模型到底是什么
Distribution Eligibility 应该先落规则层还是独立状态
Source Brand 是否先以 YouTube 模式向多平台扩展
scene 体系在官方供给扩源时如何治理，避免继续脏化

6. 重要证据文件

本轮判断主要来自 yomiya-service 当前 main HEAD：

Commit: 9efd6d7b4093b20a7379f84305441cfbd0b184fa
Commit time: 2026-04-03 20:59:32 +0900

关键证据文件：

internal/infrastructure/database/migration/20260109120000_create_content_import_tables.sql
internal/infrastructure/database/migration/20260120000000_add_source_and_type_to_news.sql
internal/infrastructure/database/migration/20250810115556_add_risk_check_status_to_raw_news.sql
internal/application/content_processing/profile_resolver.go
internal/application/content_processing/raw_lifecycle.go
internal/application/content_processing/classification/risk_check_service.go
internal/application/content_processing/providers.go
internal/application/content_processing/classification/add_scene_step.go
internal/application/news_scenes.go
internal/repository/news_repo_impl.go
internal/crawler/youtube_channel/youtube_channel_crawler.go

如果下个 session 要重新验证，请先 fresh clone 或直接在 /tmp/yomiya-service 继续核对。

7. 可直接复制给下个 Session 的提示词

你正在 /Users/cc/Documents/root-remote 继续 Yomiya Content System 文档收敛工作。

先读这些文件，建立上下文：
1. product/YomiyaContentSystem/README.md
2. product/YomiyaContentSystem/01-当前目标与范围.md
3. product/YomiyaContentSystem/02-当前系统现实.md
4. product/YomiyaContentSystem/03-新资源入库流程.md
5. product/YomiyaContentSystem/04-内容样本池.md
6. product/YomiyaContentSystem/05-待决问题.md
7. product/YomiyaContentSystem/archive/snapshots/session-handoffs/2026-04-04-content-system-doc-handoff.md

这轮之前已经核对过 yomiya-service main 的现实，关键结论是：
- news 仍是正式主内容对象
- news.source 只表示 news/imports 进入路径，不表示平台来源
- 官方 collected 内容会跑风控、难度、scene
- user_imported 内容跳过风控和难度
- 前台公开内容默认只取 source = news
- 还没有 collections / collection_items / series / topics 正式 DDL

你的任务不是重新证明这些结论，而是继续检查主目录文档还有没有口径漂移，并推进下一步收敛。

优先做：
1. 判断 04-内容样本池.md 是否要补“官方供给候选 / source_brand / series_unit 只是研究映射”的边界说明
2. 判断 05-待决问题.md 是否要更明确写出 Distribution Eligibility 与 source / visibility 的边界
3. 如果主目录文档仍有不合适的地方，直接继续修
4. 在不把目标理想写成系统现实的前提下，开始收敛 Collection 和 Distribution Eligibility 的下一轮文档方案

约束：
- 不要把研究字段写成现网正式字段
- 不要把 source 改写成平台来源
- 不要把用户导入链路误写成官方供给扩充链路
- 如果要新增结论，先核对 yomiya-service 代码或 migration 证据

8. 一句话交接

这轮已经把“repo 里其实已有官方供给处理机制”这件事写回主目录文档了；下一轮该做的不是继续争论 intake，而是继续清理主目录口径，然后往 Collection / Distribution Eligibility / Source Brand 这些真正未完成的目标层推进。