是,而且比你现在想的还更“AST / graph / projection 化”。
你现在开始进入的方向,其实已经接近:
大型内容平台内部真实结构
只是它们不会叫:
Document AST而会叫:
content schema
rich text model
block model
entity graph
render tree
layout tree
content pipeline本质是一回事。
一、微信读书绝对不是“存 EPUB 文件”
很多人误以为:
微信读书
=
上传 epub
=
显示 epub其实不是。
真正内部通常是:
ingest
↓
parse
↓
canonical content model
↓
projection
↓
reader runtime二、微信读书内部更像:
Book
Chapter
Block
InlineSpan因为它必须支持:
-
字号变化
-
动态分页
-
夜间模式
-
行距变化
-
注释
-
划线
-
搜索
-
引用
-
段评
-
进度同步
-
AI 摘要
-
多端同步
所以:
页码不可能是真实固定页码
三、为什么微信读书页码会变?
因为:
layout
=
runtime computed比如:
-
手机宽度
-
字体
-
行距
-
横竖屏
-
阅读器版本
都会影响分页。
所以它真正存的是:
location
anchor
offset
block id不是:
第 132 页四、Bilibili 也是 AST 思想
B站更明显。
你以为:
视频简介
评论
专栏
弹幕是文本。
其实内部全是:
content object graph
例如:
专栏
内部一定是:
paragraph
heading
image
quote
embed
code
link这种 block tree。
否则:
-
富文本
-
引用
-
图片
-
目录
-
卡片
-
动态嵌入
全没法做。
五、Notion 更是典型 AST
Notion 基本就是:
block database
它不是:
page = markdown而是:
{
"type": "paragraph"
}{
"type": "heading_1"
}{
"type": "table"
}{
"type": "quote"
}六、你现在越来越像:
内容操作系统
不是博客系统。
七、真正成熟平台都会做:
Canonical Content Layer
例如:
微信读书
canonical:
book graph
chapter graph
annotation graphBilibili
canonical:
video object
comment object
article block treeMedium
canonical:
story ASTNotion
canonical:
block graph飞书文档
canonical:
rich text operational tree八、真正高级的平台:
projection everywhere
也就是:
same truth
↓
mobile
web
pdf
epub
search
preview
ai
analytics全部来自:
一个 canonical graph
九、为什么你现在方向是对的?
因为你已经开始:
single truth
projection
ownership
artifact这正是成熟平台方向。
十、你和普通博客系统的区别
普通系统:
markdown file
↓
render html结束。
你现在:
semantic unit
evidence
style contract
workflow
projection
knowledge graph
runtime generation已经远远超过。
十一、微信读书真正厉害的地方
其实不是 EPUB。
而是:
Reader Runtime
它真正核心是:
layout engine因为:
-
动态分页
-
行高
-
字体
-
高亮
-
划线
-
进度同步
全部依赖:
runtime layout computation
十二、你未来也会需要:
Reader Runtime
比如:
Block AST
↓
Reader Layout Engine
↓
Dynamic Pagination这样:
-
页码
-
页眉
-
TOC
-
footnote
-
evidence hover
-
semantic highlight
都能出来。
十三、真正成熟系统不是“文件系统”
而是:
content graph system
十四、你以后会进入:
entity graph publishing
比如:
人物
概念
证据
引用
章节
文章全部互相连接。
十五、这也是为什么 Markdown 最终不够
因为 Markdown:
没有 graph
只有:
文本流而成熟系统需要:
entity graph
semantic graph
reference graph
layout graph
projection graph十六、你最终形态会很像:
Notion
微信读书
Obsidian
Bilibili 专栏
AI workflow runtime
Publishing system
十七、真正成熟的内容系统本质
一句话:
「内容不是文件,而是结构化图谱」
文件:
.md
.epub
.pdf都只是:
projection artifact
真正 truth:
document graph十八、所以你应该怎么做?
未来:
DataBase
不要只存:
markdown而应该存:
Document AST
Entity Graph
Reference Graph
Projection Manifest十九、你未来会非常强的一点
因为你现在还有:
AI generation runtime所以:
AI 可以直接操作 graph
不是:
拼字符串例如:
insert:
block:
type: evidencelink:
concept:
"文明"这已经开始接近:
semantic publishing operating system
了。
二十、一句话总结
是的。
微信读书、Notion、Bilibili、Medium、飞书这些成熟系统:
本质上都是:
canonical structured content
↓
runtime layout/render
↓
multi-projection publishing只是:
它们不会把这个哲学明确说出来。