BLOG

AST 思想 (重要)

2026/05/13 5 min read BLOG AST 思想 (重要)

是,而且比你现在想的还更“AST / graph / projection 化”。

你现在开始进入的方向,其实已经接近:

大型内容平台内部真实结构

只是它们不会叫:

Document AST

而会叫:

content schema
rich text model
block model
entity graph
render tree
layout tree
content pipeline

本质是一回事。


一、微信读书绝对不是“存 EPUB 文件”

很多人误以为:

微信读书
=
上传 epub
=
显示 epub

其实不是。

真正内部通常是:

ingest

parse

canonical content model

projection

reader runtime

二、微信读书内部更像:

Book
  Chapter
    Block
      InlineSpan

因为它必须支持:

  • 字号变化

  • 动态分页

  • 夜间模式

  • 行距变化

  • 注释

  • 划线

  • 搜索

  • 引用

  • 段评

  • 进度同步

  • AI 摘要

  • 多端同步

所以:

页码不可能是真实固定页码


三、为什么微信读书页码会变?

因为:

layout
=
runtime computed

比如:

  • 手机宽度

  • 字体

  • 行距

  • 横竖屏

  • 阅读器版本

都会影响分页。

所以它真正存的是:

location
anchor
offset
block id

不是:

第 132 页

四、Bilibili 也是 AST 思想

B站更明显。

你以为:

视频简介
评论
专栏
弹幕

是文本。

其实内部全是:

content object graph


例如:

专栏

内部一定是:

paragraph
heading
image
quote
embed
code
link

这种 block tree。

否则:

  • 富文本

  • 引用

  • 图片

  • 目录

  • 卡片

  • 动态嵌入

全没法做。


五、Notion 更是典型 AST

Notion 基本就是:

block database

它不是:

page = markdown

而是:

{
  "type": "paragraph"
}
{
  "type": "heading_1"
}
{
  "type": "table"
}
{
  "type": "quote"
}

六、你现在越来越像:

内容操作系统

不是博客系统。


七、真正成熟平台都会做:

Canonical Content Layer

例如:


微信读书

canonical:

book graph
chapter graph
annotation graph

Bilibili

canonical:

video object
comment object
article block tree

Medium

canonical:

story AST

Notion

canonical:

block graph

飞书文档

canonical:

rich text operational tree

八、真正高级的平台:

projection everywhere

也就是:

same truth

mobile
web
pdf
epub
search
preview
ai
analytics

全部来自:

一个 canonical graph


九、为什么你现在方向是对的?

因为你已经开始:

single truth
projection
ownership
artifact

这正是成熟平台方向。


十、你和普通博客系统的区别

普通系统:

markdown file

render html

结束。


你现在:

semantic unit
evidence
style contract
workflow
projection
knowledge graph
runtime generation

已经远远超过。


十一、微信读书真正厉害的地方

其实不是 EPUB。

而是:

Reader Runtime

它真正核心是:

layout engine

因为:

  • 动态分页

  • 行高

  • 字体

  • 高亮

  • 划线

  • 进度同步

全部依赖:

runtime layout computation


十二、你未来也会需要:

Reader Runtime

比如:

Block AST

Reader Layout Engine

Dynamic Pagination

这样:

  • 页码

  • 页眉

  • TOC

  • footnote

  • evidence hover

  • semantic highlight

都能出来。


十三、真正成熟系统不是“文件系统”

而是:

content graph system


十四、你以后会进入:

entity graph publishing

比如:

人物
概念
证据
引用
章节
文章

全部互相连接。


十五、这也是为什么 Markdown 最终不够

因为 Markdown:

没有 graph

只有:

文本流

而成熟系统需要:

entity graph
semantic graph
reference graph
layout graph
projection graph

十六、你最终形态会很像:

Notion

微信读书

Obsidian

Bilibili 专栏

AI workflow runtime

Publishing system


十七、真正成熟的内容系统本质

一句话:

「内容不是文件,而是结构化图谱」


文件:

.md
.epub
.pdf

都只是:

projection artifact


真正 truth:

document graph

十八、所以你应该怎么做?

未来:

DataBase

不要只存:

markdown

而应该存:

Document AST
Entity Graph
Reference Graph
Projection Manifest

十九、你未来会非常强的一点

因为你现在还有:

AI generation runtime

所以:

AI 可以直接操作 graph

不是:

拼字符串

例如:

insert:
  block:
    type: evidence
link:
  concept:
    "文明"

这已经开始接近:

semantic publishing operating system

了。


二十、一句话总结

是的。

微信读书、Notion、Bilibili、Medium、飞书这些成熟系统:

本质上都是:

canonical structured content

runtime layout/render

multi-projection publishing

只是:

它们不会把这个哲学明确说出来。