使用 org-mode 写博客

Table of Contents

我现在基本所有的个人笔记都会选择使用 denote 来写和收集。原先工作流里会使用 hugo 构建博客,是使用 markdown 为基础的博客系统,与我的笔记系统还是有点割裂,于是我计划做一个整合。

基本架构

整体的工作流程如图:

2025-03-16_17-06-25_blog-workflow.jpg

大致的过程也很简单:

  1. 日常使用 denote 写普通的 org-mode 格式的笔记,详情可以参考 Take Notes with Denote.el
  2. 给普通 org-mode 笔记添加 keyword: blog ,则会标记这个笔记会成为博文
  3. 通过 org-publish 把有 blog 关键词的文章导出成 html ,并生成 index 和 rss
  4. 把所有生成的内容发布到 GitHub Pages

导出特定 keyword 的笔记

因为所有的笔记都是由 denote 在相同的目录下管理的,我需要首先区分选出可以导出的笔记和一般的笔记。为了让管理变的简单,我直接使用 filetags 包含 blog 作为筛选条件,而不是放在单独文件夹1 下的做法。

当我决定一篇笔记需要成为笔记,我执行方法:

(defun my/denote-convert-note-to-blog-post ()
  "把当前 denote buffer 变成 blog 文件"
  (interactive)
  (my/org-add-file-tag "blog")
  (my/org-add-file-tag "draft")
  (if (seq-empty-p (org-collect-keywords '("EXPORT_FILE_NAME")))
      (my/insert-blog-export-file-name))    
  (let ((denote-rename-confirmations nil))
    (denote-rename-file-using-front-matter buffer-file-name)))

对当前的 denote buffer 执行操作:

  1. 增加 blogdraft 到当前 org-mode 笔记的 filetags 中。默认我会对笔记带上 draft 标签,防止在笔记未完成前就被发布掉。
  2. 增加一个文件的全局属性 export_file_name ,用于更好的控制输出的文件名,这个下面会介绍。
  3. 执行 denote-rename 操作,把新增的 file tag 增加到当前文件的文件名中,方便后续搜索。

当我完成对笔记的编辑,准备把它转成正式的待发布博文时,我执行方法:

(defun my/denote-publish-blog-post ()
  "把当前 denote 文件标记为发布的 blog 文件"
  (interactive)
  (if (seq-empty-p (org-collect-keywords '("SUMMARY")))
      (my-org-generate-summary-with-gptel)
      )
  (my/org-remove-file-tag "draft")
  (let ((denote-rename-confirmations nil))
    (denote-rename-file-using-front-matter buffer-file-name)))

这个函数做了两件事情:

  1. 如果当前笔记还没有 summary 属性,则使用 gptel 自动生成一个 140 字以内的文章摘要,放到文件属性中,后续将会成为输出的内容一部分。
  2. 移除当前笔记的 draft 标签,并使用 denote-rename 操作应用到文件名上。这样这篇笔记就能在后续的导出操作中被选择。

当一篇笔记被正式标记成博文后,我执行 org-publish 来导出整个博客项目。由于这个过滤过程是动态的,所以我需要一个函数能在每次 publish 时动态生成 org-publish-project-alist 变量:

(defun my/generate-org-publish-project-alist ()
  "Generate `org-publish-project-alist` dynamically for org files with the `blog` tag."
  (let* ((denote-directory denote-note-home)
         (my-blog-files (denote-directory-files "_blog.*\\.org")))
    `(("posts"
       :base-directory ,denote-note-home
       :base-extension "org"
       :section-numbers nil
       :with-toc t
       :with-tags t
       :publishing-directory ,my/org-publish-path
       :publishing-function org-html-publish-to-html
       :time-stamp-file nil ;; 避免每次执行 org-publish 的时候都往 HTML 插入最新的时间戳
       :exclude ".*"
       :include ,my-blog-files
       )

      ;; ... other contents

      ("blog" :components ("posts" )))))

(defun my/generate-blog()
  "publish my blog"
  (interactive)
  (let ((org-publish-project-alist (my/generate-org-publish-project-alist)))
    (org-publish "blog" t))
  )

这里使用了 denote-directory-files 方法过滤出所有带有 blog 标签的文档,使用参数 :eclude: ".*" 把所有文件先剔除掉,然后只 :include 过滤出来的文件,以实现只发布选定 org 文件。

处理导出文件的链接

由于我的笔记大都是用中文做 title ,按 denote 的命名规则 DATE--TITLE__KEYWORDS.EXTENSION ,他会把这样的中文 title 放在文件名上,并加上以当前时间戳组成的 id ,最后还有 keywords 。这样的文件格式默认输出的 html 也会是这样的格式。

这样的格式是相当不方便的,且先不说中文 path 在浏览器中的 url 将会被编码成很丑的 unicode 可读性很差,光就文件名中包含了 keywords 就会让 url 变的不稳定,后续编辑时增加或删除一个 keyword 都会导致 url 变化,很不适合 SEO。

所以我在上面的步骤中会生成一个文件变量 export_file_name 以应对这个问题。 org-export 会默认读取这个值作为输出文件名。在把一篇普通笔记标记成博文时,我就会使用函数:

(defun my/insert-blog-export-file-name ()
    "使用 `denote-retrieve-title-value' 来生成 export-file-name,用来去除 keyword 或时间这类内容"
    (save-excursion
      (goto-char 0)
      (search-forward "filetags")
      (end-of-line)
      (insert (format
               "\n#+export_file_name: %s"
               (denote-sluggify-title
                (denote-retrieve-title-value buffer-file-name 'org))))))

这里默认使用了 denote-retrieve-title-value 方法来生成这个导出文件名,如果文章标题是中文,我会手动把他改成另一个英文名,增加输出 url 的可读性。

但这个变量只有导出 html 时才被应用,在文章内如果有链接,或者使用 sitemap 功能生成 index 时,org-mode 是完全不处理链接文件名的。为此我创建函数:

(defun my/get-denote-export-file-name (path)
  "generate the export file name by a given path"
  (let ((export-file-name (my/org-file-find-keyword path "EXPORT_FILE_NAME")))
    (or export-file-name (denote-sluggify-title
                                      (denote-retrieve-filename-title path)))
    ))

并增加处理 denote link 的 html 导出行为:

(defun my/denote-link-ol-export (link description format)
  "Modified version of `denote-link-ol-export'.
Replace html export with `my/denote-html-export'

Original docstring below:
Export a `denote:' link from Org files.
The LINK, DESCRIPTION, and FORMAT are handled by the export
backend."
  (let* ((path-id (denote-link--ol-resolve-link-to-target link :path-id))
         (path (file-relative-name (car path-id)))
         (p (file-name-sans-extension path))
         (id (cdr path-id))
         (desc (or description (concat "denote:" id))))
    (cond
     ((eq format 'org) (format "[[denote:%s][%s]]" link desc))
     ((eq format 'html) (my/denote-html-export link desc))
     (t path))))

(defun my/denote-html-export (link desc)
  "把链接使用文件的 export-file-name 来替代"
  (let ((path (denote-get-path-by-id link)))    
    (if (not (string-match "_blog" path))
        (format "%s" desc)
      (if (string-match "_draft" path)
          (format "%s" desc)
        (format "<a href=\"%s.html\">%s</a>"
                (my/get-denote-export-file-name path)
                desc)))))

(org-link-set-parameters "denote" :export #'my/denote-link-ol-export)

这里我是改写了默认 denote-link-ol-export 的实现,当遇到 [[denote:id]][xxx]] 的链接时,把 html 的输出改写了,使用 expot_file_name 作为链接。这里还有一个处理,如果目标的 org 笔记没有 blog 标记,或带有 draft 笔记,则不生成链接,只是以纯文本的方式展示。这个实现也是参考自 1

处理图片资源

我自己的习惯,所有网站的图片资源都会放到 cdn 上以节省流量,git 不太适合管理太多的二进制文件,同时也是为了以后方便做数据迁移,毕竟远程资源只要一个链接就行了。使用 cdn 还有一个好处是,我可以利用 cdn 自动的图片剪裁和压缩能力,最佳化图片输出,给用户更好的加载体验。

所以在生成 html 的最后一步,我会检查生成 html 里面包含的所有图片,并尝试上传到我的七牛云上,大致的过程如下:

(defun my/upload-to-cdn (file-path md5)
  "上传文件到 qiniu 并返回CDN URL"
  (let* ((ext (or (file-name-extension file-path) "bin"))
         (cdn-key (concat my/qiniu-prefix md5 "." ext))
         (cdn-url (format "%s/%s" my/cdn-domain cdn-key))
         (cmd-args (list "fput" my/qiniu-bucket cdn-key file-path)))

    (unless (eq 0 (apply 'call-process "qshell" nil nil nil cmd-args))
      (error "[Qiniu] Upload failed for: %s" file-path))
    cdn-url))

(defun my/get-image-url (file-path)
  "获取图片的CDN地址(自动上传未记录的文件)"
  (interactive "fImage file: ")
  (let* ((abs-path (expand-file-name file-path denote-note-home))
         (md5 (my/file-md5 abs-path))
         (image-map (my/read-image-map))
         (existing-url (alist-get md5 image-map nil nil 'equal)))

    (if existing-url
        (progn
          (message "CDN URL: %s" existing-url)
          existing-url)
      (let ((new-url (my/upload-to-cdn abs-path md5)))
        (my/write-image-map (cons (cons md5 new-url) image-map))
        (message "New CDN URL: %s" new-url)
        new-url))))

(defun my/replace-local-image-paths (html-file)
  "Replace local image paths with remote image paths in the generated HTML file."
  (message "replace-local-image-paths")
  (let ((html-files (directory-files-recursively my/org-publish-path "\\.html$")))
    (dolist (html-file html-files)      
      (with-temp-buffer
        (insert-file-contents html-file)
        (goto-char (point-min))
        (while (re-search-forward "img src=\"\\([^\"]+\\)\"" nil t)
          (let ((local-path (match-string 1)))
            (when (my/is-local-image-path local-path)
              (let ((remote-path (my/get-image-url local-path)))
                (replace-match (concat "img src=\"" remote-path "\"") t t)))))
        (write-region (point-min) (point-max) html-file))
      ))
  )

并把这个方法放到 org-publish-project-alist 中,作为 :completion-function 的参数:

(defun my/generate-org-publish-project-alist ()
  "Generate `org-publish-project-alist` dynamically for org files with the `blog` tag."
  (let* ((denote-directory denote-note-home)
         (my-blog-files (denote-directory-files "_blog.*\\.org")))
    `(("posts"
       :base-directory ,denote-note-home
       :base-extension "org"
       :with-toc t
       :with-tags t
       :publishing-directory ,my/org-publish-path
       :publishing-function org-html-publish-to-html
       :completion-function my/replace-local-image-paths ;; 替换本地图片链接为远程 cdn 上的图片链接
       :time-stamp-file nil
       :exclude ".*"
       :include ,my-blog-files
       )
      ;; ... other settings
      ("blog" :components ("posts")))))

这里我做了如下几个事情:

  1. 使用一个本地 el 缓存文件,记录所有图片资源的 md5 值是否有对应的远程链接
  2. 如果没有对应的链接,则使用 cdn 工具上传,拼得链接后,加入到本地的 el 缓存文件
  3. 如果本地 el 缓存文件有现成的远程链接,则直接返回
  4. 对输出的 html 做 src 替换,换成远程链接

上述过程不但节省了上传用量,还因为使用的是 md5 所以本地资源不论移动文件夹,换文件名,修改内容(比如用工具做的流程图),或者是重复资源,都可以很好的处理。

生成首页和 RSS

利用 org-publish 的 sitemap 功能,自动输出所有文件列表的 index.org 文件。我再通过对这个列表做 org-publish 操作,让其生成首页。

(defun my/org-publish-sitemap-format-entry (entry style project)
  "格式化站点地图中的每个条目,显示标题、日期和摘要。"
  (let* ((title (or (my/org-publish-find-keyword entry "TITLE" project)
                    (or (org-publish-find-title entry project)
                        (file-name-base entry))))
         (id (denote-retrieve-filename-identifier (file-name-base entry)))
         (date (car (org-publish-find-property entry :date project)))
         (summary (my/get-org-publish-summary entry project)))

    (format "[[denote:%s][%s]]\n#+HTML:<p class=\"pub-date\">发布时间:%s</p>\n#+HTML:<p class=\"pub-desc\">摘要:%s</p>"
            id
            title
            (if date (org-timestamp-format date "%Y-%m-%d")
              "[无日期]")
            summary)))

使用 my/org-publish-sitemap-format-entry 函数,我给每一个连接使用的是 [[denote:id]][xxx]] 格式的链接,就是为了让他在输出时也能应用我上面的 my/denote-html-export 方法获得正确的链接文件名。同时我的项目输出中还增加了发布时间与摘要,这样让 index 列表格式看上去更丰富。

增加到 org-publish-project-alist 中,并用另一个 component 来定义 index 的输出。

(defun my/generate-org-publish-project-alist ()
  "Generate `org-publish-project-alist` dynamically for org files with the `blog` tag."
  (let* ((denote-directory denote-note-home)
         (my-blog-files (denote-directory-files "_blog.*\\.org")))
    `(("posts"
       :base-directory ,denote-note-home
       :base-extension "org"
       :section-numbers nil
       :with-toc t
       :with-tags t
       :publishing-directory ,my/org-publish-path
       :publishing-function org-html-publish-to-html
       :completion-function my/replace-local-image-paths
       :time-stamp-file nil
       :exclude ".*"
       :include ,my-blog-files
       :auto-sitemap t
       :sitemap-filename "index.org"
       :sitemap-title "gsj987的博客"
       :sitemap-format-entry my/org-publish-sitemap-format-entry ;; 设定生成 sitemap 的方法
       :sitemap-sort-files anti-chronologically
       )

      ("pages"
         :base-directory ,denote-note-home
         :base-extension "org"
         :publishing-directory ,my/org-publish-path
         :publishing-function org-html-publish-to-html
         :time-stamp-file nil
         :include ("index.org", "about.org") ;; 把 sitemap 也导出成 html。这里我还增加了一个单独维护的 about.org 文件。
         :exclude ".*"
         :section-numbers nil
         )

      ("blog" :components ("posts" "pages")))))

rss 的生成方法也是类似的,但我用了 ox-rss 的方法 2 并配合了单独的 feed-entry 函数来把 summary 放进 rss 的 detail 中。

优化样式

到此为止,大部分的工作都已经完成。关于样式我直接复制了 taxodiumn 3 的。再增加一些细节让博客变的更完美。

增加导航和页尾

使用 html-preabmle 增加页头导航,用 html-postamble 增加页尾,也用于插入追踪脚本。

(defconst my/blog-html-preamble "
 <nav>
  <ul>
    <li><a href=\"/index.html\">Home</a></li>
    <li><a href=\"/about.html\">About</a></li>
    <li><a href=\"/rss.xml\">RSS</a></li>
  </ul>
</nav>
"
  "`:html-preamble' for `org-publish'." )

(defconst my/blog-html-postamble "
<p class=\"author\">Author: gsj987</p>
<p class=\"date\">Publish Date: %d</p>
<p class=\"license\">License: <a href=\"https://www.creativecommons.org/licenses/by-nc/4.0/deed.zh-hans\">CC BY-NC 4.0</a></p>
"
  "`:html-postamble' for blog posts.")

代码高亮

代码高亮我直接使用 highlightjs ,直接从 unpkg 加载,把代码放在 postamble 里。如:

(defconst my/blog-html-postamble "
<p class=\"author\">Author: gsj987</p>
<p class=\"date\">Publish Date: %d</p>
<p class=\"license\">License: <a href=\"https://www.creativecommons.org/licenses/by-nc/4.0/deed.zh-hans\">CC BY-NC 4.0</a></p>

<script src=\"https://unpkg.com/@highlightjs/cdn-assets@11.9.0/highlight.min.js\"></script>
<script>hljs.highlightAll();</script>
"
  "`:html-postamble' for blog posts.")

如果要增加对 lisp 的支持,默认 highlightjs 是不包含的,需要额外引入

<script src=\"https://unpkg.com/@highlightjs/cdn-assets@11.9.0/languages/lisp.min.js\"></script>

另外在全局样式中,我们也需要 import 相关的 css

@import url("https://unpkg.com/@highlightjs/cdn-assets@11.9.0/styles/default.min.css");

另外,我们需要调整一下对 html 输出的方式,让 highlightjs 替代默认的 htmlize 工作 4

(defun my/org-html-wrap-blocks-in-code (src backend info)
  "Wrap a source block in <pre><code class=\"lang\">.</code></pre>"
  (when (org-export-derived-backend-p backend 'html)
    (replace-regexp-in-string
     "\\(</pre>\\)" "</code>\\1"
     (replace-regexp-in-string "<pre class=\"src src-\\([^\"]*?\\)\">"
                               "<pre>\n<code class=\"language-\\1\">" src))))


(add-to-list 'org-export-filter-src-block-functions
             'my/org-html-wrap-blocks-in-code)

(setq org-babel-execute-src-block-p nil ;; 不执行 src block 加速编译
      org-html-htmlize-output-type nil) ;; 不输出 htmlize 

TOC 在多屏幕尺寸下的自适应样式

在不同尺寸下,我希望 toc 能用不同方式展示:

  • 在宽屏幕下,应该是左右展示
  • 在窄屏幕,如手机屏幕下,为顺序展示,并且自动收拢,以避免 toc 过高,影响阅读体验

这个很容易用 css 实现:

/* 手机或小屏幕 */
@media screen and (max-width: 1300px) {
  /* 默认情况 toc 是顺序排列,设一个 max-height 超出部分隐藏 */ 
  #table-of-contents {
    max-height: 360px;
    overflow-y: hidden;
    position: relative;
  }

  /* 设一个遮罩层,有一个渐隐效果,让读者知道下面还有内容被隐藏了 */
  #table-of-contents:not(.show-all)::before {
    content: "";
    position: absolute;
    bottom: 0;
    width: 100%;
    height: 100px;
    background: linear-gradient(180deg, transparent, var(--color-bg));
    background: linear-gradient(
      180deg,
      transparent,
      light-dark(var(--color-bg), var(--dark-color-bg))
    );
    pointer-events: none;
  }

  /* 当用户点击 toggle 按钮时,用 js 增加一个 class 展开这个 toc */
  #table-of-contents.show-all {
    max-height: unset;
  }
}

/* 宽屏 */
@media screen and (min-width: 1300px) {
  /* 有 toc 时, content 自动以 grid 形式展示 */ 
  #content:has(#table-of-contents) {
    max-width: 60rem;
    display: grid;
    grid-template-rows: 5em 1fr;
    grid-template-columns: 16.5em calc(100% - 16.5em);
  }

  /* content 下除了 toc 之外,占第 2-3 列 */ 
  #content:has(#table-of-contents) > * {
    grid-column: 2 / 3;
  }

  /* toc 占第 1 列,并设置显示方式为 fixed 这样滚动时也能被用户看到 */ 
  #table-of-contents {
    width: 20em;
    grid-row: 2;
    position: fixed;
    z-index: 1;
    overflow-x: hidden;
    overflow-y: auto;
    font-size: 14px;
    top: 10em;
  }
}

而 toc 的 toggle 按钮以及跟随滚动高亮标题,都用 js 实现,比较简单就不赘述。

暗色模式

直接利用 css 的 light-dark 方法实现,非常简单。但由于这个语法相对比较新,我们会增加一个默认属性,以确保大部分浏览器的兼容性。比如 body 的字体颜色:

body {
  /* 确保兼容性 */ 
  color: var(--color-text);
  /* 暗色模式支持 */
  color: light-dark(var(--color-text), var(--dark-color-text));
}

发布博客

当所有方法都准备完毕后,我利用 simple-httpd 来本地预览我生成的博客内容:

(use-package simple-httpd
  :init
  (defun my/preview-blog ()
    "Restart simple-httpd. If it is running, stop it first, then start a new instance."
    (interactive)
    ;; 编译 blog
    (my/generate-blog)
    ;; 检查 simple-httpd 是否正在运行
    (if (and (boundp 'httpd-process) httpd-process (process-live-p httpd-process))
        (progn
          (message "Stopping existing simple-httpd process...")
          (httpd-stop)  ;; 停止当前进程
          (sleep-for 1) ;; 等待 1 秒,确保进程完全停止
          (message "Existing simple-httpd process stopped."))
      (message "No running simple-httpd process found."))

    ;; 启动新的 simple-httpd 进程
    (message "Starting a new simple-httpd process...")
    (setq httpd-root my/org-publish-path)
    (message httpd-root)
    (httpd-start)
    (message "New simple-httpd process started at localhost:8080."))
  )

这样每当我写完文档,我直接执行 my/preview-blog 就可以在 http://localhost:8080/ 来预览我的博客了。随时有修改,随时再执行一遍这个函数,就能看到改动的结果。

等一切都妥当,我执行函数 my/publish-blog 就通过 git commit 把博客发到 github pages 上。过程比较简单,这里也不再介绍。

后续思考

为什么不使用 denote 直接写 markdown 文档?

因为我比较熟悉 org-mode 的编写方式,日常我的工作流也会比较多依赖 org-mode 提供的 todo 功能,只是一种习惯。org-mode 定制能力也比较强,组织出各种工作流会比较容易。还有一个原因是目前 emacs 里没有什么 markdown 的好实现,比如 org-mode 是能做到 wysiwyg 的,观感上非常接近一个现代富文本编辑器,但 md 没有这样好的支持。

一个好的文本编辑体验是鼓励输出的最好助力。

为什么不用 org-mode 导出成 markdown 然后使用 hugo 发布?

这是一个好方法,hugo也更强大,而且我原本就是用 hugo 的,工作流也很完整。但这次我想先把一切都简化下来,体验一下 org-publish,看看其扩展能力。说不定未来我会把工作流再重新与 hugo 整合。

跨平台编辑内容怎么办?

目前 emacs 只有在桌面端有比较好的体验,移动端相关的工具都很少。我也在尝试使用 emacs on android 等方法,但目前没有什么好的成效。

不过另一方面,我由衷觉得移动端还不是一个很好的内容创作平台。内容编写需要沉浸和舒适的文本编写体验,移动端目前还没有这么好的环境。也许等 linux on android 方案成熟后,我可以搞一个安卓折叠手机试一试。

接下来要做什么

增加评论或互动的功能,不过我这样的博客其实没什么人访问,这个不是什么紧急的功能需求。 可能首先会专注内容,因为之前荒废了一段时间,其实可以写的事情已经积累一些了,接下来会先把这套工作流带来的输出欲给使用到位。

Footnotes:

1

参考了 https://jiewawa.me/2024/03/blogging-with-denote-and-hugo/ 中许多函数的实现,特别是利用 keywords 来标记需要发布内容的做法。

3

本次 org-mode 生成博客的样式主要来自 https://taxodium.ink/org-publish-blog.html 其中的实现给了许多启发

Author: gsj987

Publish Date: 2025-03-15 Sat 20:42

License: CC BY-NC 4.0