讲义：AI 时代的科研可视化革命

December 1, 2025

复旦大学上海医学院

讲义：AI 时代的科研可视化革命

——从被动阅读到全流程交互重构

授课对象

高年级本科 / 硕博研究生

课程时长

约 90 分钟

核心目标

建立“AI 逻辑 + HTML 呈现”的可视化思维，掌握科研全流程的降维打击工具。

引言：认知摩擦与沟通的桥梁

在上一章中，我们探讨了 AI 如何作为“第四范式”驱动科学发现。更现实的瓶颈是：如何让我们的人类大脑高效地读取并理解 AI 的产出？

我们正面对前所未有的 认知摩擦（Cognitive Friction），源于人机底层思维模式的巨大差异。

AI 的舒适区

结构化逻辑与线性流

AI（尤其是大语言模型）是概率预测引擎，输出被迫坍缩为线性文本流。它最擅长生成结构化语言（JSON、Python、HTML、XML），不在乎括号或层级的复杂度。

人类的舒适区

视觉感知与模式识别

人类是视觉动物，对图像、颜色、空间布局、交互的处理速度远高于纯文本。

大段纯文本是一种高能耗活动，尤其是未格式化的数据或代码。
高能耗直接拖慢科研效率，易错失洞察。

核心矛盾：AI 生产的是“高密度的代码/文本”，人类渴望的是“高带宽的视觉/交互”。

解决之道是把 AI 擅长的“结构化代码”实时转译为人类更易理解的视觉体验。那座桥梁，就是 HTML + 浏览器。

互联网馈赠给科学的礼物

要理解为什么选择 HTML 作为科研可视化的核心载体，需要回顾它的起源：Web 技术诞生的初衷就是为科学交流服务。

1989 Web 诞生于 CERN (欧洲核子研究中心)

物理学家 Tim Berners-Lee 为了解决论文格式不兼容、信息无法共享的痛点，发明了 HTML。基因：为科学交流而生

Tim Berners-Lee · 百度百科 Wikipedia

Tim Berners-Lee 个人主页（W3C） CERN 官网

2004 Markdown 发布

John Gruber 为简化 HTML 书写创造了 Markdown，成为 AI 输出的默认格式。

John Gruber · 百度百科 Wikipedia

原始 Markdown 规范（Daring Fireball）

2008 Chrome 与 V8 引擎革命

Google 推出极速 V8 引擎，浏览器升级为“超级操作系统”。

Lars Bak · 百度百科 Wikipedia

Google

Chrome 浏览器 V8 引擎官方博客

2011-2014 可视化与前端框架爆发

D3.js (2011) 让数据在网页上动起来；
Vue.js (2014) 让开发者像搭积木一样构建复杂应用。

Mike Bostock · Wikipedia

尤雨溪 · 百度百科 Evan You · Wikipedia

D3.js 官网

Vue.js 官网

Now AI Coding 时代

无需手写 V8 或 Vue 语法，只需自然语言 Prompt，即可调动上述历史积淀生成科研工具。

Sam Altman · 百度百科 Wikipedia

1.2 辨析：Markdown vs. HTML

Markdown

2004 年的极简主义

你其实早就见过它：星号 **重点**、井号 # 标题 都是标记。它是所有 AI 模型输出文本时的默认格式。

局限：它是一张“数字纸张”。排序表格、图像放大、交互按钮都做不到。

HTML

全维度的数字容器

本质：结构（Structure）、表现（Presentation）、行为（Behavior）的结合。AI 可以轻松生成 HTML，让浏览器立即把它变成可交互的软件。

优势：信息从“二维纸面”跃升到“三维交互”，匹配人类视觉优势。

结论：Markdown 适合用来与 AI 对话（输入），HTML 适合用来接收 AI 的成果（输出）。

可视化工具的谱系——寻找“中间地带”

在科研可视化的光谱上，我们拥有不同的工具。理解它们的边界，是选择正确工具的前提。

2.1 基础层：Markdown (草稿本)

与 ChatGPT 对话时最常见的格式，也是目前 AI 的默认输出。

纯文本格式简单局限：静态且线性

原始格式（Markdown）

# 免疫检查点阻断简介
PD-1 抑制剂 可以重新激活
被耗竭的 T 细胞。

nivolumab
pembrolizumab

渲染效果（在论文 / 网页中）

免疫检查点阻断简介

PD-1 抑制剂 可以重新激活被耗竭的 T 细胞。

nivolumab
pembrolizumab

2.2 严谨层：Python / R (印刷机)

发表 SCI 论文常用的绘图工具（Matplotlib, ggplot2）。

历史背景：John Hunter (Matplotlib, 2003) / Hadley Wickham (ggplot2, 2005)

静态高清精确控制局限：重且慢

原始格式（Python / Matplotlib）

import matplotlib.pyplot as plt
groups = [“CR”, “PR”, “SD”, “PD”]
values = [12, 25, 18, 9]
plt.bar(groups, values, color=“#3b82f6”)
plt.ylabel(“Patients”)
plt.title(“Response to PD-1 Blockade”)
plt.tight_layout()
plt.show()

渲染效果（论文中的静态图）

静态 PNG / PDF，被嵌入到文章中。

2.3 核心层：HTML + JS (仪表盘)

本课程的核心，也是常被忽视的“中间地带”。

历史背景：Mike Bostock (D3.js, 2011) —— 开启“数据驱动文档”时代。

折叠：保持主界面清爽。
筛选：瞬间找到关注的数据。
响应：悬停显示数值，框选放大。

价值：它是思考的容器，提供最佳的探索性数据分析 (EDA) 体验。

原始格式（HTML + JS 仪表盘片段）

<div id="response-dashboard">
  <select id="group-filter">
    <option value="all">All patients</option>
    <option value="responder">Responders (CR+PR)</option>
  </select>
  <div class="bar" data-type="CR">CR: 12</div>
  <div class="bar" data-type="PR">PR: 25</div>
  <div class="bar" data-type="SD">SD: 18</div>
  <div class="bar" data-type="PD">PD: 9</div>
</div>

渲染效果（炫彩交互仪表盘）

渐变高亮筛选突出 CR/PR

实战——全流程的交互式重构

理论必须服务于实践。以下是 5 个可以立刻落地的场景，每个都配有 操作步骤 与 可直接复制的 Prompt。

### 3.1 阅读的重构：从线性文本到交互式 App

核心思路：我们平常阅读的文献，大多是行间距很窄、版心拥挤的 PDF，图片经常跨页、来回翻找，既不护眼也不利于专注。
与其被动接受排版，不如把文献“拆开重组”：如果有对应的网页版本，可以右键查看网页源代码，把这段 HTML 源码交给 AI，请它帮我们重排成一个“适合自己阅读”的 HTML 阅读器。
源代码里天然包含了图片的 URL、标题结构等信息，因此经过一次性转换，我们就能得到一个字体更大、留白更充足、图文在同一视野内的阅读页面。
即使没有网页源码，或者你就是习惯从 PDF 中复制文字，也可以让 AI 按照“知识点罗列 + 增大行距 + 重要句加粗”的方式重新排版，减少信息密度、突出重点，从而极大提升长文献阅读的舒适度和效率。

操作步骤

1 打开论文网页（HTML版），右键点击空白处，选择“查看网页源代码” (View Source)。
2 按 Ctrl+A 全选，Ctrl+C 复制。
3 打开 Gemini/ChatGPT，输入右侧的 Prompt。
4 等待 AI 回复“请粘贴代码”后，粘贴你复制的源码。

AI Prompt (直接复制)

你是一名资深的前端工程师和生物医学专家。任务：请将我提供的论文 HTML 源码重构为一个单文件 HTML。要求： 1. **排版**：使用 Tailwind CSS，风格为学术极简，大字体，护眼背景色。 2. **交互目录**：在左侧生成悬浮目录 (TOC)，点击可跳转。 3. **图文对照**：识别源码中的 `<img>` 标签，保留原图链接。将 Figure 图片移动到正文引用处（如 "Fig 1"）的侧边，实现图文并茂。 4. **术语解释**：识别文中 5 个关键医学缩写（如肿瘤标志物、基因名），为其添加鼠标悬停显示的 Tooltip 解释。请先回复“准备好了，请粘贴 HTML 源码”，我再发送代码。

效果预览

免疫检查点阻断（示例）

近期研究显示， PD-1 程序性死亡受体 1
肿瘤细胞通过与 T 细胞上的 PD-1 结合来逃避免疫系统的攻击。抑制剂可以重新激活耗竭的 T 细胞，显著改善转移性黑色素瘤的预后。点击查看示意。

✨ Bonus: Gemini 驱动的学术翻译官

不确定某段文字的含义？粘贴在这里，让 Gemini 为你生成通俗易懂的中文解释。

不同任务选哪个 Prompt？

· 基础排版（单篇论文重排、首尝试）：使用「1. AI 论文网页化 Prompt (基础版)」。
· 深入重构（需要目录、术语工具提示、图文并茂）：使用「2. 文献重构改进版 (主要使用)」或「13. 文献重构——改进」。
· 科普/公众号改写：使用「23. 文献重构（公众号）」或「24. AI文章重构」。
· Gemini 专用版本：使用「22. 文献重构(gemeni3版本)」。

一键直达 Notion 里的 Prompt

以下链接会在新标签打开对应行，方便复制与二次修改：

1. 基础版 · 论文网页化 2. 文献重构改进版（主要使用） 13. 文献重构——改进 23. 文献重构（公众号） 24. AI文章重构 22. 文献重构（Gemini 3 版本）

Prompt 解剖：文献重构类的共同结构

系统角色设定：如“前端工程师 + 医学专家”，确保 AI 既懂排版又懂领域知识。
输入说明：告诉 AI 将收到的是 HTML 源码、Markdown 文本还是纯文本段落。
输出结构：明确需要「单文件 HTML」「TOC 目录」「图文对照」「术语 Tooltip」等模块。
约束与安全：强调不要虚构数据、不要改动图表原意，只做重排与解释补充。
交互与风格：指定字体、配色、留白、是否适配移动端，形成可复用的“视觉模板”。

3.2 演示的重构：从静态 PPT 到交互式 Slides

核心思路：传统 PPT 汇报往往存在几个痛点：文件体积大、版本混乱（final_v3_real_final.pptx）、动画效果无法跨平台复现，还不便于嵌入可交互图表。
基于 Reveal.js 的 HTML 幻灯片，本质上是一个网页：一份 index.html 就可以在任何现代浏览器中播放，不依赖特定软件，更适合通过 Git / 网盘长期保存和共享。
在这个模式下，你只需要用文字给 AI 提供大纲 + 关键内容模块（比如“代码示例”“交互式结果图”等），AI 就能自动写出包含切换动画、代码高亮、Plotly 图表占位符的完整演示文稿。
对于 Journal Club 或组会，这意味着你可以从“修 PPT 的美工工作”中解放出来，把时间真正花在梳理逻辑和筛选重点图表上，同时又能获得更现代、更适合线上分享的展示效果。

操作步骤

1 准备好你的汇报大纲（简单的 Markdown 列表）。
2 发送右侧 Prompt 给 AI。
3 将 AI 生成的代码保存为 presentation.html。
4 双击打开，按空格键翻页。

AI Prompt (直接复制)

我需要做一个学术汇报（Journal Club）。请基于 Reveal.js 框架，为我生成一个单文件 HTML 演示文稿。主题：[在此填入主题，如：单细胞测序在肺癌中的应用] 大纲内容： 1. [背景：...] 2. [方法：...] 3. [结果：...] 要求： - 使用 'white' 主题。 - 在“方法”部分，请嵌入一段 Python 代码示例，并启用语法高亮。 - 在“结果”部分，请预留一个可交互的柱状图位置（使用 Plotly.js）。 - 确保所有 JS/CSS 均通过 CDN 引入，无需本地下载。

推荐 SOTA 工具： Reveal.js 官方文档 Marp（Markdown 幻灯片）

index.html (Reveal.js Mockup)

实战练习：让 AI 帮你“读代码”

在本讲义中，你已经看到了多个 HTML + JS 小应用（如 Reveal 幻灯片、GCS 计算器）。建议同学们反向利用这些示例，用专门的「代码阅读 Prompt」请 AI 把代码翻译成人类友好的教程。

1 从本讲义或自己项目中，复制一段前端代码（组件 / 小工具均可）。
2 在 AI 工具中先发送「代码阅读类 Prompt」，等待它回复“请粘贴代码”。
3 粘贴代码，要求 AI 按「模块划分 / 数据流 / 交互逻辑」三个维度解释，并给出可以直接改造的建议。

3.3 概念的重构：从静态图示到动态模型

核心思路：在科研训练中，我们经常需要画“流程图”“信号通路图”或“诊断决策树”。用 PowerPoint 或手动画图，不仅费时费力，而且一旦修改实验流程，整张图几乎等于推倒重来。
Mermaid.js 提供了一种“用文字画图”的思路：你只需要用接近自然语言的方式描述节点和箭头关系（谁指向谁、在哪个阶段发生分支），AI 就可以帮你生成标准的 Mermaid 代码，浏览器再把它渲染成矢量图。
好处在于，这张图的“真相”不在图片里，而在背后的文本逻辑中：当你的实验流程调整时，只需修改几行文字，图像随之自动更新，不再依赖手工对齐和排版。
对于复杂概念（如多步信号转导、临床分层路径等），这种“文字即模型”的方式尤其适合在组会或课堂上快速迭代和讨论。

推荐 SOTA 资源： Mermaid.js 官方文档 Mermaid Live Editor

操作步骤

1 梳理你要展示的逻辑（如信号通路、诊断流程）。
2 发送 Prompt 给 AI。
3 AI 会生成一段 HTML，其中包含 Mermaid 代码。
4 打开 HTML，图表自动绘制。修改逻辑只需改文字，无需重画。

AI Prompt (直接复制)

请帮我生成一个单文件 HTML，使用 Mermaid.js 绘制一个流程图。逻辑内容：[Wet Lab: 样本采集 -> RNA提取 -> 质控 -> 建库测序] -> [Dry Lab: 序列比对 -> 差异表达分析 -> 通路富集] 要求： 1. 引入 mermaid.min.js CDN。 2. 图表样式美观，节点使用圆角矩形。 3. 区分 'Wet Lab' 和 'Dry Lab' 两个 Subgraph（子图），并填充不同颜色。

Mermaid.js Protocol Demo

style Wet_Lab fill:#e0f2fe,stroke:#3b82f6 style Dry_Lab fill:#f3e8ff,stroke:#a855f7

Graph will render here...

CSS Animation: Receptor Binding

3.4 逻辑的重构：从被动查询到专属工具定制

核心思路：在临床和科研中，我们每天都在做各种“如果…则…”的判断：评分量表（GCS、CHA₂DS₂-VASc）、分期分级、用药剂量调整等。传统做法要么是纸质表格，要么是在脑中硬记规则，既容易出错，也不便于团队共享。
通过 Vue.js 这样的响应式框架，我们可以让 AI 帮忙把这些规则“固化”为一个个小工具：输入选项一变，分数和风险提示就自动更新；当总分超过某个阈值时，界面背景变红、弹出提醒。
更重要的是，这些小工具都是单文件 HTML，可以离线保存到手机或平板，在查房、门诊或会议现场随时打开使用；规则更新时，只需修改一处逻辑，所有人都能立即获得同一版本的决策支持。
长远来看，这种方式帮助每位医生和科研人员，逐步沉淀出一套“专属于自己课题/学科”的微型工具库，而不仅仅是零散的截图和笔记。

操作步骤

1 明确你的计算逻辑（如：A+B=C，如果 C>10 则报警）。
2 发送 Prompt 给 AI。
3 AI 会生成包含计算逻辑的单文件 HTML。
4 保存到手机或电脑，随时离线使用。

AI Prompt (直接复制)

你是一名资深前端工程师。请为我生成一个单文件 HTML 小程序。功能：GCS (格拉斯哥昏迷评分) 计算器。逻辑： - 睁眼反应 (4分)、语言反应 (5分)、运动反应 (6分)。 - 总分 = 三项之和。界面要求： - 使用 Vue.js (CDN) 实现响应式逻辑。 - 界面风格模仿 iOS，大按钮，适合触屏。 - 视觉反馈：当总分 <= 8 时，结果区域背景变红，并显示文字“提示：需气管插管”。

9:41

GCS 计算器

睁眼反应

语言反应

运动反应

总分

正常

3.5 知识的重构：从教材到多步知识卡片流水线

核心思路：与其一遍遍从头读厚厚的教材，不如把知识拆成可复习、可追踪的「闭合卡片」。借助一组互相衔接的 Prompt，我们可以做一条流水线：
书籍图片 / PDF → Markdown 文本 → 结构化知识提炼 → ANKI / USMLE 知识卡片
每一步都由专门的 System Prompt 接手，既减少机械重复，又尽量保留原文的严谨性。

操作步骤（建议 workflow）

1 使用 20. 书籍图像转化为markdown：将教材扫描页或题库截图转为干净的 Markdown 文本。
2 使用 文献重构类 Prompt（如「2. 文献重构改进版」「13. 文献重构——改进」）整理结构：提炼章节层级、标出重点与高频考点。
3 把整理后的内容交给 USMLE / ANKI 系列 Prompt（5 / 6 / 8 / 21 / 17-19），生成分层的闭合卡片 JSON 或直接可导入的文本。
4 用 10. USMLE导师 或其他「导师类 Prompt」定期抽查这些卡片：生成周度复习计划、模拟口试问答。

附录：我的 Prompt 仓库（AI Studio）

下方小窗口实时引用我在 Notion 中维护的 Prompts List 表格，用来集中存放本课程中用到的 System Prompt 和场景 Prompt。

html / code / knowledge / agent 等标签，对应讲义中的主线：文献重构、代码阅读、知识卡片（USMLE / ANKI）、以及多步骤智能体。
阅读讲义时，可以在表格中按标签筛选，并把适合自己的 Prompt 复制到 AI 工具中反复打磨。
讲义后续新增案例时，只需在 Notion 中补充行，即可自动出现在这里，形成一个持续演化的 Prompt 库。

建议配置的一组 “AI 团队”

学术导师（长期陪跑）：9. AI教授指导。
考试教练（USMLE/执业）：10. USMLE导师 + 21. ANKI_USMLE_精华版。
前端工程师（可视化助手）：12. 前端工程师，把想法变成 HTML 小工具。
知识工程师（卡片工厂）：11. ANKI工程师，负责从文本批量生成结构化卡片。

提示：如果内嵌窗口因浏览器或网络设置无法加载，请点击右侧「在 Notion 中打开」按钮。

Table · My Prompt For AI Studio 在 Notion 中打开

结语：成为你知识产品的“首席产品经理”

回顾科学发展的历程，每一次工具的革新都带来了认知效率的飞跃。从手抄本到印刷术，从静态 PDF 到今天的交互式 HTML。在 AI 时代，自然语言就是编程语言。

1 Ask (提问)

2 Wrap (封装)

3 View (浏览)

欢迎来到科研可视化的新纪元。

Table of Contents

讲义：AI 时代的科研可视化革命

引言：认知摩擦与沟通的桥梁

互联网馈赠给科学的礼物

1.2 辨析：Markdown vs. HTML

可视化工具的谱系——寻找“中间地带”

2.1 基础层：Markdown (草稿本)

2.2 严谨层：Python / R (印刷机)

2.3 核心层：HTML + JS (仪表盘)

实战——全流程的交互式重构

操作步骤

AI Prompt (直接复制)

免疫检查点阻断（示例）

✨ Bonus: Gemini 驱动的学术翻译官

不同任务选哪个 Prompt？

一键直达 Notion 里的 Prompt

Prompt 解剖：文献重构类的共同结构

3.2 演示的重构：从静态 PPT 到交互式 Slides

操作步骤

AI Prompt (直接复制)

实战练习：让 AI 帮你“读代码”

推荐使用的代码相关 Prompt

3.3 概念的重构：从静态图示到动态模型

操作步骤

AI Prompt (直接复制)

3.4 逻辑的重构：从被动查询到专属工具定制

操作步骤

AI Prompt (直接复制)

3.5 知识的重构：从教材到多步知识卡片流水线

操作步骤（建议 workflow）

推荐使用的 Prompt 组合（可点击打开）

附录：我的 Prompt 仓库（AI Studio）

结语：成为你知识产品的“首席产品经理”

Table of Contents

讲义：AI 时代的科研可视化革命

引言：认知摩擦与沟通的桥梁

互联网馈赠给科学的礼物

1.2 辨析：Markdown vs. HTML

可视化工具的谱系——寻找“中间地带”

2.1 基础层：Markdown (草稿本)

2.2 严谨层：Python / R (印刷机)

2.3 核心层：HTML + JS (仪表盘)

实战——全流程的交互式重构

操作步骤

AI Prompt (直接复制) Copy

免疫检查点阻断（示例）

✨ Bonus: Gemini 驱动的学术翻译官

不同任务选哪个 Prompt？

一键直达 Notion 里的 Prompt

Prompt 解剖：文献重构类的共同结构

3.2 演示的重构：从静态 PPT 到交互式 Slides

操作步骤

AI Prompt (直接复制) Copy

实战练习：让 AI 帮你“读代码”

推荐使用的代码相关 Prompt

3.3 概念的重构：从静态图示到动态模型

操作步骤

AI Prompt (直接复制) Copy

3.4 逻辑的重构：从被动查询到专属工具定制

操作步骤

AI Prompt (直接复制) Copy

3.5 知识的重构：从教材到多步知识卡片流水线

操作步骤（建议 workflow）

推荐使用的 Prompt 组合（可点击打开）

附录：我的 Prompt 仓库（AI Studio）

结语：成为你知识产品的“首席产品经理”

AI Prompt (直接复制)

AI Prompt (直接复制)

AI Prompt (直接复制)

AI Prompt (直接复制)