讲义:AI 时代的科研可视化革命

复旦大学上海医学院
讲义:AI 时代的 科研可视化革命

——从被动阅读到全流程交互重构

授课对象
高年级本科 / 硕博研究生
课程时长
约 90 分钟
核心目标
建立“AI 逻辑 + HTML 呈现”的可视化思维,掌握科研全流程的降维打击工具。

引言:认知摩擦与沟通的桥梁

在上一章中,我们探讨了 AI 如何作为“第四范式”驱动科学发现。更现实的瓶颈是:如何让我们的人类大脑高效地读取并理解 AI 的产出?

我们正面对前所未有的 认知摩擦(Cognitive Friction),源于人机底层思维模式的巨大差异。

AI 的舒适区

结构化逻辑与线性流

AI(尤其是大语言模型)是概率预测引擎,输出被迫坍缩为线性文本流。它最擅长生成结构化语言(JSON、Python、HTML、XML),不在乎括号或层级的复杂度。

人类的舒适区

视觉感知与模式识别

人类是视觉动物,对图像、颜色、空间布局、交互的处理速度远高于纯文本。

  • 大段纯文本是一种高能耗活动,尤其是未格式化的数据或代码。
  • 高能耗直接拖慢科研效率,易错失洞察。

核心矛盾:AI 生产的是“高密度的代码/文本”,人类渴望的是“高带宽的视觉/交互”。

解决之道是把 AI 擅长的“结构化代码”实时转译为人类更易理解的视觉体验。那座桥梁,就是 HTML + 浏览器

互联网馈赠给科学的礼物

要理解为什么选择 HTML 作为科研可视化的核心载体,需要回顾它的起源:Web 技术诞生的初衷就是为科学交流服务。

1989 Web 诞生于 CERN (欧洲核子研究中心)

物理学家 Tim Berners-Lee 为了解决论文格式不兼容、信息无法共享的痛点,发明了 HTML。 基因:为科学交流而生

2004 Markdown 发布

John Gruber 为简化 HTML 书写创造了 Markdown,成为 AI 输出的默认格式。

2008 Chrome 与 V8 引擎革命

Google 推出极速 V8 引擎,浏览器升级为“超级操作系统”。

2011-2014 可视化与前端框架爆发

D3.js (2011) 让数据在网页上动起来;
Vue.js (2014) 让开发者像搭积木一样构建复杂应用。

Now AI Coding 时代

无需手写 V8 或 Vue 语法,只需自然语言 Prompt,即可调动上述历史积淀生成科研工具。

1.2 辨析:Markdown vs. HTML

Markdown
2004 年的极简主义

你其实早就见过它:星号 **重点**、井号 # 标题 都是标记。它是所有 AI 模型输出文本时的默认格式。

局限:它是一张“数字纸张”。排序表格、图像放大、交互按钮都做不到。
HTML
全维度的数字容器

本质:结构(Structure)、表现(Presentation)、行为(Behavior)的结合。AI 可以轻松生成 HTML,让浏览器立即把它变成可交互的软件。

优势:信息从“二维纸面”跃升到“三维交互”,匹配人类视觉优势。
结论:Markdown 适合用来与 AI 对话(输入),HTML 适合用来接收 AI 的成果(输出)。

可视化工具的谱系——寻找“中间地带”

在科研可视化的光谱上,我们拥有不同的工具。理解它们的边界,是选择正确工具的前提。

2.1 基础层:Markdown (草稿本)

与 ChatGPT 对话时最常见的格式,也是目前 AI 的默认输出。

纯文本 格式简单 局限:静态且线性
原始格式(Markdown)
# 免疫检查点阻断简介

PD-1 抑制剂 可以重新激活 被耗竭的 T 细胞。

  • nivolumab
  • pembrolizumab
渲染效果(在论文 / 网页中)
免疫检查点阻断简介

PD-1 抑制剂 可以重新激活被耗竭的 T 细胞。

  • nivolumab
  • pembrolizumab

2.2 严谨层:Python / R (印刷机)

发表 SCI 论文常用的绘图工具(Matplotlib, ggplot2)。

历史背景:John Hunter (Matplotlib, 2003) / Hadley Wickham (ggplot2, 2005)
静态高清 精确控制 局限:重且慢
原始格式(Python / Matplotlib)
import matplotlib.pyplot as plt

groups = [“CR”, “PR”, “SD”, “PD”] values = [12, 25, 18, 9]

plt.bar(groups, values, color=“#3b82f6”) plt.ylabel(“Patients”) plt.title(“Response to PD-1 Blockade”) plt.tight_layout() plt.show()

渲染效果(论文中的静态图)
CR
PR
SD
PD

静态 PNG / PDF,被嵌入到文章中。

2.3 核心层:HTML + JS (仪表盘)

本课程的核心,也是常被忽视的“中间地带”。

历史背景:Mike Bostock (D3.js, 2011) —— 开启“数据驱动文档”时代。
  • 折叠:保持主界面清爽。
  • 筛选:瞬间找到关注的数据。
  • 响应:悬停显示数值,框选放大。

价值:它是思考的容器,提供最佳的探索性数据分析 (EDA) 体验。

原始格式(HTML + JS 仪表盘片段)
<div id="response-dashboard">
  <select id="group-filter">
    <option value="all">All patients</option>
    <option value="responder">Responders (CR+PR)</option>
  </select>
  <div class="bar" data-type="CR">CR: 12</div>
  <div class="bar" data-type="PR">PR: 25</div>
  <div class="bar" data-type="SD">SD: 18</div>
  <div class="bar" data-type="PD">PD: 9</div>
</div>
渲染效果(炫彩交互仪表盘)
CR
PR
SD
PD
渐变高亮 筛选突出 CR/PR

实战——全流程的交互式重构

理论必须服务于实践。以下是 5 个可以立刻落地的场景,每个都配有 操作步骤可直接复制的 Prompt

### 3.1 阅读的重构:从线性文本到交互式 App
核心思路:我们平常阅读的文献,大多是行间距很窄、版心拥挤的 PDF,图片经常跨页、来回翻找,既不护眼也不利于专注。
与其被动接受排版,不如把文献“拆开重组”:如果有对应的网页版本,可以右键查看网页源代码,把这段 HTML 源码交给 AI,请它帮我们重排成一个“适合自己阅读”的 HTML 阅读器。
源代码里天然包含了图片的 URL、标题结构等信息,因此经过一次性转换,我们就能得到一个字体更大、留白更充足、图文在同一视野内的阅读页面。
即使没有网页源码,或者你就是习惯从 PDF 中复制文字,也可以让 AI 按照“知识点罗列 + 增大行距 + 重要句加粗”的方式重新排版,减少信息密度、突出重点,从而极大提升长文献阅读的舒适度和效率。

操作步骤

  1. 1 打开论文网页(HTML版),右键点击空白处,选择“查看网页源代码” (View Source)。
  2. 2 Ctrl+A 全选,Ctrl+C 复制。
  3. 3 打开 Gemini/ChatGPT,输入右侧的 Prompt。
  4. 4 等待 AI 回复“请粘贴代码”后,粘贴你复制的源码。

AI Prompt (直接复制)

你是一名资深的前端工程师和生物医学专家。 任务:请将我提供的论文 HTML 源码重构为一个单文件 HTML。 要求: 1. **排版**:使用 Tailwind CSS,风格为学术极简,大字体,护眼背景色。 2. **交互目录**:在左侧生成悬浮目录 (TOC),点击可跳转。 3. **图文对照**:识别源码中的 `<img>` 标签,保留原图链接。将 Figure 图片移动到正文引用处(如 "Fig 1")的侧边,实现图文并茂。 4. **术语解释**:识别文中 5 个关键医学缩写(如肿瘤标志物、基因名),为其添加鼠标悬停显示的 Tooltip 解释。 请先回复“准备好了,请粘贴 HTML 源码”,我再发送代码。
效果预览

免疫检查点阻断(示例)

近期研究显示, PD-1 抑制剂可以重新激活耗竭的 T 细胞,显著改善转移性黑色素瘤的预后。点击 查看示意。

✨ Bonus: Gemini 驱动的学术翻译官

不确定某段文字的含义?粘贴在这里,让 Gemini 为你生成通俗易懂的中文解释。

不同任务选哪个 Prompt?

  • · 基础排版(单篇论文重排、首尝试):使用「1. AI 论文网页化 Prompt (基础版)」。
  • · 深入重构(需要目录、术语工具提示、图文并茂):使用「2. 文献重构改进版 (主要使用)」或「13. 文献重构——改进」。
  • · 科普/公众号改写:使用「23. 文献重构(公众号)」或「24. AI文章重构」。
  • · Gemini 专用版本:使用「22. 文献重构(gemeni3版本)」。

Prompt 解剖:文献重构类的共同结构

  1. 系统角色设定:如“前端工程师 + 医学专家”,确保 AI 既懂排版又懂领域知识。
  2. 输入说明:告诉 AI 将收到的是 HTML 源码、Markdown 文本还是纯文本段落。
  3. 输出结构:明确需要「单文件 HTML」「TOC 目录」「图文对照」「术语 Tooltip」等模块。
  4. 约束与安全:强调不要虚构数据、不要改动图表原意,只做重排与解释补充。
  5. 交互与风格:指定字体、配色、留白、是否适配移动端,形成可复用的“视觉模板”。

3.2 演示的重构:从静态 PPT 到交互式 Slides

核心思路:传统 PPT 汇报往往存在几个痛点:文件体积大、版本混乱(final_v3_real_final.pptx)、动画效果无法跨平台复现,还不便于嵌入可交互图表。
基于 Reveal.js 的 HTML 幻灯片,本质上是一个网页:一份 index.html 就可以在任何现代浏览器中播放,不依赖特定软件,更适合通过 Git / 网盘长期保存和共享。
在这个模式下,你只需要用文字给 AI 提供大纲 + 关键内容模块(比如“代码示例”“交互式结果图”等),AI 就能自动写出包含切换动画、代码高亮、Plotly 图表占位符的完整演示文稿。
对于 Journal Club 或组会,这意味着你可以从“修 PPT 的美工工作”中解放出来,把时间真正花在梳理逻辑和筛选重点图表上,同时又能获得更现代、更适合线上分享的展示效果。

操作步骤

  1. 1 准备好你的汇报大纲(简单的 Markdown 列表)。
  2. 2 发送右侧 Prompt 给 AI。
  3. 3 将 AI 生成的代码保存为 presentation.html
  4. 4 双击打开,按空格键翻页。

AI Prompt (直接复制)

我需要做一个学术汇报(Journal Club)。 请基于 Reveal.js 框架,为我生成一个单文件 HTML 演示文稿。 主题:[在此填入主题,如:单细胞测序在肺癌中的应用] 大纲内容: 1. [背景:...] 2. [方法:...] 3. [结果:...] 要求: - 使用 'white' 主题。 - 在“方法”部分,请嵌入一段 Python 代码示例,并启用语法高亮。 - 在“结果”部分,请预留一个可交互的柱状图位置(使用 Plotly.js)。 - 确保所有 JS/CSS 均通过 CDN 引入,无需本地下载。
index.html (Reveal.js Mockup)

实战练习:让 AI 帮你“读代码”

在本讲义中,你已经看到了多个 HTML + JS 小应用(如 Reveal 幻灯片、GCS 计算器)。建议同学们反向利用这些示例,用专门的「代码阅读 Prompt」请 AI 把代码翻译成人类友好的教程。

  1. 1 从本讲义或自己项目中,复制一段前端代码(组件 / 小工具均可)。
  2. 2 在 AI 工具中先发送「代码阅读类 Prompt」,等待它回复“请粘贴代码”。
  3. 3 粘贴代码,要求 AI 按「模块划分 / 数据流 / 交互逻辑」三个维度解释,并给出可以直接改造的建议。

建议:先用「代码阅读类 Prompt」理解现有 demo,再用「前端工程师 / AI 研究工程师」Prompt 让 AI 帮你从零生成一个属于自己的小工具(如新的评分量表、实验记录器等)。

3.3 概念的重构:从静态图示到动态模型

核心思路:在科研训练中,我们经常需要画“流程图”“信号通路图”或“诊断决策树”。用 PowerPoint 或手动画图,不仅费时费力,而且一旦修改实验流程,整张图几乎等于推倒重来。
Mermaid.js 提供了一种“用文字画图”的思路:你只需要用接近自然语言的方式描述节点和箭头关系(谁指向谁、在哪个阶段发生分支),AI 就可以帮你生成标准的 Mermaid 代码,浏览器再把它渲染成矢量图。
好处在于,这张图的“真相”不在图片里,而在背后的文本逻辑中:当你的实验流程调整时,只需修改几行文字,图像随之自动更新,不再依赖手工对齐和排版。
对于复杂概念(如多步信号转导、临床分层路径等),这种“文字即模型”的方式尤其适合在组会或课堂上快速迭代和讨论。

操作步骤

  1. 1 梳理你要展示的逻辑(如信号通路、诊断流程)。
  2. 2 发送 Prompt 给 AI。
  3. 3 AI 会生成一段 HTML,其中包含 Mermaid 代码。
  4. 4 打开 HTML,图表自动绘制。修改逻辑只需改文字,无需重画。

AI Prompt (直接复制)

请帮我生成一个单文件 HTML,使用 Mermaid.js 绘制一个流程图。 逻辑内容:[Wet Lab: 样本采集 -> RNA提取 -> 质控 -> 建库测序] -> [Dry Lab: 序列比对 -> 差异表达分析 -> 通路富集] 要求: 1. 引入 mermaid.min.js CDN。 2. 图表样式美观,节点使用圆角矩形。 3. 区分 'Wet Lab' 和 'Dry Lab' 两个 Subgraph(子图),并填充不同颜色。
Mermaid.js Protocol Demo

style Wet_Lab fill:#e0f2fe,stroke:#3b82f6 style Dry_Lab fill:#f3e8ff,stroke:#a855f7

Graph will render here...
CSS Animation: Receptor Binding
L

3.4 逻辑的重构:从被动查询到专属工具定制

核心思路:在临床和科研中,我们每天都在做各种“如果…则…”的判断:评分量表(GCS、CHA2DS2-VASc)、分期分级、用药剂量调整等。传统做法要么是纸质表格,要么是在脑中硬记规则,既容易出错,也不便于团队共享。
通过 Vue.js 这样的响应式框架,我们可以让 AI 帮忙把这些规则“固化”为一个个小工具:输入选项一变,分数和风险提示就自动更新;当总分超过某个阈值时,界面背景变红、弹出提醒。
更重要的是,这些小工具都是单文件 HTML,可以离线保存到手机或平板,在查房、门诊或会议现场随时打开使用;规则更新时,只需修改一处逻辑,所有人都能立即获得同一版本的决策支持。
长远来看,这种方式帮助每位医生和科研人员,逐步沉淀出一套“专属于自己课题/学科”的微型工具库,而不仅仅是零散的截图和笔记。

操作步骤

  1. 1 明确你的计算逻辑(如:A+B=C,如果 C>10 则报警)。
  2. 2 发送 Prompt 给 AI。
  3. 3 AI 会生成包含计算逻辑的单文件 HTML。
  4. 4 保存到手机或电脑,随时离线使用。

AI Prompt (直接复制)

你是一名资深前端工程师。请为我生成一个单文件 HTML 小程序。 功能:GCS (格拉斯哥昏迷评分) 计算器。 逻辑: - 睁眼反应 (4分)、语言反应 (5分)、运动反应 (6分)。 - 总分 = 三项之和。 界面要求: - 使用 Vue.js (CDN) 实现响应式逻辑。 - 界面风格模仿 iOS,大按钮,适合触屏。 - 视觉反馈:当总分 <= 8 时,结果区域背景变红,并显示文字“提示:需气管插管”。
9:41
GCS 计算器
总分
15
正常

3.5 知识的重构:从教材到多步知识卡片流水线

核心思路:与其一遍遍从头读厚厚的教材,不如把知识拆成可复习、可追踪的「闭合卡片」。借助一组互相衔接的 Prompt,我们可以做一条流水线:
书籍图片 / PDF → Markdown 文本 → 结构化知识提炼 → ANKI / USMLE 知识卡片
每一步都由专门的 System Prompt 接手,既减少机械重复,又尽量保留原文的严谨性。

操作步骤(建议 workflow)

  1. 1 使用 20. 书籍图像转化为markdown:将教材扫描页或题库截图转为干净的 Markdown 文本。
  2. 2 使用 文献重构类 Prompt(如「2. 文献重构改进版」「13. 文献重构——改进」)整理结构:提炼章节层级、标出重点与高频考点。
  3. 3 把整理后的内容交给 USMLE / ANKI 系列 Prompt(5 / 6 / 8 / 21 / 17-19),生成分层的闭合卡片 JSON 或直接可导入的文本。
  4. 4 10. USMLE导师 或其他「导师类 Prompt」定期抽查这些卡片:生成周度复习计划、模拟口试问答。
ANKI Preview
Q. 一名 24 岁男性因高热、咳嗽入院,考虑细菌性肺炎。请列出经验性静脉抗生素选择时需要优先考虑的三个要素。

提示:用上面的 ANKI/USMLE Prompt,可以把整章节内容批量转化为类似风格的闭合卡片。

附录:我的 Prompt 仓库(AI Studio)

下方小窗口实时引用我在 Notion 中维护的 Prompts List 表格,用来集中存放本课程中用到的 System Prompt 和场景 Prompt。

  • html / code / knowledge / agent 等标签,对应讲义中的主线:文献重构、代码阅读、知识卡片(USMLE / ANKI)、以及多步骤智能体。
  • 阅读讲义时,可以在表格中按标签筛选,并把适合自己的 Prompt 复制到 AI 工具中反复打磨。
  • 讲义后续新增案例时,只需在 Notion 中补充行,即可自动出现在这里,形成一个持续演化的 Prompt 库。
建议配置的一组 “AI 团队”

提示:如果内嵌窗口因浏览器或网络设置无法加载,请点击右侧「在 Notion 中打开」按钮。

Table · My Prompt For AI Studio 在 Notion 中打开

结语:成为你知识产品的“首席产品经理”

回顾科学发展的历程,每一次工具的革新都带来了认知效率的飞跃。从手抄本到印刷术,从静态 PDF 到今天的交互式 HTML。在 AI 时代,自然语言就是编程语言

1 Ask (提问)
2 Wrap (封装)
3 View (浏览)

欢迎来到科研可视化的新纪元。