版本说明:本文档适用于 Plotter 1.0.0-beta。
最后更新:2026 年 1 月
欢迎使用 Plotter
Plotter 是一款专为科研、医药研发与生物实验设计的轻量级交互式绘图工具。它融合了专业统计逻辑与出版级可视化规范,支持四种核心分析模式(组内、组间、配对、回归),并自动生成符合学术期刊要求的高清图表(PNG)与完整数据日志(Excel)。
本文档将帮助您快速掌握 Plotter 的功能细节、统计逻辑与输出规范,确保您的数据分析高效又可复现。
目录
- 快速开始
- 界面概览
- 数据输入规范
- 分析模式与统计算法详解
- 4.1 通用机制
- 4.1.1 重复测量识别
- 4.1.2 离群值剔除算法(IQR 方法)
- 4.2 各分析模式详解
- 4.2.1 组内比较(Within-group)
- 4.2.2 组间比较(Between-group)
- 4.2.2.1 Auto模式决策流程
- 4.2.3 配对分析(Paired)
- 4.2.4 回归分析(Regression)
- 4.3 总结
- 4.1 通用机制
- 绘图参数详解
- 颜色自定义
- 输出格式与导出图表
- 快捷操作
- 常见问题
1. 快速开始
- 准备数据:在左侧表格中粘贴或输入数据。第一行为列标题(如
"Time","Vehicle","Dose_10mg"),第一列为 X 轴变量(如时间点、剂量等),其余列为 Y 值。 - 设置系列:将多个重复列命名为相同标题(如两个
"Vehicle"列),Plotter 会自动将其合并为一个实验组。 - 选择分析模式
- 组内:观察单组随时间/条件变化(如药代曲线)。
- 组间:比较多组在单一条件下的差异(如不同处理组终点值)。
- 配对:同一对象两次测量(如治疗前后)。
- 回归:探索 X 与 Y 的定量关系(如剂量-效应)。
- 调整参数(可选):如误差类型、是否剔除异常值、统计方法等。
- 点击“生成图表”:系统将渲染 PNG 图像,并自动下载图像与 Excel 日志。
2. 界面概览
| 区域 | 功能 |
|---|---|
| 左侧表格区 | 输入和编辑原始数据,支持撤销/重做、复制粘贴、删除单元格 |
| 顶部工具栏 | 撤销(Ctrl+Z)、重做(Ctrl+Shift+Z)、语言切换(中/英)、快速开始 |
| 右侧控制面板 | 设置分析模式、绘图样式、统计选项、颜色等 |
| 底部按钮 | “生成图表”触发绘图;成功后显示 PNG 图像 |
3. 数据输入规范
- 第一行:列标题(用于图例和分组识别)。
- X 列(第一列):
- 在 组内比较 和 回归分析 模式下,其标题将用作 X 轴标签。
- 支持文本(如
"Day 1")或数值(如1, 2, 3)。
- Y 列:
- 必须为数值型,空单元格视为缺失值并自动忽略。
- 重复测量:多个列使用相同标题(如
"Group A"),系统将其合并为该组的重复观测。 - Y轴标签在绘图参数中设置,将在第五章详细介绍。
- 支持操作:
- 直接键盘输入。
- 从 Excel / Numbers / Google Sheets 复制粘贴(保留行列结构)。
- 选中区域后按
Delete或Backspace清空内容(支持撤销)。
💡 提示:Y列标题是颜色分配和系列识别的依据,请确保命名正确。
4. 分析模式与统计算法详解
Plotter 支持四种核心分析模式:组内比较(Within)、组间比较(Between)、配对分析(Paired)和回归分析(Regression)。每种模式采用不同的数据结构假设、可视化策略和统计检验逻辑。其中,“Auto” 模式下的统计方法选择和离群值处理机制尤为关键。
4.1 通用机制
4.1.1 重复测量识别
- 用户可将多个列设置为相同标题(如
"Vehicle"、"Dose_10mg")。 - 所有具有相同标题的数据会被合并为同一实验组的重复测量,用于计算均值、误差及统计检验。
4.1.2 离群值剔除算法(IQR 方法)
- 触发条件:用户勾选 “排除异常值”。
- 算法:
- 对每个实验组(或每个时间点/子组),计算第一四分位数(Q1)和第三四分位数(Q3)。
- 计算四分位距:
IQR = Q3 – Q1。 - 定义正常范围:
[Q1 – 1.5×IQR, Q3 + 1.5×IQR]。 - 落在此区间外的数据点被标记为离群值并剔除。
- 特殊处理:
- 若某组数据点少于 4 个,则不执行离群值检测(避免误判)。
- 剔除记录会保存到输出 Excel 的
outliers_removed工作表,包含原始值、边界、方法等信息。
4.2 各分析模式详解
4.2.1 组内比较(Within-group)
- 适用场景:单组随时间/剂量变化(如药代动力学曲线)。
- 数据结构:
- X 列:分类变量(如
"Day 1","Control")或连续变量(如1, 2, 3...)。 - Y 列:多个重复列,按标题分组合并。
- X 列:分类变量(如
- 绘图:
- 每组绘制均值 ± 误差棒,并可叠加原始散点。
- 支持以实线连接相邻误差棒之间均值点(
connect_errorbars)。 - 误差棒下界若出现负数,将不绘制下界。
- 自动对数坐标:
- 当 Y 值最大/最小比 >
log_threshold(默认 1000)时,Y 轴自动转为对数刻度。 - 限制:若数据含 ≤0 值,则报错(对数轴不支持非正值)。
- 当 Y 值最大/最小比 >
⚠️ 此模式不进行组间统计检验,仅描述性统计。
4.2.2 组间比较(Between-group)
- 适用场景:多个独立组在单一条件下的比较(如不同处理组终点指标)。
- 数据结构:
- 每个
series_prefix对应一个独立组。- 组内所有列合并为该组的全部观测值。
- 绘图:每组绘制柱状图,包括均值 ± 误差棒(SEM),并可叠加原始散点。
- 统计检验:可选择 Auto 模式或指定 Unpaired-t test / Mann-Whitney U / One-way ANOVA / Kruskal-Wallis。
4.2.2.1 Auto 模式决策流程:
- 正态性评估(每组独立判断)
使用改进版 Shapiro-Wilk + 描述性统计综合判定,分为四级:判定逻辑:
approximately_normal:可安全使用参数检验。moderately_non_normal:小样本下谨慎使用参数检验。severely_non_normal:必须使用非参数检验。unknown:样本量过小(n < 3)。
- 极端偏度(|skew| > 2)或峰度(kurtosis > 7 或 < -1.1) →
severely_non_normal- 小样本(n < 30)且 |skew| > 0.8 或 |kurtosis| > 1.0 →
moderately_non_normal- 大样本(n ≥ 30)但 |skew| > 1.2 →
moderately_non_normal- 其余情况 →
approximately_normal- 整体参数性判断:
- 若所有组均为
approximately_normal→ 使用参数检验。- 若存在
severely_non_normal→ 使用非参数检验。- 若全为
moderately_non_normal:
- n ≥ 15:允许参数检验
- n < 15:仅当全为
approximately_normal才用参数检验- 方差齐性检验(仅参数检验路径):
- 使用 Levene 检验(对非正态更稳健)。
- 若方差齐 → 标准 t 检验 / ANOVA。
- 若方差不齐 → Welch’s t 检验 / Welch’s ANOVA(依赖
pingouin库)。- 最终检验选择:
组数 参数性 方差齐性 检验方法 2 是 是 Unpaired t-test 2 是 否 Welch’s t-test 2 否 — Mann-Whitney U ≥3 是 是 One-way ANOVA ≥3 是 否 Welch’s ANOVA ≥3 否 — Kruskal-Wallis
- 结果标注:p 值自动显示在图表右上角(如
p = 0.0032或p < 0.0001)。- 输出:完整审计日志保存至 Excel(正态性、方差检验、最终决策)。
4.2.3 配对分析(Paired Analysis)
- 适用场景:同一对象两次测量(如治疗前 vs 治疗后)。
- 数据结构:
- 必须恰好两个
series_prefixes。 - 每行代表一个受试对象,两列分别为两次测量值。
- 必须恰好两个
- 统计检验:
- 计算差值序列(B – A)。
- 对差值进行正态性检验:
- 正态 → Paired t-test
- 非正态 → Wilcoxon matched-pairs signed-rank test
- 绘图:
- 绘制配对连线(灰色细线)。
- 可选显示散点、均值 ± SEM 误差棒。
4.2.4 回归分析(Regression)
- 适用场景:探究 X 与 Y 的定量关系(如剂量-效应)。
- 数据结构:
- X 列必须为数值型(连续变量)。
- Y 列按标题分组合并。
- 拟合模型:
- 当前仅支持线性回归(
y = a*x + b)。 - 支持对 Y 进行对数转换:
log10(Y)或ln(Y)→ 拟合log(Y) ~ X- 或选择
none→ 拟合Y ~ X
- 当前仅支持线性回归(
- 统计输出:
- 可选显示:回归方程、R²、95% 置信带。
- 离群值处理:
- 若选择对数转换,将在转换后的 Y 空间(如 log(Y))中执行 IQR 剔除。
- 若不选择对数转换,将 Y 空间中执行 IQR 剔除。
4.3 总结
- 智能正态性分级:不仅依赖 p 值,还结合偏度、峰度、样本量,避免小样本下 Shapiro-Wilk 过于敏感的问题。
- 稳健方差处理:自动切换 Welch 修正,解决方差不齐导致的假阳性。
- 透明审计:所有决策步骤(正态性、方差、检验选择)均记录在输出 Excel 中,便于复现与审阅。
- 离群值可追溯:剔除记录包含原始值、边界、方法,确保数据处理可解释。
此设计确保 Plotter 在保持易用性的同时,提供符合科研规范的统计严谨性,特别适合医药研发、生物实验等对统计可靠性要求高的场景。
5. 绘图参数说明
| 参数 | 说明 |
|---|---|
| 图表标题 / Y轴标题 | 自定义图表主标题和 Y 轴标签 |
| 误差类型 | SEM(标准误,反映均值可靠性)、SD(标准差,反映数据离散度)、95% CI(置信区间) |
| 绘图模式 | 控制是否显示误差棒、散点或两者叠加 |
| 统计检验 | 自动根据数据分布选择参数/非参数检验;也可手动指定 |
| 排除异常值 | 使用 IQR 方法自动剔除离群点(谨慎使用) |
| 自动对数坐标 | 当 Y 值最大/最小比 > 阈值(默认 1000)时,Y 轴转为对数刻度 |
| 显示回归方程/R² | 仅在回归模式下生效 |
6. 颜色自定义
- 根据列标题自动识别数据系列(如所有标题为
"Drug_A"的列视为同一系列)。 - 在 “系列颜色” 面板中,可为每个系列单独设置颜色。
- 颜色选择会实时保存,即使切换语言或刷新页面也不会丢失(在当前会话中)。
- 默认使用科学出版常用配色(蓝、红、绿、紫等)。
7. 输出格式与导出图表
- 输出格式:PNG 图像(300 DPI,出版级清晰度)。
- 自动下载:
plot_xxx.png:高清图表plot_xxx.xlsx:包含原始数据、参数、统计摘要、离群值记录、正态性审计等
- 布局优化:自动调整边距、图例位置、刻度密度,确保可读性。默认使用科学出版常用Arial字体(英文)和黑体(中文和其他文字)。
8. 快捷操作
| 操作 | 快捷键 |
|---|---|
| 撤销 | Ctrl + Z (Windows/Linux) 或 Cmd + Z (Mac) |
| 重做 | Ctrl + Shift + Z 或 Cmd + Shift + Z |
| 删除选中单元格 | Delete 或 Backspace(需先选中区域) |
| 复制/粘贴 | 标准 Ctrl+C / Ctrl+V(支持跨 Excel 粘贴) |
9. 常见问题
Q1: 为什么点击“生成图表”没反应?
- 检查是否有有效数值数据(至少一行非空数字)。
- 确保未在编辑单元格时点击(先按
Enter退出编辑)。
Q2: 如何处理缺失值?
- 空单元格自动忽略,不影响其他数据点计算。
Q3: 能否导出矢量图(如 SVG/PDF)?
- 当前版本仅支持 PNG。后续版本将增加矢量导出功能。
Q4: 统计检验结果在哪里?
- 组间比较模式下,p 值会自动标注在图上(如
* p<0.05,** p<0.01)。
Q5: 应用卡顿怎么办?
- 避免一次性粘贴超大表格(>1000 行)。建议分批处理。
Q6: 为什么只下载了Excel表格一个文件?
- 这是 Safari 浏览器的安全策略导致的正常行为。点击“生成图表”后,系统会自动下载 PNG 和 Excel 日志,但 Safari 浏览器 出于安全考虑,默认只允许一次用户操作触发一个文件下载(在 Chrome / Edge / Firefox 中,这两个文件可以在一次操作中同时下载)。在页面中右键点击生成的图片,选择”存储图像“即可保存 PNG 文件。
如有更多需求或发现 Bug,请联系开发者。
祝您工作顺利,绘图高效!
发表评论