Plotter 帮助文档（1.0.0-beta）

版本说明：本文档适用于 Plotter 1.0.0-beta。

最后更新：2026 年 1 月

欢迎使用 Plotter

Plotter 是一款专为科研、医药研发与生物实验设计的轻量级交互式绘图工具。它融合了专业统计逻辑与出版级可视化规范，支持四种核心分析模式（组内、组间、配对、回归），并自动生成符合学术期刊要求的高清图表（PNG）与完整数据日志（Excel）。

本文档将帮助您快速掌握 Plotter 的功能细节、统计逻辑与输出规范，确保您的数据分析高效又可复现。

快速开始
界面概览
数据输入规范
分析模式与统计算法详解
- 4.1 通用机制
  - 4.1.1 重复测量识别
  - 4.1.2 离群值剔除算法（IQR 方法）
- 4.2 各分析模式详解
  - 4.2.1 组内比较（Within-group）
  - 4.2.2 组间比较（Between-group）
    - 4.2.2.1 Auto模式决策流程
  - 4.2.3 配对分析（Paired）
  - 4.2.4 回归分析（Regression）
- 4.3 总结
绘图参数详解
颜色自定义
输出格式与导出图表
快捷操作
常见问题

1. 快速开始

准备数据：在左侧表格中粘贴或输入数据。第一行为列标题（如 "Time", "Vehicle", "Dose_10mg"），第一列为 X 轴变量（如时间点、剂量等），其余列为 Y 值。
设置系列：将多个重复列命名为相同标题（如两个 "Vehicle" 列），Plotter 会自动将其合并为一个实验组。
选择分析模式
- 组内：观察单组随时间/条件变化（如药代曲线）。
- 组间：比较多组在单一条件下的差异（如不同处理组终点值）。
- 配对：同一对象两次测量（如治疗前后）。
- 回归：探索 X 与 Y 的定量关系（如剂量-效应）。
调整参数（可选）：如误差类型、是否剔除异常值、统计方法等。
点击“生成图表”：系统将渲染 PNG 图像，并自动下载图像与 Excel 日志。

2. 界面概览

区域	功能
左侧表格区	输入和编辑原始数据，支持撤销/重做、复制粘贴、删除单元格
顶部工具栏	撤销（Ctrl+Z）、重做（Ctrl+Shift+Z）、语言切换（中/英）、快速开始
右侧控制面板	设置分析模式、绘图样式、统计选项、颜色等
底部按钮	“生成图表”触发绘图；成功后显示 PNG 图像

3. 数据输入规范

第一行：列标题（用于图例和分组识别）。
X 列（第一列）：
- 在 组内比较 和 回归分析 模式下，其标题将用作 X 轴标签。
- 支持文本（如 "Day 1"）或数值（如 1, 2, 3）。
Y 列：
- 必须为数值型，空单元格视为缺失值并自动忽略。
- 重复测量：多个列使用相同标题（如 "Group A"），系统将其合并为该组的重复观测。
- Y轴标签在绘图参数中设置，将在第五章详细介绍。
支持操作：
- 直接键盘输入。
- 从 Excel / Numbers / Google Sheets 复制粘贴（保留行列结构）。
- 选中区域后按 Delete 或 Backspace 清空内容（支持撤销）。

💡 提示：Y列标题是颜色分配和系列识别的依据，请确保命名正确。

4. 分析模式与统计算法详解

Plotter 支持四种核心分析模式：组内比较（Within）、组间比较（Between）、配对分析（Paired）和回归分析（Regression）。每种模式采用不同的数据结构假设、可视化策略和统计检验逻辑。其中，“Auto” 模式下的统计方法选择和离群值处理机制尤为关键。

4.1 通用机制

4.1.1 重复测量识别

用户可将多个列设置为相同标题（如 "Vehicle"、"Dose_10mg"）。
所有具有相同标题的数据会被合并为同一实验组的重复测量，用于计算均值、误差及统计检验。

4.1.2 离群值剔除算法（IQR 方法）

触发条件：用户勾选 “排除异常值”。
算法：
- 对每个实验组（或每个时间点/子组），计算第一四分位数（Q1）和第三四分位数（Q3）。
- 计算四分位距：IQR = Q3 – Q1。
- 定义正常范围：[Q1 – 1.5×IQR, Q3 + 1.5×IQR]。
- 落在此区间外的数据点被标记为离群值并剔除。
特殊处理：
- 若某组数据点少于 4 个，则不执行离群值检测（避免误判）。
- 剔除记录会保存到输出 Excel 的 outliers_removed 工作表，包含原始值、边界、方法等信息。

4.2 各分析模式详解

4.2.1 组内比较（Within-group）

适用场景：单组随时间/剂量变化（如药代动力学曲线）。
数据结构：
- X 列：分类变量（如 "Day 1", "Control"）或连续变量（如 1, 2, 3...）。
- Y 列：多个重复列，按标题分组合并。
绘图：
- 每组绘制均值 ± 误差棒，并可叠加原始散点。
- 支持以实线连接相邻误差棒之间均值点（connect_errorbars）。
- 误差棒下界若出现负数，将不绘制下界。
自动对数坐标：
- 当 Y 值最大/最小比 > log_threshold（默认 1000）时，Y 轴自动转为对数刻度。
- 限制：若数据含 ≤0 值，则报错（对数轴不支持非正值）。

⚠️ 此模式不进行组间统计检验，仅描述性统计。

4.2.2 组间比较（Between-group）

适用场景：多个独立组在单一条件下的比较（如不同处理组终点指标）。

数据结构：

每个 series_prefix 对应一个独立组。

组内所有列合并为该组的全部观测值。

绘图：每组绘制柱状图，包括均值 ± 误差棒（SEM），并可叠加原始散点。

统计检验：可选择 Auto 模式或指定 Unpaired-t test / Mann-Whitney U / One-way ANOVA / Kruskal-Wallis。

4.2.2.1 Auto 模式决策流程：

正态性评估（每组独立判断）
使用改进版 Shapiro-Wilk + 描述性统计综合判定，分为四级：
approximately_normal：可安全使用参数检验。
moderately_non_normal：小样本下谨慎使用参数检验。
severely_non_normal：必须使用非参数检验。
unknown：样本量过小（n < 3）。
判定逻辑：

极端偏度（|skew| > 2）或峰度（kurtosis > 7 或 < -1.1） → severely_non_normal

小样本（n < 30）且 |skew| > 0.8 或 |kurtosis| > 1.0 → moderately_non_normal

大样本（n ≥ 30）但 |skew| > 1.2 → moderately_non_normal

其余情况 → approximately_normal

整体参数性判断：

若所有组均为 approximately_normal → 使用参数检验。

若存在 severely_non_normal → 使用非参数检验。

若全为 moderately_non_normal：

n ≥ 15：允许参数检验

n < 15：仅当全为 approximately_normal 才用参数检验

方差齐性检验（仅参数检验路径）：

使用 Levene 检验（对非正态更稳健）。

若方差齐 → 标准 t 检验 / ANOVA。

若方差不齐 → Welch’s t 检验 / Welch’s ANOVA（依赖 pingouin 库）。

最终检验选择：

组数参数性方差齐性检验方法
2 是是 Unpaired t-test
2 是否 Welch’s t-test
2 否 — Mann-Whitney U
≥3 是是 One-way ANOVA
≥3 是否 Welch’s ANOVA
≥3 否 — Kruskal-Wallis

结果标注：p 值自动显示在图表右上角（如 p = 0.0032 或 p < 0.0001）。

输出：完整审计日志保存至 Excel（正态性、方差检验、最终决策）。

4.2.3 配对分析（Paired Analysis）

组数	参数性	方差齐性	检验方法
2	是	是	Unpaired t-test
2	是	否	Welch’s t-test
2	否	—	Mann-Whitney U
≥3	是	是	One-way ANOVA
≥3	是	否	Welch’s ANOVA
≥3	否	—	Kruskal-Wallis

适用场景：同一对象两次测量（如治疗前 vs 治疗后）。
数据结构：
- 必须恰好两个 series_prefixes。
- 每行代表一个受试对象，两列分别为两次测量值。
统计检验：
- 计算差值序列（B – A）。
- 对差值进行正态性检验：
  - 正态 → Paired t-test
  - 非正态 → Wilcoxon matched-pairs signed-rank test
绘图：
- 绘制配对连线（灰色细线）。
- 可选显示散点、均值 ± SEM 误差棒。

4.2.4 回归分析（Regression）

适用场景：探究 X 与 Y 的定量关系（如剂量-效应）。
数据结构：
- X 列必须为数值型（连续变量）。
- Y 列按标题分组合并。
拟合模型：
- 当前仅支持线性回归（y = a*x + b）。
- 支持对 Y 进行对数转换：
  - log10(Y) 或 ln(Y) → 拟合 log(Y) ~ X
  - 或选择 none → 拟合 Y ~ X
统计输出：
- 可选显示：回归方程、R²、95% 置信带。
离群值处理：
- 若选择对数转换，将在转换后的 Y 空间（如 log(Y)）中执行 IQR 剔除。
- 若不选择对数转换，将 Y 空间中执行 IQR 剔除。

4.3 总结

智能正态性分级：不仅依赖 p 值，还结合偏度、峰度、样本量，避免小样本下 Shapiro-Wilk 过于敏感的问题。
稳健方差处理：自动切换 Welch 修正，解决方差不齐导致的假阳性。
透明审计：所有决策步骤（正态性、方差、检验选择）均记录在输出 Excel 中，便于复现与审阅。
离群值可追溯：剔除记录包含原始值、边界、方法，确保数据处理可解释。

此设计确保 Plotter 在保持易用性的同时，提供符合科研规范的统计严谨性，特别适合医药研发、生物实验等对统计可靠性要求高的场景。

5. 绘图参数说明

参数	说明
图表标题 / Y轴标题	自定义图表主标题和 Y 轴标签
误差类型	SEM（标准误，反映均值可靠性）、SD（标准差，反映数据离散度）、95% CI（置信区间）
绘图模式	控制是否显示误差棒、散点或两者叠加
统计检验	自动根据数据分布选择参数/非参数检验；也可手动指定
排除异常值	使用 IQR 方法自动剔除离群点（谨慎使用）
自动对数坐标	当 Y 值最大/最小比 > 阈值（默认 1000）时，Y 轴转为对数刻度
显示回归方程/R²	仅在回归模式下生效

6. 颜色自定义

根据列标题自动识别数据系列（如所有标题为 "Drug_A" 的列视为同一系列）。
在 “系列颜色” 面板中，可为每个系列单独设置颜色。
颜色选择会实时保存，即使切换语言或刷新页面也不会丢失（在当前会话中）。
默认使用科学出版常用配色（蓝、红、绿、紫等）。

7. 输出格式与导出图表

输出格式：PNG 图像（300 DPI，出版级清晰度）。
自动下载：
- plot_xxx.png：高清图表
- plot_xxx.xlsx：包含原始数据、参数、统计摘要、离群值记录、正态性审计等
布局优化：自动调整边距、图例位置、刻度密度，确保可读性。默认使用科学出版常用Arial字体（英文）和黑体（中文和其他文字）。

8. 快捷操作

操作	快捷键
撤销	`Ctrl + Z` (Windows/Linux) 或 `Cmd + Z` (Mac)
重做	`Ctrl + Shift + Z` 或 `Cmd + Shift + Z`
删除选中单元格	`Delete` 或 `Backspace`（需先选中区域）
复制/粘贴	标准 `Ctrl+C / Ctrl+V`（支持跨 Excel 粘贴）

9. 常见问题

Q1: 为什么点击“生成图表”没反应？

检查是否有有效数值数据（至少一行非空数字）。
确保未在编辑单元格时点击（先按 Enter 退出编辑）。

Q2: 如何处理缺失值？

空单元格自动忽略，不影响其他数据点计算。

Q3: 能否导出矢量图（如 SVG/PDF）？

当前版本仅支持 PNG。后续版本将增加矢量导出功能。

Q4: 统计检验结果在哪里？

组间比较模式下，p 值会自动标注在图上（如 * p<0.05, ** p<0.01）。

Q5: 应用卡顿怎么办？

避免一次性粘贴超大表格（>1000 行）。建议分批处理。

Q6: 为什么只下载了Excel表格一个文件？

这是 Safari 浏览器的安全策略导致的正常行为。点击“生成图表”后，系统会自动下载 PNG 和 Excel 日志，但 Safari 浏览器出于安全考虑，默认只允许一次用户操作触发一个文件下载（在 Chrome / Edge / Firefox 中，这两个文件可以在一次操作中同时下载）。在页面中右键点击生成的图片，选择”存储图像“即可保存 PNG 文件。

如有更多需求或发现 Bug，请联系开发者。
祝您工作顺利，绘图高效！