互动课件效果评测台
数据快照隔离与真AI双擎版
课件生成效果
用于比较不同课件生成模型、提示词版本、素材链路下的生成质量。
近期模型
Gemini 3.1 Pro
重点看复杂交互、题型保持、长 Prompt 稳定性。
对照模型
Gemini 3.5 Flash
重点看速度、成本、批量测试稳定性。
下一步
接入测评任务
后续把模型版本、截图、评分和问题记录放进这里维护。
画面风格调整
基于同一个课件批量测试 19 种基础风格,沉淀每版效果、问题、解决方法和下一版参考提示词。
套用玩法
维护灵感推荐区每个模板的套用玩法提示词,支持效果记录、下一版修订、下载开发入库表和单条接口入库。
线上站点会通过本站 Worker 代理调用开发接口:/api/update-inspiration-template-prompt/{templateId}。本地调试时如接口不可达,不影响 Excel 下载和本机维护。
一键同款
用于和“套用玩法”并列对比,判断同一素材下哪个链路效果更好。
后续在这里沉淀“一键同款 vs 套用玩法”的逐案例对比结论。
测评任务管理列表
| 任务ID | 学科 | 课件名称 | 模型数量 | 状态 | 操作 |
|---|
发布新评测任务
系统已默认添加常用模型。产物支持拖拽本地HTML或链接。
透视视角
🌟 综合视角 (全部)
有效打分样本量
- 份
全维度综合得分王 (V5)
-
最大进步幅度 (V1至V5)
-
模型能力分布 (V5均分)
综合实力对决
初稿开箱即用能力最强
V1 版本综合得分王
-
终稿潜力迭代上限最高
V5 版本综合得分王
-
各维度最强王者对比
进化幅度对比 (V1 vs V5)
自研模型专属迭代诊断
大模型量化分析点击顶部[获取最新归档数据进行分析]生成诊断...
教研主观评价核心观点提取
大模型智能解析点击顶部[获取最新归档数据进行分析]生成聚类...