生物医学产品策略草案
LitSource 聚焦生物医学文献反查、证据核验与引用风险控制的产品方向与改动点。
文档目的
这份文档用于明确 LitSource 下一阶段的产品方向:
- 不再追求全学科泛化
- 以生物医学为唯一核心学科
- 围绕“反查文献 + 核验文献真假 + 控制引用风险”做深做透
- 建立与全学科研究工具不同的产品壁垒
本文不是市场宣传稿,而是内部策略草案,重点是产品边界、能力优先级和建议改动点。
当前判断
LitSource 现在已经具备两条有价值的核心链路:
Claim / 观点 -> 反查相关证据Reference / 参考文献 -> 检测真假、匹配元数据、给出纠正建议
这两条链路方向是对的,但当前产品仍然更接近“工具集合”,还没有完全成为“生物医学证据决策工具”。
目前最明显的问题不是功能没有,而是产品重心还不够锋利:
- 检索能力还偏“泛搜索”
- 核验能力还偏“真假与纠正”
- 生物医学场景下最值钱的“证据等级、适用性、投稿前风险”还不够完整
核心决策
LitSource 应明确定位为:
面向生物医学研究的文献反查与证据核验平台。
英文可以定义为:
A biomedical evidence verification and literature decision tool.
这个定位意味着:
- 我们不是通用学术搜索产品
- 我们不是泛学科 citation helper
- 我们也不应该以“覆盖所有学科”为主要卖点
我们真正要卖的是:
- 生物医学证据可信度
- 生物医学引用安全性
- 投稿、综述、标书、AI 辅助写作前的风险控制
为什么必须聚焦生物医学
生物医学和其他学科的差异不是小差异,而是足以决定产品形态的结构性差异。
例如:
- 生物医学高度依赖 PubMed、trial、guideline、systematic review、meta-analysis
- 生物医学对 evidence level 非常敏感
- 生物医学场景里“错误引用”的代价高于很多学科
- 生物医学场景下,review、animal study、in vitro、conference abstract、preprint 之间不能混用
- 生物医学用户对“这篇文献能否支撑这个 claim”极其敏感
全学科产品很难把这些规则做深,因为一旦做深,就会与其他学科的工作方式冲突。
因此,LitSource 的机会不是“比别人覆盖更广”,而是:
比别人更懂生物医学证据如何被检索、如何被验证、如何被安全使用。
与全学科产品的差异化
全学科工具通常在卖什么
- 更快搜到相关论文
- 更快做综述式浏览
- 更快用 AI 理解论文内容
- 更通用的研究辅助
LitSource 应该卖什么
- 更快找到可以支撑某个生物医学 claim 的证据
- 更快判断一条生物医学引用是否真实、是否准确、是否安全
- 更快识别哪些文献虽然“真实存在”,但不适合直接使用
- 更快在投稿前、修稿前、写综述前降低引用风险
一句话区分
- 全学科工具:帮助用户探索
- LitSource:帮助用户在信任和引用之前完成核验
更适合 LitSource 的一句话表达:
Find biomedical evidence. Verify every reference. Reduce citation risk before submission.
我们要做的 5 个核心能力模块
1. 生物医学证据反查
目标不是做泛搜索,而是让用户输入一个 claim、问题或段落后,尽快找到可以用来支撑、反驳或限定该观点的生物医学证据。
这一模块应该重点做:
- 生物医学 query rewrite
- PICO 或 claim 结构拆解
- population / intervention / outcome 抽取
- 支持 / 反对 / 部分支持 区分
- 研究对象与结局的匹配检查
- 按生物医学证据强度排序
这会是最重要的流量入口。
2. 文献真假检测与引用纠正
这是当前已经具备雏形的模块,也是用户最容易立即感知价值的能力。
这一模块负责:
- 检测引用是否真实存在
- 核对 DOI、标题、年份、作者、期刊是否匹配
- 识别错误引用、残缺引用、错配引用
- 给出标准化后的纠正结果
这部分仍然要继续保留,并保持简洁高效,因为它是用户进入产品后最快产生“信任感”的功能。
3. 引用风险雷达
这是下一阶段最关键的付费能力。
真假检测解决的是:
- 这篇文献是不是真的
- 这条引用是不是写对了
风险雷达要解决的是:
- 这篇文献即使是真的,是否适合拿来用
- 拿来写论文、标书、综述、答辩会不会出问题
这一模块应该逐步覆盖:
- 撤稿
- 勘误 / correction / erratum
- expression of concern
- preprint 与正式发表区分
- conference abstract、thesis、book、review、editorial 类型识别
- review 与 original study 区分
- animal study / in vitro / human study 区分
- evidence level 判断
- 不适合作为核心证据的提示
这是 LitSource 从“真假工具”升级为“生物医学引用风控工具”的关键。
4. 证据等级与使用建议
用户最终不是为了知道“这篇 paper 在不在”,而是为了知道“这篇能不能支撑我现在的话”。
因此,系统应该逐步增加:
- 文献类型判断
- 证据等级提示
- 是否适合支持临床结论
- 是否只能支持背景陈述
- 是否更适合作为机制补充
- 是否建议替换为更高等级证据
这部分会显著提升用户对结果的信任,也会提高产品溢价能力。
5. 生物医学专用工作流
不要只提供功能点,还要围绕真实工作场景组织工作流。
优先工作流建议:
- 投稿前 reference QA
- AI 生成参考文献后的人工复核
- systematic review 初筛
- grant / proposal 写作中的证据确认
- 修稿回复时的证据补充
一旦工作流成型,产品就不再只是若干按钮,而是进入用户的日常研究流程。
最重要的改动点
下面是建议优先推进的改动点,按重要程度排序。
P0:把“真假核验”升级成“风险核验”
这是最关键的改动。
建议新增的结果层包括:
riskLevelriskFlagsrecommendedUseriskEvidencereplaceSuggestion
第一版优先支持的风险标签:
retractedcorrectedexpression_of_concernpreprint_onlyreview_not_primaryconference_onlythesis_onlyanimal_or_in_vitro_only
原因:
- 这些标签非常符合生物医学场景
- 风险含义明确
- 用户感知价值强
- 很适合转化成付费点
P0:反查结果加入证据等级排序
当前反查结果不能只按相关性返回。
建议增加排序信号:
- study design
- human > animal > in vitro
- meta-analysis / systematic review / guideline 优先
- RCT 优先于低等级观察性证据
- publication recency
- journal signal
- citation signal
- 与当前 claim 的 population / outcome 匹配度
目标是让用户看到的不是“最像”的文献,而是“最能用”的文献。
P1:强化生物医学 claim 解析
当前输入处理应该继续从“语义重写”升级到“claim understanding”。
建议逐步增加:
- disease / biomarker / intervention / endpoint 抽取
- 因果与相关性区分
- 治疗、机制、风险因素、诊断四类 claim 分流
- 多句输入的主次 claim 拆解
这一步会显著提升反查结果质量。
P1:建立生物医学知识库与风险缓存
长期壁垒不在界面,而在数据积累。
建议逐步沉淀:
- 高频错误引用库
- 高频真实引用库
- 生物医学 study type 分类结果
- 风险标记缓存
- 常见 journal / publication type 规则
这样结果会越来越快、越来越稳、越来越便宜。
P1:围绕投稿和综述组织结果页
结果页不要只展示“判断结果”,还应展示“下一步怎么处理”。
建议增加:
- 可直接引用
- 建议降级使用
- 仅作背景材料
- 建议替换
- 必须人工复核
这会让系统更像决策工具,而不是检查器。
当前不建议优先做的事
以下事项不建议现在优先推进:
- 扩展到更多非生物医学学科
- 为了看起来“功能多”而加入泛学科标签
- 先做很复杂的社区协作功能
- 在没有风险层之前过度优化视觉层
- 把产品宣传成通用 academic search
原因很简单:这些会削弱产品重心。
产品边界
LitSource 应明确坚持以下边界:
- 核心学科:生物医学
- 核心任务:反查证据、核验引用、控制风险
- 核心用户:研究者、医学生、PI、systematic review 用户、写作者、修稿用户
- 核心价值:降低错误引用与错误证据使用带来的风险
其他学科可以兼容,但不应成为产品主承诺。
推荐的对外表述
以下几句可以作为未来官网或介绍材料的方向:
- 面向生物医学研究的文献反查与引用核验平台
- 帮你找到能用的证据,而不是只找到相关论文
- 在信任和引用之前,先完成核验
- 为投稿、综述、标书和 AI 辅助写作提供最后一道证据质控
英文方向:
- Biomedical-first evidence search and citation verification
- Submission-grade verification for biomedical references
- Verify biomedical evidence before you trust or cite it
建议的阶段性路线
第 1 阶段
- 保持当前真假检测能力
- 加入第一版风险雷达
- 统一前端文案,强调生物医学定位
第 2 阶段
- 增加 evidence level 与 usage recommendation
- 加强反查结果中的 study design 排序
- 开始沉淀风险缓存和分类结果
第 3 阶段
- 面向投稿、综述、修稿构建专用工作流
- 形成真正的生物医学证据决策平台
最终结论
LitSource 不应继续朝“全学科研究工具”发展。
最正确的方向是:
把生物医学做深,把证据核验做透,把引用风险做成壁垒。
如果以后要扩展其他学科,也应建立在“通用核验底座 + 生物医学深度能力已经站稳”的前提之上,而不是现在就分散资源。
具体改动点与交互设计
下面补充一版更具体的功能改动点与页面交互,重点覆盖:
- 反查文献页
- 引用核验页
- 结果页
- 批量处理与工作流
一、反查文献功能具体改动点
目标:
- 不是只返回“相关文献”
- 而是返回“可用于当前生物医学 claim 的证据”
1. 输入阶段改动
当前输入框建议增加以下能力:
- 自动识别输入类型
- claim
- research question
- abstract / paragraph
- reviewer comment
- 自动识别研究意图
- 治疗
- 风险因素
- 机制
- 诊断
- 预后
- 自动抽取关键信息
- population
- intervention / exposure
- comparator
- outcome
- disease
- biomarker
2. 输入区交互建议
在搜索前先做一个轻量解析卡片。
用户输入后,搜索框下方即时出现:
识别到的疾病识别到的干预/暴露识别到的结局当前任务类型建议检索重点
示例交互:
- 用户输入一句 claim
- 系统在用户点击搜索前显示:
- 疾病:T2DM
- 干预:metformin
- 结局:cardiovascular mortality
- 类型:治疗效果判断
- 检索重点:优先 RCT / meta-analysis / cohort
这样用户会立刻感受到系统“懂生物医学问题”,不是普通搜索框。
3. 搜索结果排序改动
建议把结果排序从“相关性优先”升级为“可用性优先”。
新增排序因子:
- study design
- human / animal / in vitro
- 与 claim 的 PICO 匹配度
- 支持 / 反对 / 部分支持
- publication recency
- citation count
- journal signal
- guideline / systematic review / meta-analysis 权重
4. 结果卡片新增字段
每张 paper card 建议新增:
- 证据类型
- guideline
- meta-analysis
- systematic review
- RCT
- cohort
- case-control
- review
- animal
- in vitro
- 适用性标签
- 可直接支撑
- 部分支撑
- 仅机制支持
- 仅背景支持
- 不建议用于该 claim
- 风险提示
- preprint
- low evidence
- model-only inference
5. 结果卡片交互建议
建议增加几个高频操作按钮:
为什么推荐这篇为什么不完全匹配查看证据等级查看与 claim 的匹配点加入证据清单替代更高等级证据
点开后展开一个 explanation panel,内容包括:
- 这篇文献支持的是哪个结论
- 支持证据来自哪一段
- 人群是否一致
- 结局是否一致
- 是否只是部分支持
- 是否有更高等级替代证据
二、引用核验功能具体改动点
目标:
- 从“真假与纠正”
- 升级成“真假 + 风险 + 使用建议”
1. 输入阶段改动
Verify 页建议支持 3 种输入模式:
- 粘贴 reference list
- 上传 manuscript references section
- 上传 AI 生成的参考文献列表
未来可以增加:
- 粘贴正文中的 in-text citation + references 一起分析
2. 输入区交互建议
在用户点击 Run 之前,先做一轮预解析预览。
输入区下方显示:
- 检测到多少条引用
- 每条的 citation type
- DOI 缺失数量
- 可疑格式数量
- 可能重复引用数量
并给出一个 preflight summary:
发现 18 条引用其中 6 条缺 DOI2 条疑似重复3 条格式明显不完整
这样用户在付费前就知道系统不是“黑箱跑一下”。
3. 核验结果新增维度
当前结果已有真假、reason、match、suggested citation。
建议新增:
- 文献状态
- 正常
- 已撤稿
- 有勘误
- expression of concern
- preprint only
- 文献类型
- journal article
- review
- meta-analysis
- conference abstract
- dissertation
- book chapter
- 证据等级
- high
- medium
- low
- not primary evidence
- 使用建议
- 可直接引用
- 建议仅作背景
- 建议替换
- 必须人工复核
4. 结果表格交互建议
建议在现有表格基础上增加几列或折叠卡片:
StatusRiskEvidence TypeRecommended Use
推荐交互:
- 默认表格只显示最重要标签
- 点击某条记录展开详情
展开详情后显示:
- 核验结论
- 风险标签
- 风险依据来源链接
- 正确引用格式
- 替换建议
- 推荐下一步动作
5. 单条引用详情页建议
建议让每条引用可进入详情抽屉或详情卡。
详情内展示:
- 原始引用
- 标准化引用
- DOI / PMID / source URL
- 文献类型判断
- 风险判断
- 风险证据链接
- 是否适合作为核心证据
- 如果不适合,原因是什么
特别建议增加一个模块:
Why this is risky
用一句到三句话解释:
- 这篇虽然真实存在,但它是 review,不是 original study
- 这篇虽然真实,但当前版本带有 correction
- 这篇只在动物模型中成立,不建议直接支撑临床结论
三、风险雷达具体改动点
这是最值得单独做成一个产品心智的部分。
第一版建议支持的风险标签
文献状态风险
- retracted
- corrected
- erratum
- expression_of_concern
- duplicate_publication
- preprint_only
来源类型风险
- review_not_primary
- conference_only
- thesis_only
- editorial_or_commentary
生物医学适用性风险
- animal_only
- in_vitro_only
- low_evidence_for_clinical_claim
- population_mismatch
- outcome_mismatch
- intervention_mismatch
风险等级建议
建议统一成 5 档:
- critical
- high
- medium
- low
- info
其中:
retracted直接 criticalexpression_of_concern直接 highpreprint_only一般 high 或 mediumreview_not_primary一般 mediumanimal_only对临床 claim 场景一般 high
风险交互建议
每条引用旁边显示风险 badge。
点击 badge 后弹出风险说明面板,包含:
- 风险名称
- 风险等级
- 风险依据
- 来源链接
- 对应建议
示例:
- 风险:Preprint only
- 等级:High
- 依据:仅发现预印本记录,未发现正式期刊发表版本
- 建议:可作线索参考,不建议作为核心结论依据
四、结果页整体交互改动建议
1. 增加 Summary Dashboard
无论是 Search 还是 Verify,结果页顶部都应该有一个强概览。
对于 Verify:
- 总引用数
- 已核验
- 可疑
- 高风险
- 建议替换
- 撤稿数量
对于 Search:
- 总命中文献数
- 可直接支撑数量
- 高等级证据数量
- 反对证据数量
- 部分支持数量
2. 增加可执行筛选
Verify 结果页建议支持按以下筛选:
- 只看高风险
- 只看可替换
- 只看 DOI 缺失
- 只看 review / non-primary
- 只看已核验但不建议直接使用
Search 结果页建议支持按以下筛选:
- 只看 high evidence
- 只看 human study
- 只看 RCT / meta-analysis
- 只看 support
- 只看 against
- 只看近期文献
3. 增加批量操作
Verify 批量操作建议:
- 批量标记为“需人工复核”
- 批量导出高风险文献
- 批量导出纠正后的引用
- 批量生成替换清单
Search 批量操作建议:
- 批量加入证据清单
- 批量导出 citations
- 批量生成 supporting set / opposing set
五、面向真实场景的专用交互
不要只做“单次工具调用”,而要让用户进入工作流。
1. 投稿前检查模式
入口文案:
Pre-submission Reference Check
交互建议:
- 用户上传 references section
- 系统返回:
- 真假
- 风险
- 替换建议
- 投稿前优先处理项
结果页顶部给一个明确 summary:
3 references need urgent review before submission
2. AI 引用质检模式
入口文案:
AI-generated References QA
交互建议:
- 用户粘贴 AI 生成的 reference list
- 系统重点突出:
- fake citation
- metadata mismatch
- hallucinated journal / year / DOI
- suspicious but real
这是很强的付费场景。
3. Systematic Review 初筛模式
入口文案:
Evidence Screening for Review Workflows
交互建议:
- 支持按 study design、human/animal、publication type、risk flags 快速筛
- 支持把“背景材料”和“核心证据”分开
六、建议新增的关键文案与按钮
为了让产品更像“生物医学证据工作台”,建议增加一些更专业、更明确的按钮和标签。
建议按钮:
Explain MatchRisk DetailsCan I Cite This?Find Better EvidenceMark for Manual ReviewExport Corrected ReferencesOpen Source Record
建议标签:
Primary EvidenceNot Primary EvidenceClinical Use RiskMechanistic OnlyBackground OnlySubmission RiskPreprintRetracted
七、建议新增的数据结构
为了支持上面的交互,后端建议逐步增加这些字段:
riskLevelriskFlagsriskEvidencerecommendedUseevidenceTypestudyDesignsubjectLevel- human
- animal
- in_vitro
claimFitreplacementPrioritymanualReviewRequired
这些字段不一定第一期都要落库,但建议先按统一 schema 设计。
八、建议优先落地的交互顺序
如果按版本优先级排,建议是:
第一批
- Verify 结果页增加
Risk列 - 每条引用支持风险详情展开
- 顶部 summary 增加高风险数量
- 输入前增加预解析摘要
第二批
- Search 结果页增加 evidence type 和 recommended use
- 支持按 human / animal / review / RCT 筛选
- 支持 explanation panel
第三批
- 投稿前检查模式
- AI 引用质检模式
- 批量替换建议与导出
九、最需要避免的交互问题
在设计这些改动时,需要避免以下问题:
- 标签很多,但没有行动建议
- 给出风险,但没有依据链接
- 给出“可疑”,但用户不知道为什么
- 给出“verified”,却没有说明是否适合当前场景
- 前端出现看起来很高级但实际不生效的筛选
生物医学用户对“看起来懂”和“真的能用”非常敏感,后者必须优先。