注释增强(可选)
概述
注释增强是一种高级验证工具,通过多次迭代分析增强注释的置信度。它特别适用于:
- 验证低置信度注释
- 获取特定细胞簇的详细见解
- 解决模糊的细胞类型分配
- 生成全面的验证报告
快速开始
runCASSIA_annotationboost( full_result_path = "batch_results_summary.csv", marker = marker_data, cluster_name = "CD4+ T cell", major_cluster_info = "Human PBMC", output_name = "Cluster1_report", model = "anthropic/claude-sonnet-4.6", provider = "openrouter", )R
输入
- CASSIA批量分析的完整结果CSV(
_summary.csv) - 原始标记基因文件(建议使用原始标记文件 - 请勿过滤!)
- 簇上下文信息
- 特定簇标识符
- (可选)批量注释的对话 JSON 文件(
_conversations.json)
参数
必需参数
| 参数 | 描述 |
|---|---|
full_result_path | CASSIA 结果 CSV 文件的路径(_summary.csv) |
marker | 标记基因数据(数据框或路径)。使用与初始分析相同的标记数据(不要过滤) |
cluster_name | 要验证的目标簇的确切名称 |
major_cluster_info | 数据集的上下文信息(例如,"Human PBMC", "Mouse Brain") |
output_name | 输出验证报告的基本名称 |
可选参数
| 参数 | 默认值 | 描述 |
|---|---|---|
num_iterations | 5 | 验证轮数 |
model | - | 使用的 LLM 模型。推荐:anthropic/claude-sonnet-4.6 或更好的模型 |
provider | - | 模型的 API 提供商 |
conversations_json_path | "auto" | 对话 JSON 文件路径,或 "auto" 从 full_result_path 自动检测(例如,batch_summary.csv → batch_conversations.json) |
conversation_history_mode | "full" | 如何使用先前的对话历史:"full"、"final" 或 "none" |
search_strategy | "breadth" | 探索假设的策略:"breadth" 或 "depth" |
report_style | "per_iteration" | 最终报告的格式:"per_iteration" 或 "total_summary" |
reasoning | - | 推理深度级别:"low"、"medium"、"high"。仅支持 OpenAI GPT-5 系列模型 |
输出
分析生成以下输出文件:
{output_name}_summary.html:包含详细分析结果和可视化的 HTML 报告。{output_name}_raw_conversation.txt:包含完整分析对话的原始对话文本。