股票投资AI助手
模型选型与工作流设计调研报告

价值投资 + 市场热点分析 | 主A股 · 次港股 · 参考美股 | 基于Hermes Agent框架

报告日期 2026-04-19

框架 Hermes Agent

数据源东方财富 + Tushare

🤖

一、LLM模型选型分析与推荐

1.1 金融场景模型能力对比

维度	GPT-4o	Claude 3.5/4	DeepSeek-R1/V3	Qwen2.5-72B	GLM-4/5	通义千问-Max
中文金融理解	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★
数值推理精度	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★
财报分析深度	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★
中国会计准则	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★
A股市场理解	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★
港股/美股关联	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★
性价比	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★
长文本处理	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★	★★★★★

绿色列 = 该维度最佳选择

1.2 关键金融NLP基准测试排名

📊 FinEval

中文金融评估基准 2024-2025

涵盖：金融知识、金融推理、会计、经济、统计

          排名趋势：DeepSeek ≈ Qwen > GLM > GPT-4o

          GPT-4o在跨市场关联分析上有优势

📋 CGFLEval

中国金融大语言模型评估

考察：金融专业术语、法规理解、风险识别

          本土模型显著优于海外模型

          因训练数据偏向中国市场

🏆 SuperCLUE-金融

中文通用大模型评测金融子榜

综合性中文LLM能力评测

          DeepSeek和Qwen持续领先

          GLM紧随其后，海外模型落后

1.3 推荐方案：分层模型组合策略

      核心结论：单一模型无法覆盖所有需求。A股深度分析用 DeepSeek，长文本研报用 Qwen，美股/港股关联用 Claude/GPT，实现分层协作。
    

⭐ 核心主力 DeepSeek-V3/R1

中文金融推理最强、A股理解最深、成本极低

~2元/百万token 硅基流动 / 官方API

📗 辅助模型 Qwen2.5-72B

长文本处理优秀，适合批量文档处理

~4元/百万token 硅基流动 / 阿里云

🌐 跨市场 Claude / GPT-4o-mini

英文金融理解最强，全球市场视角

中等成本仅用于跨市场场景

⚠️ 当前模型 GLM-5.1 评估

优势

中文理解良好
长上下文支持（128K+）
通过硅基流动低成本使用

不足

金融专项推理不如DeepSeek
数值精度一般
中文金融基准排名靠后

        建议：作为通用对话模型可用，但金融深度分析建议切换至 DeepSeek
      

1.4 月度成本估算（中度使用）

DeepSeek-V3

6-10元

300-500万token/月

Qwen2.5-72B

4-8元

100-200万token/月

Claude / GPT

30-60元

50-100万token/月

月度合计

40-78元

极低成本 · 专业级输出

⚙️

二、AI投资研究工作流设计（Code Plan）

2.1 价值投资分析 Pipeline

1股票初筛 Screening

数据源

mx-finance-data / Tushare

筛选条件

PE<15, PB<2, ROE>15%, 营收增长>10%

输出

候选股票清单 (10-20只)

频率

每周一次

2财报深度分析 Financial Deep Dive

数据源

Tushare利润表/资产负债表/现金流量表

分析

3年趋势、杜邦分析、现金流质量

LLM任务

生成财报摘要与预警信号

输出

单股财报分析报告

3估值建模 Valuation

方法

DCF + 相对估值 (PE/PB/PS对比)

数据源

历史财务数据 + 行业对比

LLM任务

参数合理性校验、敏感性分析

输出

估值区间与安全边际

4研报综合 Research Synthesis

数据源

mx-finance-search 搜索研报

LLM任务

多篇研报观点提取与对比

整合

买入/持有/卖出目标价统计

输出

研报共识与分歧点

5投资决策 Decision

综合

财报 + 估值 + 研报 + 风险

LLM任务

生成结构化投资建议

输出

买入/观望/回避 + 理由 + 仓位建议

关键

人在回路 → 人工确认后执行

2.2 市场热点分析 Pipeline

1热点发现 Trend Discovery

数据源

mx-finance-search + Tushare板块资金

LLM任务

识别当日/本周热点主题

输出

热点主题清单 + 关联个股

2政策催化分析 Policy Catalyst

数据源

mx-finance-search 政策新闻

LLM任务

判断政策级别/持续性/受益标的

输出

政策影响评估报告

3资金面分析 Capital Flow

数据源

Tushare北向资金/主力/融资融券

分析

板块轮动信号、资金偏好变化

输出

资金流向热力图

4跨市场联动 Cross-Market

数据源

Tushare美股指数/港股恒指

分析

美股 → 港股 → A股传导路径

输出

隔夜风险提示

5交易策略建议 Strategy

综合

热点 + 政策 + 资金 + 外盘

LLM任务

生成短期/中期策略建议

输出

关注板块 + 标的 + 风险提示

2.3 定时任务（Cron Jobs）设计

任务名称

频率

内容描述

主力模型

隔夜市场速览

每日 8:00

美股收盘 → 港股预判 → A股开盘策略

DeepSeek + GPT-4o-mini

午盘复盘

每日 11:35

上午走势/资金流向/热点变化

DeepSeek

收盘复盘

每日 15:10

全天复盘/北向资金/明日预判

DeepSeek

周度价值筛选

周日 20:00

价值股筛选/估值更新

DeepSeek + Qwen

政策追踪

每日 18:00

政策新闻扫描与影响评估

DeepSeek

研报精选

每日 19:00

当日新研报摘要与重点提示

Qwen（长文本）

📚

三、开源项目与成功经验借鉴

3.1 值得参考的开源项目

FinGPT ⭐ 15k+

AI4Finance Foundation · 开源金融大模型框架

核心能力：金融数据清洗、模型微调、情感分析

          可借鉴：
          金融NLP pipeline（新闻→情感→信号）、多数据源统一接入、prompt模板库
        

⚠ 偏英文，A股适配需自行扩展

QLib ⭐ 16k+

微软 · AI量化投资平台

核心能力：因子挖掘、模型训练、回测框架

          可借鉴：
          Alpha因子方法论、ML选股架构、业绩归因框架
        

⚠ 偏技术面，价值投资支持弱

FinRL ⭐ 10k+

AI4Finance · 深度强化学习量化交易框架

核心能力：多智能体交易、强化学习策略

          可借鉴：
          A股市场仿真、风险管理框架、多资产配置策略
        

⚠ 强化学习过拟合风险高，不适合价值投资

AutoDL-Stock / ChatStock

社区 · 基于大模型的A股分析工具

核心能力：自然语言→数据查询转换

          可借鉴：
          财报自动解读pipeline、A股特有指标处理、东方财富数据集成、prompt工程
        

3.2 关键成功经验总结

📌 经验1：数据先行，模型后置

成功的AI投资分析系统，核心竞争力在数据pipeline而非LLM。稳定、清洁、及时的数据源比最强模型更重要。

→ 建议：先确保 mx-finance-data 和 Tushare 稳定可用，再优化模型选择

📌 经验2：结构化输出 > 自由文本

让LLM输出结构化JSON而非长文，准确率和可用性大幅提升。使用outlines/guidance等工具约束输出格式。

→ 建议：投资建议模板化（评分 + 理由 + 风险 + 仓位）

📌 经验3：多Agent协作优于单Agent

价值投资和热点分析是不同思维模式，应分离。推荐数据获取Agent + 分析Agent + 决策Agent三层架构。

→ 建议：利用 Hermes 的 delegate_task 实现多Agent协作

📌 经验4：人在回路（Human-in-the-Loop）

AI做信息整合和初步判断，人做最终决策。设置风险阈值，越过阈值强制人工确认。

→ 建议：大额交易/异常信号时暂停并通知用户确认

📌 经验5：回测验证而非盲目信任

任何策略上线前必须历史回测。注意过拟合风险，样本外验证必不可少。

→ 建议：用 Tushare 历史数据做回测，定期验证AI建议准确率

🚀

四、Hermes Agent 具体实施路径

第一阶段

1-2天

基础搭建

第二阶段

3-5天

核心工作流

第三阶段

持续

自动化与迭代

第一阶段：基础搭建 1-2天

1. 配置API密钥：EM_API_KEY（东方财富妙想）、TUSHARE_TOKEN（Tushare Pro）
2. 配置模型切换：默认DeepSeek-V3（硅基流动），备选Qwen2.5-72B和Claude/GPT
3. 验证三大金融技能可用性： mx-finance-data 查询PE指标、 mx-finance-search 搜索研报、 tushare-finance 获取K线数据

第二阶段：核心工作流实现 3-5天

1. 创建"价值投资分析"Skill — 输入股票代码，自动执行财报→估值→研报→决策
2. 创建"市场热点跟踪"Skill — 输入日期/板块，自动执行新闻→政策→资金→跨市场
3. 创建"隔夜风险提示"Skill — 定时触发，美股→港股→A股风险传导

第三阶段：自动化与迭代持续

1. 设置6个Cron定时任务（盘前/午盘/收盘/周度/政策/研报）
2. 建立投资决策日志，定期复盘AI建议准确率
3. 扩展数据源：宏观经济指标、行业景气度、舆情数据

Prompt框架设计核心

{

  "stock": "贵州茅台",

  "code": "600519.SH",

  "rating": "买入/持有/观望/回避",

  "target_price": {"low": X, "mid": X, "high": X},

  "confidence": 1-5,

  "thesis": "核心投资逻辑（3-5句话）",

  "risks": ["风险1", "风险2"],

  "catalysts": ["催化剂1", "催化剂2"],

  "position_advice": "仓位建议（%）",

  "horizon": "建议持有周期"

}

⚠️

五、风险提示与免责声明

      AI生成的投资分析仅供参考，不构成投资建议
LLM可能产生"幻觉"，所有数据和结论需人工核实
历史数据不代表未来表现
市场存在系统性风险，AI无法预测黑天鹅事件
投资有风险，决策需谨慎

    

🎯

六、下一步行动建议

1️⃣

立即

选择主力模型（推荐DeepSeek-V3），配置API密钥

2️⃣

本周

创建第一个"价值投资分析"Skill，跑通完整pipeline

3️⃣

下周

设置每日定时复盘任务，积累分析数据

4️⃣

持续

每周评估AI分析准确率，迭代优化工作流

股票投资AI助手模型选型与工作流设计调研报告

1.1 金融场景模型能力对比

1.2 关键金融NLP基准测试排名

📊 FinEval

📋 CGFLEval

🏆 SuperCLUE-金融

1.3 推荐方案：分层模型组合策略

⭐ 核心主力 DeepSeek-V3/R1

📗 辅助模型 Qwen2.5-72B

🌐 跨市场 Claude / GPT-4o-mini

⚠️ 当前模型 GLM-5.1 评估

1.4 月度成本估算（中度使用）

2.1 价值投资分析 Pipeline

1股票初筛 Screening

2财报深度分析 Financial Deep Dive

3估值建模 Valuation

4研报综合 Research Synthesis

5投资决策 Decision

2.2 市场热点分析 Pipeline

1热点发现 Trend Discovery

2政策催化分析 Policy Catalyst

3资金面分析 Capital Flow

4跨市场联动 Cross-Market

5交易策略建议 Strategy

2.3 定时任务（Cron Jobs）设计

3.1 值得参考的开源项目

FinGPT ⭐ 15k+

QLib ⭐ 16k+

FinRL ⭐ 10k+

AutoDL-Stock / ChatStock

3.2 关键成功经验总结

📌 经验1：数据先行，模型后置

📌 经验2：结构化输出 > 自由文本

📌 经验3：多Agent协作优于单Agent

📌 经验4：人在回路（Human-in-the-Loop）

📌 经验5：回测验证而非盲目信任

第一阶段：基础搭建 1-2天

第二阶段：核心工作流实现 3-5天

第三阶段：自动化与迭代 持续

Prompt框架设计 核心

立即

本周

下周

持续

股票投资AI助手
模型选型与工作流设计调研报告

第三阶段：自动化与迭代持续

Prompt框架设计核心