股票投资AI助手
模型选型与工作流设计调研报告

价值投资 + 市场热点分析  |  主A股 · 次港股 · 参考美股  |  基于Hermes Agent框架

报告日期 2026-04-19
框架 Hermes Agent
数据源 东方财富 + Tushare
🤖
一、LLM模型选型分析与推荐

1.1 金融场景模型能力对比

维度 GPT-4o Claude 3.5/4 DeepSeek-R1/V3 Qwen2.5-72B GLM-4/5 通义千问-Max
中文金融理解 ★★★★ ★★★★ ★★★★★ ★★★★★ ★★★★ ★★★★★
数值推理精度 ★★★★★ ★★★★★ ★★★★★ ★★★★ ★★★★ ★★★★
财报分析深度 ★★★★★ ★★★★ ★★★★ ★★★★ ★★★★ ★★★★
中国会计准则 ★★★★★ ★★★★★ ★★★★★ ★★★★★ ★★★★ ★★★★★
A股市场理解 ★★★★★ ★★★★★ ★★★★★ ★★★★★ ★★★★ ★★★★★
港股/美股关联 ★★★★★ ★★★★★ ★★★★ ★★★★★ ★★★★★ ★★★★★
性价比 ★★★★★ ★★★★★ ★★★★★ ★★★★ ★★★★ ★★★★★
长文本处理 ★★★★ ★★★★★ ★★★★ ★★★★ ★★★★★ ★★★★

绿色列 = 该维度最佳选择

1.2 关键金融NLP基准测试排名

📊 FinEval

中文金融评估基准 2024-2025

涵盖:金融知识、金融推理、会计、经济、统计

排名趋势:DeepSeek ≈ Qwen > GLM > GPT-4o
GPT-4o在跨市场关联分析上有优势

📋 CGFLEval

中国金融大语言模型评估

考察:金融专业术语、法规理解、风险识别

本土模型显著优于海外模型
因训练数据偏向中国市场

🏆 SuperCLUE-金融

中文通用大模型评测金融子榜

综合性中文LLM能力评测

DeepSeek和Qwen持续领先
GLM紧随其后,海外模型落后

1.3 推荐方案:分层模型组合策略

核心结论:单一模型无法覆盖所有需求。A股深度分析用 DeepSeek,长文本研报用 Qwen,美股/港股关联用 Claude/GPT,实现分层协作。

⭐ 核心主力 DeepSeek-V3/R1

中文金融推理最强、A股理解最深、成本极低

研报解读 财报分析 估值建模 A股热点
~2元/百万token 硅基流动 / 官方API

📗 辅助模型 Qwen2.5-72B

长文本处理优秀,适合批量文档处理

研报对比 长财报精读 政策解读
~4元/百万token 硅基流动 / 阿里云

🌐 跨市场 Claude / GPT-4o-mini

英文金融理解最强,全球市场视角

美股分析 港股外资 英文研报
中等成本 仅用于跨市场场景

⚠️ 当前模型 GLM-5.1 评估

优势

  • 中文理解良好
  • 长上下文支持(128K+)
  • 通过硅基流动低成本使用

不足

  • 金融专项推理不如DeepSeek
  • 数值精度一般
  • 中文金融基准排名靠后
建议:作为通用对话模型可用,但金融深度分析建议切换至 DeepSeek

1.4 月度成本估算(中度使用)

DeepSeek-V3
6-10
300-500万token/月
Qwen2.5-72B
4-8
100-200万token/月
Claude / GPT
30-60
50-100万token/月
月度合计
40-78
极低成本 · 专业级输出
⚙️
二、AI投资研究工作流设计(Code Plan)

2.1 价值投资分析 Pipeline

1股票初筛 Screening

数据源
mx-finance-data / Tushare
筛选条件
PE<15, PB<2, ROE>15%, 营收增长>10%
输出
候选股票清单 (10-20只)
频率
每周一次

2财报深度分析 Financial Deep Dive

数据源
Tushare利润表/资产负债表/现金流量表
分析
3年趋势、杜邦分析、现金流质量
LLM任务
生成财报摘要与预警信号
输出
单股财报分析报告

3估值建模 Valuation

方法
DCF + 相对估值 (PE/PB/PS对比)
数据源
历史财务数据 + 行业对比
LLM任务
参数合理性校验、敏感性分析
输出
估值区间与安全边际

4研报综合 Research Synthesis

数据源
mx-finance-search 搜索研报
LLM任务
多篇研报观点提取与对比
整合
买入/持有/卖出 目标价统计
输出
研报共识与分歧点

5投资决策 Decision

综合
财报 + 估值 + 研报 + 风险
LLM任务
生成结构化投资建议
输出
买入/观望/回避 + 理由 + 仓位建议
关键
人在回路 → 人工确认后执行

2.2 市场热点分析 Pipeline

1热点发现 Trend Discovery

数据源
mx-finance-search + Tushare板块资金
LLM任务
识别当日/本周热点主题
输出
热点主题清单 + 关联个股

2政策催化分析 Policy Catalyst

数据源
mx-finance-search 政策新闻
LLM任务
判断政策级别/持续性/受益标的
输出
政策影响评估报告

3资金面分析 Capital Flow

数据源
Tushare北向资金/主力/融资融券
分析
板块轮动信号、资金偏好变化
输出
资金流向热力图

4跨市场联动 Cross-Market

数据源
Tushare美股指数/港股恒指
分析
美股 → 港股 → A股传导路径
输出
隔夜风险提示

5交易策略建议 Strategy

综合
热点 + 政策 + 资金 + 外盘
LLM任务
生成短期/中期策略建议
输出
关注板块 + 标的 + 风险提示

2.3 定时任务(Cron Jobs)设计

任务名称
频率
内容描述
主力模型
隔夜市场速览
每日 8:00
美股收盘 → 港股预判 → A股开盘策略
DeepSeek + GPT-4o-mini
午盘复盘
每日 11:35
上午走势/资金流向/热点变化
DeepSeek
收盘复盘
每日 15:10
全天复盘/北向资金/明日预判
DeepSeek
周度价值筛选
周日 20:00
价值股筛选/估值更新
DeepSeek + Qwen
政策追踪
每日 18:00
政策新闻扫描与影响评估
DeepSeek
研报精选
每日 19:00
当日新研报摘要与重点提示
Qwen(长文本)
📚
三、开源项目与成功经验借鉴

3.1 值得参考的开源项目

FinGPT ⭐ 15k+

AI4Finance Foundation · 开源金融大模型框架

核心能力:金融数据清洗、模型微调、情感分析

可借鉴: 金融NLP pipeline(新闻→情感→信号)、多数据源统一接入、prompt模板库

⚠ 偏英文,A股适配需自行扩展

QLib ⭐ 16k+

微软 · AI量化投资平台

核心能力:因子挖掘、模型训练、回测框架

可借鉴: Alpha因子方法论、ML选股架构、业绩归因框架

⚠ 偏技术面,价值投资支持弱

FinRL ⭐ 10k+

AI4Finance · 深度强化学习量化交易框架

核心能力:多智能体交易、强化学习策略

可借鉴: A股市场仿真、风险管理框架、多资产配置策略

⚠ 强化学习过拟合风险高,不适合价值投资

AutoDL-Stock / ChatStock

社区 · 基于大模型的A股分析工具

核心能力:自然语言→数据查询转换

可借鉴: 财报自动解读pipeline、A股特有指标处理、东方财富数据集成、prompt工程

3.2 关键成功经验总结

📌 经验1:数据先行,模型后置

成功的AI投资分析系统,核心竞争力在数据pipeline而非LLM。稳定、清洁、及时的数据源比最强模型更重要。

→ 建议:先确保 mx-finance-data 和 Tushare 稳定可用,再优化模型选择

📌 经验2:结构化输出 > 自由文本

让LLM输出结构化JSON而非长文,准确率和可用性大幅提升。使用outlines/guidance等工具约束输出格式。

→ 建议:投资建议模板化(评分 + 理由 + 风险 + 仓位)

📌 经验3:多Agent协作优于单Agent

价值投资和热点分析是不同思维模式,应分离。推荐数据获取Agent + 分析Agent + 决策Agent三层架构。

→ 建议:利用 Hermes 的 delegate_task 实现多Agent协作

📌 经验4:人在回路(Human-in-the-Loop)

AI做信息整合和初步判断,人做最终决策。设置风险阈值,越过阈值强制人工确认。

→ 建议:大额交易/异常信号时暂停并通知用户确认

📌 经验5:回测验证而非盲目信任

任何策略上线前必须历史回测。注意过拟合风险,样本外验证必不可少。

→ 建议:用 Tushare 历史数据做回测,定期验证AI建议准确率

🚀
四、Hermes Agent 具体实施路径
第一阶段
1-2
基础搭建
第二阶段
3-5
核心工作流
第三阶段
持续
自动化与迭代

第一阶段:基础搭建 1-2天

1. 配置API密钥:EM_API_KEY(东方财富妙想)、TUSHARE_TOKEN(Tushare Pro)
2. 配置模型切换:默认DeepSeek-V3(硅基流动),备选Qwen2.5-72B和Claude/GPT
3. 验证三大金融技能可用性: mx-finance-data 查询PE指标、 mx-finance-search 搜索研报、 tushare-finance 获取K线数据

第二阶段:核心工作流实现 3-5天

1. 创建"价值投资分析"Skill — 输入股票代码,自动执行财报→估值→研报→决策
2. 创建"市场热点跟踪"Skill — 输入日期/板块,自动执行新闻→政策→资金→跨市场
3. 创建"隔夜风险提示"Skill — 定时触发,美股→港股→A股风险传导

第三阶段:自动化与迭代 持续

1. 设置6个Cron定时任务(盘前/午盘/收盘/周度/政策/研报)
2. 建立投资决策日志,定期复盘AI建议准确率
3. 扩展数据源:宏观经济指标、行业景气度、舆情数据

Prompt框架设计 核心

{
  "stock": "贵州茅台",
  "code": "600519.SH",
  "rating": "买入/持有/观望/回避",
  "target_price": {"low": X, "mid": X, "high": X},
  "confidence": 1-5,
  "thesis": "核心投资逻辑(3-5句话)",
  "risks": ["风险1", "风险2"],
  "catalysts": ["催化剂1", "催化剂2"],
  "position_advice": "仓位建议(%)",
  "horizon": "建议持有周期"
}
⚠️
五、风险提示与免责声明
  1. AI生成的投资分析仅供参考,不构成投资建议
  2. LLM可能产生"幻觉",所有数据和结论需人工核实
  3. 历史数据不代表未来表现
  4. 市场存在系统性风险,AI无法预测黑天鹅事件
  5. 投资有风险,决策需谨慎
🎯
六、下一步行动建议
1️⃣

立即

选择主力模型(推荐DeepSeek-V3),配置API密钥

2️⃣

本周

创建第一个"价值投资分析"Skill,跑通完整pipeline

3️⃣

下周

设置每日定时复盘任务,积累分析数据

4️⃣

持续

每周评估AI分析准确率,迭代优化工作流