moonlight

方法论

这一页给报告里的每个数字提供出处:怎么算的、什么意思、什么时候不可靠,全在这里。

原则:每一项分析都是一条公式。每条公式都有可追溯的输入、写得清楚的分数区间、明确的局限性。没有黑箱评分,也没有任何一句话告诉你”该怎么操作”。

法律边界

Moonlight 是研究工具的发布方,不是投资顾问。我们不对证券价值、是否值得投资、或者任何个人组合的具体配置发表意见。产品输出的是算法报告。所有用户跑的是同一套算法,没有”针对你定制的建议”这种个性化逻辑。

具体来说:

这些边界是有意设计的。产品想做的是机构级的分析,但不踏进任何需要按美国 1940 年《投资顾问法》或州对应法规注册为投资顾问的领域。如果你需要的是个性化建议,请找一位受信顾问,不是这个产品。

分析流程

所有时间序列分析的标准窗口都是过去 252 个交易日,差不多一个自然年。回测、因子回归、滚动 Sharpe、滚动 β、回撤、波动率全部共用这个窗口,所以报告里的数字互相之间是一致的。

持仓从截图里解析出来。在任何分析开跑之前,解析出的持仓表先过一道输入校验;分析流程本身还有四十多道质量检查,在每个阶段验证算术是否守恒、模块之间的契约是否一致、数据是否够新。你在屏幕上确认解析结果之后流程才会继续——某只股票如果认错了,这一步就能抓到,不会等到报告生成完才发现。

具体的校验规则集合是产品的一部分,我们不完整公开。这套规则是从一份份真实截图里积累出来的边界处理经验,目的是保证流程在遇到异常输入时不会”悄悄出错”。我们公开的是上面这些公式,以及质量检查的结果——每份报告底部有 Quality Check 板块,列出多少项检查通过、多少个数字带追溯、多少个模块运行干净。完整的、可机读的来源记录会随报告一起输出在 provenance.json 边车文件里,每个数字都附带它的公式、输入哈希、计算时间戳。

评分卡

执行摘要那四张卡(Beta、集中度、质量、市场拟合度)不是一个综合分。每张卡背后是一条固定的公式,对照 S&P 500 全部成分股算分,分数区间写在下面。区间不会因为”想让某个组合看起来更好”而调整——同一套切分用在所有用户的报告上。

如果你不同意某张卡的标签——比如你觉得自己 Beta 1.4 应该算”平衡”而不是”激进”,因为你组合的另一部分有股指空头对冲——你大概率是对的,但那是基于你自己的具体情境。这张卡是一个参考基准,不是结论。

Beta

组合 Beta 是用 252 个交易日的 OLS 回归,把组合日收益对 SPY 日收益跑出来的(CAPM 形式)。报告同时给出 90% 置信区间和回归 R²。

区间。

举个例子。 假设组合 60% AAPL、40% MSFT,AAPL 的 β 是 1.20,MSFT 是 0.95。按持仓加权算出来的 β 是 0.6 × 1.20 + 0.4 × 0.95 = 1.10。但我们另外再对整个组合的日收益重新跑一次回归,结果不一定等于这个加权数(除非两只股票各自的回归残差结构完全一样)。报告把”重新回归”得到的那个数字当主结果,加权值放旁边做合理性校验。

局限性。 β 在回归 R² 低于 0.6 左右时不稳定。报告里同时显示 R² 让你看到这一点。β 也捕捉不到跳跃风险、流动性差的仓位、或者任何不在基准范围内的暴露。

集中度

仓位权重的 Herfindahl-Hirschman Index(HHI),缩到 0 到 100 的尺度。HHI = Σ wᵢ² × 100,wᵢ 是每个仓位占组合的比例。同时报告 top-K 占比(最大 1、3、5 只仓位的合计权重)、有效持仓数(HHI 比例下的 1 / HHI)、权重的 Gini 系数。

区间。

为什么用 HHI 而不是简单的”前 3 只占多少”。 HHI 是反垄断领域的标准指标,它对大仓位是平方加权而不是线性加权,正好对应单只股票的风险在真实组合里也是非线性放大的事实。30% / 30% / 30% / 10% 的组合和 50% / 30% / 10% / 10% 的组合,前三只都占 90%,但集中度风险完全不同——HHI 能把这个差异显出来。

局限性。 HHI 看不到行业重叠。33% / 33% / 33% 持有 NVDA / AMD / TSM,HHI 数字看上去”分散”,但实际上整个组合就是一个半导体押注。读 HHI 时一定要把旁边那张行业分布图一起看。

质量

每只股票的质量是三个会计指标的等权混合:

  1. 过去 5 年 ROIC 中位数(投入资本回报率)。看一家公司是不是真的在赚回它的资本成本。
  2. 净债务 / EBITDA。 杠杆。越低越好,净现金的公司压到 0。
  3. 自由现金流转化率。 FCF 占净利润的百分比。看报表上的盈利是不是能落到现金。

每只股票在 S&P 500 全部成分股里对每个指标打 0 到 100 分,三项取平均,再按你持仓的市值加权得到组合的质量分。

局限性。 质量是慢信号。它告诉你你买的是不是能长期复利的好生意,不告诉你下个季度业绩好不好。对 ETF、金融股(净债务 / EBITDA 在金融股里没意义)、上市不满 5 年的公司(ROIC 历史不够长)也不适用。

市场拟合度

把你组合的日收益和三个基准的日收益做 60 天滚动 Pearson 相关性:SPY(美国大盘)、IWM(美国小盘)、EFA(海外发达市场)。哪一项相关性最高,就说明你的组合实际上更像哪一类指数在动——这跟你看持仓表得到的印象不一定一致。

我们不算综合分。三个相关性同时摆出来,让你看清”形状”。0.95 跟 SPY、0.40 跟 EFA 的组合,和 0.70 同时跟两者相关的组合,意义完全不同——一个综合的”分散度评分”会把这两种组合打成一样的分。

风格箱

标准 3 × 3 网格:大盘 / 中盘 / 小盘(行)× 价值 / 混合 / 成长(列)。按持仓金额加权,不是按股数。每只股票先按 Russell 切分点定大小(美国总市值前 70% 是大盘,接下来 20% 是小盘,中间填中盘),再用 P/B 加远期 P/E 在它所属行业里打价值—成长得分。

局限性。 风格箱是一张快照,不是一条轨迹。今天 P/E 35 的”成长股”,一年前 P/E 12 时是”价值股”,明年也可能再变。这张图用来看”是不是过度集中在某一格”——比如 80% 仓位都是大盘成长股——很好用;用来预测未来表现就不行。

因子回归

把组合的日度超额收益(日收益减去日度无风险利率)对六个 Fama-French 因子做 OLS 回归。回归窗口 252 个交易日。报告给出每个因子的系数、t 统计量、回归 R²,以及残差 α(因子解释不了的那部分收益)。

五个风格因子是:SMB(规模)、HML(价值)、RMW(盈利能力)、CMA(投资)、MOM(动量)。它们对应学术研究里被反复验证、跟长期超额收益相关的系统性暴露。Mkt-RF 是宽口径股票市场溢价;剩下五个告诉你,你的组合在市场溢价里的哪几个切片上是超配的,哪些是低配的。

1 年回测是假设性的,不是预测。 我们把”当前权重”原样套回过去 252 天。这意味着两件事:一,存在”事后回看”偏差(我们已经知道哪几只今年涨了),二,存在”幸存者”偏差(不模拟你实际会做的调仓、税务、操作)。这份回测的用途是描述:“如果当时就拿着现在这套权重,过去一年会是什么样”——而不是给一条”应该这么持仓”的建议。

风险面板(Standard / Pro)

五个风险指标,全部跑在同一个 252 天窗口上:

为什么放五个不放一个。 单一风险数字误导性很强。一个组合可以 Sharpe 很好但 Calmar 很差(比如回撤集中在某一年),反过来也成立。五个一起放,才能看出风险的形状。

Brinson 归因(Pro)

Pro 报告把组合的”主动收益”(相对 SPY 基准的超额)按 Brinson 公式拆成三块:

三项加起来 = 总主动收益。这个拆解告诉你:你跑赢(或跑输)大盘,到底是因为押对了行业,还是在某个行业里选对了股票。这是两种不同的能力,对未来给的信号也不一样。

新闻台

Standard 和 Pro 套餐里,每个持仓股票都会做一次过去 24 小时的滚动搜索,去重之后按相关性排序,把最相关的几条连同来源域名和时间戳一起列出来。我们不做摘要,不做点评。原文链接可点,你自己去读。

我们不给”情绪分数”。金融新闻的情感分析本身就是一个还没解决好的研究问题,我们不假装用二十行 prompt 就能搞定,所以宁可让你自己看标题做判断。