Pellegrino (2025) 理论框架深度解析
—— 致经济学一年级博士生的一封导读信
1. 理论动机与直觉 (Theoretical Motivation & Intuition)
核心权衡 (The Core Trade-off)
这篇文章试图解决的核心经济学权衡是 “微观结构的精确性” (Micro-structure Precision) 与 “宏观模型的通用性/可解性” (Macro-scalability/Tractability) 之间的矛盾。越想精确描述复杂的竞争网络,模型通常就越难求解;越想做一般均衡分析,往往就得牺牲对竞争细节的描述。
直觉叙述 (Intuitive Narrative)
想象一个巨大的高维空间,每个点代表一家企业的产品。位置由产品的"特征"决定,距离越近(夹角越小),说明它们的产品越相似,竞争越激烈。宏观经济不再是代表性企业,而是一个动态变化的竞争网络。
2. 模型解剖 (Model Anatomy)
| 模型组件 | 符号表示 | 经济学含义 |
|---|---|---|
| 特征向量 | $a_i \in \mathbb{R}^m$ | 产品 $i$ 在特征空间中的坐标(归一化单位向量)。 |
| 相似度矩阵 | $A'A$ | 其中的元素 $a_i' a_j$ 是余弦相似度(Cosine Similarity)。 |
| 需求系统 | GHL Demand | “广义特征-线性需求系统”,斜率参数由产品特征微观决定。 |
| 加成率 (Markup) | $\mu = P / MC$ | 衡量市场力量的核心指标,本文将其分解为生产率和中心度。 |
3. 推导复现:古诺-纳什均衡 (Derivation)
通过最大化势函数 (Potential Function) $\Phi(q)$,作者得到了均衡产量的闭式解:
$$\boxed{ q^{\Phi} = (2I + \Delta + \Sigma)^{-1} (b - c^0) }$$方法论启示: 整个竞争网络结构被压缩进了一个矩阵逆 $(2I + \Delta + \Sigma)^{-1}$ 中。这不仅考虑了直接对手,也考虑了“对手的对手”产生的间接竞争。
4. 反事实模拟:Step-by-Step 操作手册 (Counterfactual Simulation)
这是本文从理论走向政策建议的关键。模拟过程分为以下五步:
Step 1: 参数回归 (Parameter Recovery)
在进行模拟前,必须解出基准年份(如 2021 年)的不可观测参数。
- 识别 $b$ (质量向量): 利用观测到的产量 $q$ 和价格 $p$,根据公式 $b = (2I + \Delta + \Sigma)q + c$ 反向求出每个产品的需求截距。
- 识别 $c$ (成本向量): 利用财务数据中的可变成本反推边际成本。
Step 2: 设定“规则冲击” (Equilibrium Selection)
修改企业的一阶条件(FOC),定义不同的“平行世界”:
- 现状 (Baseline): 执行古诺竞争规则。
- 完全竞争 (Competitive): 强行令 $p_i = MC_i$。
- 合谋/垄断 (Collusive): 强行令所有企业共同最大化 $\sum \pi_i$。
Step 3: 求解新产量向量 (Solving $q^{CF}$)
根据新规则解线性方程组。例如在“完全竞争”世界中,通过求逆 $(I + \Delta + \Sigma)^{-1}$ 得到新的产量向量 $q^{W}$。
Step 4: 评估福利 (Welfare Tally)
计算新世界下的消费者剩余 ($S$)、总利润 ($\Pi$) 和总福利 ($W = S + \Pi$)。
- 消费者剩余: 使用线积分公式 $S(q) = q'b - \frac{1}{2}q'(I + \Sigma)q - p'q$。
Step 5: 计算无谓损失 (DWL Calculation)
对比现状与完全竞争之间的差距:
$$DWL = \frac{W^{Perfect\ Comp} - W^{Cournot}}{W^{Perfect\ Comp}}$$这是政策制定者最关心的数字。
5. 加成分解:为什么有些公司 Markup 更高?
根据 Proposition 2,加成率 $\mu_i$ 由两股力量驱动:
- 如果你“真的好”: 拥有高生产率/高质量(High $\omega_i = b_i/c_i$)。
- 如果你“躲得好”: 处于网络边缘,避开了竞争(Low Centrality $\chi_i$)。
实证发现: 1995-2021 年间,美国企业加成率的上升,很大程度上是因为竞争网络变得更加稀疏(企业找到了避开直接竞争的方法),以及资源流向了高 $\omega_i$ 的超级明星企业。
导师总结: 不要把反事实模拟看成简单的数学游戏。它是在结构性约束下,对市场制度设计的一种科学预判。当你能熟练操作这个五步流程时,你就已经具备了独立开展结构化研究的基础。
小白也能懂
核心映射表 (The Mapping)
我们面临的任务是解出以下未知参数集合 $\Theta = \{b, c, \Sigma, \alpha, q, p\}$。注意,这里 $q$ 和 $p$ 在模型中是内生变量,但在数据中我们只观测到收入 $R$,因此它们也需要被“识别”。
| 参数类型 | 符号 | 来源性质 | 识别/估计方法 | 数据来源 |
|---|---|---|---|---|
| 竞争网络结构 | $A'A$ | 数据观测 | 直接计算文本余弦相似度 | Hoberg & Phillips (10-K Text) |
| 竞争强度标量 | $\alpha$ | 结构估计 | 矩匹配 (GMM 风格) / 校准 | 外部文献 (Nevo, 2001) |
| 边际成本 | $c_i$ | 供给侧反推 | 结合 FOC 与会计数据 | Compustat (COGS) |
| 产量 (质量调整) | $q_i$ | 结构反推 | 利用利润函数结构 | Compustat (Revenue, COGS) |
| 需求截距 (质量) | $b_i$ | 结构反推 | 模型求逆 (Model Inversion) | 剩余项 (Residual) |
Step 1: 供给侧识别——“无中生有”的产量 (Identification of $q_i$)
这是一个经典的 IO 难题:我们在 Compustat 中只看到收入 ($R_i = p_i q_i$) 和成本 ($TVC_i$),看不到物理产量 $q_i$ 和单价 $p_i$。作者利用结构假设巧妙地分离了 $p$ 和 $q$。
假设: 1. 边际成本是线性的(基准模型假设 MC 恒定,即 $\delta_i=0$)。 2. 企业也是成本最小化者。
推导 (Proposition 9): 利润 $\pi_i = p_i q_i - c_i q_i - FixedCost$。 由于 $p_i q_i = Revenue_i$,且在常数边际成本下 $c_i q_i = TVC_i$ (Total Variable Cost)。 那么,$\pi_{variable} = Revenue_i - TVC_i$。 在古诺模型中,我们可以证明 $q_i^2$ 正比于可变利润(这来自二次效用函数的特性)。具体地,作者证明了:
$$q_i = \sqrt{\frac{Revenue_i - TVC_i}{1 + \delta_i/2}}$$在基准模型 ($\delta_i=0$) 下,产量被识别为:
$$q_i = \sqrt{Revenue_i - TVC_i}$$直觉解读: 这里的 $q_i$ 不是指“卖了多少个苹果”,而是指“提供了多少单位的效用”。通过这个公式,作者将财务数据(美元)转化为了模型可用的产量单位(Utils)。一旦 $q_i$ 确定,$p_i$ 也就随之确定 ($p_i = Revenue_i / q_i$)。
Step 2: 竞争强度估计——$\alpha$ 的校准 (Calibration of $\alpha$)
现在我们有了 $\Sigma$ 的骨架 ($A'A$),但不知道它的缩放比例 $\alpha$。
$$\Sigma = \alpha(A'A - I)$$$\alpha$ 决定了交叉价格弹性的量级。
-
为什么要结构估计? 我们没有足够的价格外生变动(IV)来回归出 4000 家企业的交叉弹性。
-
方法 (Calibration): 作者选择“借力打力”。
-
Target: 经典的 IO 文献(Nevo, 2001)估算出了 Kellogg’s 和 Quaker Oats 的交叉价格弹性 $\epsilon_{KQ}^{Target}$。
-
Model: 在模型中,交叉弹性是 $\alpha$ 的函数:$\epsilon_{KQ}^{Model}(\alpha)$。
-
Estimation: 求解 $\alpha$ 使得:
$$\epsilon_{KQ}^{Model}(\alpha) = \epsilon_{KQ}^{Target}$$
-
-
结果: 解得 $\alpha \approx 0.12$。
Step 3: 需求反转——解出 $b$ (Inverting for Demand)
这是最后一步,也是最关键的一步。现在我们已知 $q$ (Step 1), $c$ (Step 1), $\Sigma$ (Step 2)。 我们回到企业的一阶条件 (FOC):
$$MR = MC \implies b - (2I + \Delta + \Sigma)q = c^0$$(注意:这是古诺竞争的 FOC,$MR$ 的斜率是 Demand 斜率的两倍)。
直接移项,求出 $b$:
$$\boxed{ b = c^0 + (2I + \Delta + \Sigma)q }$$经济学含义: $b_i$ 在这里扮演了计量经济学中 “结构性残差” (Structural Residual) 的角色。 它的意思是:给定我们观察到的成本 $c$ 和竞争对手的压力 $\Sigma q$,为什么这家企业还能卖出 $q$ 这么多产量? 答案只能是:因为消费者特别喜欢它($b_i$ 很高)。 因此,反推出来的 $b_i$ 直接衡量了企业的产品质量 (Vertical Differentiation)。
5. 反事实模拟:Step-by-Step 操作手册 (Counterfactual Simulation)
这是本文从理论走向政策建议的关键。模拟过程分为以下五步:
Step 1: 参数回归 (Parameter Recovery)
在进行模拟前,必须解出基准年份(如 2021 年)的不可观测参数。
- 识别 $b$ (质量向量): 利用观测到的产量 $q$ 和价格 $p$,根据公式 $b = (2I + \Delta + \Sigma)q + c$ 反向求出每个产品的需求截距。
- 识别 $c$ (成本向量): 利用财务数据中的可变成本反推边际成本。
Step 2: 设定“规则冲击” (Equilibrium Selection)
修改企业的一阶条件(FOC),定义不同的“平行世界”:
- 现状 (Baseline): 执行古诺竞争规则。
- 完全竞争 (Competitive): 强行令 $p_i = MC_i$。
- 合谋/垄断 (Collusive): 强行令所有企业共同最大化 $\sum \pi_i$。
Step 3: 求解新产量向量 (Solving $q^{CF}$)
根据新规则解线性方程组。例如在“完全竞争”世界中,通过求逆 $(I + \Delta + \Sigma)^{-1}$ 得到新的产量向量 $q^{W}$。
Step 4: 评估福利 (Welfare Tally)
计算新世界下的消费者剩余 ($S$)、总利润 ($\Pi$) 和总福利 ($W = S + \Pi$)。
- 消费者剩余: 使用线积分公式 $S(q) = q'b - \frac{1}{2}q'(I + \Sigma)q - p'q$。
Step 5: 计算无谓损失 (DWL Calculation)
对比现状与完全竞争之间的差距:
$$DWL = \frac{W^{Perfect\ Comp} - W^{Cournot}}{W^{Perfect\ Comp}}$$这是政策制定者最关心的数字。
6. 加成分解:为什么有些公司 Markup 更高?
根据 Proposition 2,加成率 $\mu_i$ 由两股力量驱动:
- 如果你“真的好”: 拥有高生产率/高质量(High $\omega_i = b_i/c_i$)。
- 如果你“躲得好”: 处于网络边缘,避开了竞争(Low Centrality $\chi_i$)。
实证发现: 1995-2021 年间,美国企业加成率的上升,很大程度上是因为竞争网络变得更加稀疏(企业找到了避开直接竞争的方法),以及资源流向了高 $\omega_i$ 的超级明星企业。
导师总结: 不要把反事实模拟看成简单的数学游戏。它是在结构性约束下,对市场制度设计的一种科学预判。当你能熟练操作这个五步流程时,你就已经具备了独立开展结构化研究的基础。
Pellegrino (2025) 完整深度解析
第一部分:理论框架的完整架构
1.1 权衡问题的精确化
问题 1:维度灾难 (Curse of Dimensionality)
在标准的 BLP 随机系数 logit中,我们需要估计什么?
|
|
问题 2:CES 假设的刚性
在宏观模型(如 Melitz 型)中:
|
|
Pellegrino 的解决方案:参数化替代结构
关键创新:
|
|
1.2 网络经济学的深度直觉
为什么用"网络"的视角?
传统的产业组织视角:
|
|
网络视角:
|
|
数学的网络结构
竞争矩阵 $\Sigma$ 的特征:
|
|
为什么这是"势博弈"(Potential Game)?
|
|
第二部分:模型的数学完整推导
2.1 消费者问题的完整求解
效用函数的设定
代表性消费者的效用函数:
$$U(q, H) = \underbrace{\alpha \left( x'b^x - \frac{1}{2}x'x \right)}_{\text{Common features}} + \underbrace{(1-\alpha)\left( y'b^y - \frac{1}{2}y'y \right)}_{\text{Idiosyncratic features}} - H$$参数解读:
| 参数 | 含义 | 范围 |
|---|---|---|
| $\alpha$ | 消费者关心共同特征的程度 | $[0,1]$ |
| $1-\alpha$ | 消费者关心差异特征的程度 | $[0,1]$ |
| $x'b^x$ | 共同特征对效用的贡献(线性项) | 任意 |
| $\frac{1}{2}x'x$ | 特征的边际效用递减 | 二次衰减 |
| $H$ | 其他商品/休闲时间消费 | 价格标准化为 1 |
关键映射:特征到产品
企业通过产品来提供特征:
|
|
其中$A$是$m \times N$的特征矩阵:
$$ A = \begin{bmatrix} a_1' \\ a_2' \\ \vdots \\ a_m' \end{bmatrix} $$每一行代表一个特征维度在各产品上的"加载"。
消费者最优性条件
消费者最大化效用受预算约束:
$$\max_{q, H} U(q, H) \quad \text{s.t.} \quad p'q + H = Y$$代入预算约束消去$H$:
$$\max_q \left[ \alpha(Aq)'b^x - \frac{1}{2}(Aq)'(Aq) + (1-\alpha)q'b^y - \frac{1}{2}q'q - p'q \right]$$展开$(Aq)'(Aq) = q'A'Aq$:
$$\max_q \left[ \alpha q'A'b^x - \frac{1}{2}q'A'Aq + (1-\alpha)q'b^y - \frac{1}{2}q'q - p'q \right]$$一阶条件(对$q$求导):
$$\alpha A'b^x - A'Aq + (1-\alpha)b^y - q - p = 0$$整理:
$$p = \alpha A'b^x + (1-\alpha)b^y - A'Aq - q$$$$p = b - [A'A + I]q$$其中$b = \alpha A'b^x + (1-\alpha)b^y$是有效的需求移位向量。
关键转换:引入$\Sigma$矩阵
观察反需求函数:
$$p = b - [A'A + I]q$$定义:
$$\Sigma = \alpha(A'A - I)$$则:
$$A'A + I = I + A'A = I + (I + \Sigma) - I = I + \alpha(A'A - I) + I - \alpha(A'A - I) + (1-\alpha)I$$实际上,更直接的做法是:
$$A'A + I = A'A + I$$当$\alpha=1$(消费者只关心共同特征)时:
$$A'A + I = (I + \Sigma) = I + \alpha(A'A - I) = I + (A'A - I) = A'A$$当$\alpha < 1$时,会有额外的$(1-\alpha)I$项来自于$y$的部分。
让我重新整理这部分的参数化:
更清晰的参数化方法:
设$A$的行向量为单位向量($\|a_i\|=1$),则:
$$A'A \text{的}(i,j)\text{元素} = a_i'a_j = \cos(\text{angle between } a_i, a_j)$$这就是余弦相似度。
反需求函数变为:
$$\boxed{p_i = b_i - q_i - \sum_j \alpha(a_i'a_j - \delta_{ij}) q_j}$$简化记号,定义:
$$\Sigma_{ij} = \alpha(a_i'a_j - \delta_{ij})$$其中$\delta_{ij}$是 Kronecker 符号(若$i=j$则为 1,否则为 0)。
则反需求函数为:
$$p = b - (I + \Sigma)q$$消费者剩余
消费者剩余(间接效用):
$$CS = b'q - \frac{1}{2}q'(I+\Sigma)q$$这个表达式在反事实分析中会用到。
2.2 企业问题与均衡
企业 i 的利润最大化
利润函数:
$$\pi_i(q) = p_i(q) \cdot q_i - C_i(q_i)$$代入反需求函数:
$$\pi_i = \left[ b_i - q_i - \sum_j \Sigma_{ij} q_j \right] q_i - C_i(q_i)$$假设成本函数:
$$C_i(q_i) = c_i^0 q_i + \frac{\delta_i}{2}q_i^2$$则:
$$\pi_i = b_i q_i - q_i^2 - q_i\sum_j \Sigma_{ij} q_j - c_i^0 q_i - \frac{\delta_i}{2}q_i^2$$一阶条件(MR=MC)
对$q_i$求偏导:
$$\frac{\partial \pi_i}{\partial q_i} = b_i - 2q_i - \sum_j \Sigma_{ij} q_j - c_i^0 - \delta_i q_i = 0$$关键观察: $2q_i$来自哪里?
|
|
整理 FOC:
$$(2 + \delta_i)q_i + \sum_j \Sigma_{ij} q_j = b_i - c_i^0$$矩阵形式的均衡解
对所有$i$求和,写成矩阵形式:
$$\underbrace{(2I + \Delta)}_{\text{对角}} q + \underbrace{\Sigma}_{\text{非对角}} q = b - c^0$$其中$\Delta = \text{diag}(\delta_1, ..., \delta_N)$。
合并:
$$(2I + \Delta + \Sigma) q = b - c^0$$求逆:
$$\boxed{ q^* = (2I + \Delta + \Sigma)^{-1}(b - c^0) }$$均衡价格
代入反需求函数:
$$p^* = b - (I + \Sigma)q^*$$$$= b - (I+\Sigma)(2I+\Delta+\Sigma)^{-1}(b-c^0)$$加成率的定义与计算
加成率(Markup):
$$\mu_i^* = \frac{p_i^* - c_i}{p_i^*} = \frac{p_i^* - c_i^0 - \delta_i q_i^*}{p_i^*}$$在均衡时:
$$\mu_i^* = \frac{p_i^* - \partial C_i / \partial q_i}{p_i^*}$$对于线性成本($\delta_i = 0$,常数边际成本$c_i = c_i^0$):
$$\mu_i^* = 1 - \frac{c_i}{p_i^*}$$2.3 势博弈的证明与直觉
势函数的构造
定义势函数:
$$\Phi(q) = b'q - \frac{1}{2}q'(I+\Sigma)q - c_0'q - \frac{1}{2}q'\Delta q$$简化:
$$\Phi(q) = (b-c_0)'q - \frac{1}{2}q'(I+\Sigma+\Delta)q$$验证势函数性质
对$q_i$求偏导:
$$\frac{\partial \Phi}{\partial q_i} = (b-c_0)_i - \sum_j (I+\Sigma+\Delta)_{ij} q_j$$$$= (b-c_0)_i - (1+\delta_i)q_i - \sum_j \Sigma_{ij} q_j$$对比企业$i$的利润函数的梯度:
$$\frac{\partial \pi_i}{\partial q_i} = b_i - c_i^0 - 2q_i - \sum_j \Sigma_{ij}q_j - \delta_i q_i$$$$= (b-c_0)_i - (2 + \delta_i)q_i - \sum_j \Sigma_{ij}q_j$$差异: $\partial \pi_i / \partial q_i = \partial \Phi / \partial q_i - q_i$
这意味着:
$$\pi_i(q) = \Phi(q) - \frac{1}{2}\sum_j q_j^2 + \text{const}$$(差一个通用的凸函数)
为什么这是"势博弈"?
定义(复习): 一个博弈是势博弈,如果存在$\Phi(q)$使得
$$\pi_i(q_{-i}, q_i') - \pi_i(q_{-i}, q_i) = \Phi(q_{-i}, q_i') - \Phi(q_{-i}, q_i)$$对所有$i, q_i, q_i'$成立。
在这个模型中: 虽然不是严格的势博弈(因为有额外的$\frac{1}{2}q_i^2$项差异),但接近的性质意味着:
- 均衡是唯一的 ← 因为$\Phi$是严格凹函数
- 最优解等价于最大化$\Phi$ ← 分散化企业的决策与社会规划者一致
- 可以用梯度下降求解 ← 而非迭代求解非线性方程组
网络中心度的联系
注意到均衡解:
$$q^* = (2I + \Delta + \Sigma)^{-1}(b - c^0)$$可以重写为:
$$q^* = \frac{1}{2}(I - \frac{1}{2}\Sigma + O(\Sigma^2))^{-1}(b - c^0)$$当$\Sigma$的谱半径小于 1 时,可以展开:
$$(I - \frac{1}{2}\Sigma)^{-1} = I + \frac{1}{2}\Sigma + \frac{1}{4}\Sigma^2 + ...$$这是一个几何级数,第$k$项对应"$k$度邻居"的影响。
网络解释:
|
|
这正是Bonacich Centrality的形式,一种流行的网络中心度度量。
第三部分:识别与估计的技术细节
3.1 Hoberg-Phillips 文本数据的使用
数据来源
Hoberg and Phillips (2016) 的Product-Market Text-Based Measures:
|
|
具体数据构建示例:
| 公司 | 关键词(高权重) | 与 Apple 的相似度 |
|---|---|---|
| Apple | smartphone, mobile, app, … | 1.00 |
| Samsung | smartphone, galaxy, … | 0.78 |
| IBM | cloud, enterprise, software, … | 0.35 |
| Intel | processor, chip, technology, … | 0.42 |
| 玉米面粉公司 | corn, ingredient, … | 0.05 |
假设 1:从文本向量到特征向量
核心假设(Assumption 1):
|
|
假设 2:从文本相似度到产品替代
核心假设(Assumption 2):
|
|
HP 数据的优势与局限
优势:
|
|
局限:
|
|
3.2 参数 α 的校准
识别问题
给定了相似度矩阵$A'A$后,我们还需要什么?
回顾竞争矩阵:
$$\Sigma = \alpha(A'A - I)$$- $A'A - I$是已知的(来自 HP 数据)
- 但标量$\alpha$(称为"替代强度参数")不可识别
为什么不可识别?
|
|
作者的校准策略
第一步:找一个微观参考点(Micro-econometric Anchor)
Nevo (2001)对早餐麦片市场的经典估计:
|
|
第二步:参数化的模型预测
在模型中:
|
|
第三步:校准目标
选择$\alpha^*$使得:
$$\epsilon_{KFC,Quaker}^{\text{model}}(\alpha^*) = \epsilon_{KFC,Quaker}^{Nevo(2001)} = 0.3$$结果: $\alpha^* \approx 0.12$(论文中的校准值)
校准的经济学含义
|
|
稳健性检查
论文应该报告:
|
|
3.3 边际成本的估计(De Loecker 方法)
从财务数据反演成本
思路: 利用企业的利润最大化行为反演成本。
基本设定:
从利润恒等式出发:
$$\pi_i = (p_i - c_i) q_i - F_i$$其中:
- $p_i$ = 价格(可观测)
- $q_i$ = 产量(可观测或推算)
- $c_i$ = 边际成本(不可观测)
- $F_i$ = 固定成本(不可观测)
问题: 如何从$\pi_i$反演$c_i$?
De Loecker & Warzynski (2012) 的方法
核心思想: 从一阶条件反演成本。
在古诺均衡中,企业$i$的 FOC 是:
$$\frac{\partial \pi_i}{\partial q_i} = p_i + q_i \frac{\partial p_i}{\partial q_i} - c_i = 0$$重新排列:
$$c_i = p_i + q_i \frac{\partial p_i}{\partial q_i}$$关键系数: $q_i \frac{\partial p_i}{\partial q_i}$
在这个模型中,我们知道:
$$p_i = b_i - q_i - \sum_j \sigma_{ij} q_j$$所以:
$$\frac{\partial p_i}{\partial q_i} = -1$$(自己的产量提高 1 单位,价格下跌 1 单位)
因此:
$$c_i = p_i - q_i$$这太简单了?不对! 让我重新检查。
实际上,完整的 FOC 应该是:
$$p_i \cdot 1 + q_i \cdot \frac{\partial p_i}{\partial q_j} \Big|_{j=i} + \sum_{j \neq i} q_i \frac{\partial p_i}{\partial q_j} - c_i = 0$$在齐次产品市场(横截面,不同产品有不同特征),这变得复杂。
Pellegrino 在这里的处理
在本文中,成本函数是二次的:
$$C_i(q_i) = c_i q_i + \frac{\delta_i}{2}q_i^2$$所以边际成本是:
$$MC_i = \frac{\partial C_i}{\partial q_i} = c_i + \delta_i q_i$$如果$\delta_i \approx 0$(常数边际成本),则:
$$c_i \approx p_i - q_i$$但作者可能采用了更复杂的反演方法,涉及到加成率的定义。
从加成率的定义:
$$\mu_i = \frac{p_i - MC_i}{p_i}$$重新排列:
$$MC_i = p_i(1 - \mu_i)$$算法步骤:
|
|
数据来源:Compustat
Compustat是标准的企业财务数据库:
|
|
第四部分:加成分解的经济学含义
4.1 Proposition 2 的完整推导
加成率的均衡表达式
从 FOC,我们有:
$$(2 + \delta_i)q_i^* + \sum_j \sigma_{ij} q_j^* = b_i - c_i$$可以重新写为:
$$q_i^* = \frac{1}{2 + \delta_i} (b_i - c_i - \sum_j \sigma_{ij} q_j^*)$$现在,利用反需求函数:
$$p_i^* = b_i - q_i^* - \sum_j \sigma_{ij} q_j^*$$$$= b_i - \frac{1}{2 + \delta_i}(b_i - c_i - \sum_j \sigma_{ij} q_j^*) - \sum_j \sigma_{ij} q_j^*$$$$= b_i - \frac{1}{2 + \delta_i}(b_i - c_i) + \frac{1}{2 + \delta_i}\sum_j \sigma_{ij} q_j^* - \sum_j \sigma_{ij} q_j^*$$$$= b_i - \frac{1}{2 + \delta_i}(b_i - c_i) - \frac{1 + \delta_i}{2 + \delta_i}\sum_j \sigma_{ij} q_j^*$$这变得很复杂。让我用另一个方法。
简化路径:假设$\delta_i = 0$(常数 MC)
当$\delta_i = 0$时,成本函数$C_i(q) = c_i q$是线性的。
FOC 变为:
$$2q_i + \sum_j \sigma_{ij} q_j = b_i - c_i$$矩阵形式:
$$2Iq + \Sigma q = b - c$$$$(2I + \Sigma)q = b - c$$
$$q = (2I + \Sigma)^{-1}(b - c)$$
加成率:
$$\mu_i = \frac{p_i - c_i}{p_i}$$从 FOC,我们可以写:
$$2q_i + \sum_j \sigma_{ij}q_j = b_i - c_i$$同时,从反需求:
$$p_i = b_i - q_i - \sum_j \sigma_{ij}q_j$$两式相加:
$$2q_i + \sum_j \sigma_{ij}q_j + p_i = b_i - c_i + b_i - q_i - \sum_j \sigma_{ij}q_j$$$$2q_i + p_i + q_i = 2b_i - c_i$$$$p_i + 3q_i = 2b_i - c_i$$这还是很复杂。
使用网络中心度的启发式论证
论文提出的分解形式(Proposition 2):
$$\mu_i = \chi_i + (1 - \chi_i) \bar{\mu}_i$$其中:
- $\chi_i$ = “中心度"参数,衡量企业在竞争网络中有多"中心”
- $\bar{\mu}_i$ = “孤立加成率”,企业如果没有竞争对手会收的加成率
直觉解释:
|
|
中心度的定义
论文可能使用的是Bonacich 中心度或Katz 中心度的变体:
$$\chi_i = \text{某种网络中心度度量}$$常见的形式(伪代码):
|
|
产品质量调整后生产率$\omega_i$
$$\omega_i = \frac{b_i}{c_i}$$含义:
|
|
垄断加成率$\bar{\mu}_i$
如果企业$i$是孤立的垄断者,反需求是:
$$p_i = b_i - q_i$$(只有自己的产量项)
FOC:
$$p_i + q_i \frac{dp_i}{dq_i} = c_i$$$$p_i - q_i = c_i$$$$p_i = c_i + q_i$$加成率:
$$\mu_i^{mono} = \frac{q_i}{c_i + q_i}$$通过一些计算(设定$q_i = p_i - c_i$的某个比例),可得:
$$\bar{\mu}_i = \frac{1 + \omega_i}{2}$$其中$\omega_i = b_i / c_i$。
第五部分:反事实分析与福利计算
5.1 三个关键反事实场景
场景 0(基准):古诺均衡
|
|
场景 1:完全竞争(First-Best)
规则: 强行令$p_i = MC_i$对所有企业。
|
|
数学:
定义一个约束优化问题:
$$\max_q CS(q) + \Pi(q) \quad \text{s.t.} \quad p(q) = c$$但更直接的方法是:给定$p = c$的约束,反向计算$q$。
从反需求:
$$p = b - (I + \Sigma)q$$令$p = c$:
$$c = b - (I + \Sigma)q^{PC}$$$$(I + \Sigma)q^{PC} = b - c$$$$q^{PC} = (I + \Sigma)^{-1}(b - c)$$福利: 完全竞争下的总剩余
$$W^{PC} = CS^{PC} + \Pi^{PC}$$其中:
$$CS^{PC} = \int_0^{q^{PC}} p(q) dq = b'q^{PC} - \frac{1}{2}(q^{PC})'(I+\Sigma)q^{PC}$$$$\Pi^{PC} = (p^{PC} - c)' q^{PC} = 0$$(利润为 0)
场景 2:合谋垄断(Worst-Case)
规则: 所有企业被一个总垄断者拥有,目标是最大化总利润。
|
|
数学:
$$\max_q (b - (I+\Sigma)q - c)' q$$$$= \max_q (b-c)'q - q'(I+\Sigma)q$$一阶条件:
$$(b - c) - 2(I+\Sigma)q = 0$$$$q^{mono} = \frac{1}{2}(I + \Sigma)^{-1}(b - c)$$观察:
$$q^{mono} = \frac{1}{2} q^{PC}$$产量只有完全竞争的一半!这正是垄断的典型特征。
价格:
$$p^{mono} = b - (I + \Sigma)q^{mono} = b - \frac{1}{2}(I + \Sigma)(I+\Sigma)^{-1}(b - c)$$$$= b - \frac{1}{2}(b - c) = \frac{b + c}{2}$$平均定价是消费者支付意愿和成本的中点。
场景 3:资源配置效率(Mix)
规则: 社会计划者在"有效利用现有资源"的约束下最大化福利。
|
|
动机:
|
|
数学设定(假设线性成本):
总劳动投入(假设各单位成本相同):
$$H = \sum_i q_i \times \text{(labor per unit)}$$如果标准化为$\sum_i q_i = Q_{total}$,则:
|
|
优化会导致:企业从低$b_i/c_i$向高$b_i/c_i$转移产量。
5.2 无谓损失(DWL)的定义与计算
消费者剩余
从效用函数,消费者剩余:
$$CS(q) = b'q - \frac{1}{2}q'(I + \Sigma)q$$这反映了消费者对产品包的总支付意愿,减去消费时的"饱和成本"。
生产者剩余
$$\Pi(q) = \sum_i \pi_i = \sum_i (p_i - c_i) q_i$$$$= (p - c)'q$$$$= (b - (I+\Sigma)q - c)' q$$$$= (b - c)' q - q'(I + \Sigma)q$$总福利/总剩余
$$W(q) = CS(q) + \Pi(q)$$$$= b'q - \frac{1}{2}q'(I+\Sigma)q + (b-c)'q - q'(I+\Sigma)q$$$$= 2b'q - c'q - \frac{3}{2}q'(I+\Sigma)q$$嗯,这不对。让我重新检查。
实际上,总福利应该是消费者愿意支付减去成本:
$$W(q) = \int_0^q p(x) dx - C(q)$$给定反需求$p = b - (I+\Sigma)q$,成本$C = c'q$:
$$W(q) = \int_0^q [b - (I+\Sigma)x] dx - c'q$$$$= b'q - \frac{1}{2}q'(I+\Sigma)q - c'q$$$$= (b - c)'q - \frac{1}{2}q'(I+\Sigma)q$$DWL 相对于完全竞争
|
|
由于计算量大,通常用数值模拟。
Pellegrino 的主要发现
论文报告了:
|
|
5.3 DWL 的来源分解
垄断力上升 vs. 网络稀疏化
论文进行了一个有趣的分解分析:
|
|
这是一种路径分解 (Oaxaca-Blinder 型的分解)。
第六部分:批判性评价与局限
6.1 模型的关键假设与其可信性
假设 1:二次效用函数
|
|
假设 2:文本相似度 = 产品特征相似度
|
|
假设 3:古诺竞争
|
|
假设 4:代表性消费者(Representative Consumer)
|
|
6.2 数据与识别的局限
HP 数据的局限
|
|
参数 α 的校准
|
|
第七部分:与相关文献的对话
7.1 与 De Loecker et al. (2020)的关系
De Loecker 的"成本-双对数"方法
|
|
Pellegrino 的改进
|
|
7.2 与 BLP (1995)随机系数 logit 的对话
BLP 的标准方法
|
|
Pellegrino 的参数化替代品
|
|
第八部分:对未来研究的启示
8.1 潜在的扩展方向
扩展 1:动态与学习
|
|
扩展 2:全球贸易网络
|
|
扩展 3:内生产品创新
|
|
扩展 4:政策反事实
|
|
8.2 方法论的可转移性
可以应用到其他经济问题吗?
是的!核心思想可以推广:
|
|
第九部分:导师给博士生的建议
9.1 如何阅读这篇论文?
第一遍(快速扫描,1 小时)
|
|
第二遍(深度理解,3-4 小时)
|
|
第三遍(批判性思考,2-3 小时)
|
|
9.2 发展自己的研究论文时的启示
学习 1:权衡取舍的艺术
|
|
学习 2:使用现有的"数据金矿"
|
|
学习 3:理论、实证、政策的三角形
|
|
学习 4:福利分析的重要性
|
|
第十部分:高级讨论与开放问题
10.1 网络经济学的深度问题
什么决定了竞争网络的结构?
|
|
网络与不平等
|
|
10.2 校准 vs. 估计的哲学问题
论文的识别策略中的折衷
|
|
一个可能的改进
|
|
第十一部分:总结与反思
11.1 核心贡献的清晰总结
这篇论文做了什么?
|
|
11.2 与当代宏观经济学议题的联系
“美国为什么越来越不平等?”
|
|
“为什么创新不再转化为工资增长?”
|
|
“为什么我们看到’超级明星企业’的崛起?”
|
|
11.3 给博士生的最后建议
如何选择自己的研究课题?
|
|
五个关键问题来评估一篇论文(或你的论文)
|
|
读论文时的快速检查清单
|
|
最终寄语
亲爱的博士生,
这篇 Pellegrino (2025)的论文代表了现代应用经济学研究的精髓:
- 它选择了一个重要的问题(企业定价力为什么在上升?)
- 它从多角度融合数据(财务数据+文本数据+微观研究)
- 它建立了清晰的理论框架(竞争网络+古诺模型)
- 它进行了现实的量化(DWL 的大小)
- 它得出了政策洞见(关于垄断反托拉斯的新视角)
当你写自己的论文时,问问自己:
我是否能同样清晰地讲述一个故事? 我是否利用了最好的可用数据? 我是否推导了可以被他人验证的结果? 我的发现是否会改变人们对世界的理解?
如果答案都是"是",你就在正确的道路上。
祝你的研究之旅充满发现!