结构化估计方法论深度解析报告 —— 基于 Stanton & Thomas (2025) 的逆向工程

估计技巧：极大似然估计 (MLE) + 控制函数法 (Control Function) + 有限混合模型 (Finite Mixture Model)。

第一步：理论构建 —— 搭骨架 (Theoretical Derivation)

任务： 建立一个数学世界，描述买家和工人是怎么思考的。

逻辑：

买家（需求方）： 面对几百份简历，买家是“有限理性”的。他们只看前份（搜索摩擦），然后在里面挑一个性价比最高的（Logit 选择）。
工人（供给方）： 工人很聪明。他们知道买家“懒”（只看前几份）且“挑剔”（对价格敏感）。所以工人根据自己被看到的概率和买家的敏感度，设定一个最优工资（加价）。

工人知道买家有摩擦，所以工人有局部市场势力。

数学形式：逆弹性法则（Inverse Elasticity Rule）。

$$\text{Markup} = \frac{1}{\text{Elasticity of Demand}}$$

工资是观测到的，弹性是估计出来的。通过这个公式，我们可以倒推出不可观测的机会成本。

方法： 博弈论与最优化推导。
买家效用最大化导出 Logit 概率公式。
工人期望利润最大化对求导（FOC）导出 “逆弹性加价法则”（）。

我们可以得到经典的逆弹性定价公式（Lerner Index 的变体）：

$$\text{Markup} = \frac{\text{Net Wage}}{\text{Cost}} = \left( 1 + \frac{E[\tilde{p}]}{\partial E[\tilde{p}] / \partial \log w_{oj}} \right)^{-1}$$

或者写成原文 Equation (7) 的反函数形式，用来反推成本：

$$c_{oj} = \frac{w_{oj}}{1+\tau} \left( 1 + \frac{E[\tilde{p}]}{\partial E[\tilde{p}] / \partial \log w_{oj}} \right)$$

地位： 这是纯理论推导。不涉及数据，只涉及假设。这是整个大厦的蓝图。

第二步：需求侧参数估计 —— 填肉 (Empirical Estimation)

任务： 理论骨架搭好了，但具体的参数是多少？买家到底有多懒（）？对价格到底有多敏感（）？这需要问数据。

逻辑：

我们观察到买家雇佣了谁，没雇佣谁。
我们利用**“申请顺序”**作为线索：如果买家经常雇佣第 50 个申请者，说明他不懒；如果只雇前 5 个，说明他很懒。这识别了搜索参数。
我们利用**“工资变动”**作为线索：工资涨 1 块钱，雇佣概率掉多少？这识别了价格弹性。
难点（内生性）： 高工资可能意味着高质量。为了把“纯价格影响”剥离出来，作者用了工具变量（IV）——汇率变化和竞争程度。

方法： 最大似然估计 (MLE) + 控制函数法 (Control Function)。
数据： 17 万个职位的详细流水（谁申请了、什么时间申请、报价多少、最后雇了谁）。
地位： 这是实证估计。这是全篇最硬核、工作量最大的部分。Table 4 的参数就是这一步的产出。

如果你拿到了数据，该按什么顺序操作？

第一阶段：准备与降噪 (Data Prep & First Stage)

目标：清洗数据，并处理价格内生性。

定义“顺序 (Order)”：必须精确计算每个申请者是第几个提交的。这是识别搜索摩擦的唯一抓手。

运行第一阶段回归 (Equation 9)：

回归方程：$\log(w_{oj}) = \text{IVs} + \text{Controls} + \nu_{oj}$

IV 选择：汇率（供给冲击）、竞争对手申请量（竞争预期）。

产出：提取残差 $\hat{\nu}_{oj}$，记为 $CF_{oj}$。

第二阶段：结构参数估计 (Structural Estimation)

目标：获得 $\alpha$（价格敏感度）、$\beta$（偏好）、$\lambda$（搜索范围）。

构建似然函数 (The Grand Likelihood)：你需要写一个程序（Python/Julia/Matlab），计算观察到当前数据的概率。

输入：参数猜测值 $\theta$。

循环：遍历每个买家 $i$。

步骤 A：计算关注集概率（看了多少人？）。

步骤 B：计算选择概率（雇了谁？）。注意，要把 $CF_{oj}$ 作为控制变量加进去：$U = X\beta - \alpha P + \psi CF$。

步骤 C：计算发帖间隔概率（多久发一次？）。

混合 (Mixture)：假设有 3 种买家类型，加权求和：$L_i = \sum \rho_k L_{ik}$。

最大化：使用优化算法（如 BFGS 或 Nelder-Mead）寻找让 $L$ 最大的 $\theta$。

第三步：供给侧成本反推 —— 读心术 (Calibration / Fitting)

任务： 我们想算工人赚了多少钱（剩余），等于“工资 - 成本”。工资数据里有，但工人的心理成本（机会成本）是看不见的。我们需要“算出”它。

逻辑：

回到第一步的理论公式：。
利用第二步估计出的参数（），我们可以算出每个工人面临的需求弹性。
把弹性代入公式，算出工人的 Markup（加价率）。
最后，成本 = 工资 / (1 + Markup)。

目标：计算剩余。

计算弹性：利用估计出的 $\hat{\theta}$，为每个工人计算其面临的需求弹性 $\epsilon_{oj}$。

计算成本：代入公式 $c_{oj} = w_{oj} / (1 + \frac{1}{\epsilon_{oj}})$。

计算剩余： $\text{Surplus} = w_{oj} - c_{oj}$。

作者如何确保估计出的 $\alpha$（价格敏感度）是准确的？他们使用了工具变量（IV）：

汇率冲击：影响工人的外部机会成本（供给移动），从而识别需求曲线。
竞争对手的申请量：影响工人的竞争预期，移动报价。

还有一个小细节（拟合）： 工人其实不知道买家确切是哪种类型（Type 1, 2, 3），只能猜。工人对私有信号赋予多大权重（参数）？

作者通过非线性最小二乘法（NLLS），寻找一个值，使得模型预测的工资方差与数据中的实际方差最接近。
方法： 校准 (Calibration) / 拟合 (Fitting)。
使用结构方程反推不可观测变量。
地位： 这是连接估计与福利分析的桥梁。Table 6 的结果（工人加价 28%）就是这一步的产出。

控制函数法

买家的效用函数包含工资 $w_{oj}$。但是，$w_{oj}$ 可能与不可观测的工人质量 $\xi_{j}$ 相关（高质量工人要价高）。如果不处理，价格系数 $\alpha$ 会有偏差（Bias toward zero），导致需求看起来缺乏弹性。

作者假设内生性来源于一个可加的误差项。

第一阶段回归 (First Stage Regression - Equation 9): 我们将内生的工资 $w_{oj}$ 对所有外生变量（$X_j$）和工具变量（$Z_j$）回归：

$$\log(w_{oj}) = Z_j \gamma_1 + X_j \gamma_2 + \nu_{oj}$$

$Z_j$ (IVs):

汇率冲击 (Exchange Rate): 移动工人的保留工资（成本侧移动）。

竞争程度 (Competition): 同类工作在其他买家那里的申请量（影响工人的加价策略）。

$\nu_{oj}$: 回归残差。这个残差包含了“未能被可观测变量解释的价格部分”，即不可观测的质量冲击。

构建控制变量: 计算出估计残差 $\hat{\nu}_{oj} = CF_{oj}$。将这个 $\hat{CF}_{oj}$ 直接作为回归元（Regressor）放入第二阶段的效用函数中。

构建买家效用与选择模型 (The Choice Model)

效用函数 (Utility Function)

买家 $k$（拥有经验 $x$）雇佣工人 $j$ 的间接效用为：

$$U_{ojk} = \underbrace{X_j \beta_{k\chi}}_{\text{Observed Quality}} - \underbrace{\alpha_k \log(w_{oj})}_{\text{Disutility of Price}} + \underbrace{\psi_{k\chi} \hat{CF}_{oj}}_{\text{Correction for Endogeneity}} + \epsilon_{oj}$$

$\hat{CF}_{oj}$ 的作用：它作为不可观测质量的代理变量。$\psi > 0$ 意味着价格高出预期的部分通常代表高质量。通过控制它，$\alpha_k$ 就能纯粹地捕捉买家对价格的敏感度。

条件 Logit 概率 (Conditional Logit - Equation 10)

给定买家实际看了集合 $J_o$ 里的工人，选择工人 $j$ 的概率是：

$$p(j | J_o, k, \chi) = \frac{\exp(V_{ojk})}{\sum_{l \in J_o \cup \{0\}} \exp(V_{olk})}$$

其中 $V_{ojk} = X_j \beta - \alpha \log w + \psi \hat{CF}$。选项 $\{0\}$ 代表不雇佣（Outside Option）。

第四步：反事实模拟（动态模拟）

任务： 政策制定者想知道，如果收 10%的税，市场会变成什么样？既然我们有了模型（骨架）和参数（血肉），我们就可以造一个“平行宇宙”来实验。

逻辑：

静态模拟： 强制给工资加 10% 的税代入模型算出新的需求弹性工人调整报价买家减少雇佣。
动态模拟（最关键）：

今天少雇佣一个人明天少一个“有经验的买家”。
今天价格变高买家因为厌恶高价（参数），下个月发帖频率降低。

在这条逻辑链上，让计算机模拟 30 个月，看最终剩下的“蛋糕”（总剩余）变小了多少。

方法： 数值模拟 (Numerical Simulation)。
不使用新数据，而是使用第二步估计出的参数（）生成新数据。
地位： 这是应用分析。Table 9 的政策建议就是这一步的产出。

到达率 (Arrival Rate - Equation 8): 买家发布下一个工作的速率 $\lambda^{ARRIVAL}$ 建模为：

$$\log(\lambda_{k\chi}^{ARRIVAL}) = \delta_{1k} + \delta_2 \mathbb{1}(\chi > 0) + \delta_3 \log(\bar{w}_{past})$$

关键参数 $\delta_3$: 买家对“过去价格”的敏感度。如果过去的工资很高，买家可能会减少未来的发帖。这是连接静态均衡和动态市场规模的关键机制。

目标：政策评估。

设定冲击：比如税收 $t=10\%$。

求解新均衡：

工人重新优化报价 $w'$。

买家面对新价格 $w'$，调整雇佣概率 $p'$。

动态演化：模拟未来 30 个月。如果 $T=1$ 时期没雇人，买家在 $T=2$ 就无法积累经验，且可能因为高价而减少发帖。计算总损失。

极大似然估计

将上述所有部分拼在一起，一个买家的似然函数贡献 $L_k$ 包含三部分乘积：

选择概率: $\prod_o p(j | J_o, k, \chi)$ —— 给定关注集，选了谁？

关注集概率: $\prod_o \eta(|J_o|)$ —— 看了多少人？

发帖时间概率: $\prod_o f(t_{arrival})$ —— 多久发一次帖？

核心重温：成本反推

完成需求侧估计后，我们得到了买家的参数（$\alpha, \beta$）。现在我们需要知道工人的剩余（Wages - Costs）。但是成本（Costs）是不可观测的。

A. 结构方程反推 (Structural Inversion)

作者利用工人的最优报价一阶条件（FOC）来反推成本。

逻辑：工人设定工资 $w_{oj}$ 以最大化期望利润。根据逆弹性法则，最优工资是成本乘以一个加价（Markup）。

公式 (Equation 7):

$$c_{oj} = \frac{w_{oj}}{1+\tau} \left( 1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)] / \partial \log w_{oj}} \right)$$

$w_{oj}$：观测到的工资。

括号内的项：完全由需求侧参数决定的加价倒数。因为我们已经估计出了需求参数，所以这一项是已知的（取决于工人对买家的预期）。

$c_{oj}$：被反推出来的隐性成本。

B. 校准信息权重 $b$ (Fitting the Information Weight via NLLS)

问题：工人计算加价时，依赖于他认为买家是哪种类型（Type 1, 2, or 3）。工人有一个猜测公式：

$$\text{Belief}_k = b \cdot \text{Signal}_k + (1-b) \cdot \text{PopulationAvg}_k$$

这里的 $b$ 是未知的。如果 $b=0$，工人只看平均值；如果 $b=1$，工人完全信任私有信号。

NLLS 拟合思路：作者利用**“同一工人在短时间内的报价变化”**来识别 $b$。

假设：同一个工人，在同一周、同一类工作中，其成本 $c_{oj}$ 是不变的。

方差来源：如果成本不变，为什么他在 Job A 报价 $10，在 Job B 报价 $12？唯一的解释是：他对 Job A 和 Job B 的买家类型预期不同（信号不同），导致他设定的 Markup 不同。

方程构建：对工资公式取对数：

$$\log(w_{oj}) = \log(c_{\text{worker,week}}) + \log(\text{Markup}_{oj}(b)) + \text{Constants}$$

移项并去除固定效应（Fixed Effects）：

$$\log(w_{oj}) - \overline{\log(w)} \approx \log(\text{Markup}_{oj}(b)) - \overline{\log(\text{Markup}(b))}$$

左边：数据中观察到的工资波动。

右边：模型预测的加价波动（它是参数 $b$ 的函数）。

求解：使用非线性最小二乘法 (NLLS) 搜索一个最优的 $b$，使得左右两边的差异最小。

结论：这一步不仅仅是计算，而是一个巧妙的识别策略——利用工资的变动率（Variation）来推测信息的精确度（Information Precision）。

总结：一张表看懂递进关系

步骤	环节	核心问题	方法 / 手段	使用数据	对应结果
1	理论推导	世界是如何运作的？	效用最大化、FOC	无（纯数学）	Eq (2), (6)
2	实证估计	买家有多挑剔/多懒？	MLE + IV (控制函数)	17 万职位、440 万申请、汇率数据	Table 4 (弹性参数)
3	拟合/校准	工人的成本是多少？	反推 (Inversion) + NLLS	观测到的工资	Table 6 (剩余/加价)
4	数值模拟	收税会有什么后果？	动态模拟算法	估计出的参数	Table 9 (福利变化)

通俗得说：

理论： 画图纸（造人逻辑）。
估计： 填数据（量出这个人的身高体重、脾气秉性）。
校准： 读心术（根据他的行为推测他心里的底线）。
模拟： 做实验（打他一拳，看他怎么反应，以及明天还会不会来）。

希望这个梳理能帮你打通任督二脉！结构化模型看似复杂，核心就是这四步走的逻辑闭环。

《谁从在线零工经济平台中获益？》深度解构

执行摘要

这是一篇结构计量经济学论文，其核心贡献在于：用一个精心设计的需求-供给结构模型来量化双边市场（买方与卖方）的剩余分配。我将带你从理论动机开始，逐层剥开这个模型的数学与经济学内核。

1. 理论动机与直觉

1.1 核心经济学权衡

这篇论文处理的是一个表面上的悖论：

在一个买方市场 (buyer’s market)——即申请者（卖方）远远超过工作机会（买方需求）的市场中，经济学的传统直觉认为：

竞争应该摧毁工人的议价权，工资应该被压低至保留工资 (reservation wage)
工人应该赚取零经济剩余 (zero economic surplus)

但现实观察 (Figure 2)：

每月平均 16,600 名申请者竞争仅 5,600 个工作
仅有 1,100 名工人被雇用
尽管竞争激烈，论文的核心发现是工人实际上捕获了 46%的总剩余，平均每小时赚取 $1.97 的经济剩余

问题的经济学本质：为什么工人没有被竞争压低到保留工资？

1.2 现有文献的缺口

传统劳动经济学框架（例如完全竞争模型、单一底价拍卖）假设：

工人是同质的 (homogeneous)——一个简单的劳动力模型足以理解市场
信息完全且搜索无摩擦 (frictionless)——买方考虑所有申请者，所有工人知道所有工作

这些假设对在线零工市场完全不适用，理由是：

假设	现实	后果
工人同质性	工人高度异质（技能、声誉、地点、可用性不同）	简化的竞争模型低估工人剩余
完全信息	买方有有限的搜索能力，只考虑小部分申请者	搜索摩擦产生市场力量
无差异工人	图 A.1 显示：即使在最低工资十分位数，也仅有~10% 的工作被分配给最低出价者	工人差异化 (differentiation) 给予市场力量

1.3 核心机制：两股力量维系工人剩余

作者论证两个独立且互补的机制解释为什么工人不被竞争压垮：

机制 A：工人差异化 (Worker Differentiation)

经济学直觉：买方不是在雇用"劳动力单位"，而是在匹配特定工人。

论文量化发现（表 4）：工人特征标准差变化产生的需求效应 ≈ 38% 的工资变化
这意味着：即使有很多申请者，买方仍倾向于特定工人
结果：工人获得局部垄断力量——特定工人不是完全可替代的

数学对应：模型的择偶函数（方程 2）采用 logit 形式，其中：

$$U = X_j \beta^k_\chi - \alpha^k \log(w_{oj}) + \varepsilon_{oj}$$

工人特征 $X_j$ 的系数 $\beta^k_\chi$ 相对于价格敏感性系数 $\alpha^k$ 很大 → 工人不是价格的完美替代品

机制 B：买方搜索摩擦 (Buyer Search Frictions)

经济学直觉：买方审查申请者是有成本的（时间、认知负荷）。

实证事实（表格 A.2, 图 3）：

平均而言，买方只考虑 18 名申请者
申请顺序是强有力的预测因子：
- 前 10 名申请者被互动概率：>20%
- 第 45 名申请者被互动概率：<5%
这远不是随机的——是有序偏差 (order bias)

结果：

早期申请者获益（他们面临更少有效竞争）
搜索摩擦限制了头对头竞争（many applicants never face each other）
即使有 1000 名申请者，对第 40 名之后申请者的就业概率影响很小

数学对应：模型明确建模考虑集大小的分布 $\eta^{Consider}_{k\chi}(|J_o|)$，以及招聘概率受到的影响：

$$p(j|k,\chi) = \sum_{|J_o|=j}^{|J_o|} \eta_{k\chi}(|J_o|) \cdot p(j|\tilde{J}_o, k, \chi)$$

这里求和仅越过那些包含工人 $j$ 的考虑集——搜索摩擦将劲敌的数量限制在 18 左右。

1.4 关键洞察总结

驱动力	对工人的影响	论文中的量化证据
工人差异化	买方愿意为特定工人支付更高工资	Xβ 标准差变化 = 38% 工资变化
搜索摩擦	竞争限制到~18 名考虑申请者	平均考虑集大小=18.09(表 4)
两者交互	早期申请者：低竞争 + 高差异化溢价	预期剩余随申请顺序下降(图 5)

2. 模型解剖

2.1 模型的"骨架"：三个子游戏

这个模型实际上是一个动态的三层结构：

1
2
3
4
5
6


时间轴：
t=0: 买方决定是否发布工作
t=0+: 工人观察工作，决定申请和出价
t=1: 买方选择考虑哪些申请者
t=2: 买方在考虑集中选择雇用谁（或不雇用）
t=3: 工作执行，未来工作发布

2.2 三个相互关联的子模型

子模型 I：需求模型 (Demand Model) — 给定考虑集的购买选择

参与者：一个特定买方 $k$ 类型，经验水平 $\chi$，在职位 $o$ 考虑申请者集合 $\tilde{J}_o \subseteq J_o$

买方的目标函数（间接效用）：

$$U_j = \frac{\exp(X_j\beta^k_\chi + \varepsilon_{oj})}{(w_{oj})^{\alpha^k}}$$

经济学解读：

分子 $\exp(X_j\beta^k_\chi + \varepsilon_{oj})$：工人的"质量" = 可观测特征（经验、反馈、技能）+ 买方的主观偏好冲击
分母 $(w_{oj})^{\alpha^k}$：工人成本（工资出价）
指数 $\alpha^k$：衡量买方对价格的敏感程度
- 如果 $\alpha^k$ 很大 → 买方对价格敏感 → 市场竞争激烈
- 如果 $\alpha^k$ 很小 → 买方对价格不敏感 → 工人有市场力量

买方选择：雇用使得 $U_j$ 最大的申请者 $j^* \in \tilde{J}_o$，或选择"不在平台上雇用"（选择项 0）

概率形式（logit，假设 $\varepsilon_{oj}$ 是 I.I.D. 类型 I 极值分布）：

$$p(j|\tilde{J}_o, k, \chi) = \frac{\exp(X_j\beta^k_\chi - \alpha^k \log(w_{oj}))}{1 + \sum_{l \in \tilde{J}_o} \exp(X_l\beta^k_\chi - \alpha^k \log(w_{ol}))}$$

为什么是 logit？

数学上：便利性 → 闭式解
经济上：反映买方的"随机偏好异质性"——即使给定可观测特征，买方也有变化的个人偏好

子模型 II：供给模型 (Supply Model) — 工人的最优出价

参与者：工人 $j$ 在职位 $o$ 决定工资出价 $w_{oj}$

时间序列：

工人观察职位、已有申请数量、自己的成本 $c_{oj}$
工人形成对被雇用概率的预期 $E[\tilde{p}(j)]$
工人选择 $w_{oj}$ 以最大化期望效用

工人的期望效用函数：

$$E(U_{oj}(w_{oj})) = E[\tilde{p}(j)] \times \frac{w_{oj}}{1+\tau} + (1-E[\tilde{p}(j)]) \times c_{oj}$$

解读：

第一项：被雇用的概率 × 净工资（扣除平台费用 $\tau=10\%$）
第二项：未被雇用 → 获得机会成本 $c_{oj}$（离线替代品）
关键：工人的出价 $w_{oj}$ 影响 $E[\tilde{p}(j)]$
- 更高的出价 → 更低的聘用概率（买方对高价格敏感）
- 更低的出价 → 更高的聘用概率（但收益更少）

工人的信息结构（这是关键！）：工人不知道买方的真实类型 $k$，而是基于：

总体买方类型分布 $\rho_k$（她知道这个）
关于这个特定买方类型的私人信号 $\tilde{\rho}_k$（她有一个嘈杂信号）

她形成的聘用概率期望是这两者的加权平均：

$$E[\tilde{p}(j)] = b \sum_k \tilde{\rho}_k \sum_{|J_o|=j}^{|J_o|} \eta_{k\chi}(|J_o|) p(j|\tilde{J}_o,k,\chi) + (1-b) \sum_k \rho_k \ldots$$

其中 $b \in [0,1]$ 是工人对私人信息的权重。

最优出价的一阶条件 （从最大化期望效用的一阶导数 = 0）：

假设工人用一个标记价格 (markup pricing rule)，即：

$$w^*_{oj} = c_{oj}(1+\tau) \times \underbrace{\left[1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}\right]^{-1}}_{\text{最优加成}}$$

关键见解：

$$\text{最优加成} = 1 + \frac{E[\tilde{p}(j)]}{\text{需求对数价格半弹性}}$$

这遵循标准加成定价法则（如在产业组织中）：

$$\text{加成} = -\frac{1}{\varepsilon}$$

其中 $\varepsilon$ 是工人对其出价的聘用概率的需求弹性。

经济学直觉：

如果工人面临高需求弹性（聘用概率对出价敏感）→ 低加成 → 接近边际成本定价
如果工人面临低需求弹性（聘用概率对出价不敏感）→ 高加成 → 显著高于边际成本

子模型 III：工作发布到达过程 (Job Posting Process)

参与者：买方 $k$ 类型，经验 $\chi$，在时间序列中决定何时发布下一个工作

建模：指数到达过程，速率为：

$$\lambda^{Arrival}_{k\chi} = \exp(\delta^k_1 + \delta_2 \mathbb{1}(\chi > 0) + \delta_3 \hat{w}_{oj})$$

解读：

买方有一个"基础"工作发布速率 $\exp(\delta^k_1)$（类型相关）
获得经验后增加 $\times \exp(\delta_2)$
但曾经遇到高工资出价会阻止未来发布：$\delta_3 < 0$
- 当买方在过去工作中看到高工资时，他们减少未来发布
- 这意味着：高工资成本会抑制市场参与

为什么这很重要？这创造了政策分析中的动态乘数效应（见第 IV 部分）。

2.3 模型的五个关键假设

#	假设	经济学角色	现实性检验
1	工人出价是"要价不议价" (take-it-or-leave-it)	简化 — 允许集中定价	表 15（脚注）：初始出价和最终工资高度相关
2	买方独立选择考虑集大小（固定样本搜索）	使得搜索成本可识别	面试请求的时间戳聚集在早期（脚注 30）
3	工人知道申请顺序但不知道完整的考虑集大小	创建应用顺序作为工人力量的来源	83% 的被调查工人说他们基于先前申请者数量调整出价（第 I.B 节）
4	极值分布 $\varepsilon_{oj}$ 和考虑集是指数分布	计算便利性	使用灵敏度测试；在附录 C.C2 的最低工资中稳健
5	平台不改变算法或设计以应对政策	限制反事实分析的范围	脚注 31 中明确声明

3. 推导复现与教学

3.1 核心命题 I：考虑集加权的聘用概率

定理（方程 3）：

$$p(j|k,\chi) = \sum_{|J_o|=j}^{|J_o|} \eta_{k\chi}(|J_o|) \cdot p(j|\tilde{J}_o, k, \chi)$$

这是什么？这是边际概率 (marginal probability)，整合了所有可能的考虑集大小。

为什么需要这个？

申请者不知道买方会选择多大的考虑集
但他们知道：
- 考虑集大小的分布 $\eta_{k\chi}(|J_o|)$（从招聘数据估计的）
- 条件聘用概率，给定他们在考虑集中（方程 2）

一步步推导：

第 1 步：申请者 $j$ 的聘用概率取决于他是否被考虑和是否被选择给定考虑：

$$p(j|k,\chi) = P(\text{考虑} \cap \text{选择}) = \sum_{|J_o|=j}^{|J_o|} P(\text{考虑集大小是} |J_o|) \times P(\text{选择}|\text{在考虑集中})$$

第 2 步：申请者 $j$ 在大小为 $|J_o|$ 的考虑集中当且仅当 $j \leq |J_o|$（因为申请者按顺序到达，考虑集是连续的前 $|J_o|$ 名申请者）。

第 3 步：因此求和从 $|J_o|=j$ 开始（如果考虑集小于 $j$，申请者不被考虑）：

$$\boxed{p(j|k,\chi) = \sum_{|J_o|=j}^{|J_o|_{\max}} \eta_{k\chi}(|J_o|) \cdot \underbrace{\frac{\exp(X_j\beta^k_\chi - \alpha^k \log(w_{oj}))}{1 + \sum_{l=1}^{|J_o|}\exp(X_l\beta^k_\chi - \alpha^k \log(w_{ol}))}}_{\text{logit, 给定考虑集}}}$$

经济学意义：

这个概率考虑了两个独立的排斥机制：
1. 搜索摩擦排斥：申请者必须落在买方的考虑范围内
2. 竞争排斥：即使被考虑，申请者也必须战胜其他被考虑的申请者

3.2 核心命题 II：工人最优加成定价规则

定理（方程 6）：

$$w^*_{oj} = c_{oj}(1+\tau) \left[1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}\right]^{-1}$$

我们要推导这个。这里需要细致的经济学和数学。

3.2a 工人的最优化问题

第 1 步：写出工人的期望效用（方程 4）：

$$\max_{w_{oj}} E(U_{oj}) = E[\tilde{p}(j)] \cdot \exp(\log w_{oj} - \log(1+\tau)) + (1-E[\tilde{p}(j)]) \cdot c_{oj}$$

简化：

$$\max_{w_{oj}} E(U_{oj}) = E[\tilde{p}(j)] \cdot \frac{w_{oj}}{1+\tau} + (1-E[\tilde{p}(j)]) \cdot c_{oj}$$

第 2 步：这是什么样的优化问题？

$E[\tilde{p}(j)]$ 本身取决于 $w_{oj}$（更高的出价 → 更低的聘用概率）
这是一个内生性变量问题 — 价格既影响效用又影响成功概率

第 3 步：一阶条件（求导 w.r.t. $w_{oj}$ 并设为 0）：

$$\frac{\partial E(U_{oj})}{\partial w_{oj}} = \frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}} \cdot \frac{w_{oj}}{1+\tau} + E[\tilde{p}(j)] \cdot \frac{1}{1+\tau} + \frac{\partial(1-E[\tilde{p}(j)])}{\partial w_{oj}} \cdot c_{oj} = 0$$

第 4 步：简化。注意 $\frac{\partial(1-E[\tilde{p}(j)])}{\partial w_{oj}} = -\frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}}$：

$$\frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}} \left(\frac{w_{oj}}{1+\tau} - c_{oj}\right) + E[\tilde{p}(j)] \cdot \frac{1}{1+\tau} = 0$$

第 5 步：两边乘以 $(1+\tau)$：

$$\frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}} \left(w_{oj} - c_{oj}(1+\tau)\right) + E[\tilde{p}(j)] = 0$$

第 6 步：重新排列：

$$E[\tilde{p}(j)] = -\frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}} \left(w_{oj} - c_{oj}(1+\tau)\right)$$

第 7 步：两边除以 $\frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}}$（注意这是负的）：

$$\frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial w_{oj}} = -(w_{oj} - c_{oj}(1+\tau))$$

第 8 步：现在，转换为对数导数。这是关键技巧。

定义 对数价格的半弹性（semi-elasticity）：

$$\frac{\partial E[\tilde{p}(j)]}{\partial \log w_{oj}} = \frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}} \cdot w_{oj}$$

（这来自链式法则）

代入上面的方程：

$$\frac{E[\tilde{p}(j)]}{\frac{\partial E[\tilde{p}(j)]}{\partial \log w_{oj}} / w_{oj}} = -(w_{oj} - c_{oj}(1+\tau))$$$$\frac{E[\tilde{p}(j)] \cdot w_{oj}}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}} = -(w_{oj} - c_{oj}(1+\tau))$$

第 9 步：两边除以 $w_{oj}$：

$$\frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}} = -\frac{w_{oj} - c_{oj}(1+\tau)}{w_{oj}} = -\left(1 - \frac{c_{oj}(1+\tau)}{w_{oj}}\right)$$

第 10 步：设 $m = w_{oj} / (c_{oj}(1+\tau))$（加成，多少倍边际成本）。然后：

$$\frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}} = -(1 - 1/m) = \frac{-(m-1)}{m}$$

第 11 步：求解 $m$：

$$m = \frac{1}{1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}}$$

第 12 步：代入 $m = w_{oj} / (c_{oj}(1+\tau))$：

$$\boxed{w^*_{oj} = c_{oj}(1+\tau) \left[1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}\right]^{-1}}$$

这就是方程 6！

3.2b 经济学解读：加成定价规则

现在让我们看看这与产业组织中的标准加成规则的关系。

在完全竞争中，企业在边际成本处定价。在不完全竞争中，企业对其价格有权力。

标准的Lerner 指数定价规则是：

$$\frac{p - MC}{p} = -\frac{1}{\varepsilon^D}$$

其中 $\varepsilon^D$ 是需求价格弹性。

在工人的情况下，相当于：

$p = w_{oj}$（工人的"价格"）
$MC = c_{oj}(1+\tau)$（工人的边际成本）
$\varepsilon^D = \frac{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}{E[\tilde{p}(j)]}$（工人出价对聘用概率的需求弹性）

代入 Lerner 规则：

$$\frac{w_{oj} - c_{oj}(1+\tau)}{w_{oj}} = -\frac{1}{\varepsilon^D} = -\frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}$$

重新排列：

$$w_{oj} = c_{oj}(1+\tau) \left(1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}\right)^{-1}$$

这与方程 6 一致！

3.2c 工人成本的恢复公式

从最优出价反过来恢复成本 $c_{oj}$：

从方程 6：

$$c_{oj} = \frac{w_{oj}}{(1+\tau)} \left(1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}\right)$$

这是方程 7。

经济学意义：

给定我们估计的 $E[\tilde{p}(j)]$ 和 $\partial E[\tilde{p}(j)]/\partial \log w_{oj}$（来自需求估计）
以及观测到的出价 $w_{oj}$
我们可以反演工人的费用 $c_{oj}$

然后，工人剩余 = 被雇用的网工资 — 费用：

$$\text{工人剩余} = \frac{w_{oj}}{1+\tau} - c_{oj}$$

3.3 核心命题 III：识别策略——两个工具变量

这是计量经济学脊索。为什么我们需要工具变量？为什么这两个特定的工具变量有效？

3.3a 内生性问题

在方程 2（需求）中，我们想要估计 $\alpha^k$（买方对价格的敏感程度）。

但是 $w_{oj}$（工资出价）可能与 $\varepsilon_{oj}$（买方的个人偏好冲击）相关：

例如，“高质量"工人可能往往出价更高（他们知道他们值钱）
或者，“低质量"工人出价低，并且更有可能看到 $\varepsilon_{oj} < 0$（买方不喜欢他们）

如果 $\text{Cov}(w_{oj}, \varepsilon_{oj}) \neq 0$，那么 OLS 对 $\alpha^k$ 会有偏。

3.3b 工具变量策略的逻辑

工具变量 $Z$ 必须：

与内生变量相关：$\text{Cov}(Z, w_{oj}) \neq 0$ ✓
与误差项无关：$\text{Cov}(Z, \varepsilon_{oj}) = 0$ ✓ （外生性）

论文的想法：寻找改变工人费用的变量，从而改变他们的最优出价（通过方程 6），但不直接改变买方对工人的偏好。

3.3c 工具变量 #1：汇率变动

机制：

工人在美国以美元获得报酬
但他们在当地国家的机会成本（离线工作工资）以当地货币计算
汇率变动改变了美元工作相对于本地工作的价值

例子：

印度工人在 2008 年初：1 美元 = 40 卢比
2009 年底：1 美元 = 48 卢比（卢比贬值）
相同的美元出价现在价值更多卢比 → 工人对平台工作的吸引力更高 → 他们可以要求更高的出价 → $w_{oj}$ 上升

为什么这是有效的工具变量：

✓ 相关性：$Z_1 =$ 汇率与工资出价相关（表 3，第 1 列：系数 = 0.087，F 统计量 = 89.50）
✓ 外生性：买方看不到汇率（他们只看到以美元计算的出价）；买方不根据汇率做出决定
✓ 排斥限制：汇率变动不应改变工人的质量混合或买方对工人的偏好

排斥限制的三个测试（表 3，脚注）：

申请人特征几乎不随工具变量而变化（表 A.3）
工作应用数量不随工具变量而变化（表 A.4）
买方不根据汇率做出发布决定（Horton 2021）

3.3d 工具变量 #2：竞争强度

机制：

工人知道他们可以申请多个工作
如果同一类别中的其他工作吸引许多申请者，那么：
- 这些其他工作的竞争很激烈
- 工人对这些其他工作的成功概率较低
- 他们对当前工作的外部选择价值较低
- 他们应该在当前工作上出价更高来弥补较低的外部选择概率

例子：

当前工作：网络开发（周一发布）
同一周的其他网络开发工作：平均 50 个申请者
工人推断：竞争很激烈 → 应该专注于当前工作 → 出价更高

为什么这是有效的工具变量：

✓ 相关性：竞争与出价相关（表 3，第 1 列：系数 = -0.067，F-stat = 89.50）
✓ 外生性：竞争（其他买方的工作吸引的申请者数量）不受当前申请者出价质量的直接影响
✓ 排斥限制：竞争不应改变当前工人申请者的质量混合

注意一个微妙之处（脚注 20）：该论文对竞争工具变量进行了"预白化”，从中删除了时间和类别固定效应，以隔离幂等（特定于工作）的竞争变化。

3.4 核心命题 IV：估计策略——控制函数方法

这是结构计量经济学中处理内生性的一个巧妙方法，超越简单的 IV。

3.4a 控制函数的直觉

问题：即使我们有工具变量，我们也可能有未观测的混淆因素：

例如，申请人可能有不可观测的高质量，导致：
- 更高的出价（他知道他很有价值）
- 更高的被雇用概率（买方认识到他的质量）

这创造了 $w_{oj}$ 和 $\varepsilon_{oj}$ 之间的相关性，即使在控制已观测特征后也是如此。

解决方案：Petrin & Train 的控制函数方法（2010）：

第 1 步：从工具变量和观测到的特征运行第一阶段回归（方程 9）：

$$\log(w_{oj}) = Z_j\gamma_1 + X_j\gamma_2 + \nu_{oj}$$

获得残差：$\hat{\nu}_{oj} = \log(w_{oj}) - \hat{Z_j\gamma_1} - \hat{X_j\gamma_2}$

经济学解读：$\hat{\nu}_{oj}$ 捕捉出价中不能由工具变量或观测特征解释的部分。这是"未观测的申请人质量"的代理。

第 2 步：在需求方程中包括控制函数（方程 10）：

$$p(j|\tilde{J}_o, k, \chi) = \frac{\exp(X_j\beta^k_\chi - \alpha^k \log(w_{oj}) + \psi_{k\chi} \hat{\nu}_{oj})}{1 + \sum_{l \in \tilde{J}_o} \exp(\ldots)}$$

新项 $\psi_{k\chi} \hat{\nu}_{oj}$：如果 $\psi_{k\chi} > 0$，更高的残差（更高的未观测质量）增加聘用概率，正如预期的那样。

为什么有效：

如果残差与 $\varepsilon_{oj}$ 相关（即，它们捕捉相同的未观测因素），那么包括它作为控制变量会吸收内生性
剩余的参数估计（特别是 $\alpha^k$）现在基于外生变化（来自工具变量）

3.5 核心命题 V：买方剩余的计算

给定估计的参数，我们如何量化买方从交易中获得的价值？

3.5a 条件买方剩余（给定雇用）

定义：如果买方雇用工人 $j$，他会愿意支付多少额外费用，而不会受到伤害？

从买方的间接效用函数：

$$U_j = \frac{\exp(X_j\beta^k_\chi)}{w_{oj}^{\alpha^k}}$$

如果我们提高工资至 $w'_{oj}$，使得买方仍然得到相同的效用：

$$\frac{\exp(X_j\beta^k_\chi)}{(w'_{oj})^{\alpha^k}} = \frac{\exp(X_j\beta^k_\chi)}{w_{oj}^{\alpha^k}}$$

这意味着 $w'_{oj} = w_{oj}$（显然无趣）。

更好的定义：买方愿意为工人支付多少超过外部选择（不在平台上雇用）？

从方程（2），不雇用的间接效用是 $1$（规范化）。在平台上工作的间接效用是：

$$\frac{\exp(X_j\beta^k_\chi)}{w_{oj}^{\alpha^k}}$$

如果我们增加工资 $\Delta w$，买方在以下情况下与不雇用无差别：

$$\frac{\exp(X_j\beta^k_\chi)}{(w_{oj}+\Delta w)^{\alpha^k}} = 1$$

求解 $\Delta w$：

$$(w_{oj}+\Delta w)^{\alpha^k} = \exp(X_j\beta^k_\chi)$$$$w_{oj}+\Delta w = \exp\left(\frac{X_j\beta^k_\chi}{\alpha^k}\right)$$$$\Delta w = \exp\left(\frac{X_j\beta^k_\chi}{\alpha^k}\right) - w_{oj}$$

这是买方为雇用该工人而支付的最高工资与实际工资之间的差异。

在数据中我们没有直接观测 $X_j\beta^k_\chi$（它包含 $\varepsilon_{oj}$），所以我们：

从聘用决策中模拟 $\varepsilon_{oj}$（使用接受-拒绝）
计算 $X_j\beta^k_\chi + \varepsilon_{oj}$
计算剩余如上所示

3.5b 期望买方剩余（给定发布）

这考虑了工作可能无法填补的事实（在数据中，仅 20% 的工作被填满）。

使用消费者剩余的标准公式，与所有申请人的工资集成：

$$E(\text{剩余/小时})^{k\chi} = \int_0^\infty (1 - p(0|\tilde{J}_o, k, \chi)) \times (w^* - w) \, dw$$

其中 $p(0|\tilde{J}_o, k, \chi)$ 是"不雇用"的概率，$w^*$ 是有效"需求曲线"的截距。

直觉：

如果买方非常不愿意支付高工资（需求缺乏弹性），买方剩余很高
如果买方对工资很敏感（需求富有弹性），买方剩余很低

4. 估计结果的关键数字解读

现在我们有足够的理论背景，让我们解析主要数值结果（表 4-8）。

4.1 需求参数（表 4）：买方的三种类型

第一行：买方类型份额

类型 2（最常见）：76% 的买方
类型 3（中等）：20% 的买方
类型 1（活跃）：4% 的买方

第二行：工作填补弹性 (Job Fill Elasticity)

$$\varepsilon_{\text{fill}} = \frac{\partial \ln p(\text{hire})}{\partial \ln w}$$

类型 2 的 $\varepsilon_{\text{fill}} = -3.24$ 意味着：

如果所有工资增加 1%，填补概率降低 3.24%
这表明适度的需求缺乏弹性（但不是极端的）

类型 1（高销售额买方）的 $\varepsilon_{\text{fill}} = -4.53$ 意味着：

他们对价格更敏感 — 他们可能面临更强的竞争，需要货比三家

第三行：被考虑申请人的平均数

类型 2：15.38 申请人
类型 1：20.51 申请人
类型 3：21.29 申请人

解读：尽管类型 1 是最活跃的发布者，他们考虑更多申请人。这可能表明：

他们更谨慎（或优化程度较低）
或他们寻求更特殊的特征组合

第四行：经历后的月度工作发布频率

类型 2：0.09 工作/月 → 非常不活跃，一年仅 1 次工作
类型 1：4.23 工作/月 → 每周 1 次，持续业务
类型 3：0.70 工作/月 → 中等活跃

4.2 工人剩余（表 6）：标记定价

第 1 行：被雇用工人的每小时剩余 = **$1.97** SD = $1.63

这听起来不多，但记住：

他们已经赚取了他们的工资 $w_{oj}$
这是额外的经济剩余，超过他们的机会成本

第 2 行：标记 = 1.28 或 28%

经济学解读：

平均而言，工人出价是他们成本的 1.28 倍
他们建立 28% 的加成在他们的边际成本之上
这比完全竞争（加成 = 1.00）要大得多

为什么是 28% 而不是更高？

工人不是垄断企业；他们仍然面临相当多的竞争（平均 26 个申请者每个工作）
但搜索摩擦给了他们一些市场力量

对比：在一个单一底价拍卖中（所有申请人同时看到彼此的出价），加成会趋向 1.00。搜索摩擦推高了加成。

4.3 应用顺序效应（图 5 和 6）：搜索摩擦量化

图 5 说明：预期工人剩余如何随申请顺序下降

申请人 1-10：$2.18 预期剩余
申请人 11-20：$1.15（下降 47%）
申请人 21-30：$0.73（下降 67%）
申请人 31-40：$0.55（下降 75%）
申请人 40+：< 5% of hourly cost

经济学解读：

即使有很多申请者，早期的人获得巨大的优势
这是搜索摩擦量化
论文认为这种顺序偏差的稳健性非常高（附录表 A.2：每 10 位位置下降 = 0.57% 的交互概率）

模型验证（图 6）：

蓝色线（数据中的实际出价）：应用人 61-70 出价低 3.5% vs. 申请人 1-10
红色线（模型预测的标记）：应用人 61-70 出价低 2.4% vs. 申请人 1-10

模型捕捉了大约 68% 的顺序效应 (2.4% / 3.5%)。剩余 1.1% 可能来自：

样本稀疏（> 97% 的工作考虑 < 80 申请人）
模型中未捕捉的其他因素

5. 政策反事实：为什么监管会伤害工人

5.1 反事实设置

论文检验政策情景：对买方的工资出价征收 10% 税收（模仿 FICA 雇主税）。

两个版本：

主要：税收有常规的动态效应
替代：关闭"高工资 → 较低未来发布"的链接

5.2 逐步机制

阶段 1：工人对税收的响应

工人观察到买方的新实际成本增加了 10%。

他们预计：买方对工资更敏感（接受的工资出价必须补偿 10% 的税收）。

结果：工人提高他们的出价 8.8%（表 9，面板 A）来补偿降低的接受概率。

阶段 2：招聘率下降（静态）

较高的工资出价使买方的成本更高。

从需求曲线（方程 2），招聘概率下降 27%。

这本身就会伤害：

工人：聘用概率下降 → 预期收入下降
买方：聘用率下降 → 每份工作的剩余下降

阶段 3：长期效应 — 工作发布下降

这是关键的乘数效应。

从方程（8），买方的工作发布速率取决于他们过去看到的工资：

$$\log(\lambda^{\text{Arrival}}_{k\chi}) = \delta_1^k + \delta_2 \mathbb{1}(\chi > 0) + \delta_3 \hat{w}_{oj}$$

估计的 $\delta_3 = -2.02$（表 4，面板 D，最后一行），意思是：

如果过去工资 ↑ 1 个标准差 (0.037 log points)，
那么未来工作发布速率 ↓ $2.02 \times 0.037 = 7.6\%$

在反事实中，经历税收的买方观察到 8.8% 的更高工资。

这导致他们在未来发布更少工作。

经验买方（已经从事该平台）：工作发布 ↓ 67%（表 9，面板 B）

阶段 4：工人遭受最大伤害

较小的市场（更少的工作）比较少的招聘率更伤害工人，因为：

失业的固定组件变大（许多工人根本找不到工作）
聘用工人的剩余减少了 26%（静态）
但现值剩余减少了 59%，因为市场规模缩小

即使整个税收收入 ($) 被回扣给工人，net 效果仍然是负的 37%（表 9，面板 C，“P.V. 有税收回扣”）。

5.3 为什么政策分析困难：市场均衡的复杂性

这个反事实说明了为什么在市场中简单地"为工人提供补偿”不起作用：

市场规模减少了（较少的工作发布）
这对所有人都不利，包括获得补偿的工人
原因：买方对价格敏感（通过 $\delta_3 < 0$）

如果 $\delta_3 = 0$（买方对过去工资不敏感），然后：

工作发布保持不变
税收收入的全额回扣会使工人受益 12%（表 9，第 2 列，面板 C）

但估计显示 $\delta_3 \approx -2.02$，因此市场规模确实对政策敏感。

小白也能懂

目标： 不用死记硬背，通过“公式+直觉”的对应关系，彻底看懂结构估计是怎么跑出来的。

序言：结构估计的本质

想象你手里有一个**“模拟人生”游戏机**（这就是模型）。游戏机上有几个旋钮（参数 $\theta$），分别控制里面小人的“贪婪程度”、“懒惰程度”和“敏感程度”。

MLE（最大似然估计）的任务就是： 不断调节这几个旋钮，直到游戏机里小人做出的行为（发帖、雇佣、报价），和我们在现实数据里看到的行为一模一样。

模块一：买家选人模型 (Choice Model)

核心问题： 面对一堆简历，买家为什么选了 A 没选 B？

1. 核心公式 (Utility & Probability)

买家 $k$ 雇佣工人 $j$ 的效用函数（得分）：

$$U_{oj} = \underbrace{X_j \beta}_{\text{能力得分}} - \underbrace{\alpha \log(w_{oj})}_{\text{嫌贵扣分}} + \underbrace{\psi \cdot CF_{oj}}_{\text{质量补丁}} + \epsilon_{oj}$$

买家选择工人 $j$ 的概率（Logit 公式）：

$$P(\text{Hire } j) = \frac{\exp(U_{oj})}{\sum_{l \in \text{Seen}} \exp(U_{ol}) + \exp(U_{NoHire})}$$

2. 我们要估计谁？(Parameters)

$\alpha$ (价格弹性): 旋钮向右拧，买家变得超级抠门；向左拧，买家不在乎钱。
$\beta$ (特征偏好): 旋钮向右拧，买家超级看重学历/评分。
$\psi$ (内生性修正): 这是一个技术性参数，用来过滤掉“高价=高质量”的干扰。

3. 数据怎么告诉我们答案？(Identification)

识别 $\alpha$: 计算机扫描所有数据，发现：当工资 $w_{oj}$ 哪怕只高了一点点，雇佣率 $y_{oj}$ 就暴跌。
- 结论： 计算机把 $\alpha$ 调得很大（比如 -4.0）。
识别 $\beta$: 计算机发现：不管工资多高，只要是有“5 星好评”($X_j$) 的人，总能被录用。
- 结论： 计算机把 $\beta_{score}$ 调成正数。
识别 $\psi$: 计算机发现：有些人工资高得离谱，按理说 $\alpha$ 效应下不该被录用，但他还是被录用了。而且他的 IV 残差 $CF$ 很大（说明有不可观测的高能力）。
- 结论： 计算机调高 $\psi$，把这部分功劳归给“未观测质量”，而不是调低 $\alpha$。

模块二：买家搜索模型 (Search Model)

核心问题： 买家到底看了多少份简历？（这是本文最核心的创新）

1. 核心公式 (Consideration Set Probability)

买家只看前 $n$ 份简历的概率（指数分布）：

$$P(\text{Size} = n) = \lambda \cdot \exp(-\lambda \cdot n)$$

注意： 我们看不见 $n$ 是多少，我们只能看见申请顺序 (Order)。

2. 我们要估计谁？(Parameters)

$\lambda$ (搜索摩擦/懒惰系数):
- $\lambda$ 很大 $\rightarrow$ 买家很懒，看两眼就停了。
- $\lambda$ 很小 $\rightarrow$ 买家很勤快，会看很多份。

3. 数据怎么告诉我们答案？(Identification)

数据特征： 你的数据里有一列叫 Applicant_Order（申请顺序）。
识别逻辑：
- 情况 A： 数据显示，第 50、60、80 个申请者经常被录用。
  - 推理： 如果买家只看前 10 个，他绝不可能录用到第 80 个。能录用第 80 个，说明他肯定看得很深。
  - 操作： 计算机把 $\lambda$ 调小（勤快）。
- 情况 B： 数据显示，录用的全是前 5 名，第 10 名以后几乎没人被录用。
  - 推理： 买家大概率只看前几页。
  - 操作： 计算机把 $\lambda$ 调大（懒惰）。
一句话总结： 录用者的平均排位越靠后，估计出来的 $\lambda$ 越小。

模块三：动态发帖模型 (Posting Dynamics)

核心问题： 买家受了刺激以后，还会不会再来发帖？

1. 核心公式 (Hazard Rate)

买家在 $t$ 时刻发下一个帖子的概率（速率）：

$$\log(\text{Rate}) = \delta_0 + \delta_{Exp} \cdot \mathbb{1}(\text{IsExperienced}) + \delta_3 \cdot \log(\text{Past Prices})$$

2. 我们要估计谁？(Parameters)

$\delta_3$ (价格敏感度): 这是一个负数。表示过去被“宰”得越狠，未来发帖越少。

3. 数据怎么告诉我们答案？(Identification)

数据特征： 你有买家的历史记录。
- 买家 A：上次招人花了 $50/小时（很贵），结果过了 12 个月才发下一个帖。
- 买家 B：上次招人花了 $10/小时（便宜），结果过了 1 个月就发下一个帖。
识别逻辑： 计算机发现“历史高价”和“长发帖间隔”之间有强烈的正相关。
- 操作： 计算机把 $\delta_3$ 设为一个显著的负数（如 -2.02）。
作用： 这个参数直接决定了反事实模拟中，收税会导致市场规模萎缩多少。

模块四：供给侧成本反推 (Supply Side Inversion)

核心问题： 工人心里到底怎么想的？成本是多少？

1. 核心公式 (Inverse Elasticity Rule)

这是基于 FOC 推导出来的“读心术”公式：

$$\text{Cost} = \frac{\text{Wage}}{1 + \text{Markup}}$$

其中，加价率（Markup）完全取决于工人感知的需求弹性：

$$\text{Markup} = \frac{1}{\text{Elasticity}(\hat{\alpha}, \hat{\beta}, \hat{\lambda}, b)}$$

2. 我们要估计谁？(Parameters)

$b$ (信息权重): 工人有多信赖自己看到的私有信号？
- $b=0$: 工人很傻，觉得所有买家都一样。
- $b=1$: 工人很精，知道这个买家特抠门，那个特大方。

3. 数据怎么告诉我们答案？(Identification via NLLS)

前提： 我们已经用 MLE 拿到了 $\hat{\alpha}, \hat{\beta}, \hat{\lambda}$。
识别逻辑：
- 观察同一个工人，这周申了两个类似的工作。
- 工作 A 他报价 $10，工作 B 他报价 $15。为什么变了？
- 因为他对工作 A 的买家和工作 B 的买家有不同的预期（信号）。
- 如果 $b=0$，模型预测他的报价应该不变（都看平均）。
- 如果 $b=1$，模型预测他的报价应该剧烈波动。
操作： 计算机调整 $b$，使得模型预测的工资方差 $\approx$ 数据里的真实工资方差。

终极总结表：参数-数据的一一映射

步骤	这里的参数…	是通过看这个数据…	由这个机制锁定的
MLE (需求)	$\alpha$ (价格敏感)	工资高低 vs 录用率	越贵越没人要 $\rightarrow$ $\alpha$ 越大
MLE (需求)	$\beta$ (偏好)	评分高低 vs 录用率	评分高总被录 $\rightarrow$ $\beta$ 越大
MLE (搜索)	$\lambda$ (懒惰)	申请顺序 vs 录用率	越靠后越没人要 $\rightarrow$ $\lambda$ 越大 (懒)
MLE (动态)	$\delta_3$ (回头客)	历史价格 vs 下次发帖时间	以前买贵了就不来了 $\rightarrow$ $\delta_3$ 越负
NLLS (供给)	$b$ (信息)	同一工人的工资波动	报价忽高忽低 $\rightarrow$ $b$ 越大 (信信号)

博士生复现 Checklist

如果你要自己做，哪怕数据换了（比如换成 Airbnb 或 Uber），这套逻辑是不变的：

建 Likelihood： 把模块一、二、三的概率乘起来。
喂数据： 主要是 Hire, Wage, Order, Time_Gap 这四列。
求极值： 让计算机跑 MLE，得到 $\hat{\alpha}, \hat{\lambda}, \hat{\delta}$。
反推成本： 用 $\hat{\alpha}$ 算出弹性，反推 Cost。
拟合波动： 用 Wage 的方差定出 $b$。
模拟政策： 改税率，用 $\hat{\delta}$ 算市场萎缩。

现在，你应该能清晰地看到每一个希腊字母背后，是哪一列数据在起作用了。