欢迎光临寒舍

谁从在线零工经济平台中获益?—— Stanton & Thomas (2025) 结构化估计方法论深度解析

2507 字

结构化估计方法论深度解析报告 —— 基于 Stanton & Thomas (2025) 的逆向工程

估计技巧: 极大似然估计 (MLE) + 控制函数法 (Control Function) + 有限混合模型 (Finite Mixture Model)。

第一步:理论构建 —— 搭骨架 (Theoretical Derivation)

任务: 建立一个数学世界,描述买家和工人是怎么思考的。

  • 逻辑:
  1. 买家(需求方): 面对几百份简历,买家是“有限理性”的。他们只看前 份(搜索摩擦),然后在里面挑一个性价比最高的(Logit 选择)。
  2. 工人(供给方): 工人很聪明。他们知道买家“懒”(只看前几份)且“挑剔”(对价格敏感)。所以工人根据自己被看到的概率和买家的敏感度,设定一个最优工资 (加价)。

工人知道买家有摩擦,所以工人有局部市场势力。

数学形式: 逆弹性法则(Inverse Elasticity Rule)。

$$\text{Markup} = \frac{1}{\text{Elasticity of Demand}}$$

工资是观测到的,弹性是估计出来的。通过这个公式,我们可以倒推出不可观测的机会成本。

  • 方法: 博弈论与最优化推导
  • 买家效用最大化 导出 Logit 概率公式。
  • 工人期望利润最大化 对 求导(FOC) 导出 “逆弹性加价法则”()。

我们可以得到经典的逆弹性定价公式(Lerner Index 的变体):

$$\text{Markup} = \frac{\text{Net Wage}}{\text{Cost}} = \left( 1 + \frac{E[\tilde{p}]}{\partial E[\tilde{p}] / \partial \log w_{oj}} \right)^{-1}$$

或者写成原文 Equation (7) 的反函数形式,用来反推成本:

$$c_{oj} = \frac{w_{oj}}{1+\tau} \left( 1 + \frac{E[\tilde{p}]}{\partial E[\tilde{p}] / \partial \log w_{oj}} \right)$$
  • 地位: 这是纯理论推导。不涉及数据,只涉及假设。这是整个大厦的蓝图。

第二步:需求侧参数估计 —— 填肉 (Empirical Estimation)

任务: 理论骨架搭好了,但具体的参数是多少?买家到底有多懒()?对价格到底有多敏感()?这需要问数据。

  • 逻辑:
  1. 我们观察到买家雇佣了谁,没雇佣谁。
  2. 我们利用**“申请顺序”**作为线索:如果买家经常雇佣第 50 个申请者,说明他不懒;如果只雇前 5 个,说明他很懒。这识别了搜索参数。
  3. 我们利用**“工资变动”**作为线索:工资涨 1 块钱,雇佣概率掉多少?这识别了价格弹性 。
  4. 难点(内生性): 高工资可能意味着高质量。为了把“纯价格影响”剥离出来,作者用了工具变量(IV)——汇率变化和竞争程度。
  • 方法: 最大似然估计 (MLE) + 控制函数法 (Control Function)

  • 数据: 17 万个职位的详细流水(谁申请了、什么时间申请、报价多少、最后雇了谁)。

  • 地位: 这是实证估计。这是全篇最硬核、工作量最大的部分。Table 4 的参数就是这一步的产出。

如果你拿到了数据,该按什么顺序操作?

第一阶段:准备与降噪 (Data Prep & First Stage)

目标: 清洗数据,并处理价格内生性。

定义“顺序 (Order)”: 必须精确计算每个申请者是第几个提交的。这是识别搜索摩擦的唯一抓手。

运行第一阶段回归 (Equation 9):

回归方程:$\log(w_{oj}) = \text{IVs} + \text{Controls} + \nu_{oj}$

IV 选择:汇率(供给冲击)、竞争对手申请量(竞争预期)。

产出: 提取残差 $\hat{\nu}_{oj}$,记为 $CF_{oj}$。

第二阶段:结构参数估计 (Structural Estimation)

目标: 获得 $\alpha$(价格敏感度)、$\beta$(偏好)、$\lambda$(搜索范围)。

构建似然函数 (The Grand Likelihood):你需要写一个程序(Python/Julia/Matlab),计算观察到当前数据的概率。

输入: 参数猜测值 $\theta$。

循环: 遍历每个买家 $i$。

步骤 A: 计算关注集概率(看了多少人?)。

步骤 B: 计算选择概率(雇了谁?)。注意,要把 $CF_{oj}$ 作为控制变量加进去:$U = X\beta - \alpha P + \psi CF$。

步骤 C: 计算发帖间隔概率(多久发一次?)。

混合 (Mixture): 假设有 3 种买家类型,加权求和:$L_i = \sum \rho_k L_{ik}$。

最大化: 使用优化算法(如 BFGS 或 Nelder-Mead)寻找让 $L$ 最大的 $\theta$。


第三步:供给侧成本反推 —— 读心术 (Calibration / Fitting)

任务: 我们想算工人赚了多少钱(剩余),等于“工资 - 成本”。工资数据里有,但工人的心理成本(机会成本)是看不见的。我们需要“算出”它。

  • 逻辑:
  1. 回到第一步的理论公式:。
  2. 利用第二步估计出的参数(),我们可以算出每个工人面临的需求弹性
  3. 把弹性代入公式,算出工人的 Markup(加价率)
  4. 最后,成本 = 工资 / (1 + Markup)

目标: 计算剩余。

计算弹性: 利用估计出的 $\hat{\theta}$,为每个工人计算其面临的需求弹性 $\epsilon_{oj}$。

计算成本: 代入公式 $c_{oj} = w_{oj} / (1 + \frac{1}{\epsilon_{oj}})$。

计算剩余: $\text{Surplus} = w_{oj} - c_{oj}$。

作者如何确保估计出的 $\alpha$(价格敏感度)是准确的?他们使用了工具变量(IV):

  • 汇率冲击: 影响工人的外部机会成本(供给移动),从而识别需求曲线。

  • 竞争对手的申请量: 影响工人的竞争预期,移动报价。

还有一个小细节(拟合): 工人其实不知道买家确切是哪种类型(Type 1, 2, 3),只能猜。工人对私有信号赋予多大权重(参数 )?

  • 作者通过非线性最小二乘法(NLLS),寻找一个 值,使得模型预测的工资方差与数据中的实际方差最接近。

  • 方法: 校准 (Calibration) / 拟合 (Fitting)

  • 使用结构方程反推不可观测变量。

  • 地位: 这是连接估计与福利分析的桥梁。Table 6 的结果(工人加价 28%)就是这一步的产出。

控制函数法

买家的效用函数包含工资 $w_{oj}$。但是,$w_{oj}$ 可能与不可观测的工人质量 $\xi_{j}$ 相关(高质量工人要价高)。如果不处理,价格系数 $\alpha$ 会有偏差(Bias toward zero),导致需求看起来缺乏弹性。

作者假设内生性来源于一个可加的误差项。

第一阶段回归 (First Stage Regression - Equation 9): 我们将内生的工资 $w_{oj}$ 对所有外生变量($X_j$)和工具变量($Z_j$)回归:

$$\log(w_{oj}) = Z_j \gamma_1 + X_j \gamma_2 + \nu_{oj}$$

$Z_j$ (IVs):

汇率冲击 (Exchange Rate): 移动工人的保留工资(成本侧移动)。

竞争程度 (Competition): 同类工作在其他买家那里的申请量(影响工人的加价策略)。

$\nu_{oj}$: 回归残差。这个残差包含了“未能被可观测变量解释的价格部分”,即不可观测的质量冲击。

构建控制变量: 计算出估计残差 $\hat{\nu}_{oj} = CF_{oj}$。将这个 $\hat{CF}_{oj}$ 直接作为回归元(Regressor)放入第二阶段的效用函数中。

构建买家效用与选择模型 (The Choice Model)

效用函数 (Utility Function)

买家 $k$(拥有经验 $x$)雇佣工人 $j$ 的间接效用为:

$$U_{ojk} = \underbrace{X_j \beta_{k\chi}}_{\text{Observed Quality}} - \underbrace{\alpha_k \log(w_{oj})}_{\text{Disutility of Price}} + \underbrace{\psi_{k\chi} \hat{CF}_{oj}}_{\text{Correction for Endogeneity}} + \epsilon_{oj}$$

$\hat{CF}_{oj}$ 的作用: 它作为不可观测质量的代理变量。$\psi > 0$ 意味着价格高出预期的部分通常代表高质量。通过控制它,$\alpha_k$ 就能纯粹地捕捉买家对价格的敏感度。

条件 Logit 概率 (Conditional Logit - Equation 10)

给定买家实际看了集合 $J_o$ 里的工人,选择工人 $j$ 的概率是:

$$p(j | J_o, k, \chi) = \frac{\exp(V_{ojk})}{\sum_{l \in J_o \cup \{0\}} \exp(V_{olk})}$$

其中 $V_{ojk} = X_j \beta - \alpha \log w + \psi \hat{CF}$。选项 $\{0\}$ 代表不雇佣(Outside Option)。


第四步:反事实模拟(动态模拟)

任务: 政策制定者想知道,如果收 10%的税,市场会变成什么样?既然我们有了模型(骨架)和参数(血肉),我们就可以造一个“平行宇宙”来实验。

  • 逻辑:
  1. 静态模拟: 强制给工资加 10% 的税 代入模型 算出新的需求弹性 工人调整报价 买家减少雇佣。
  2. 动态模拟(最关键):
  • 今天少雇佣一个人 明天少一个“有经验的买家”。
  • 今天价格变高 买家因为厌恶高价(参数 ),下个月发帖频率降低。
  1. 在这条逻辑链上,让计算机模拟 30 个月,看最终剩下的“蛋糕”(总剩余)变小了多少。
  • 方法: 数值模拟 (Numerical Simulation)

  • 不使用新数据,而是使用第二步估计出的参数()生成新数据。

  • 地位: 这是应用分析。Table 9 的政策建议就是这一步的产出。

到达率 (Arrival Rate - Equation 8): 买家发布下一个工作的速率 $\lambda^{ARRIVAL}$ 建模为:

$$\log(\lambda_{k\chi}^{ARRIVAL}) = \delta_{1k} + \delta_2 \mathbb{1}(\chi > 0) + \delta_3 \log(\bar{w}_{past})$$

关键参数 $\delta_3$: 买家对“过去价格”的敏感度。如果过去的工资很高,买家可能会减少未来的发帖。这是连接静态均衡和动态市场规模的关键机制。

目标: 政策评估。

设定冲击: 比如税收 $t=10\%$。

求解新均衡:

工人重新优化报价 $w'$。

买家面对新价格 $w'$,调整雇佣概率 $p'$。

动态演化: 模拟未来 30 个月。如果 $T=1$ 时期没雇人,买家在 $T=2$ 就无法积累经验,且可能因为高价而减少发帖。计算总损失。


极大似然估计

将上述所有部分拼在一起,一个买家的似然函数贡献 $L_k$ 包含三部分乘积:

选择概率: $\prod_o p(j | J_o, k, \chi)$ —— 给定关注集,选了谁?

关注集概率: $\prod_o \eta(|J_o|)$ —— 看了多少人?

发帖时间概率: $\prod_o f(t_{arrival})$ —— 多久发一次帖?


核心重温:成本反推

完成需求侧估计后,我们得到了买家的参数($\alpha, \beta$)。现在我们需要知道工人的剩余(Wages - Costs)。但是成本(Costs)是不可观测的。

A. 结构方程反推 (Structural Inversion)

作者利用工人的最优报价一阶条件(FOC)来反推成本。

逻辑: 工人设定工资 $w_{oj}$ 以最大化期望利润。根据逆弹性法则,最优工资是成本乘以一个加价(Markup)。

公式 (Equation 7):

$$c_{oj} = \frac{w_{oj}}{1+\tau} \left( 1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)] / \partial \log w_{oj}} \right)$$

$w_{oj}$:观测到的工资。

括号内的项:完全由需求侧参数决定的加价倒数。因为我们已经估计出了需求参数,所以这一项是已知的(取决于工人对买家的预期)。

$c_{oj}$:被反推出来的隐性成本。

B. 校准信息权重 $b$ (Fitting the Information Weight via NLLS)

问题: 工人计算加价时,依赖于他认为买家是哪种类型(Type 1, 2, or 3)。工人有一个猜测公式:

$$\text{Belief}_k = b \cdot \text{Signal}_k + (1-b) \cdot \text{PopulationAvg}_k$$

这里的 $b$ 是未知的。如果 $b=0$,工人只看平均值;如果 $b=1$,工人完全信任私有信号。

NLLS 拟合思路:作者利用**“同一工人在短时间内的报价变化”**来识别 $b$。

假设: 同一个工人,在同一周、同一类工作中,其成本 $c_{oj}$ 是不变的。

方差来源: 如果成本不变,为什么他在 Job A 报价 $10,在 Job B 报价 $12?唯一的解释是:他对 Job A 和 Job B 的买家类型预期不同(信号不同),导致他设定的 Markup 不同。

方程构建:对工资公式取对数:

$$\log(w_{oj}) = \log(c_{\text{worker,week}}) + \log(\text{Markup}_{oj}(b)) + \text{Constants}$$

移项并去除固定效应(Fixed Effects):

$$\log(w_{oj}) - \overline{\log(w)} \approx \log(\text{Markup}_{oj}(b)) - \overline{\log(\text{Markup}(b))}$$

左边:数据中观察到的工资波动。

右边:模型预测的加价波动(它是参数 $b$ 的函数)。

求解: 使用非线性最小二乘法 (NLLS) 搜索一个最优的 $b$,使得左右两边的差异最小。

结论: 这一步不仅仅是计算,而是一个巧妙的识别策略——利用工资的变动率(Variation)来推测信息的精确度(Information Precision)。

总结:一张表看懂递进关系

步骤 环节 核心问题 方法 / 手段 使用数据 对应结果
1 理论推导 世界是如何运作的? 效用最大化、FOC 无(纯数学) Eq (2), (6)
2 实证估计 买家有多挑剔/多懒? MLE + IV (控制函数) 17 万职位、440 万申请、汇率数据 Table 4 (弹性参数)
3 拟合/校准 工人的成本是多少? 反推 (Inversion) + NLLS 观测到的工资 Table 6 (剩余/加价)
4 数值模拟 收税会有什么后果? 动态模拟算法 估计出的参数 Table 9 (福利变化)

通俗得说:

  1. 理论: 画图纸(造人逻辑)。
  2. 估计: 填数据(量出这个人的身高体重、脾气秉性)。
  3. 校准: 读心术(根据他的行为推测他心里的底线)。
  4. 模拟: 做实验(打他一拳,看他怎么反应,以及明天还会不会来)。

希望这个梳理能帮你打通任督二脉!结构化模型看似复杂,核心就是这四步走的逻辑闭环。


《谁从在线零工经济平台中获益?》深度解构

执行摘要

这是一篇结构计量经济学论文,其核心贡献在于:用一个精心设计的需求-供给结构模型来量化双边市场(买方与卖方)的剩余分配。我将带你从理论动机开始,逐层剥开这个模型的数学与经济学内核。


1. 理论动机与直觉

1.1 核心经济学权衡

这篇论文处理的是一个表面上的悖论

在一个买方市场 (buyer’s market)——即申请者(卖方)远远超过工作机会(买方需求)的市场中,经济学的传统直觉认为:

  • 竞争应该摧毁工人的议价权,工资应该被压低至保留工资 (reservation wage)
  • 工人应该赚取零经济剩余 (zero economic surplus)

但现实观察 (Figure 2):

  • 每月平均 16,600 名申请者竞争仅 5,600 个工作
  • 仅有 1,100 名工人被雇用
  • 尽管竞争激烈,论文的核心发现是工人实际上捕获了 46%的总剩余,平均每小时赚取 $1.97 的经济剩余

问题的经济学本质:为什么工人没有被竞争压低到保留工资?

1.2 现有文献的缺口

传统劳动经济学框架(例如完全竞争模型、单一底价拍卖)假设:

  1. 工人是同质的 (homogeneous)——一个简单的劳动力模型足以理解市场
  2. 信息完全且搜索无摩擦 (frictionless)——买方考虑所有申请者,所有工人知道所有工作

这些假设对在线零工市场完全不适用,理由是:

假设 现实 后果
工人同质性 工人高度异质(技能、声誉、地点、可用性不同) 简化的竞争模型低估工人剩余
完全信息 买方有有限的搜索能力,只考虑小部分申请者 搜索摩擦产生市场力量
无差异工人 图 A.1 显示:即使在最低工资十分位数,也仅有~10% 的工作被分配给最低出价者 工人差异化 (differentiation) 给予市场力量

1.3 核心机制:两股力量维系工人剩余

作者论证两个独立且互补的机制解释为什么工人不被竞争压垮:

机制 A:工人差异化 (Worker Differentiation)

经济学直觉:买方不是在雇用"劳动力单位",而是在匹配特定工人。

  • 论文量化发现(表 4):工人特征标准差变化产生的需求效应 ≈ 38% 的工资变化
  • 这意味着:即使有很多申请者,买方仍倾向于特定工人
  • 结果:工人获得局部垄断力量——特定工人不是完全可替代的

数学对应:模型的择偶函数(方程 2)采用 logit 形式,其中:

$$U = X_j \beta^k_\chi - \alpha^k \log(w_{oj}) + \varepsilon_{oj}$$

工人特征 $X_j$ 的系数 $\beta^k_\chi$ 相对于价格敏感性系数 $\alpha^k$ 很大 → 工人不是价格的完美替代品

机制 B:买方搜索摩擦 (Buyer Search Frictions)

经济学直觉:买方审查申请者是有成本的(时间、认知负荷)。

实证事实(表格 A.2, 图 3):

  • 平均而言,买方只考虑 18 名申请者
  • 申请顺序是强有力的预测因子:
    • 前 10 名申请者被互动概率:>20%
    • 第 45 名申请者被互动概率:<5%
  • 这远不是随机的——是有序偏差 (order bias)

结果

  1. 早期申请者获益(他们面临更少有效竞争)
  2. 搜索摩擦限制了头对头竞争(many applicants never face each other)
  3. 即使有 1000 名申请者,对第 40 名之后申请者的就业概率影响很小

数学对应:模型明确建模考虑集大小的分布 $\eta^{Consider}_{k\chi}(|J_o|)$,以及招聘概率受到的影响:

$$p(j|k,\chi) = \sum_{|J_o|=j}^{|J_o|} \eta_{k\chi}(|J_o|) \cdot p(j|\tilde{J}_o, k, \chi)$$

这里求和仅越过那些包含工人 $j$ 的考虑集——搜索摩擦将劲敌的数量限制在 18 左右。

1.4 关键洞察总结

驱动力 对工人的影响 论文中的量化证据
工人差异化 买方愿意为特定工人支付更高工资 Xβ 标准差变化 = 38% 工资变化
搜索摩擦 竞争限制到~18 名考虑申请者 平均考虑集大小=18.09(表 4)
两者交互 早期申请者:低竞争 + 高差异化溢价 预期剩余随申请顺序下降(图 5)

2. 模型解剖

2.1 模型的"骨架":三个子游戏

这个模型实际上是一个动态的三层结构

1
2
3
4
5
6
时间轴:
t=0: 买方决定是否发布工作
t=0+: 工人观察工作,决定申请和出价
t=1: 买方选择考虑哪些申请者
t=2: 买方在考虑集中选择雇用谁(或不雇用)
t=3: 工作执行,未来工作发布

2.2 三个相互关联的子模型

子模型 I:需求模型 (Demand Model) — 给定考虑集的购买选择

参与者:一个特定买方 $k$ 类型,经验水平 $\chi$,在职位 $o$ 考虑申请者集合 $\tilde{J}_o \subseteq J_o$

买方的目标函数(间接效用):

$$U_j = \frac{\exp(X_j\beta^k_\chi + \varepsilon_{oj})}{(w_{oj})^{\alpha^k}}$$

经济学解读

  • 分子 $\exp(X_j\beta^k_\chi + \varepsilon_{oj})$:工人的"质量" = 可观测特征(经验、反馈、技能)+ 买方的主观偏好冲击
  • 分母 $(w_{oj})^{\alpha^k}$:工人成本(工资出价)
  • 指数 $\alpha^k$:衡量买方对价格的敏感程度
    • 如果 $\alpha^k$ 很大 → 买方对价格敏感 → 市场竞争激烈
    • 如果 $\alpha^k$ 很小 → 买方对价格不敏感 → 工人有市场力量

买方选择:雇用使得 $U_j$ 最大的申请者 $j^* \in \tilde{J}_o$,或选择"不在平台上雇用"(选择项 0)

概率形式(logit,假设 $\varepsilon_{oj}$ 是 I.I.D. 类型 I 极值分布):

$$p(j|\tilde{J}_o, k, \chi) = \frac{\exp(X_j\beta^k_\chi - \alpha^k \log(w_{oj}))}{1 + \sum_{l \in \tilde{J}_o} \exp(X_l\beta^k_\chi - \alpha^k \log(w_{ol}))}$$

为什么是 logit

  • 数学上:便利性 → 闭式解
  • 经济上:反映买方的"随机偏好异质性"——即使给定可观测特征,买方也有变化的个人偏好

子模型 II:供给模型 (Supply Model) — 工人的最优出价

参与者:工人 $j$ 在职位 $o$ 决定工资出价 $w_{oj}$

时间序列

  1. 工人观察职位、已有申请数量、自己的成本 $c_{oj}$
  2. 工人形成对被雇用概率的预期 $E[\tilde{p}(j)]$
  3. 工人选择 $w_{oj}$ 以最大化期望效用

工人的期望效用函数

$$E(U_{oj}(w_{oj})) = E[\tilde{p}(j)] \times \frac{w_{oj}}{1+\tau} + (1-E[\tilde{p}(j)]) \times c_{oj}$$

解读

  • 第一项:被雇用的概率 × 净工资(扣除平台费用 $\tau=10\%$)
  • 第二项:未被雇用 → 获得机会成本 $c_{oj}$(离线替代品)
  • 关键:工人的出价 $w_{oj}$ 影响 $E[\tilde{p}(j)]$
    • 更高的出价 → 更低的聘用概率(买方对高价格敏感)
    • 更低的出价 → 更高的聘用概率(但收益更少)

工人的信息结构(这是关键!):工人不知道买方的真实类型 $k$,而是基于:

  • 总体买方类型分布 $\rho_k$(她知道这个)
  • 关于这个特定买方类型的私人信号 $\tilde{\rho}_k$(她有一个嘈杂信号)

她形成的聘用概率期望是这两者的加权平均:

$$E[\tilde{p}(j)] = b \sum_k \tilde{\rho}_k \sum_{|J_o|=j}^{|J_o|} \eta_{k\chi}(|J_o|) p(j|\tilde{J}_o,k,\chi) + (1-b) \sum_k \rho_k \ldots$$

其中 $b \in [0,1]$ 是工人对私人信息的权重。

最优出价的一阶条件 (从最大化期望效用的一阶导数 = 0):

假设工人用一个标记价格 (markup pricing rule),即:

$$w^*_{oj} = c_{oj}(1+\tau) \times \underbrace{\left[1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}\right]^{-1}}_{\text{最优加成}}$$

关键见解

$$\text{最优加成} = 1 + \frac{E[\tilde{p}(j)]}{\text{需求对数价格半弹性}}$$

这遵循标准加成定价法则(如在产业组织中):

$$\text{加成} = -\frac{1}{\varepsilon}$$

其中 $\varepsilon$ 是工人对其出价的聘用概率的需求弹性。

经济学直觉

  • 如果工人面临高需求弹性(聘用概率对出价敏感)→ 低加成 → 接近边际成本定价
  • 如果工人面临低需求弹性(聘用概率对出价不敏感)→ 高加成 → 显著高于边际成本

子模型 III:工作发布到达过程 (Job Posting Process)

参与者:买方 $k$ 类型,经验 $\chi$,在时间序列中决定何时发布下一个工作

建模:指数到达过程,速率为:

$$\lambda^{Arrival}_{k\chi} = \exp(\delta^k_1 + \delta_2 \mathbb{1}(\chi > 0) + \delta_3 \hat{w}_{oj})$$

解读

  • 买方有一个"基础"工作发布速率 $\exp(\delta^k_1)$(类型相关)
  • 获得经验后增加 $\times \exp(\delta_2)$
  • 曾经遇到高工资出价会阻止未来发布:$\delta_3 < 0$
    • 当买方在过去工作中看到高工资时,他们减少未来发布
    • 这意味着:高工资成本会抑制市场参与

为什么这很重要?这创造了政策分析中的动态乘数效应(见第 IV 部分)。

2.3 模型的五个关键假设

# 假设 经济学角色 现实性检验
1 工人出价是"要价不议价" (take-it-or-leave-it) 简化 — 允许集中定价 表 15(脚注):初始出价和最终工资高度相关
2 买方独立选择考虑集大小(固定样本搜索) 使得搜索成本可识别 面试请求的时间戳聚集在早期(脚注 30)
3 工人知道申请顺序但不知道完整的考虑集大小 创建应用顺序作为工人力量的来源 83% 的被调查工人说他们基于先前申请者数量调整出价(第 I.B 节)
4 极值分布 $\varepsilon_{oj}$ 和考虑集是指数分布 计算便利性 使用灵敏度测试;在附录 C.C2 的最低工资中稳健
5 平台不改变算法或设计以应对政策 限制反事实分析的范围 脚注 31 中明确声明

3. 推导复现与教学

3.1 核心命题 I:考虑集加权的聘用概率

定理(方程 3):

$$p(j|k,\chi) = \sum_{|J_o|=j}^{|J_o|} \eta_{k\chi}(|J_o|) \cdot p(j|\tilde{J}_o, k, \chi)$$

这是什么?这是边际概率 (marginal probability),整合了所有可能的考虑集大小。

为什么需要这个

  • 申请者不知道买方会选择多大的考虑集
  • 但他们知道:
    • 考虑集大小的分布 $\eta_{k\chi}(|J_o|)$(从招聘数据估计的)
    • 条件聘用概率,给定他们在考虑集中(方程 2)

一步步推导

第 1 步:申请者 $j$ 的聘用概率取决于他是否被考虑和是否被选择给定考虑:

$$p(j|k,\chi) = P(\text{考虑} \cap \text{选择}) = \sum_{|J_o|=j}^{|J_o|} P(\text{考虑集大小是} |J_o|) \times P(\text{选择}|\text{在考虑集中})$$

第 2 步:申请者 $j$ 在大小为 $|J_o|$ 的考虑集中当且仅当 $j \leq |J_o|$(因为申请者按顺序到达,考虑集是连续的前 $|J_o|$ 名申请者)。

第 3 步:因此求和从 $|J_o|=j$ 开始(如果考虑集小于 $j$,申请者不被考虑):

$$\boxed{p(j|k,\chi) = \sum_{|J_o|=j}^{|J_o|_{\max}} \eta_{k\chi}(|J_o|) \cdot \underbrace{\frac{\exp(X_j\beta^k_\chi - \alpha^k \log(w_{oj}))}{1 + \sum_{l=1}^{|J_o|}\exp(X_l\beta^k_\chi - \alpha^k \log(w_{ol}))}}_{\text{logit, 给定考虑集}}}$$

经济学意义

  • 这个概率考虑了两个独立的排斥机制
    1. 搜索摩擦排斥:申请者必须落在买方的考虑范围内
    2. 竞争排斥:即使被考虑,申请者也必须战胜其他被考虑的申请者

3.2 核心命题 II:工人最优加成定价规则

定理(方程 6):

$$w^*_{oj} = c_{oj}(1+\tau) \left[1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}\right]^{-1}$$

我们要推导这个。这里需要细致的经济学和数学。

3.2a 工人的最优化问题

第 1 步:写出工人的期望效用(方程 4):

$$\max_{w_{oj}} E(U_{oj}) = E[\tilde{p}(j)] \cdot \exp(\log w_{oj} - \log(1+\tau)) + (1-E[\tilde{p}(j)]) \cdot c_{oj}$$

简化:

$$\max_{w_{oj}} E(U_{oj}) = E[\tilde{p}(j)] \cdot \frac{w_{oj}}{1+\tau} + (1-E[\tilde{p}(j)]) \cdot c_{oj}$$

第 2 步:这是什么样的优化问题?

  • $E[\tilde{p}(j)]$ 本身取决于 $w_{oj}$(更高的出价 → 更低的聘用概率)
  • 这是一个内生性变量问题 — 价格既影响效用影响成功概率

第 3 步:一阶条件(求导 w.r.t. $w_{oj}$ 并设为 0):

$$\frac{\partial E(U_{oj})}{\partial w_{oj}} = \frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}} \cdot \frac{w_{oj}}{1+\tau} + E[\tilde{p}(j)] \cdot \frac{1}{1+\tau} + \frac{\partial(1-E[\tilde{p}(j)])}{\partial w_{oj}} \cdot c_{oj} = 0$$

第 4 步:简化。注意 $\frac{\partial(1-E[\tilde{p}(j)])}{\partial w_{oj}} = -\frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}}$:

$$\frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}} \left(\frac{w_{oj}}{1+\tau} - c_{oj}\right) + E[\tilde{p}(j)] \cdot \frac{1}{1+\tau} = 0$$

第 5 步:两边乘以 $(1+\tau)$:

$$\frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}} \left(w_{oj} - c_{oj}(1+\tau)\right) + E[\tilde{p}(j)] = 0$$

第 6 步:重新排列:

$$E[\tilde{p}(j)] = -\frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}} \left(w_{oj} - c_{oj}(1+\tau)\right)$$

第 7 步:两边除以 $\frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}}$(注意这是负的):

$$\frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial w_{oj}} = -(w_{oj} - c_{oj}(1+\tau))$$

第 8 步:现在,转换为对数导数。这是关键技巧。

定义 对数价格的半弹性(semi-elasticity):

$$\frac{\partial E[\tilde{p}(j)]}{\partial \log w_{oj}} = \frac{\partial E[\tilde{p}(j)]}{\partial w_{oj}} \cdot w_{oj}$$

(这来自链式法则)

代入上面的方程:

$$\frac{E[\tilde{p}(j)]}{\frac{\partial E[\tilde{p}(j)]}{\partial \log w_{oj}} / w_{oj}} = -(w_{oj} - c_{oj}(1+\tau))$$$$\frac{E[\tilde{p}(j)] \cdot w_{oj}}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}} = -(w_{oj} - c_{oj}(1+\tau))$$

第 9 步:两边除以 $w_{oj}$:

$$\frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}} = -\frac{w_{oj} - c_{oj}(1+\tau)}{w_{oj}} = -\left(1 - \frac{c_{oj}(1+\tau)}{w_{oj}}\right)$$

第 10 步:设 $m = w_{oj} / (c_{oj}(1+\tau))$(加成,多少倍边际成本)。然后:

$$\frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}} = -(1 - 1/m) = \frac{-(m-1)}{m}$$

第 11 步:求解 $m$:

$$m = \frac{1}{1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}}$$

第 12 步:代入 $m = w_{oj} / (c_{oj}(1+\tau))$:

$$\boxed{w^*_{oj} = c_{oj}(1+\tau) \left[1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}\right]^{-1}}$$

这就是方程 6

3.2b 经济学解读:加成定价规则

现在让我们看看这与产业组织中的标准加成规则的关系。

完全竞争中,企业在边际成本处定价。在不完全竞争中,企业对其价格有权力。

标准的Lerner 指数定价规则是:

$$\frac{p - MC}{p} = -\frac{1}{\varepsilon^D}$$

其中 $\varepsilon^D$ 是需求价格弹性

在工人的情况下,相当于:

  • $p = w_{oj}$(工人的"价格")
  • $MC = c_{oj}(1+\tau)$(工人的边际成本)
  • $\varepsilon^D = \frac{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}{E[\tilde{p}(j)]}$(工人出价对聘用概率的需求弹性

代入 Lerner 规则:

$$\frac{w_{oj} - c_{oj}(1+\tau)}{w_{oj}} = -\frac{1}{\varepsilon^D} = -\frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}$$

重新排列:

$$w_{oj} = c_{oj}(1+\tau) \left(1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}\right)^{-1}$$

这与方程 6 一致!

3.2c 工人成本的恢复公式

从最优出价反过来恢复成本 $c_{oj}$:

从方程 6:

$$c_{oj} = \frac{w_{oj}}{(1+\tau)} \left(1 + \frac{E[\tilde{p}(j)]}{\partial E[\tilde{p}(j)]/\partial \log w_{oj}}\right)$$

这是方程 7

经济学意义

  • 给定我们估计的 $E[\tilde{p}(j)]$ 和 $\partial E[\tilde{p}(j)]/\partial \log w_{oj}$(来自需求估计)
  • 以及观测到的出价 $w_{oj}$
  • 我们可以反演工人的费用 $c_{oj}$

然后,工人剩余 = 被雇用的网工资 — 费用:

$$\text{工人剩余} = \frac{w_{oj}}{1+\tau} - c_{oj}$$

3.3 核心命题 III:识别策略——两个工具变量

这是计量经济学脊索。为什么我们需要工具变量?为什么这两个特定的工具变量有效?

3.3a 内生性问题

在方程 2(需求)中,我们想要估计 $\alpha^k$(买方对价格的敏感程度)。

但是 $w_{oj}$(工资出价)可能与 $\varepsilon_{oj}$(买方的个人偏好冲击)相关

  • 例如,“高质量"工人可能往往出价更高(他们知道他们值钱)
  • 或者,“低质量"工人出价低,并且更有可能看到 $\varepsilon_{oj} < 0$(买方不喜欢他们)

如果 $\text{Cov}(w_{oj}, \varepsilon_{oj}) \neq 0$,那么 OLS 对 $\alpha^k$ 会有偏

3.3b 工具变量策略的逻辑

工具变量 $Z$ 必须:

  1. 与内生变量相关:$\text{Cov}(Z, w_{oj}) \neq 0$ ✓
  2. 与误差项无关:$\text{Cov}(Z, \varepsilon_{oj}) = 0$ ✓ (外生性)

论文的想法:寻找改变工人费用的变量,从而改变他们的最优出价(通过方程 6),但不直接改变买方对工人的偏好。

3.3c 工具变量 #1:汇率变动

机制

  • 工人在美国以美元获得报酬
  • 但他们在当地国家的机会成本(离线工作工资)以当地货币计算
  • 汇率变动改变了美元工作相对于本地工作的价值

例子

  • 印度工人在 2008 年初:1 美元 = 40 卢比
  • 2009 年底:1 美元 = 48 卢比(卢比贬值)
  • 相同的美元出价现在价值更多卢比 → 工人对平台工作的吸引力更高 → 他们可以要求更高的出价 → $w_{oj}$ 上升

为什么这是有效的工具变量

  • ✓ 相关性:$Z_1 =$ 汇率与工资出价相关(表 3,第 1 列:系数 = 0.087,F 统计量 = 89.50)
  • ✓ 外生性:买方看不到汇率(他们只看到以美元计算的出价);买方不根据汇率做出决定
  • ✓ 排斥限制:汇率变动不应改变工人的质量混合或买方对工人的偏好

排斥限制的三个测试(表 3,脚注):

  1. 申请人特征几乎不随工具变量而变化(表 A.3)
  2. 工作应用数量不随工具变量而变化(表 A.4)
  3. 买方不根据汇率做出发布决定(Horton 2021)

3.3d 工具变量 #2:竞争强度

机制

  • 工人知道他们可以申请多个工作
  • 如果同一类别中的其他工作吸引许多申请者,那么:
    • 这些其他工作的竞争很激烈
    • 工人对这些其他工作的成功概率较低
    • 他们对当前工作的外部选择价值较低
    • 他们应该在当前工作上出价更高来弥补较低的外部选择概率

例子

  • 当前工作:网络开发(周一发布)
  • 同一周的其他网络开发工作:平均 50 个申请者
  • 工人推断:竞争很激烈 → 应该专注于当前工作 → 出价更高

为什么这是有效的工具变量

  • ✓ 相关性:竞争与出价相关(表 3,第 1 列:系数 = -0.067,F-stat = 89.50)
  • ✓ 外生性:竞争(其他买方的工作吸引的申请者数量)不受当前申请者出价质量的直接影响
  • ✓ 排斥限制:竞争不应改变当前工人申请者的质量混合

注意一个微妙之处(脚注 20):该论文对竞争工具变量进行了"预白化”,从中删除了时间和类别固定效应,以隔离幂等(特定于工作)的竞争变化。


3.4 核心命题 IV:估计策略——控制函数方法

这是结构计量经济学中处理内生性的一个巧妙方法,超越简单的 IV。

3.4a 控制函数的直觉

问题:即使我们有工具变量,我们也可能有未观测的混淆因素

  • 例如,申请人可能有不可观测的高质量,导致:
    • 更高的出价(他知道他很有价值)
    • 更高的被雇用概率(买方认识到他的质量)

这创造了 $w_{oj}$ 和 $\varepsilon_{oj}$ 之间的相关性,即使在控制已观测特征后也是如此。

解决方案:Petrin & Train 的控制函数方法(2010):

第 1 步:从工具变量和观测到的特征运行第一阶段回归(方程 9):

$$\log(w_{oj}) = Z_j\gamma_1 + X_j\gamma_2 + \nu_{oj}$$

获得残差:$\hat{\nu}_{oj} = \log(w_{oj}) - \hat{Z_j\gamma_1} - \hat{X_j\gamma_2}$

经济学解读:$\hat{\nu}_{oj}$ 捕捉出价中不能由工具变量或观测特征解释的部分。这是"未观测的申请人质量"的代理。

第 2 步:在需求方程中包括控制函数(方程 10):

$$p(j|\tilde{J}_o, k, \chi) = \frac{\exp(X_j\beta^k_\chi - \alpha^k \log(w_{oj}) + \psi_{k\chi} \hat{\nu}_{oj})}{1 + \sum_{l \in \tilde{J}_o} \exp(\ldots)}$$

新项 $\psi_{k\chi} \hat{\nu}_{oj}$:如果 $\psi_{k\chi} > 0$,更高的残差(更高的未观测质量)增加聘用概率,正如预期的那样。

为什么有效

  • 如果残差与 $\varepsilon_{oj}$ 相关(即,它们捕捉相同的未观测因素),那么包括它作为控制变量会吸收内生性
  • 剩余的参数估计(特别是 $\alpha^k$)现在基于外生变化(来自工具变量)

3.5 核心命题 V:买方剩余的计算

给定估计的参数,我们如何量化买方从交易中获得的价值

3.5a 条件买方剩余(给定雇用)

定义:如果买方雇用工人 $j$,他会愿意支付多少额外费用,而不会受到伤害?

从买方的间接效用函数:

$$U_j = \frac{\exp(X_j\beta^k_\chi)}{w_{oj}^{\alpha^k}}$$

如果我们提高工资至 $w'_{oj}$,使得买方仍然得到相同的效用:

$$\frac{\exp(X_j\beta^k_\chi)}{(w'_{oj})^{\alpha^k}} = \frac{\exp(X_j\beta^k_\chi)}{w_{oj}^{\alpha^k}}$$

这意味着 $w'_{oj} = w_{oj}$(显然无趣)。

更好的定义:买方愿意为工人支付多少超过外部选择(不在平台上雇用)?

从方程(2),不雇用的间接效用是 $1$(规范化)。在平台上工作的间接效用是:

$$\frac{\exp(X_j\beta^k_\chi)}{w_{oj}^{\alpha^k}}$$

如果我们增加工资 $\Delta w$,买方在以下情况下与不雇用无差别:

$$\frac{\exp(X_j\beta^k_\chi)}{(w_{oj}+\Delta w)^{\alpha^k}} = 1$$

求解 $\Delta w$:

$$(w_{oj}+\Delta w)^{\alpha^k} = \exp(X_j\beta^k_\chi)$$$$w_{oj}+\Delta w = \exp\left(\frac{X_j\beta^k_\chi}{\alpha^k}\right)$$$$\Delta w = \exp\left(\frac{X_j\beta^k_\chi}{\alpha^k}\right) - w_{oj}$$

这是买方为雇用该工人而支付的最高工资与实际工资之间的差异。

在数据中我们没有直接观测 $X_j\beta^k_\chi$(它包含 $\varepsilon_{oj}$),所以我们:

  1. 从聘用决策中模拟 $\varepsilon_{oj}$(使用接受-拒绝)
  2. 计算 $X_j\beta^k_\chi + \varepsilon_{oj}$
  3. 计算 剩余如上所示

3.5b 期望买方剩余(给定发布)

这考虑了工作可能无法填补的事实(在数据中,仅 20% 的工作被填满)。

使用消费者剩余的标准公式,与所有申请人的工资集成:

$$E(\text{剩余/小时})^{k\chi} = \int_0^\infty (1 - p(0|\tilde{J}_o, k, \chi)) \times (w^* - w) \, dw$$

其中 $p(0|\tilde{J}_o, k, \chi)$ 是"不雇用"的概率,$w^*$ 是有效"需求曲线"的截距。

直觉

  • 如果买方非常不愿意支付高工资(需求缺乏弹性),买方剩余很高
  • 如果买方对工资很敏感(需求富有弹性),买方剩余很低

4. 估计结果的关键数字解读

现在我们有足够的理论背景,让我们解析主要数值结果(表 4-8)。

4.1 需求参数(表 4):买方的三种类型

第一行:买方类型份额

  • 类型 2(最常见):76% 的买方
  • 类型 3(中等):20% 的买方
  • 类型 1(活跃):4% 的买方

第二行:工作填补弹性 (Job Fill Elasticity)

$$\varepsilon_{\text{fill}} = \frac{\partial \ln p(\text{hire})}{\partial \ln w}$$

类型 2 的 $\varepsilon_{\text{fill}} = -3.24$ 意味着:

  • 如果所有工资增加 1%,填补概率降低 3.24%
  • 这表明适度的需求缺乏弹性(但不是极端的)

类型 1(高销售额买方)的 $\varepsilon_{\text{fill}} = -4.53$ 意味着:

  • 他们对价格更敏感 — 他们可能面临更强的竞争,需要货比三家

第三行:被考虑申请人的平均数

  • 类型 2:15.38 申请人
  • 类型 1:20.51 申请人
  • 类型 3:21.29 申请人

解读:尽管类型 1 是最活跃的发布者,他们考虑更多申请人。这可能表明:

  • 他们更谨慎(或优化程度较低)
  • 或他们寻求更特殊的特征组合

第四行:经历后的月度工作发布频率

  • 类型 2:0.09 工作/月 → 非常不活跃,一年仅 1 次工作
  • 类型 1:4.23 工作/月 → 每周 1 次,持续业务
  • 类型 3:0.70 工作/月 → 中等活跃

4.2 工人剩余(表 6):标记定价

第 1 行:被雇用工人的每小时剩余 = **$1.97** SD = $1.63

这听起来不多,但记住:

  • 他们已经赚取了他们的工资 $w_{oj}$
  • 这是额外的经济剩余,超过他们的机会成本

第 2 行:标记 = 1.2828%

经济学解读

  • 平均而言,工人出价是他们成本的 1.28 倍
  • 他们建立 28% 的加成在他们的边际成本之上
  • 这比完全竞争(加成 = 1.00)要大得多

为什么是 28% 而不是更高

  • 工人不是垄断企业;他们仍然面临相当多的竞争(平均 26 个申请者每个工作)
  • 但搜索摩擦给了他们一些市场力量

对比:在一个单一底价拍卖中(所有申请人同时看到彼此的出价),加成会趋向 1.00。搜索摩擦推高了加成。

4.3 应用顺序效应(图 5 和 6):搜索摩擦量化

图 5 说明:预期工人剩余如何随申请顺序下降

  • 申请人 1-10:$2.18 预期剩余
  • 申请人 11-20:$1.15(下降 47%)
  • 申请人 21-30:$0.73(下降 67%)
  • 申请人 31-40:$0.55(下降 75%)
  • 申请人 40+:< 5% of hourly cost

经济学解读

  • 即使有很多申请者,早期的人获得巨大的优势
  • 这是搜索摩擦量化
  • 论文认为这种顺序偏差的稳健性非常高(附录表 A.2:每 10 位位置下降 = 0.57% 的交互概率)

模型验证(图 6):

  • 蓝色线(数据中的实际出价):应用人 61-70 出价低 3.5% vs. 申请人 1-10
  • 红色线(模型预测的标记):应用人 61-70 出价低 2.4% vs. 申请人 1-10

模型捕捉了大约 68% 的顺序效应 (2.4% / 3.5%)。剩余 1.1% 可能来自:

  • 样本稀疏(> 97% 的工作考虑 < 80 申请人)
  • 模型中未捕捉的其他因素

5. 政策反事实:为什么监管会伤害工人

5.1 反事实设置

论文检验政策情景:对买方的工资出价征收 10% 税收(模仿 FICA 雇主税)。

两个版本

  1. 主要 :税收有常规的动态效应
  2. 替代:关闭"高工资 → 较低未来发布"的链接

5.2 逐步机制

阶段 1:工人对税收的响应

工人观察到买方的新实际成本增加了 10%

他们预计:买方对工资更敏感(接受的工资出价必须补偿 10% 的税收)。

结果:工人提高他们的出价 8.8%(表 9,面板 A)来补偿降低的接受概率。

阶段 2:招聘率下降(静态)

较高的工资出价使买方的成本更高。

从需求曲线(方程 2),招聘概率下降 27%。

这本身就会伤害

  • 工人:聘用概率下降 → 预期收入下降
  • 买方:聘用率下降 → 每份工作的剩余下降

阶段 3:长期效应 — 工作发布下降

这是关键的乘数效应

从方程(8),买方的工作发布速率取决于他们过去看到的工资

$$\log(\lambda^{\text{Arrival}}_{k\chi}) = \delta_1^k + \delta_2 \mathbb{1}(\chi > 0) + \delta_3 \hat{w}_{oj}$$

估计的 $\delta_3 = -2.02$(表 4,面板 D,最后一行),意思是:

  • 如果过去工资 ↑ 1 个标准差 (0.037 log points),
  • 那么未来工作发布速率 ↓ $2.02 \times 0.037 = 7.6\%$

在反事实中,经历税收的买方观察到 8.8% 的更高工资。

这导致他们在未来发布更少工作

经验买方(已经从事该平台):工作发布 ↓ 67%(表 9,面板 B)

阶段 4:工人遭受最大伤害

较小的市场(更少的工作)比较少的招聘率更伤害工人,因为:

  • 失业的固定组件变大(许多工人根本找不到工作)
  • 聘用工人的剩余减少了 26%(静态)
  • 现值剩余减少了 59%,因为市场规模缩小

即使整个税收收入 ($) 被回扣给工人,net 效果仍然是负的 37%(表 9,面板 C,“P.V. 有税收回扣”)。

5.3 为什么政策分析困难:市场均衡的复杂性

这个反事实说明了为什么在市场中简单地"为工人提供补偿”不起作用

  1. 市场规模减少了(较少的工作发布)
  2. 这对所有人都不利,包括获得补偿的工人
  3. 原因:买方对价格敏感(通过 $\delta_3 < 0$)

如果 $\delta_3 = 0$(买方对过去工资不敏感),然后:

  • 工作发布保持不变
  • 税收收入的全额回扣会使工人受益 12%(表 9,第 2 列,面板 C)

但估计显示 $\delta_3 \approx -2.02$,因此市场规模确实对政策敏感。


小白也能懂

目标: 不用死记硬背,通过“公式+直觉”的对应关系,彻底看懂结构估计是怎么跑出来的。

序言:结构估计的本质

想象你手里有一个**“模拟人生”游戏机**(这就是模型)。游戏机上有几个旋钮(参数 $\theta$),分别控制里面小人的“贪婪程度”、“懒惰程度”和“敏感程度”。

MLE(最大似然估计)的任务就是: 不断调节这几个旋钮,直到游戏机里小人做出的行为(发帖、雇佣、报价),和我们在现实数据里看到的行为一模一样

模块一:买家选人模型 (Choice Model)

核心问题: 面对一堆简历,买家为什么选了 A 没选 B?

1. 核心公式 (Utility & Probability)

买家 $k$ 雇佣工人 $j$ 的效用函数(得分):

$$U_{oj} = \underbrace{X_j \beta}_{\text{能力得分}} - \underbrace{\alpha \log(w_{oj})}_{\text{嫌贵扣分}} + \underbrace{\psi \cdot CF_{oj}}_{\text{质量补丁}} + \epsilon_{oj}$$

买家选择工人 $j$ 的概率(Logit 公式):

$$P(\text{Hire } j) = \frac{\exp(U_{oj})}{\sum_{l \in \text{Seen}} \exp(U_{ol}) + \exp(U_{NoHire})}$$

2. 我们要估计谁?(Parameters)

  • $\alpha$ (价格弹性): 旋钮向右拧,买家变得超级抠门;向左拧,买家不在乎钱。
  • $\beta$ (特征偏好): 旋钮向右拧,买家超级看重学历/评分。
  • $\psi$ (内生性修正): 这是一个技术性参数,用来过滤掉“高价=高质量”的干扰。

3. 数据怎么告诉我们答案?(Identification)

  • 识别 $\alpha$: 计算机扫描所有数据,发现:当工资 $w_{oj}$ 哪怕只高了一点点,雇佣率 $y_{oj}$ 就暴跌。
    • 结论: 计算机把 $\alpha$ 调得很大(比如 -4.0)。
  • 识别 $\beta$: 计算机发现:不管工资多高,只要是有“5 星好评”($X_j$) 的人,总能被录用。
    • 结论: 计算机把 $\beta_{score}$ 调成正数。
  • 识别 $\psi$: 计算机发现:有些人工资高得离谱,按理说 $\alpha$ 效应下不该被录用,但他还是被录用了。而且他的 IV 残差 $CF$ 很大(说明有不可观测的高能力)。
    • 结论: 计算机调高 $\psi$,把这部分功劳归给“未观测质量”,而不是调低 $\alpha$。

模块二:买家搜索模型 (Search Model)

核心问题: 买家到底看了多少份简历?(这是本文最核心的创新)

1. 核心公式 (Consideration Set Probability)

买家只看前 $n$ 份简历的概率(指数分布):

$$P(\text{Size} = n) = \lambda \cdot \exp(-\lambda \cdot n)$$
  • 注意: 我们看不见 $n$ 是多少,我们只能看见申请顺序 (Order)

2. 我们要估计谁?(Parameters)

  • $\lambda$ (搜索摩擦/懒惰系数):
    • $\lambda$ 很大 $\rightarrow$ 买家很懒,看两眼就停了。
    • $\lambda$ 很小 $\rightarrow$ 买家很勤快,会看很多份。

3. 数据怎么告诉我们答案?(Identification)

  • 数据特征: 你的数据里有一列叫 Applicant_Order(申请顺序)。
  • 识别逻辑:
    • 情况 A: 数据显示,第 50、60、80 个申请者经常被录用。
      • 推理: 如果买家只看前 10 个,他绝不可能录用到第 80 个。能录用第 80 个,说明他肯定看得很深。
      • 操作: 计算机把 $\lambda$ 调小(勤快)。
    • 情况 B: 数据显示,录用的全是前 5 名,第 10 名以后几乎没人被录用。
      • 推理: 买家大概率只看前几页。
      • 操作: 计算机把 $\lambda$ 调大(懒惰)。
  • 一句话总结: 录用者的平均排位越靠后,估计出来的 $\lambda$ 越小。

模块三:动态发帖模型 (Posting Dynamics)

核心问题: 买家受了刺激以后,还会不会再来发帖?

1. 核心公式 (Hazard Rate)

买家在 $t$ 时刻发下一个帖子的概率(速率):

$$\log(\text{Rate}) = \delta_0 + \delta_{Exp} \cdot \mathbb{1}(\text{IsExperienced}) + \delta_3 \cdot \log(\text{Past Prices})$$

2. 我们要估计谁?(Parameters)

  • $\delta_3$ (价格敏感度): 这是一个负数。表示过去被“宰”得越狠,未来发帖越少。

3. 数据怎么告诉我们答案?(Identification)

  • 数据特征: 你有买家的历史记录。
    • 买家 A:上次招人花了 $50/小时(很贵),结果过了 12 个月才发下一个帖。
    • 买家 B:上次招人花了 $10/小时(便宜),结果过了 1 个月就发下一个帖。
  • 识别逻辑: 计算机发现“历史高价”和“长发帖间隔”之间有强烈的正相关。
    • 操作: 计算机把 $\delta_3$ 设为一个显著的负数(如 -2.02)。
  • 作用: 这个参数直接决定了反事实模拟中,收税会导致市场规模萎缩多少。

模块四:供给侧成本反推 (Supply Side Inversion)

核心问题: 工人心里到底怎么想的?成本是多少?

1. 核心公式 (Inverse Elasticity Rule)

这是基于 FOC 推导出来的“读心术”公式:

$$\text{Cost} = \frac{\text{Wage}}{1 + \text{Markup}}$$

其中,加价率(Markup)完全取决于工人感知的需求弹性

$$\text{Markup} = \frac{1}{\text{Elasticity}(\hat{\alpha}, \hat{\beta}, \hat{\lambda}, b)}$$

2. 我们要估计谁?(Parameters)

  • $b$ (信息权重): 工人有多信赖自己看到的私有信号?
    • $b=0$: 工人很傻,觉得所有买家都一样。
    • $b=1$: 工人很精,知道这个买家特抠门,那个特大方。

3. 数据怎么告诉我们答案?(Identification via NLLS)

  • 前提: 我们已经用 MLE 拿到了 $\hat{\alpha}, \hat{\beta}, \hat{\lambda}$。
  • 识别逻辑:
    • 观察同一个工人,这周申了两个类似的工作。
    • 工作 A 他报价 $10,工作 B 他报价 $15。为什么变了?
    • 因为他对工作 A 的买家和工作 B 的买家有不同的预期(信号)
    • 如果 $b=0$,模型预测他的报价应该不变(都看平均)。
    • 如果 $b=1$,模型预测他的报价应该剧烈波动。
  • 操作: 计算机调整 $b$,使得模型预测的工资方差 $\approx$ 数据里的真实工资方差

终极总结表:参数-数据的一一映射

步骤 这里的参数… 是通过看这个数据… 由这个机制锁定的
MLE (需求) $\alpha$ (价格敏感) 工资高低 vs 录用率 越贵越没人要 $\rightarrow$ $\alpha$ 越大
MLE (需求) $\beta$ (偏好) 评分高低 vs 录用率 评分高总被录 $\rightarrow$ $\beta$ 越大
MLE (搜索) $\lambda$ (懒惰) 申请顺序 vs 录用率 越靠后越没人要 $\rightarrow$ $\lambda$ 越大 (懒)
MLE (动态) $\delta_3$ (回头客) 历史价格 vs 下次发帖时间 以前买贵了就不来了 $\rightarrow$ $\delta_3$ 越负
NLLS (供给) $b$ (信息) 同一工人的工资波动 报价忽高忽低 $\rightarrow$ $b$ 越大 (信信号)

博士生复现 Checklist

如果你要自己做,哪怕数据换了(比如换成 Airbnb 或 Uber),这套逻辑是不变的:

  1. 建 Likelihood: 把 模块一、二、三 的概率乘起来。
  2. 喂数据: 主要是 Hire, Wage, Order, Time_Gap 这四列。
  3. 求极值: 让计算机跑 MLE,得到 $\hat{\alpha}, \hat{\lambda}, \hat{\delta}$。
  4. 反推成本: 用 $\hat{\alpha}$ 算出弹性,反推 Cost。
  5. 拟合波动: 用 Wage 的方差定出 $b$。
  6. 模拟政策: 改税率,用 $\hat{\delta}$ 算市场萎缩。

现在,你应该能清晰地看到每一个希腊字母背后,是哪一列数据在起作用了。

使用 Hugo 构建
主题 StackJimmy 设计