关键信息
- 采用率:39.4%的18至64岁美国人口使用生成式AI,28%的雇员在工作中使用,近1/9每天使用。工作之外,32.7%的受访者使用,但仅6.4%每天使用。
- 采用速度:生成式AI的采用速度超越了个人电脑和互联网,两年内的采用率为39.5%,而后者在同样时期的采用率仅为20%。
- 使用特征:生成式AI在管理、商业和计算机职业中最为普遍,使用率超过40%;蓝领工人中也有近1/4使用。使用场景涵盖写作、信息检索和数据分析等多项任务,使用率均超25%。
-
经济影响:生成式AI对工作时间的贡献预计为0.5%至3.5%,假设生产力提升25%,整体劳动生产力可能提高0.125至0.875个百分点。各行业使用率差异明显,金融/保险/房地产行业使用率最高(51%),休闲/住宿行业最低(15%)。工作外使用更普遍但强度较低。
----------
摘要
生成式人工智能(GenAI)是一项潜在的重要新技术,但其对经济的影响取决于采用的速度和强度。本文报告了首个美国全国性代表性调查结果,涉及美国在工作和家庭中生成式AI的采用情况。2024年8月,39%的18至64岁美国人口使用生成式AI。在调查前一周内,超过24%的员工至少使用过一次,几乎每九人中就有一人每天在工作中使用。历史数据表明,生成式AI的采用速度超过了个人电脑和互联网的普及。生成式AI是一种通用技术,广泛应用于各种职业和工作任务中,无论是在工作场所还是家庭。
1 引言
生成式人工智能(GenAI)迅速崛起,成为一种可能变革工作场所的技术。大型语言模型(LLM)ChatGPT于2022年11月推出,到2024年3月,最常用的生成式AI工具已被数亿用户访问超过三十亿次(Liu和Wang,2024)。多项最新研究发现,生成式AI提高了员工的生产力(Brynjolfsson, Li, 和 Raymond, 2023;Cui等,2024;Dell’Acqua等,2023;Noy和Zhang,2023;Peng, Kalliamvakou, Cihon和Demirer,2023)。然而,其他研究预计AI对工作的影响仅为适度,这取决于AI在复杂工作任务中的替代能力(Acemoglu, Autor, Hazell和Restrepo,2022;Bloom, Prettner, Saadaoui和Veruete,2024)。
生成式AI对经济的最终影响取决于该技术的采用速度和强度。然而,目前缺乏系统性证据来表明生成式AI在工作和家庭中的使用程度。谁在使用生成式AI,他们使用的频率和用途是什么?
本文呈现了首个美国全国性代表性调查结果,涉及美国在工作和家庭中生成式AI的采用情况。我们的数据来自实时人口调查(RPS),这是一项全国范围的调查,采用与美国人口普查局为劳工统计局(BLS)进行的每月劳动力调查(CPS)相同的核心问题和时间结构。我们将调查结果与全国就业和收入的估计进行基准比较,以确保代表性。此前的研究已使用RPS方法研究COVID-19疫情期间的居家工作等主题(Bick和Blandin,2023;Bick, Blandin和Mertens,2023)。该调查结构使我们能够轻松添加和修改问题,并在美国劳动力的大型代表性样本中追踪生成式AI的使用情况。
我们发现,2024年8月,39.4%的18至64岁美国人口使用生成式AI,其中32.0%的人在调查周内至少使用过一次;28.0%的受访雇员在工作中使用生成式AI,其中大多数(24.2%)至少每周使用一次;10.6%的雇员报告称每天在工作中使用生成式AI。生成式AI在工作之外的使用更为普遍,但强度较低。三分之一的受访者(32.7%)表示在工作之外使用生成式AI,但只有6.4%的人在工作之外每天使用。ChatGPT显然是最常用的生成式AI程序,尽管也有许多其他工具被提及,包括嵌入在标准办公软件包中的AI工具(例如,Microsoft Copilot)。
生成式AI的采用速度和强度与其他技术相比如何?以往的研究表明,更好的技术被采用的速度更快,技术在各国的采用速度和强度与经济增长高度相关(Beaudry, Doms和Lewis,2010;Comin和Hobijn,2010;Comin和Mestieri,2018)。我们将生成式AI的采用速度与个人电脑(PC)和互联网两项技术进行比较,使用CPS计算机和互联网使用补充调查以及国际电信联盟(ITU)的数据。
生成式AI的采用速度超过了个人电脑和互联网。在两年的时间内,生成式AI的采用率为39.5%,而互联网的两年采用率为20%,个人电脑的三年采用率也为20%(这是我们能测量的最早数据)。这一现象主要是由于家庭中生成式AI的采用速度快于个人电脑,这可能与便携性和成本的差异有关。我们发现,PC和生成式AI在工作中的采用率相似。(请注意,我们无法将互联网使用在家庭和工作之间进行区分。)
一些学者认为,生成式AI可能会减少工作场所的不平等(例如,Autor 2024)。然而,类似于个人电脑的采用,生成式AI的使用在年轻、更高教育水平和更高收入的劳动者中更为普遍。这一点值得注意,因为个人电脑革命后,劳动市场不平等上升,电脑取代了常规的“中等技能”任务,同时补充了高技能劳动(Autor, Levy和Murnane,2003)。唯一的例外是性别。我们发现,男性在工作中使用生成式AI的可能性比女性高9个百分点,在家庭中高7个百分点。相比之下,个人电脑在工作中的采用率在女性中更为普遍,这可能是由于从打字机到文字处理器的过渡,以及女性在秘书和其他行政职业中的高比例。
生成式AI被广泛应用于各种职业,以执行多种不同的工作任务。生成式AI的采用在管理、商业和计算机职业中最为普遍,使用率超过40%。尽管如此,每五位“蓝领”工人和每五位没有大学学位的工人也在工作中定期使用生成式AI。这与Eloundou、Manning、Mishkin和Rock(2024)的研究一致,他们将生成式AI的能力与工作的任务内容进行比较,发现许多职业将受到影响。我们询问工人是否使用生成式AI来帮助他们执行十种不同的工作任务,包括写作、信息检索、数据或文本解释、编码、数据分析等。在工作中使用生成式AI的用户中,我们列出的十种任务的使用率至少为25%,其中写作、解释和行政支持被认为是最有帮助的。
根据有关工作使用频率和强度的回答,我们估计当前在美国,0.5%到3.5%的工作时间受到生成式AI的辅助。如果我们假设生成式AI将任务生产力提高25%——这是五项随机研究中的中位数估计——这将转化为劳动生产力的提升,范围在0.125到0.875个百分点。然而,这一计算假设小规模研究在外部有效,应谨慎对待。
我们的结果与其他已发布的生成式AI使用调查基本一致。与我们最为相似的研究是Humlum和Vestergaard(2024),他们对丹麦十一种职业中的代表性样本工人进行调查,了解他们在工作中使用ChatGPT的情况。我们发现两个调查中涵盖职业的使用率大致相似,尽管由于各国工作代码之间缺乏明确对应,使得精确比较变得困难。皮尤研究中心于2024年2月进行的一项调查发现,23%的受访成年人表示曾经使用过ChatGPT,年轻和受教育程度较高的受访者的采用率更高(McClain,2024)。路透社于2024年4月在六个国家进行的在线调查发现,18%的美国受访者每周至少使用一次ChatGPT,而在阿根廷、丹麦、法国、日本和英国的比例则不到10%(Fletcher和Nielsen,2024)。
我们的研究表明,生成式AI的采用速度远远超过以往AI技术的浪潮。McElheran等(2024)发现,2017年不到6%的公司使用前沿AI技术,如机器学习、计算机视觉和自然语言处理。类似地,Acemoglu、Autor、Hazell和Restrepo(2022)发现,2016年至2018年间,只有约3%的美国公司采用了预测性AI工具,而Humlum和Meyer(2022)则在2017年发现丹麦的采用率同样较低。
生成式AI之所以可能更快速地被采用,是因为它主要面向消费者,而非企业。Bonney等(2024)使用商业趋势和前景调查(BTOS)报告公司层面的AI采用情况,该调查询问企业在2023年12月至2024年2月期间的AI使用情况。他们发现,在调查期间,AI采用率从12月的3.7%上升到2月的5.4%,尽管这一增幅迅速,但仍远低于我们的估计。与Bonney等(2024)一致,我们也发现生成式AI在大企业中的使用更为普遍。然而,企业规模之间的差距太小,无法解释公司和员工使用之间的差异,这表明即使在未正式采用生成式AI的公司中,员工也在使用这一技术。
本文的结构如下:第二部分描述调查方法和数据,第三部分呈现我们的主要结果,第四部分为结论。
2 数据来源与测量
2.1 实时人口调查(RPS)
我们的数据来源是实时人口调查(RPS),这是一项针对美国18至64岁成年人进行的全国劳动市场调查(详细讨论见Bick和Blandin,2023)。RPS通过大型商业调查提供商Qualtrics在线进行,自2020年以来每年收集多轮调查数据。RPS旨在在关键维度上镜像当前人口调查(CPS)。RPS调查在基本CPS和CPS外流组中的人口特征和劳动市场结果问题上采用相同的逐字措辞,并复制了获取劳动市场结果所需的复杂问题序列,以确保与CPS一致(美国人口普查局,2015)。复制现有高质量调查的关键部分确保调查概念的可比性,使研究人员能够将RPS结果与样本量更大的广泛基准进行验证,并在必要时构建样本权重。
然而,RPS还收集了CPS中未包含的信息。RPS中的新问题曾被用于研究员工在公司之间的重新配置、居家工作、州际迁移以及通货膨胀与求职之间的关系(Bick和Blandin,2023;Bick, Blandin和Mertens,2023;Bick, Blandin, Mertens和Rubinton,2024;Pilossoph和Ryngaert,2023)。在2024年6月和8月,RPS引入了一项模块,旨在测量工作和家庭中生成式AI的使用情况。
RPS在疫情期间在就业、工作小时、收入、行业构成和员工任期方面生成的统计数据非常相似(Bick和Blandin,2023)。这部分归因于调查的细致、迭代式实施,以匹配CPS的问题措辞和其他细节。
2.2 样本
Qualtrics面板的受访者在线招募,可以参与调查以获得Qualtrics收取费用的30%至50%作为补偿(我们为每个完成的调查支付6.90美元)。Qualtrics面板约有1500万名成员,且不是美国人口的随机样本。然而,研究人员可以指示Qualtrics将调查邀请目标定向到特定的人口群体。RPS样本旨在在多个广泛的人口特征上具有全国代表性,包括性别、年龄、种族和民族、教育、婚姻状况、家庭儿童数量、人口普查区域以及过去12个月的家庭收入。
我们在2024年6月进行了试点调查,收到了2551个回复。随后在2024年8月启动了完整调查,收到了5014个回复。两个调查均在CPS进行相应调查的同一周内进行。我们分别从6月和8月的调查中剔除了14名和33名受访者,因为他们报告的行业和/或职业为军事。又有9名受访者在每项调查中被剔除,因为他们报告自己受雇但也称自己为家庭主妇、退休或失业。
2024年8月的调查在试点调查的基础上进行了多项改进。这是一个更大的样本,并包含了有关生成式AI使用强度和跨工作任务使用广度的问题。我们还改进了行业和职业的编码,并进行了其他小幅改进。我们发现两个调查中重叠问题的结果非常相似,8月的工作使用率略高,尽管这一增幅在统计上并未显著。因此,为了简化起见,本文仅报告8月的结果。附录B使用2024年6月的调查数据复制了本文的主要图表。
表1:2024年8月CPS和RPS样本组成
备注:第一列报告了2024年8月当前人口调查(CPS)中由Qualtrics在采样过程中针对的变量的样本组成。就业状态是唯一未针对的变量。第二列报告了2024年8月实时人口调查(RPS)中的样本组成。两个数据集的样本均限于18至64岁的平民人口。第三列和第四列报告了受雇者(上周在职和缺勤者)的相同结果。
表1的前两列比较了2024年8月我们主要调查中CPS与RPS在目标抽样程序下的人口构成。最显著的差异是,18至24岁且学历不超过高中毕业的个体在RPS中的代表性不足,而年收入为50,000美元或以下的个体则在RPS中代表性过高。表1的下半部分比较了CPS和RPS中的就业状态,这些统计数据没有在抽样程序中进行目标设定。根据CPS的定义,被分类为失业的个体在RPS中代表性过高。
表1的第三列和第四列比较了CPS与RPS中受雇受访者的人口构成。这总体上改善了平衡,尽管仍存在一些差异。
2.3 样本权重与验证
为了解决这些差异,我们使用Deming和Stephan(1940)的迭代比例调整(raking)算法构建样本权重。我们对raking算法的应用确保关键人口特征的加权样本比例与CPS中的比例相匹配。我们还使用比Qualtrics抽样目标中包含的教育和婚姻状况更细化的分类,并将所有这些分类与性别进行交互。此外,我们的抽样权重复制了就业状态的分类,无论是总体上还是基于我们一系列目标特征,以确保某些变量具有足够大的样本量。我们还在加权方案中包括了职业。这要求我们由于6月和8月调查中缺失职业代码,分别剔除另外108名和112名观察值。附录C.1提供了我们加权方案所针对的类别的详细信息。
图1:验证检查
备注:左侧的图使用未加权的RPS数据,右侧的图使用加权的RPS数据。两幅图均使用RPS受访者样本。所有图均使用加权的CPS数据。每周收入的数据显示为2024年8月RPS和CPS-ORG中18至64岁员工的样本,周收入低于CPS的最高代码3960美元,且隐含时薪至少为联邦最低工资7.25美元。RPS和CPS的样本量分别为2184和6078。职业数据样本为2024年8月RPS和CPS中18至64岁受雇受访者,样本量分别为3216和42987。
Bick和Blandin(2023)表明,RPS在许多未在抽样程序中设定目标或未包含在加权方案中的维度上很好地复制了CPS,包括常规和实际的每周工作小时、按小时计酬的工人比例、每周收入分布、行业构成和工作任期。图1的面板(a)和(b)分别比较了RPS与CPS的常规每周收入分布,未加权和加权的情况。未加权的分布已经相似,加权进一步改善了拟合度。
图1的面板(c)和(d)分别比较了RPS和CPS中的职业份额,未加权和加权的情况。这两个样本在未加权时基本一致。两个样本之间的相关性为0.87,管理类职业在RPS中尤其过度代表。基于此原因,我们对所有进一步分析应用职业权重。面板(d)显示这一调整在职业上机械性地平衡了样本。
2.4 生成式AI使用的测量
定义与引导问题。生成式AI模块首先给出生成式AI的定义:生成式AI是一种响应提示生成文本、图像、音频或视频的人工智能。生成式AI的一些例子包括ChatGPT、Gemini和Midjourney。由于生成式AI是一项相对新兴的技术,我们认为提供概念定义和一些具体实例非常重要。我们避免提及诸如“大型语言模型”等具体生成式AI方法,因为这些术语对一般受众来说过于技术化,并且我们希望我们的定义能够涵盖广泛的方法。同时,我们提到了一些流行的生成式AI产品示例,因为我们认为一些受访者可能更熟悉这些产品名称,而非生成式AI的更广泛概念。
在定义生成式AI后,模块询问受访者在调查之前是否听说过该概念。回答“否”的受访者将跳过该模块的其余部分,而回答“是”的受访者则继续回答AI模块中的下一个问题。
工作中的生成式AI使用。对于受雇受访者,下一问题询问工作中是否使用生成式AI:您在工作中使用生成式AI吗?(否/是)这个问题旨在与CPS计算机和互联网使用补充调查中的类似问题相对应,详细讨论见第2.5节。回答“否”的受访者将跳过与工作相关的生成式AI后续问题。回答“是”的受访者将被询问有关工作中生成式AI使用的额外问题,这些问题分为两个大类。第一类与生成式AI使用的强度有关。我们询问他们在过去一周内使用生成式AI的天数,以及在这些天中,平均每天使用的时间。第二类问题则询问受访者使用了哪些特定产品,生成式AI在具体任务中提供了哪些帮助,以及一些关于生成式AI使用和好处的更广泛问题。
工作之外的生成式AI使用。生成式AI模块的最后部分询问工作之外的使用情况:您在工作之外使用生成式AI吗?(否/是)回答“否”的受访者将直接跳到生成式AI模块的末尾。回答“是”的受访者将被询问一组与“在工作”部分类似的额外问题。
2.5 计算机和互联网使用的测量
自1984年起,CPS开展了一项偶发的调查补充,涉及计算机和互联网使用,称为计算机和互联网使用补充调查(CIU)。与我们研究相关的问题在1984年、1989年、1993年、1997年、2001年、2003年、2007年和2009年由CIU进行调查。所有接受基本CPS问题的受访者也收到了CIU的问题。
我们关注CIU补充调查中与计算机使用相关的两组问题。第一个问题询问工作中的计算机使用情况:您在工作中[直接]使用计算机吗?(否/是)第二个问题询问家庭中的计算机使用情况:您在家中[直接]使用计算机吗?(否/是)CIU询问“在家”的计算机使用,而我们询问“在工作之外”的生成式AI使用。这意味着我们的措辞与CPS问题不完全相同,但我们更广泛的措辞在两个方面具有优势。首先,居家工作在当今并不少见,询问家庭中的生成式AI使用将无法清晰地区分工作与非工作用途。其次,许多人通过移动设备访问生成式AI,单独询问家庭使用可能无法捕捉到家庭外的非工作使用。
我们还使用CIU中的一个关于互联网使用的问题:您在任何地点使用互联网吗?(否/是)该问题在CIU的2001年、2003年、2007年和2009年调查中被提问,且与计算机相关的问题不同,它并不受地点限制。
为了计算2001年前的互联网普及情况,我们使用国际电信联盟(ITU)提供的数据。ITU与世界银行合作,自1995年以来收集美国及其他国家的互联网使用数据。他们结合国家监管机构和服务提供商的互联网使用数据,以订户数量为基础,估算人口中有互联网接入的比例(Pen˜a-L´opez等,2009)。
3 结果
图2展示了我们的主要结果。第一个条形图显示,在2024年8月的RPS受访者中,39.4%的受访者表示他们在工作或家庭中使用了生成式AI。约32%的受访者报告在调查前一周至少使用过一次生成式AI,而10.6%的受访者报告在上周每天使用。约28%的受雇受访者在2024年8月工作中使用生成式AI,其中绝大多数(24.1%)在过去一周至少使用过一次,10.9%每天使用。工作之外的使用更为普遍(32.7%),但使用强度稍低,25.9%在上周至少使用过一次,6.4%每天使用。附录图A.1展示了使用特定生成式AI产品的受访者比例。ChatGPT的使用率最高(28.5%),其次是Google Gemini(16.3%)。
图2:使用生成式AI的工作年龄成年人比例
备注:该图显示了在工作中、工作外及整体(工作或工作外)使用AI的受访者比例。使用强度分为上周每天使用(深蓝色)、至少一周使用一天但不每天使用(中蓝色)、以及上周未使用(浅蓝色)。数据来源为2024年8月的RPS,年龄范围为18至64岁。“工作样本”为受雇个体(N = 3216);其他柱状图包括所有受访者(N = 4682)。
图3:工作中AI使用的不同人口特征
备注:该图显示了按性别、年龄、教育和专业划分的工作中使用AI的受访者比例。使用强度分为上周每天使用(深蓝色)、至少一周使用一天但不每天使用(中蓝色)、以及上周未使用(浅蓝色)。数据来源为2024年8月的RPS,年龄范围为18至64岁。该图的样本为受雇个体(N = 3216)。大学专业的样本为拥有学士学位或以上的受雇个体。STEM专业包括生物、农业、环境、物理及相关科学;计算机、数学和统计;以及工程。“商业/传播/经济”包括商业、传播和经济学专业。“人文学科/其他”包括所有其他专业。
图3展示了按性别、年龄、教育和专业的工作中生成式AI的采纳率。调查显示,32%的男性在工作中使用生成式AI,而女性为23%。生成式AI的使用随年龄增长而下降,从40岁以下的工人中约为34%降至50岁以上工人中的17%。拥有学士学位或更高学历的工人中约有40%使用生成式AI,而没有大学学位的人中约为20%。学习科学、技术、工程或数学(STEM)专业的工人中有46%在工作中使用生成式AI,而学习商业、经济或传播专业的工人中为40%,其他专业(包括人文学科和社会科学)则为22%。附录图A.2展示了按人口特征划分的工作之外生成式AI使用情况,整体趋势相似,但差异不如工作中使用明显。
附录表A.1展示了生成式AI在工作中的采纳与人口特征和职业的多元回归系数。我们发现这里描述的模式在多元规格下普遍成立,因此为了简便,我们专注于简单的双变量比较。
3.1 生成式AI采纳与个人电脑和互联网的比较
图4比较了生成式AI与其他两项技术(个人电脑和互联网)的采纳速度。横轴测量相对于第一款大众市场产品的采纳情况。第一款大众市场电脑是IBM PC,于1981年8月发布,并售出超过一百万台(Abbate, 1999)。这意味着我们从CIU获得的第一个数据点是在大众普及三年后。首个销售至少一百万订阅的生成式AI模型是ChatGPT,发布于2022年11月,距我们的调查仅两年。最后,我们将互联网的大众市场可用性日期定为1995年4月,当时国家科学基金会(NSF)关闭了NSFnet,并允许互联网承载商业流量(Leiner等,2009)。这也是网景公司首次公开募股(IPO)的年份。
图4:计算机、互联网与AI采用的轨迹
备注:该图显示了三种技术在工作中的使用率,包括AI、计算机和互联网。横轴表示自各技术首个大众市场产品推出以来的年份。我们将2022年视为AI的推出年份,即ChatGPT发布的年份。1995年是互联网的推出年份,因为这一年NSF关闭了NSFNet并允许互联网进行商业流量传输。1981年是计算机的推出年份,IBM PC正是在这一年发布。AI的数据来源于2024年8月的RPS(实心蓝点)。计算机的数据来源于1984-2003年CPS的计算机和互联网使用补充调查(空心红方块)。我们绘制了两种互联网使用的估算值:2001-2009年CPS的计算机和互联网使用补充调查(深绿色三角形)和国际电信联盟(ITU)(青色三角形)。RPS和CPS的样本均为18至64岁个体。RPS样本量为N = 4682。ITU的样本为所有年龄段个体。
为了便于比较,我们测量这三项技术的综合使用情况,因为我们无法区分工作和非工作中的互联网使用。图4中的蓝点重复了图2中生成式AI的39.4%采纳率。红色方块描绘了从第3年到第22年的个人电脑采纳情况,涵盖了1984年至2003年的CPS补充调查。个人电脑的采纳率稳步上升,从第3年的20%上升至第22年的近70%。深绿色三角形展示了第6年至第14年间的互联网使用情况,涵盖了2001年至2009年的CPS调查,当时加入了关于互联网使用的问题。到第6年时,互联网的采纳率已经约为60%。浅绿色三角形则呈现了根据国际电信联盟(ITU)在第0年至第26年(例如,1995年至2021年)收集的美国互联网采纳情况。互联网采纳率迅速从第2年的20%增加到第7年的60%,然后在接下来的20年内稳步提高至90%。这两个数据集在重叠年份中的数据非常接近。
图4显示,迄今为止,生成式AI的采纳速度快于个人电脑和互联网。生成式AI比个人电脑更快采纳的原因在于其在工作之外的使用更为广泛,可能与便携性和成本的差异有关。附录图A.3仅比较了工作中生成式AI与个人电脑的采纳情况,使用CIU数据(我们无法区分家庭和工作中的互联网使用)。我们发现,生成式AI在第二年的采纳率为28%,而个人电脑在第三年的采纳率为25%。
在教育和收入方面,生成式AI和个人电脑的早期采纳模式相似。附录图A.4显示,在大众市场普及三年后,约42%的拥有学士学位及以上的工人在工作中使用个人电脑,而只有20%的工人未获得大学学位。对于生成式AI,我们发现教育水平的采纳率几乎相同。附录图A.5根据每周收入的百分位数展示了生成式AI和个人电脑的使用情况。两项技术的使用模式非常相似,收入上升至约第85百分位时使用率增加,随后略有下降。
尽管这两项技术的采纳模式总体上非常相似,但唯一的例外是性别。附录图A.6显示,32%的男性在工作中使用生成式AI,而女性仅为23%。相比之下,到1984年,只有22%的男性在工作中使用个人电脑,而女性为30%。一个可能的解释是,办公室和行政支持岗位中的女性比例较高,而个人电脑的采纳率接近50%。
3.2 各职业和任务中的生成式AI使用
图5a展示了按职业划分的生成式AI采纳情况。我们通过自由文本回应收集受访者的职位名称,然后使用解析算法将其匹配到标准职业分类(SOC)代码,识别成功率达到97%。
图5:按职业和行业组划分的工作中AI使用情况
备注:图5a显示了按职业划分的工作中使用AI的受访者比例。个人服务职业结合了SOC代码31-39,包括医疗支持、保护服务、食品准备与服务、清洁与维护,以及个人护理。蓝领职业结合了SOC代码4753,包括建筑、采矿、安装、维护与修理、生产、运输及搬运。使用强度分为上周每天使用(深蓝色)、至少一周使用一天但不每天使用(中蓝色)、以及上周未使用(浅蓝色)。数据来源为2024年8月的RPS,年龄范围为18至64岁。该图的样本为受雇个体(N = 3191)。图5b显示了按行业划分的工作中使用AI的受访者比例。使用强度同样分为上周每天使用(深蓝色)、至少一周使用一天但不每天使用(中蓝色)、以及上周未使用(浅蓝色)。数据来源为2024年8月的RPS,年龄范围为18至64岁。该图的样本为受雇个体(N = 3216)。
在工作中,计算机/数学和管理职业的生成式AI采纳率最高,约为49%。商业与金融及教育职业的使用率也较高,分别为42%和38%。然而,生成式AI在多种职业中的采纳相对普遍。除个人服务外,所有主要职业群体中至少有20%的工人在工作中使用生成式AI。有趣的是,在“蓝领”职业(包括建筑和采矿、安装和维修、熟练生产以及运输和搬运)中,22%的工人在工作中使用生成式AI。
附录图A.7展示了按受访者职业划分的工作之外生成式AI的采纳情况。总体排序大致相同,虽然使用率更高,范围从个人服务中的27%到管理层的47%。图5b展示了按行业的结果。金融、保险和房地产行业的工作者生成式AI使用率最高(51%),而休闲和住宿行业最低(15%)。附录图A.8比较了按职业划分的生成式AI和个人电脑的采纳率。个人电脑的使用更集中于少数职业,从计算机和数学职业的90%以上到大多数蓝领和个人服务职业的10%以下。
图6:AI在哪些具体任务中最有用?
备注:该图显示了AI用户报告AI在完成哪些任务时最有帮助。面板(a)涉及工作中的任务;面板(b)涉及工作外的任务。在工作和工作外,受访者首先提供了一份任务清单,并被要求选择上周使用AI协助完成的任务。随后,受访者被要求根据AI在完成任务中的帮助程度对这些选定任务进行排名。该图报告了将特定任务排名为第1(AI在该任务中最有帮助)或第2的AI用户的比例。由于一些受访者选择的任务少于两个,因此柱状图的总和不自然。数据来源为2024年8月的RPS,年龄范围为18至64岁。面板(a)和(b)的样本分别为受雇个体(N = 3216)和所有个体(N = 4682)。
我们还询问RPS受访者生成式AI在哪些工作任务中最为有用。在表示过去一周使用过生成式AI的受访者中,我们展示了图6中的任务列表,并要求他们选择过去一周中使用生成式AI帮助的任务。他们也可以填写其他任务。随后,受访者被要求按生成式AI在完成任务中的帮助程度对所选任务进行排序。
图6报告了排名前两的任务占受访者的比例。在工作中,排名最高的任务是写作(38%)、行政任务(27%)以及文本或数据的解释/翻译/总结(23%)。总体而言,排名相对均匀,列表中的十个任务中至少有10%的受访者将八个任务列为前两名。在工作之外,排名最高的任务是写作(27%)、解释/翻译/总结(23%)以及个人协助(21%)。与工作使用类似,列表中的十一个任务中至少有10%的受访者将八个任务列为前两名。
附录图A.9报告了每项任务中使用生成式AI的受访者比例。总体排序与图6大致相同。工作中的所有十项任务的使用率至少为25%,其中最常见的任务为写作(57%)、信息搜索(49%)和获取详细指示(48%)。在工作之外,最常见的任务是个人协助(如列表、日程等)、创意项目的想法和提示,以及写作。总体而言,生成式AI在职业和工作任务中的使用范围广泛。
3.3 生成式AI对劳动生产率的提升潜力
除了询问受访者使用生成式AI的频率外,我们还关注其日常使用强度。具体而言,我们询问受访者在使用生成式AI的工作日和休息日中,是否使用了15分钟或更少、15分钟到一个小时之间,或者超过一个小时。附录图A.10报告了工作和家庭中生成式AI的日常使用强度。总体而言,25%的生成式AI用户表示在工作中使用时间超过一个小时,52%的用户在使用的日子里使用时间在15到60分钟之间。使用强度和频率呈正相关,42%的每日用户报告每天使用一个小时或更长时间。工作之外的使用模式也类似。
我们利用生成式AI的使用强度和频率来估算所有工作时间中受生成式AI辅助的比例。对于每位受访者,我们将其报告的工作小时数与其自报的生成式AI使用频率和强度的上下限相乘。例如,假设一名工人在上周某些工作日使用了生成式AI,并且每天使用时间在15到60分钟之间。对于下限,我们假设该受访者在某一天使用了15分钟。上限则是假设他们在工作日中除了某一天都使用生成式AI,每天使用59分钟。对于那些报告使用过生成式AI但在上周没有使用的受访者,我们假设其使用时间为零。
将所有受访者的这些数据相加,得出每周受生成式AI辅助的工作时间占比的下限和上限分别为0.5%和3.5%。这个总体比例较小,主要是由于大量工人报告没有使用生成式AI,达到76%。
鉴于这些数据,生成式AI能够在多大程度上提升劳动生产率?五项近期研究通过实验或准实验设计估算了生成式AI对任务生产率的影响。Noy和Zhang(2023)付费给受过大学教育的专业人士进行写作任务,发现ChatGPT提升了40%的生产率。Brynjolfsson、Li和Raymond(2023)发现基于生成式AI的对话助手提高了14%的生产率。Dell’Acqua等(2023)发现,为战略顾问提供生成式AI的访问权限,在他们认为适合AI辅助的预注册任务中,生产率提高了约25%。Cui等(2024)发现,在一家大型电子制造公司中,随机为软件开发者提供GitHub Copilot这一基于AI的编码助手,使其生产率提升了26%。Peng、Kalliamvakou、Cihon和Demirer(2023)研究了GitHub Copilot在单一编码任务上的影响,发现其生产率提高了56%。
如果我们(稍微任意地)将约25%的中位数估计值乘以受生成式AI辅助的工作时间比例,我们估计其可能在当前使用水平下提升劳动生产率的幅度在0.125%到0.875%之间。如果生成式AI的采纳速度保持与个人电脑和互联网等过去技术相同,且使用强度或任务构成没有变化,这些数字将在下一个十年内翻倍。然而,我们需要警告的是,这一计算极具推测性。工人和企业可能首先在其最具生产力的应用中使用生成式AI,这意味着随着使用的扩展,收益递减现象可能会出现。另一方面,随着时间推移,技术可能变得更加先进和适用。
4 结论
生成式AI迅速崛起为一项重要的新技术,其对经济的影响在很大程度上取决于采纳的速度和强度。本文报告了美国首次全国代表性调查关于生成式AI在工作和家庭中使用的结果。我们的数据来源于实时人口调查(RPS),该调查经过构建和加权以确保全国代表性,并遵循与广泛使用的国家数据源CPS相同的调查设计。我们发现,在2024年8月,39.4%的美国18至64岁人群报告使用过生成式AI,其中28.0%在工作中使用,近九分之一的工人报告每日使用。
我们将生成式AI的采纳速度和强度与两项变革性技术——个人电脑和互联网进行比较。我们发现,生成式AI的采纳速度快于这两项技术。我们还发现,生成式AI被广泛应用于多种职业和工作任务中。近一半的计算机、数学和管理职业工人在使用生成式AI,而近四分之一的蓝领工人也在使用。我们询问受访者生成式AI在撰写、行政支持、文本或数据的解释与总结、编码等十一项不同工作任务中的实用性。我们的调查显示,工作中的使用率在十项任务中均超过25%。总体而言,我们发现生成式AI确实是一种通用技术(Eloundou、Manning、Mishkin和Rock,2024)。
我们估算,目前美国约有0.5%到3.5%的工作时间受到生成式AI的辅助。假设近期实验研究的生产率提升在外部上是有效的,这表明生成式AI在当前使用水平下可能使劳动生产率提升0.125到0.875个百分点,但我们需要警告,这一计算应被视为高度推测性的,因为它基于特定假设。
我们的研究结果为未来的研究提供了许多方向。特别是,随着技术的成熟,跟踪生成式AI的采纳情况非常重要,并监测其在工人、企业和职业中的广泛使用情况。未来的RPS调查将包括关于生成式AI采纳频率和强度的更详细问题,以便我们跟踪其对美国经济不断演变的影响。
参考资料:Bick, Alexander, Blandin, Adam, and Deming, David J. "The Rapid Adoption of Generative AI." NBER Working Paper No. 32966, September 2024. National Bureau of Economic Research. https://www.nber.org/papers/w32966
---【本文完】---
本文转载自 Andy730公众号