OpenAI揭秘:七家前沿企业AI转型的黄金法则
本文为2025年4月OpenAI发布的报告《AI in the Enterprise:Lessons from seven frontier companies》的正文主体的翻译。
目录
工作新方式
执行摘要
企业AI应用的七大经验
从评估开始
将人工智能嵌入产品
立即行动并早期投入
定制并微调模型
让专家掌握AI技术
释放开发者的潜力
设定大胆的自动化目标
结论
作为一家人工智能研究与部署公司,OpenAI高度重视与全球企业合作,因为我们的模型需要在日益复杂、精密且相互关联的工作流程与系统中发挥最大效能。
我们观察到人工智能已在以下三个领域带来显著且可量化的提升:
1、提升员工效能:帮助人们在更短时间内产出更高品质成果;
2、自动化常规操作:将人们从重复性任务中解放,专注于创造价值;
3、赋能产品创新:通过提供更精准、响应更快的客户体验。
但人工智能的应用不同于传统软件开发或云应用部署。最成功的企业往往将其视为一种新范式,这促使企业形成实验性思维和迭代方法,从而更快实现价值并获得用户与利益相关者的广泛认可。
我们的方法:迭代式开发
OpenAI的组织架构围绕三大团队展开:
研究团队 致力于推进人工智能基础研究,开发新模型与能力;
应用团队 将这些模型转化为产品,如ChatGPT企业版和API接口;
部署团队 则将产品引入企业,解决其最迫切的应用场景需求。
我们通过迭代式部署从客户应用场景中快速学习,并利用反馈加速产品改进。这意味着定期发布更新、收集反馈,并在每一步优化性能与安全性。最终效果:用户能尽早且持续获得AI技术的最新突破,而您的反馈将直接塑造未来的产品与模型。
1、从评估开始:通过系统化的评估流程,衡量模型在具体应用场景中的表现。
2、将AI嵌入产品:创造全新的客户体验与更精准的互动场景。
3、立即行动并早期投入:越早启动,价值积累越显著。
4、定制并微调模型:针对具体应用场景调整AI模型,可大幅提升价值产出。
5 、让专家掌握AI技术:最贴近业务流程的人员最适合用AI优化流程。
6、释放开发者的潜力:通过自动化软件开发生命周期,放大AI的应用效益。
7、设定大胆的自动化目标:大多数流程包含大量重复性工作,亟待自动化。目标应更高远。
让我们结合客户案例深入剖析每一条经验。
摩根士丹利如何通过反复测试确保质量与安全
作为全球领先的金融服务机构,摩根士丹利本质上是关系驱动型企业。因此,企业内部对人工智能能否为高度个性化且敏感的业务创造价值存在疑问实属正常。
解决方案
对每个拟议的应用程序进行深入eval。评估本质上是一套严谨、结构化的流程,用于衡量AI模型在特定应用场景中对标基准的实际表现。它同时通过专家全程反馈,持续优化AI赋能的流程。
实践过程
摩根士丹利的首次评估聚焦于提升财务顾问的效率与效能。核心逻辑简单明确:若顾问能更快获取信息并减少重复性任务耗时,即可为客户创造更多优质洞见。
初始阶段进行了三项模型评估:
1、模型语言翻译能力 :对比AI结果与专家顾问的回答,评估准确性与相关性;
2、内容摘要生成 :通过既定指标(准确性、相关性、连贯性)评估模型压缩信息的能力;
3、人工训练师参与 :测量模型输出翻译的准确性与质量。
这些评估(及后续更多测试)让摩根士丹利有信心将应用场景投入生产。
成果展示
当前,98%的摩根士丹利顾问每日使用OpenAI;文档访问率从20%跃升至80%,搜索时间显著缩短;顾问得以将更多时间投入客户关系维护,归功于任务自动化与洞察加速。
顾问反馈呈现压倒性积极态势:客户互动度提升,原本需数日的跟进现在数小时内完成。
凯特琳·埃利奥特
企业级生成式AI解决方案主管
评估定义
评估是验证和测试模型输出结果的过程。严谨的评估可构建更稳定、可靠且适应变化的应用。
评估围绕关键任务展开,通过基准对标模型输出质量——是否更精准?更合规?更安全?具体指标取决于各场景的核心需求。
Indeed如何实现职位匹配的人性化
当人工智能被用于自动化并加速繁琐重复的工作时,员工得以专注于人类独有的能力。而由于AI能处理来自多源的海量数据,它能创造更贴近人性的客户体验——因为更精准且个性化。
Indeed(全球第一大招聘平台)通过GPT-4o mini以创新方式实现职位匹配。
「为什么」的力量
为求职者推荐优质岗位仅仅是Indeed体验的起点。平台还需向候选人解释为何特定岗位适合他们。Indeed利用GPT-4o mini的数据分析与自然语言能力,在邮件和消息中生成这些「推荐理由」。借助AI,广受欢迎的「邀请申请」功能还能说明候选人的背景或过往经历为何与岗位高度匹配。
Indeed团队将原有匹配引擎与GPT驱动的新版本(含定制化上下文)进行对比测试,性能提升显著:
职位申请量提升20%
招聘成功率提升13% ——不仅申请人数增加,雇主更倾向录用这些候选人。
鉴于Indeed每月向求职者发送超2,000万条消息,且每月网站访问量达3.5亿人次,这些提升对业务产生深远影响。但规模化也意味着token消耗激增。为提升效率,OpenAI与Indeed合作微调了一款更小型GPT模型,在保持效果的同时减少60%的token消耗。
帮助求职者找到合适岗位并理解机会为何匹配自身需求,这是极具人性化的结果。Indeed团队通过AI加速了人岗匹配效率——这对所有人都是共赢。
"我们看到持续投资这一新基础设施的巨大机遇,这将助力营收增长。"
Chris Hyams首席执行官
Klarna如何从AI复合效应中获益
人工智能绝非简单的即插即用方案——应用场景的复杂度与影响力需通过迭代逐步提升。
越早启动,组织越能享受复合式提升带来的长期收益 。
全球支付网络及购物平台Klarna推出的AI助手,成功简化了客户服务流程。短短数月内,该助手已承担三分之二的客服对话量——相当于数百名人工客服的工作量,同时将平均问题解决时间从11分钟缩短至仅2分钟。该项目预计可带来4000万美元的利润增长,且客户满意度评分与人工服务持平。这些成果并非一蹴而就:Klarna通过持续测试与优化AI助手才实现这一突破。
更重要的是,目前90%的Klarna员工已在日常工作中使用AI工具。随着全公司对AI的认知与熟悉度提升,Klarna得以更快推进业务,更高效启动内部项目,并持续优化客户体验。通过早期投资与广泛推广,AI的效益正在Klarna内部形成复合增长——为整个企业创造持续回报。
"这一AI在客户交互领域的突破,意味着我们的客户能以更低价格获得更优质的服务,员工面临更富挑战的工作,投资者收获更可观的回报。"
Sebastian Siemiatkowski
联合创始人兼首席执行官
劳氏如何提升商品搜索体验
从人工智能应用中获得最大收益的企业,往往是那些投入时间与资源定制训练专属AI模型的公司。OpenAI已对API进行深度优化,无论是自助式服务还是通过工具支持,都能更便捷地实现模型定制与微调。
我们与《财富》500强企业Lowe's密切合作,共同提升其电商平台搜索功能的准确性与相关性。面对数千家供应商提供的不完整或不一致的商品数据,精准的商品描述与标签体系成为核心挑战,同时需要理解消费者动态变化的搜索习惯——这一需求因品类差异而复杂化。
通过微调OpenAI模型,劳氏团队成功将商品标签准确率提升20%,错误检测能力提升60%。
当团队看到基于产品数据微调GPT 3.5的成果时,兴奋之情溢于言表。我们深知,这项技术将成为制胜关键!
Nishant Gupta
数据、分析与计算智能高级总监
什么是微调?
如果将GPT模型比作成衣西装,微调则是定制版本——通过这种方式将模型适配到您组织的特定数据与需求。
为何重要:
提升准确性:通过对独特数据(如产品目录或内部常见问题解答)进行训练,模型能输出更相关、符合品牌调性的结果。
领域专业知识:微调后的模型能更好理解您所在行业的术语、风格与语境。
一致的语气与风格:对零售商而言,意味着每段产品描述都保持品牌语调;对律所而言,则是每次都能生成正确格式的法律引用。
更快达成目标:减少人工编辑与重复核查,使团队专注于高价值任务。
BBVA的专家主导式AI实践
您的员工最贴近业务流程与问题,往往最适合发现AI驱动的解决方案。将AI工具交到这些专家手中,其效果远胜于构建通用型或横向扩展的解决方案。
全球银行业领导者BBVA拥有超过125,000名员工,每位员工都面临独特挑战与机遇。他们选择将AI工具交到员工手中——通过与法务、合规及IT安全部门紧密协作确保责任共担,随后在全球部署ChatGPT企业版,让员工自主探索应用场景。
"通常在我们这样的企业中,即使开发一个原型都需要大量技术资源与时间," BBVA全球AI应用主管Elena Alfaro表示,"而借助定制GPT,任何人都能轻松创建应用解决独特问题。"
在短短五个月内,BBVA员工创建了2900多个定制GPT,其中部分应用将项目与流程周期从数周缩短至数小时。这种影响已渗透到多个领域与部门:
信贷风险团队:更精准评估信用资质;
法务团队:每年解答40,000次政策咨询,并通过NPS调查进行情感分析;
客户服务团队:实现自动化操作。
胜利果实持续向市场营销、风险管理、运营等部门蔓延——这皆源于将AI交到真正懂得如何应用的专业人士手中。
"我们认为对ChatGPT的投资本质上是对员工的投资。人工智能放大了我们的潜力,助力实现更高的效率与创造力。"
Elena Alfaro全球AI应用主管
美客多构建更快速、更一致的AI开发体系
开发者资源是许多组织发展的主要瓶颈与制约因素。当工程团队超负荷运转时,创新速度减缓,并产生难以逾越的应用积压。
拉美最大电商平台及金融科技公司Mercado Libre与OpenAI合作构建了名为Verdi的开发平台层,该平台由GPT-4o及GPT-4o mini驱动,现助力其17,000名开发者统一并加速AI应用开发流程。
Verdi通过集成语言模型、Python节点及API,打造以自然语言为核心交互界面的可扩展、一致性平台。开发者如今无需深入源代码即可更高效地构建高质量应用,同时内置安全机制、防护规则与路由逻辑。
这一变革使AI应用开发速度显著提升,助力美客多员工实现以下突破:
提升库存容量:GPT-4o mini视觉模型标记并完善产品列表,使产品目录容量提升100倍;
欺诈检测:每日分析数百万商品数据,flagged商品的欺诈识别准确率提升至99%;
定制产品描述:将商品标题与描述翻译适配西班牙语和葡萄牙语的地域性差异;
增加订单量:自动化生成评论摘要,帮助用户快速掌握产品反馈;
个性化通知:定制推送消息以提升用户参与度并优化产品推荐。
下一步计划:利用Verdi改善物流体系、减少延迟交付,并在全公司范围内推进更多高影响力任务。
"我们基于GPT-4o mini设计理想AI平台,核心目标是降低认知负担,赋能全组织快速迭代、开发并部署创新解决方案。"
Sebastian Barrios技术高级副总裁
OpenAI如何实现内部工作自动化
在OpenAI,我们每天与AI共处,因此总能发现新的自动化机会。例如,我们的支持团队曾因以下问题陷入低效:访问系统、理解上下文、撰写回复、执行客户操作。
解决方案
我们构建了内部自动化平台。该平台基于现有工作流程与系统运行,可自动化重复性任务并加速洞察与行动。
首个应用场景
在Gmail基础上开发客户回复生成与操作触发功能。通过自动化平台,团队可即时调取客户数据与相关知识文档,并将结果整合至回复邮件或具体操作(如更新账户信息或创建支持工单)。
成效
通过将AI嵌入现有流程,团队效率更高、响应更快、客户更聚焦。该平台每月处理数十万任务,释放人力投入高价值工作。随着系统扩展至其他部门,我们验证了初始设定大胆自动化目标的重要性——而非将低效流程视为必然成本。
从彼此经验中学习
如前所述,每家企业都充满利用AI提升成果的机会。尽管应用场景因行业而异,但核心经验普适:
开放的实验性思维 :通过严格评估与安全防护机制推动AI部署;
聚焦高回报场景 :优先选择低投入、高收益的应用场景,在迭代中学习并拓展新领域。
成果清晰可量:流程更高效精准、客户体验更个性化、员工专注人类擅长的创造性工作。当前,企业正通过集成AI工作流实现更复杂流程的自动化——常借助工具、资源及智能代理完成任务。我们将持续分享前线经验,助您探索AI落地路径。
TsingtaoAI(北京霆涛商业智能技术有限公司)企业内训业务线专注于提供LLM、具身智能、AIGC、智算和数据科学领域的企业内训服务,通过深入业务场景的案例实战和项目式培训,帮助企业应对AI转型中的技术挑战。其培训内容涵盖AI大模型开发、Prompt工程、数据分析与模型优化等最新前沿技术,并结合实际应用场景,如智能制造、医药健康、金融科技和智能驾驶等。通过案例式学习和PBL项目训练,TsingtaoAI能够精准满足企业技术团队的学习需求,提升员工的业务能力和实战水平,实现AI技术的高效落地,为企业创新和生产力提升提供强有力的支持。
同时,TsingtaoAI公司并不是一家单纯的培训机构,我们同样是一家AI产品开发公司,公司核心团队主要也都是由技术和产品人才构成,公司团队大部分成员在大模型时代之前就在从事AI产品相关的工作。公司在过去一年里,为10余家客户开发了AI相关的产品,涵盖医疗、教育、智能制造、人力资源等领域。相信我们在AI产品开发和客户服务的过程所形成的认知和方法论,能对贵司的需求有更深更细的洞察和理解,也能提供更深入业务肌理的“AI能力获得”。