| 石油专家评论
来源:中国石油报
时间:2024-07-09
01
大模型技术的性能和迁移性显著超越此前模型,具备支持行业智能化的巨大潜力
自ChatGPT模型于2022年底问世以来,大模型以其强大的多轮对话能力、多场景多任务适应能力和与人的交互体验,在全世界引发热烈反响。
目前的大模型属于生成式人工智能(AI Generated Contents,AIGC)范畴,主要指语言大模型,也包括计算机视觉(Computer Vision,CV)大模型和多模态(Multimodal)大模型。大模型的训练数据量、参数量、计算量显著大于此前的人工智能模型,可实现在超高维度空间上对人类全部知识的高度压缩映射。
大模型基于海量数据训练形成基本的语言能力,并通过基于人工干预的模型调优,形成了包括对话能力、代码生成能力在内的一系列基础能力。大模型普遍具有自动形成推理结构和分析逻辑、长距离上下文一致、代码生成和理解等支撑相对复杂任务的基础能力。同时,大模型还能够理解基于自然语言的需求描述或示例,结合补充的业务信息知识,实现基础能力迅速向不同任务和场景迁移,有效解决人工智能技术在场景落地时研发成本高、数据不足、模型能力不稳定且迁移性差等问题。
大模型的上述突出能力也令其具有较大的工程应用潜力。基于提示词工程、强化学习、外部知识库等技术,大模型能迅速实现从基座模型能力向场景应用落地转化,模型的场景调优成本很低甚至无须模型调优。这不仅使得模型场景落地的研发成本和业务知识需求显著降低,而且令模型场景落地的标准化、流程化水平以及相应标准化工具的可用性显著提高。
众多科技企业正全力推进行业大模型技术落地工作,打造通用的基座模型、通用的工具能力和标准化的行业智能应用。建设服务专业领域的行业大模型,并深度赋能业务,已成为众多企业在人工智能技术领域的关键工作任务。
02
大模型技术在油气行业应用潜力巨大,但面临应用层面和工程层面的业务理解、数据打通等挑战
目前,大模型的主要应用形式包括聊天对话、智能写作、辅助编程、智能搜索、知识问答等,主要应用场景可分为通用(如经营管理、办公)和专业(如能源、金融)两类。
人工智能大模型技术在助力油气行业适应市场变化、提升生产效率等方面前景广阔,潜在的业务需求场景丰富。在勘探开发领域,行业大模型可以帮助工程师快速分析地质、储层、油藏等复杂信息,为勘探技术方案、研究报告等专业文档的编写提供辅助支持。在炼油化工领域,行业大模型可以针对化工研究中特定的物理和化学特性,智能化模拟组合全新的化工原料,帮助炼化企业产品向差异化、高端化的方向发展。在销售等领域,行业大模型可以快速获取和分析生产、市场等数据,生成行业和市场分析研究报告,为企业管理决策提供依据。
与此同时,油气行业大模型技术落地,在应用层面和工程层面分别存在一定的困难。
在应用层面,一是场景洞察难。石油天然气工业数智化场景覆盖采集、分析、控制、呈现、决策等业务链。在实际场景应用上,是否真正具备价值、如何实现可量化的商业价值评判,是技术、经验、商业模式、交付能力、生态等多方面共同作用的结果,这导致洞察难度大、试错成本高。二是结论解释难。生成式人工智能属于典型的黑盒编解码架构,推理预测过程不可解释。同时,大模型提供的数据服务,存在生成幻觉、错误引导等风险,需要通过具有业务属性的结果解释来满足终端用户的理解与使用要求。
在工程层面,一是应用构建和集成难。企业现有业务信息系统,均以流程驱动为主、以数据和模型驱动为辅。大模型与现有业务系统及流程对接难度大。此外,跨多个分布式系统带来的组织、角色、权限统一管理与数据资产安全应用问题,给大模型应用的嵌入带来了不确定性。二是跨专业语言对齐难。垂直领域大模型涉及勘探、开发、生产、营销、运营等多个不同专业,跨专业间的术语、专业知识、业务模式等复杂体系急需统一模式进行对齐。此外,对于同类专业内部,终端用户的业务专业语言与开发者的技术语言也同样急需对齐。三是数据获取难。能源工业数据资产多为私域数据资产,存在数据获取渠道和获取可行性上的限制,数据的流通与共享存在一定困难。同时,不同来源的数据资产涉及范围广、数量大、质量不一致,需要完备的数据存储、治理、传输、表征和应用链路,以保证数据资产的全链路可靠。
03
加快大模型技术研究与应用落地,建议重点关注掌握自主可控的大模型技术,实现场景深化应用
大模型技术在通用和油气专业场景展现出传统技术不可替代的价值,将为产业新旧动能转换和能源经济高质量发展提供有力支撑。建议贴近油气产业链价值增量,基于油气工业理解和数据资产积累,建设油气行业的一体化大模型平台和场景大模型应用,解决应用组装、场景嵌入、高价值内容生成、复杂任务链路执行、复杂决策辅助等系列难点问题,以大模型智能体集群支撑业务模式重塑、生产效率提升和生产安全可控。
一方面,要培育自主可控的油气行业大模型关键核心技术。
培育人工智能大模型关键核心技术,目标是掌握大语言模型数据集建设技术,大模型分布式构建、训练、调优、推理技术,以及与之相配套的开发工具。具体包括:一是研究模型基础技术,具备源码层面的大模型开发能力;二是研发模型工程技术能力与工具链,具备部署及持续优化千亿参数级大模型的能力;三是试点通用大模型的技术落地,结合油气行业真实业务需求实现大模型技术的应用落地。
另一方面,要打造通用智能助手、行业知识服务、智能伙伴等三类大模型应用。
一是通用智能助手。优先在基础通用大模型(L0)上加载通用语料,结合提示词(Prompt)技术,快速搭建并推广员工日常办公辅助AI工具,提升办公效率,培育大模型应用环境和文化。
二是行业(专业)知识服务。依托行业大模型(L1)、专业大模型(L2),加载沉淀的行业和专业知识,构建行业和专业知识库,提供行业和专业知识服务,为智能业务协同辅助奠定基础。
三是智能伙伴。结合专业知识和AI智能体(Agent)技术,打造辅助业务系统的智能助手(Copilot),实现智能化与当前面向业务的数字化系统深度集成,并优化甚至重构再造现有业务流程,大幅提升企业的整体运营效率和响应速度。
国际石油网声明:本文仅代表作者本人观点,与国际石油网无关,文章内容仅供参考。凡注明“来源:国际石油网”的所有作品,版权均属于国际石油网,转载时请署名来源。
本网转载自合作媒体或其它网站的信息,登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。如因作品内容、版权和其它问题请及时与本网联系。
图片正在生成中...