BIM知识提取与发现:历史回顾与未来展望

摘要

过去,建筑、工程和施工 (AEC) 行业领域的知识主要来自经验, 为了利用这些知识,许多研究都集中在以系统和可访问的方式检索和存储这些知识。 建筑信息模型 (BIM) 技术被证明是提取数据的媒体,因为它为项目生命周期内的所有设施提供对应的数字模型。 因此,将知识科学与BIM相结合,在AEC行业领域知识图谱的构建中展现出巨大的潜力。

本文在文献综述的基础上,从(1)知识描述(2)知识发现(3)知识存储与管理(4)知识推理和 (5)知识应用,展示知识科学和BIM技术在AEC行业领域的应用现状和未来方向。

该文章表明,BIM能够通过采用语义网络、知识图谱等相关方法,为知识提取和发现提供信息。这也说明了这些知识在AEC行业的设计、施工、运营和维护阶段是有帮助的,但现在还只是处于起步阶段。

1. 介绍

在过去的几十年中,建筑、工程和施工 (AEC) 行业领域的知识主要来自经验,并且通常记录在纸质文档中或特定的电子数据库中。 此类文件包括法规、标准、手册和教科书。然而,从文档和特定电子媒体中检索信息是困难且容易出错的,这给提取和重用知识带来了麻烦。 随着建筑信息模型(BIM)、地理信息系统(GIS)、物联网(IoT)、云计算等信息技术的发展,越来越多的数据被收集到AEC行业。然而,无论数据是否可以提供知识,在这些数据无法被使用时,它就不是信息。

因此,很多研究集中于通过各种方法从数据中提取知识,包括本体、语义网络、数据挖掘算法等。例如,采用本体来定义和表示建筑行业中概念的类别、属性和关系。语义网络的概念是在 1990 年代初期 Berners-Lee 等人提出的。扩展了万维网 (WWW) 的概念,无需人工操作即可处理网络通信中积累的数据。更具体地说,本体有助于将基于自然语言的网络数据转换为计算机可识别的信息,这有助于计算机进行查询或推理的过程,因为它“知道”概念和它们之间的关系。 另一方面,语义网络通过不同的方法从互联网中提取“事实”方面的新知识。 这些事实相互关联,因此可以组织成一系列关系图,称为知识图(KG)。KG通过分析文本的语法、词汇和结构特征,结合数据并发现来自不同来源的知识。 同时,利用聚类、模式识别等数据挖掘算法从大数据中检索隐藏的信息。所有这些方法都有助于为AEC行业提供新知识。

BIM技术的概念是在20世纪70年代提出,近20年来,它给AEC行业带来了巨大的积极影响。BIM模型包括建筑物所有设施的物理和功能数字模型,通过应用数字建模和相关技术(DMAT)收集数据[9],并采用独特、可读的数据标准,支持项目生命周期不同阶段的参与者共享数据。应该注意的是,它还改善了项目不同方面的不同参与者之间的协作。BIM还可以为自动化和智能应用集成领域知识和专家方法。由于BIM如今已发展到一个成熟阶段,大量BIM系统和相应的数据平台应用于AEC行业。随着数据量的增长,参与者逐渐意识到从BIM中积累的数据中发现新知识的潜力。例如,研究人员发现,通过采用语义网络来支持不同数据源之间的数据集成和复杂的搜索需求,BIM的价值可以提高。BuildingSMART观察到了这种趋势,该组织将其技术路线图修改为三个长期级别,并引入了第四层,以涵盖“语义搜索”和“云数据库”领域。此外,关于BIM在知识生成/提取中的应用的研究不断被报道,包括基于本体的数据管理和共享、不同领域之间的知识融合以及自动逻辑推理和知识检索等。

然而,为了提高知识管理的通用性和效率,基于BIM的知识相关领域仍有许多工作有待研究。为了总结基于BIM数据的知识提取和发现的最新进展,识别可能出现的挑战并指出未来的方向,本文对相关文献进行了系统的回顾。以下各节安排如下。第2节阐述了研究方法和研究框架。第3至7节分别从知识描述、知识发现、知识存储和管理、知识推理和知识应用等方面讨论了当前最新的研究课题。最后一节讨论了挑战,并提出了未来的发展方向。

2. 方法论和框架

以系统和有组织的方式对相关文献进行了5个步骤的回顾。 首先,审查范围确定为基于BIM的知识提取和发现。 因此,通过将关键字组合为TITLE-ABS-KEY((“construction industry”) OR (“BIM”) OR (“AEC”) OR (“construction management”)) ANDTITLE-ABS-KEY((“本体*”)或(“语义网”)或(“知识”)或(“链接数据”))。 给定原始数据库,通过手动检查标题和摘要来过滤掉相关性较低的研究。 然后总结高被引作者、期刊和关键词,然后深入研究主流文献,总结state-of-art研究课题和未来方向。

2.1 研究方向

为了重点关注基于BIM的知识提取和发现,本综述主要包括与BIM、语义网、本体、资源描述框架、web本体语言、知识管理等密切相关的研究。

尤其是知识与BIM的结合给AEC行业带来了巨大的变化。在二十一世纪早期,基于领域知识的语义技术被引入AEC行业。例如,Pan等人、Elghamrawy和Boukamp讨论了语义网对建设项目有益的额外价值。同时,最近的一些评论讨论了BIM的知识及其在建筑设计、能源模拟、智能优化、安全管理、城市空间设计和分析、BIM与地理信息系统的集成、设计规范合规性、设施管理中的应用,根据主题的潜在语义分析(LSA)对这些主题进行了总结。由于BIM本身强调数字模型中的信息,因此该文章主要集中于如何提供基本信息以满足特定领域或应用的要求。为了便于组织,研究分为5个主流主题,即知识描述、知识发现、知识存储和管理、知识推理和知识应用,如表1所示。

上面列出的每个研究主题都依赖于特定形式的建筑信息,其中一些甚至依赖于来自不同数据源的信息。BIM技术能够提供包括数据标准、数据管理和数据平台在内的信息框架,以集成这些基本数据。同时,语义网为基于BIM的数据平台的知识提取和发现提供了知识描述、查询语言和推理机的技术框架。因此,如图1所示,这两种技术的集成对于AEC行业的知识工程具有巨大的潜力。


   表 1 建筑信息建模知识抽取与发现研究课题
 


   图1 建筑信息建模知识抽取与发现框架
 

2.2 文献数据

本研究主要考察了 Web of Science (WoS)和Scopus数据库中 2009 年至 2019 年发表的文献。 评审论文数量如图2所示。总体而言,该领域的论文数量逐年增长,尤其是在2014年之后,这意味着基于BIM的知识管理成为吸引AEC行业信息技术学者关注的重要趋势。


   图2 WoS和Scopus数据库2009-2019年文献数
 

根据过滤后的文献,C.Eastman、J.Beetz和P.Pauwels等被引用次数最多且影响最大的学者,以及建筑自动化和高级工程信息学等国际学术期刊总结在图 3 中。 图4显示最活跃的关键词包括BIM、本体和语义网等。

3. 研究课题一:知识描述

汉努斯等人 使用术语“孤岛”来描述信息之间的差距。 当岛屿可以交换信息时,意味着应该建立一个公共的数据模型,而不是特定的模型,以通用的形式描述对象,不分专业、流程和系统。工业基础类(IFC)相关标准是构建信息描述的模型,资源描述框架(RDF和Web本体语言(OWL)是语义描述的模型。


   图3. 与建筑信息建模知识提取和发现相关的前10名作者和前10名出版商
 


   图 4 建筑信息建模知识抽取与发现相关关键词
 

3.1 IFC建筑信息描述标准框架

由 BuildingSMART 提出的 IFC 标准框架作为建筑环境中资产交付和支持的开放标准框架,由 IFC、数据字典 (bSDD)、信息交付手册 (IDM) 和模型视图定义 (MVD) 和 BIM 协作格式 (BCF) 。 IFC 是一种开放和中立的数据格式,用于描述 BIM 和模型内的所有元素,以提供独特的数据交换标准。如今,许多 BIM 兼容软件采用 IFC 作为数据交换格式之一。 bSDD 是从国际词典框架 (IFD) 发展而来的,它构成了一个对象及其属性库,用于识别建筑环境中的对象及其特定属性,而不受语言限制。 IDM 提出了一种通过流程建模来定义信息交换需求的方法,以便组织中的所有参与者都知道必须在何时以及哪些不同类型的信息中进行通信。 MVD 是一种 IFC 视图定义,它定义了 IFC 模式的子集,以满足 IDM 中一个或多个交换要求的需要。 MVD 以“mvdXML”格式编码,并在特定数据类型的特定属性处定义允许值。 BCF 是一种开放文件 XML 格式“bcfXML”,它支持 BIM 流程中的工作流通信,并为软件开发提供 Web 服务“bcfAPI”以交换 BCF 数据。 如今,所有这些标准都在制定最重要和可接受的 BIM 标准框架,以存储与 AEC 行业相关的信息和知识。

当然,也有研究通过采用IFC框架开发了面向对象的信息模型[28]或通用应用程序,而不管平台、机器或数据源如何。在这些研究中,研究人员通常采用数据建模语言EXPRESS来描述实体关系(E-R)模型,包括数百个通过树结构定义的对象。在当前发布的IFC模式中,共有4层,即资源层、内核层、共享层和域层。每一层都有几个模块。资源层由基本信息资源(如材质、几何图形和拓扑)的定义组成。但是,如果不链接到其他层的实体,这些定义就不能单独使用,因为它们不包含全局唯一标识符(GUID)。而其他3层中的实体具有GUID。核心层定义核心数据模型,包括对象定义(例如工程对象的位置和几何外观以及这些对象之间的关系)。共享层定义了各种专业领域或流程(如墙、梁、门和窗)可以使用的公共实体。域层定义了用于域内信息交换的专业领域相关实体(例如加热、通风和空调(HVAC)域中的蒸汽锅炉、风扇和阻尼器)。

3.2 用于语义描述的RDF和OWL

RDF由万维网联盟(W3C)提出。通过使用各种语法符号和数据序列化格式,它旨在描述元数据数据模型,作为语义网络描述。具体来说,RDF采用主语-谓语-宾语的表达式(称为“三元组”)来描述资源。由于三元组可以表示在RDF图中,RDF图是一种有向标签图,因此它能够广泛地用于描述基于语义的知识。在RDF图中,每个节点都引用真实世界的一个概念或对象,并且节点由统一资源标识符(URI)标识。通过这些节点之间的定向链接,计算机可以读取和重用信息。

OWL构建于RDF之上,也是用于编写本体的知识表示语言家族的一员。基于OWL概念构建的RDF图称为OWL本体。OWL的当前版本是OWL2。图5总结了其概况。椭圆的上方表示本体中的抽象概念,因此可以被视为抽象结构或RDF图。事实上,任何OWL本体也可以被视为RDF图。RDF图文档(OWL2/RDF映射)中规定了本体结构和RDF图之间的关系。OWL Lite、OWL DL和OWL Full是OWL的三个子语言,而OWL DL可以进一步分为OWL EL、OWL QL和OWL RL三种语言。不同的语言适用于基于本体的推理的不同复杂性。


   图5. OWL2 文件概况
 

3.3 ifcXML and ifcOWL

由于EXPRESS语言缺乏语义信息,基于逻辑的语言(如OWL)被认为在知识描述、语义数据共享、重用现有本体和软件之间的协作性方面具有优势。因此,为了提高通用性和可访问性,IFC除了EXPRESS格式外,还提供了另外两种建筑信息格式,即IFCXML和IFC-OWL。后缀为“.ifcXML”的IFC-XML文件遵循可扩展标记语言(XML)的规则以及IFC、ifcXML模式和XML模式的约束。ifcOWL语言基于ifcXML扩展了OWL标准,提供了基于BIM的本体语言,从而改善了EXPRESS带来的可扩展性问题。此外,为了整合建筑信息和语义的描述,一些学者提出了独立于平台的框架,将IFC数据转换为语义表示。该平台通过交换来自不同产品信息模型的数据,提供语义丰富和人类可读的信息。Schevers和Drogemuller提出了一个转换图,Beetz等人提出了一种半自动方法,将基于EXPRESS的IFC数据转换为OWL本体。Barbau等人。还提出了此类过渡的法规,并开发了基于Protégé的OWL插件。Zhang和Issa断言,通过将IFC转换为OWL,可以通过采用信息技术重构信息模型,并且从IFC检索信息可以更高效。Pauwels等人演示了使用语义Web规则语言(SWRL)来丰富IFC的OWL版本,并创建语义规则检查环境。他们还建议,应基于SWRL开发特定的规则本体,并与AEC行业中的核心现有本体相连接。


4. 研究主题:知识发现

人们更容易理解建筑信息和大数据背后的内容,而不是计算机,因此,实现机器可读和可交换的信息,使知识可以由计算机自己发现,一直是一种前景。

4.1 知识与知识图谱

知识可分为显性知识和隐性知识两类[38]。显性知识通常记录在自然语言或可读符号中,用于交流,而隐性知识则是通过附带活动或无意识获得的。在项目中,解决方案和技术框架通常依赖于有经验的参与者,这种知识也被认为是隐含的。大多数基于信息的知识管理研究侧重于获取建筑项目中的隐性知识。Ugwu等人引入本体思想,支持知识的挖掘、表示和重用,用于钢结构的可建造性评估,证明本体能够获取领域知识,并将隐性知识转化为显性知识。然而,获取隐性知识需要大量的手工工作,并且缺乏从下到上建立知识的通用方法。然后,KG和人工智能(AI)包括深度学习模型和自然语言处理(NLP)工具是使发现知识更容易的可能手段。

KG于2012年首次以谷歌搜索引擎命名。从那时起,它被提升为一个概念,指的是基于网络的语义数据库。通过分析文本语法、单词和短语以及文本的结构特征,可以从各种数据源(如网站)中提取包含一系列实体以及这些实体之间的属性和关系的KG。与语义网络相比,KG需要更少的人工干预,因为它集成了信息获取和处理的算法,并且可以通过从internet自动提取知识进行扩展。除了Google KG,现在还有一些通用KG,如DBPedia和YAGO,而地球科学KG则是AEC领域KG。KG已广泛应用于影响人们日常生活的领域,尤其是在信息检索和知识推理领域。在AEC行业,已开展研究,以构建KG,用于管理来自多个参与者的相关项目信息,并识别施工现场的危险。然而,目前的KG远远不够AEC行业使用。通过通用方法集成不同的信息源,是生成特定领域KG的重要挑战。

4.2 提取AEC实体

实体提取的目的是从文本内容中自动识别那些与AEC域相关的实体。这里的实体指的是那些AEC术语,将被视为KG的网络节点。

在非结构化建筑信息中,实体提取过程属于自然语言处理中的命名实体识别(NER),目前已有多种技术算法。早期的NER方法是基于规则的[52]或基于词典的[53]。虽然简单,但这些方法已在AEC行业的特定领域得到应用,例如在故障报告中识别受影响的基础设施和承包商实体。然后,采用机器学习方法代替实体识别来完成序列标记任务,其中标签由其概率决定。NER的一些典型机器学习模型包括隐马尔可夫模型(HMM)和条件随机场(CRF。最近,通过采用深度学习技术提高了NER的准确性,该技术也标记了序列,但模型更复杂。循环神经网络(RNN)就是这种技术的一个成功例子。RNN同一层中的神经直接相连,形成循环,以便更容易分析句子中单词之间的依赖关系。此外,RNN可以与CRF等传统机器学习模型相结合,以进一步提高准确性。注意机制也可以与神经网络相结合,以提高预测性能。有证据表明,作为RNN的一个分支,长期和短期记忆双向神经网络(bi LSTM)解决了正常RNN无法长时间“记忆参数”的问题,并显示出最高的准确性和性能,因此预计它在AEC领域的实体提取方面也有潜力

在结构化BIM模型中,建筑实体已经定义并表示为面向对象的。BIM软件为各种基本建筑对象提供几何(如长度、宽度和深度)和非几何(如颜色、防火等级)参数。然而,这些默认参数仅提供对象的信息,而不是直接的知识。因此,一些研究鼓励BIM用户定义自己的参数,以便将知识附加到BIM模型中的建筑对象或项目中。例如,在Autodesk REVIT中,用户可以定义两种类型的参数,即项目参数和共享参数,但只有后一种类型的参数可以在族之间共享,或者通过开放式数据库连接(ODBC)在项目之间共享。Peng等人利用此功能,通过在REVIT模型中定义用于公共建筑安全管理的疏散参数来生成疏散实体。Deshpande、Azhar和Amireddy开发了一个基于BIM的知识系统,供用户定义代表人类经验的参数,以便提取知识

4.3 提取AEC实体之间的关系

关系抽取的目的是识别实体之间不同类型的关系。这些关系成为连接KG中节点的定向边,形成网状结构,并描述实体如何以逻辑和物理方式协同工作。

在非结构化文本中,研究人员还提出了与实体提取类似的算法,包括采用基于规则的深度学习模型。特别是,残差卷积神经网络(ResCNN)由于其高精度和对手动标记工作的低要求而被广泛采用。ResCNN的结构如图6所示。它由卷积层、池层、全连接层和Softmax进程组成。ResCNN首先将单词序列转换为向量。然后,它在几个卷积层之间有捷径,以形成剩余块,以便输入可以直接参与计算。因此,神经网络更加稳定,因为学习目标变为残差而不是预测结果。Res-CNN最终预测每个关系的概率,概率最高的一个可以被视为提取的关系。


   图6. 残差卷积网络结构
 

除了构建连续提取实体和关系的管道系统外,近年来出现了端到端知识提取的概念,它在一个神经网络中实现实体识别和关系发现。端到端任务也采用了深度神经模型,如BiLSTMCRF网络,而编码和解码过程经过精心设计,以同时考虑实体和关系信息。端到端模型解决了管道系统中常见的错误传播问题,并被证明具有最先进的性能。

除了语义逻辑之外,空间关系的提取在建筑管理中也很重要。当前BIM支持的知识管理逐渐关注通过BIM模型内的几何信息提取空间关系。大多数BIM模型可以转换为IFC结构表示的数据,IFC以Curve2D、GeometricSet和GeometricCurveSet为基本元素来描述几何信息。IFC还采用SurfaceModel和SolidModel以曲面和实体模式描述三维模型。SolidModel可以进一步分为SweptSolid、B-rep和CSG等类型。根据这种几何信息分解,Borrmann讨论了空间数据结构和分析运算符的定义并总结了点、线、曲面和体积之间的拓扑结构,如边界、内部、外部和闭合环。表2比较了不同类型的操作符、它们的理论基础和关系。逻辑链也可以根据BIM模型内的空间信息和预定义的识别规则自动生成。


   表2. 3D 空间运算
 

5. 研究方向3:知识存储和管理

知识应该在组织中的成员之间和组织之间共享。鉴于这一目标,知识可以更好地以计算机可读的形式存储。存储策略对知识检索和重用的效率有很大的影响。只有正确地表示知识,才能有效地存储知识。

5.1 知识存储媒介

Wang和Meng[75]回顾了BIM支持的知识库,并得出结论,与其他基于IT的知识库相比,BIM具有多种优势,包括三维可视化和协作工作。然而,BIM数据库中存储的数据甚至一些知识对特定项目最为有用,但并非用于共同目的。为了重用这些知识,一些研究试图建立独立的知识库,通过信息标准(如IFC)与BIM模型相联系。例如,Motawa和Almarshad开发了一个将知识库和BIM模型分离的系统。Ding等人还提出了一个系统,以实现知识可以收集并集成到一个平台中,并在其他相关项目中重用的想法。

本体使用共享格式来概念化领域知识,但通常不支持领域之间的知识交换[40]。将本体论和语义技术相结合,只要数据得到正确的解释,领域知识对其他领域是有意义的。例如,Lee和Jeong开发的知识管理模型可以将特定的领域格式转换为神经格式,这与语义机制的方向相反。即使在同一知识领域,本体规则也是异构的。除了本体,链接数据和模糊多准则模型也可以作为链接跨领域知识的媒介。

本体框架的发展为BIM环境下的知识检索带来了新的途径。一个例子是基于本体论和BIM的施工风险知识的存储和管理。但通常,本体负责反映特定领域知识的一组概念以及它们之间的关系。因此,在开发共享本体方面做出了一些努力,以将各种公共领域概念嵌入BIM环境中。共享本体可以看作是领域知识对齐的语义代理,用户可以在共享本体的基础上创建自己的本体。

为了实现不同领域知识之间的语义协作,应通过在BIM环境中集成不同的本体知识来建立一个通用的语义机制。因此,BIM与知识系统的集成已成为一种新的技术趋势。Deshpande等人提出了一种在BIM中获取、检索和存储信息和知识的方法,以及知识分类和传播框架。Ho、Tserng和Jan开发了基于BIM的知识共享管理系统,供管理人员和工程师在BIM环境中共享知识和经验。还努力通过构建基于本体的Vault数据库来链接异构BIM数据,并促进不同领域(包括建筑、工程、施工和设施管理)之间的数据共享

5.2 知识存储框架

如图7所示,有4种典型的BIM知识存储框架,即基于文件的、中央数据库、单服务器和云服务器。


   基于BIM的知识存储 a文件传输 b中央数据库 c单服务器 d云服务器
 

大多数基于文件的框架都是在IFC标准的基础上设计的,其文件格式通常是基于IFC的,例如带有的IFC-SPF,ifc后缀。在中央数据库框架中,研究人员采用了各种数据库,包括关系数据库、面向对象数据库、键值数据库和关系对象数据库作为其存储介质。然而,无论是基于文件的还是中央数据库框架都不包含用于使用模型和知识的通用层。相反,用户应该根据功能需求开发自己的应用程序。改善参与者之间数据共享的一种方法是为用户及其应用程序设置BIM服务器。该服务器应基于BIM数据提供额外功能,如模型审查、三维可视化、版本控制和碰撞检测等。三个具有代表性的BIM服务器是VTT Building and SECOM Co.Ltd开发的IFC模型服务器、Jotne EPM开发的EDM模型服务器和Bimserver。org由TNO荷兰和Eindhoven TU编制。由于云计算技术有可能改革AEC行业的信息管理,过去几年提出了用于BIM模型管理的云计算平台,该平台有助于降低成本,同时提供更高的性能,如今变得越来越成熟。这种想法可以追溯到十年前,当时张提出了基于BIM的建筑信息集成平台(BIMIIP)。基于对BIM系统内数据协作的进一步研究,Zhang等人开发了一个原型系统(BIMDISP),以建立多服务器数据共享环境。BIM的一些典型商业云计算平台有Autodesk BIM 360、Cadd Force、BIM9、BIMServer、BIMx和STRATUS等。

5.3 连接领域知识

如何管理依赖于语义本体的领域知识是一个新兴的研究领域,因为这些技术为领域知识提供了协作表示,例如来自BIM、GIS、传感器和楼宇自动化系统(BAS)等的数据。此外,它们还提供了数据之间的联系。这些技术通常采用ifcOWL来链接来自多个数据源的建筑数据,因为ifcOWL具有以下优点:(1)提供RDF来表示任何数据类型;(2)通过采用OWL和(3)网络中的链接信息图,允许逻辑推理的扩展。图8展示了基于ifcOWL跨领域知识构建数据链接的框架。


   图8. 跨领域知识链接建筑数据
 

在BIM、GIS和CAD平台中集成数据也是一个正在进行的研究课题,这在某些方面导致了知识管理的集成。GIS广泛应用于基础设施项目生命周期中。诸如CityXML之类的GIS数据标准由开放地理空间联盟(OGC)组织。GML模型与RDF关系密切,适合于数据链接。利用这一特点,大量软件和产品通过引入几何描述WKT和查询语言GeoSPARQL,支持对大型GIS数据集的有效存储和空间查询。

尤其是在大型基础设施项目中,建筑数据和地理数据的集成对于支持项目知识管理和来自多学科的所有参与者之间的交流至关重要。Mignard等人开发了Siga3D系统,集成BIM数据和GIS数据,实现城市规模的基础设施管理。Beetz和Borrmann引入了链接数据,并讨论了空间语义数据交换、管理和相关应用,以及道路项目的设计、施工和运营管理,并开发了一个系统来集成各种数据源。Zhao、Liu和Mbachu通过本体映射将BIM和GIS本体之间的类似概念联系起来,并使用集成的BIM-GIS数据支持公路规划过程。

5.4 建筑能耗和设施维护知识

知识集成管理还关注建筑生命周期不同阶段的信息集成。一个典型的例子是为建筑信息和机械、电气和管道(MEP)数据构建领域本体模式,为建筑能耗分析和优化提供知识,尤其是为设计、运行和维护期间的应用提供知识。

在设计阶段,Korman、Fischer和Tatum建立了MEP知识库,通过检索、分析和总结相关知识来表示MEP系统的复杂组成,并在此基础上开发了知识推理方法以及原型系统,以利用这些知识进行MEP设计和冲突分析。Olofsson等人通过一个案例研究,讨论了BIM和虚拟设计与施工(VDC)在MEP系统协同设计中的综合应用,并根据承包商和分包商的角色,提出了设计过程和安装的实施例程。

在运营和维护期间,研究的重点是建筑性能评估和优化的信息集成。例如,基于BIM模型,提出了一些用于运行和维护阶段智能MEP管理的集成交付技术;S、 江、王、吴实现了基于语义网络的建筑能源集成管理,吴提出了基于本体的绿色建筑智能评价系统。Dibley等人开发了一种基于多智能体的OntoFM系统,用于实时监控建筑物。在本研究中,基于ifcOWL和Ontosensor建立了领域本体,这是一个针对传感器本身的本体。Zhang等人提出了一个综合数据模型,通过重用ifcOWL、语义传感器网络(SSN)和构建拓扑本体(BOT)作为参考来构建性能监控。该模型旨在集成静态设施信息和动态监控数据,以支持性能管理平台。Marroquin、Dubois和Nicole进行了类似的基于感知本体的分析,以找出室内居住者与建筑能耗之间的关系。Marroquin研究中需要强调的一点是,知识学习和推理被用来提供智能分析。除了传感数据外,建筑材料还能够通过精确查询每个元素的材料来支持建筑物的性能分析知识始终可以被视为支持能耗计算信息检索算法的核心,大多数能耗分析都基于核心建筑数据,如IFC描述的模型和能耗数据。这里,一个典型的能源数据模型是SimModel,它被广泛应用于能源模拟软件中,用于数据交换和共享。SimModel现在包含在建筑领域本体中,可以转换为其他数据模型,如RDF图。将能源数据转换为RDF模型在信息采集和分析方面具有优势,但IFC与SimModel之间的数据交换标准还需要进一步研究

5.5 多层建筑知识集成与管理

在大型建筑中,由于对所有细节进行建模的工作量巨大,一些研究人员倾向于定义多尺度信息模型来提供各种细节的知识。在这些研究中,LOD一词可能指的是详细程度或开发程度。前者关注模型元素的细节,尤其是几何信息,而后者关注附加到模型的附加信息的细节。LOD越低,模型提供的细节就越少。同时,高LOD模型大多建立在低LOD模型之上,但任何LOD模型都应该逐步建立。在GIS系统中,LOD也被用于快速和多尺度可视化城市级模型。根据GIS和BIM模型之间的差异,如何在这两种系统中映射和重用模型对于大型项目至关重要。例如,Kang和Hong提出了一种基于语义和基于多处理的屏幕缓冲区扫描(包括映射规则)的BIM和GIS多比例尺映射方法。Hu等人还提出了一个基于多尺度模型的多尺度管理框架,用于大型公共建筑的施工和设施管理。提出的多尺度模型由几个宏观、微观和示意尺度模型组成。该管理框架利用多比例尺模型,嵌入了数据管理机制,以及根据多比例尺管理需求将BIM模型转换为GIS地图模型的算法

6. 研究方向4:知识推理

6.1 对领域知识的查询语言

由于IFC是建立在EXPRESS的基础上的,EXPRESS可以为大型数据集提供有限的查询和分析支持,因此很少为IFC建立查询语言。为了解决这个问题,人们对XML或RDF框架进行了研究,它们为查询语言提供了更好的支持。在这样的框架中,结构化查询语言(SQL)可以用于关系数据库中的查询,XQuery语言可以用于XML格式,SPARQL可以用于RDF格式。

XML是结构化知识的标准表示形式之一。在大多数情况下,XML是一种面向对象的模式,可以在实例文件中采用XML进行数据交换。目前,BIM环境中广泛采用XML和XML模式来记录AEC知识。学者们甚至为IFC模型采用了XML映射(ifcXML)。此外,为了分析和过滤XML数据,XQuery语言被提出并被W3C标准所接受。

SPARQL是一种RDF查询语言,基于图结构的资源描述。它是基于语义网络开发的。SPARQL采用“Select Where”表达式,除了与ifcOWL结合使用之外,它与关系数据库查询类似。Zhang等人提出了一种基于SPARQL的更符合BIM的查询语言,命名为BimSPARQL。如图9所示,SPARQL作为一种公共接口语言,具有广泛的功能,用于从数据源外部查询数据,被W3C采用,并具有一系列用于RDF应用程序的应用程序编程接口(API)。


   图9. SPARQL支持的领域本体检索扩展流程图
 

OWL是另一种基于RDF并提供本体信息框架的本体语言。通常,本体使数据在计算机中可读,因此可以由计算机根据已知知识和定义的规则进行推断。然而,RDF和OWL只支持低级推断。当需要复杂的推理时,规则定义需要更专业的语言。这种语言可以自定义规则来说明复杂的逻辑,并通过使用这些自定义规则来支持推理过程。目前,SWRL、规则交换格式(RIF)和N3logic都是此类规则语言。这里,SWRL是一种基于OWL和规则ML的通用语义网络规则语言,可以链接不同的数据模型。SWRL语言已应用于基于BIM的知识系统中,用于复杂的分析任务,例如通过比较砌体的铺设顺序和拓扑结构来检查砌体是否属于同一堵墙。

应该强调的是,在执行查询之前,应该建立检索信息的形式。Liu等人开发了特定领域查询语言的词汇和语法,以及一组机制,以方便用户制定查询语句、解析查询和检索信息。他们的工作重点是暖通空调系统,但似乎是通用的。

6.2 领域知识推理的方法

6.2.1 知识描述的CWA和OWA

在描述真实世界时,人们使用两种知识描述,即封闭世界假设(CWA)和开放世界假设(OWA)。根据CWA,任何未知的事实都被认为是错误的。当知识库中的知识是完整的,或者用户必须根据不完整的知识进行决策而没有风险时,CWA是一个很好的知识推理假设。相比之下,OWA更开放地处理不完整的知识,它会将未知返回给那些未确定的结果。

大多数现有的AEC应用程序,包括BIM系统和公共数据库,都采用CWA根据现有知识进行决策。但语义网技术依赖于OWA,因为语义网是一个知识不完整的系统。例如,在语义网络中,常识可能意味着A是MEP工程中 B的子系统。然后CWA可以推断A是B的唯一一个子系统,因为知识库没有显示B的任何其他子系统。这种推断在许多情况下可能不正确。因此,一些研究讨论了如何将CWA中的信息映射到OWA中的信息,并使用完整性约束扩展OWL【128】,确保CWA和OWA对AEC软件都有价值。

6.2.2 用于知识检索的CBR、RBR和KG

基于BIM的知识检索采用了基于实例推理(CBR)基于规则推理(RBR)。例如,开发了知识管理系统,以在BIM环境中进行进度评估和基于CBR的建筑维护。在这些系统中,BIM模型通过IFC标准向CBR提供图元的参数。Zhang等人开发了基于RBR的安全检查系统,也在BIM环境中。该系统负责根据预定义的规则检查模型内容,然后自动提供可施工性和安全优化报告。GhaffarianHoseini等人将CBR和RBR相结合,以支持BIM综合设施故障管理,其中CBR用于从过去的问题中获取经验,RBR用于给出明确的解决方案。BIM的可视化在这些CBR或RBR系统中被证明是必不可少的。研究还表明,当结合CBR-BIM和RBR-BIM时,基于BIM的知识管理系统也有助于AEC项目生命周期内的安全和安保识别

KG在公共领域的知识检索方面显示出巨大的潜力。其主要过程包括链路预测和实体解析。前者是指预测KG中实体之间可能的关系,而后者是指在不同实体的名称表示一个唯一的对象或单个实体的名称表示多个不同的对象的情况下,实体的识别和融合。因此,Socher、Chen、Manning和Ng提出了一种基于神经张量网络(NTN)的机器学习和知识检索机制。Wang、Wang和Guo将KG嵌入低维向量空间,并将物理和逻辑规则作为约束进行扩展,以改善KG的学习行为和知识检索的准确性。

6.2.3 用于知识推理的本体推理机

本体推理是实现语义网络进行知识推理的关键技术,因此开发了许多本体推理机,如W3C的测试机和HPlabs嵌入语义web框架的推理机,作为本体创建和应用的基本支持工具这些本体推理机提供以下两个主要功能,可以检索本体中隐藏的信息,然后生成新的知识。(1)本体的一致性测试。一致性测试确保实体和实例之间的所有逻辑以及实体本身是一致的,并且在实体、属性和实例的公理约束范围内没有冲突。(2)内隐知识的推理。本体的创建通常遵循一个原则,即实体及其关系应尽可能简单,并具有足够的信息。因此,在采用本体时,隐含知识的推理对于提供知识非常重要。

表3列出了一些典型的推理机。所有这些机器都保持上述功能,各有优缺点。其中,Racer、Pellet和FaCT++都是本体的专用推理机。它们的推理方法依赖于传统的逻辑描述,并采用Tableau算法进行优化。因此,它们在推理效率上显示出优势,但在特定的本体语言以及扩展和定制能力方面受到限制。具体来说,Racer不提供枚举或用户定义数据类型的推理,Pellet只支持少数本体查询语言,Jena只支持简单的推理规则,不支持OWL推理。Jess是一个更容易与其他应用程序连接的开源引擎,采用通用推理引擎支持跨域推理。但推理效率较低。


   表3. 各种推理引擎的对比分析
 

7. 研究方向5:知识应用

在项目生命周期内,AEC行业有许多知识应用程序。Rivera等人提出了新兴概念构建4.0的方法论技术框架,将基于BIM的知识应用作为实现自动化和数字化的核心过程。本节根据设计、施工和维护阶段,研究和总结了一些典型和有效的应用。

7.1 设计阶段

基于领域知识的建筑智能设计是AEC行业应用知识管理领域的一个快速发展的领域。计算机辅助设计(CAD)和工程(CAE)与计算智能(CI)相结合,在设计阶段提供集成应用。MacCallum曾提出一个问题:“智能CAD存在吗?”1990年的研究表明,将机器学习等算法应用于建筑设计在20世纪90年代初已经到位。BIM的兴起为建筑设计提供了一个交互式可视化平台和强大的知识管理系统,基于知识的AI技术被应用于优化和配置、模式和理念、智能设计和交互设计等,以实现手动任务自动化的目标,为领域专家提供个性支持,为业余爱好者提供专业指导。此外,Merrell等人应用基于领域知识和真实数据的贝叶斯网络随机生成一系列布局,甚至一个完整的3D住宅建筑。Fisher等人还将贝叶斯模型作为核心元素,提出了一种基于现有示例在建筑物内排列3D家具对象的方法。这些研究探索了基于领域知识的智能建筑设计的可能性。

AEC行业中基于规则的自动检查意味着通过计算机程序根据各种标准评估建筑设计。目标是通过解释规则和对标准进行编码来自动检查设计的模型,以给出“通过”、“失败”、“警告”或“未知”等结果。基于规则的检查中考虑的规则和标准主要是建筑物或基础设施应遵循的最低标准,以确保安全和正常功能。这种检查过程至少需要两个步骤:(1)将建筑规则和BIM模型分别形式化为规则模型和表示模型;(2)确保计算机程序能够解析这两个模型,然后根据规则和设计对象执行基于规则的检查。最近,观察到了许多成就。例如,人们努力建议对建筑物进行法规合规性检查[162163]。Solihin采用IFC模型和Express Data Manager(EDM)开发了一个自动代码检查系统,以评估新加坡的代码合规性。由Fiatech开发的自动编码系统(Autocodes)能够根据现有的BIM标准和指南对美国建筑进行合规性检查。此外,还考虑了一些特殊检查,包括课程问题、空间要求和特殊场地需求。Han、Kunz和Law提出了一种混合方法,将规则编码和基于性能的方法相结合,用于残疾人访问的合规性分析。Lee等人构建了一种CBR方法,将其与规则检查过程相结合,并在检查过程后给出建议。Kadolsky等人展示了一个案例来说明如何基于本体定义建筑信息管理规则,然后Hu提出了一种基于BIM和本体的建筑设计中的自动消防安全检查。Baumgärtel等人讨论了如何利用规则在建筑设计中保温。

7.2 建造阶段

知识提供了一种创新的方法,可以更好地支持成本估算、安全管理和计算机辅助施工等子部门的施工管理。

具体来说,将人工智能技术引入施工管理,可以优化安全、成本和进度。Sigalov和König提出了一种基于BIM的施工进度计划的过程模式识别方法,通过估计施工进度计划中的相似性,解决了手动定义适当和特定于应用程序的过程模板的问题。基于BIM模型和环境提供的知识,还可以采用遗传算法(GA)和资源约束,空间约束来生成和优化施工进度。对于具体的施工活动,也可以预测进度。Ganbat等人对基于BIM的风险管理应用程序进行了系统审查。他们的结论表明,及时上传、记录和检查数据是降低潜在风险的关键。

建筑成本被视为BIM的第五维度(5D),知识也证实了基于模型的成本估算和流程优化的结果。例如,de Soto和Adey提出了一个资源需求预测模型,以根据详细的材料价格估算施工成本。在一些研究中,BIM和知识相结合,选择合适的塔式起重机,并在施工期间对塔式起重机进行合理的布局规划。基于BIM和施工知识,还可以优化设备行进路径,以避免障碍物并降低施工成本。这些研究大多采用现有的人工智能算法来生成隐藏在数据或常规活动中的知识。

此外,在安全和风险管理领域,基于语义规则检查,Zhang et al提出了用于工作危险分析的施工安全知识,通过将Tekla结构模型转换为RDF图,并结合本体和SWRL法规,确定任务、活动和资源方面的安全问题。Ding等人构建了一个基于本体描述的语义网络,支持建筑安全知识管理框架,以生成安全映射及其关系。然后通过搜索语义,将应用知识组合到BIM对象中。有了这些想法,可以开发基于知识的BIM系统,以捕获和存储施工期间不同参与者的各种类型的信息和知识。

7.3 运营和管理阶段

在AEC项目的运行和维护过程中,人们普遍对知识抱有很高的期望,尤其是在安全管理、自动控制、能耗管理和决策支持方面。在以下三个方面对应用进行了详细讨论。

智能答疑系统是运营维护期间常见的基于知识的应用。一个典型的智能答疑系统至少有三个模块,即信息处理、问题索引和答案推荐。系统应首先对用户发送的查询进行语义分析。具体来说,基于语义知识库,通过分析词法、句法和语法对句子进行预处理,以语句和文本集合的形式提取语义。Motawa构建了一个基于BIM的对话系统,供用户寻求建筑维护问题的答案。在这样的系统中,领域KG对于为答案提供全面且深入相关的摘要至关重要。Corry等人提出了一种使用语义网技术访问社交媒体、个人通信、移动网络、室内位置和财务报告等软AEC数据的方法,以建立知识库。通过BIM和语义网络的集成,可以与其他开放数据源一起访问建筑信息。这些建筑信息包括材料、系统、职业信息甚至天气。这些信息有助于预测能源消耗、未来材料以及环境、人员和成本之间的关系。特别是在能源消耗领域,人们在住宅建筑节能的人类行为建模以及智能家居环境节能的语义分析和决策支持模型方面进行了更多的研究。

故障检测与诊断(FDD)通常包括故障检测、故障诊断和故障识别过程,是这一时期另一种基于知识的应用。FDD方法可分为两类,即基于模型的FDD和数据驱动的FDD。基于模型的FDD计算所提出模型的预测与测量值之间的偏差,然后比较此类偏差和预定义阈值以判断故障。然而,数据驱动的FDD提取了历史累积数据的特征,然后将这些特征视为检测故障的先验知识。然而,随着先进MEP设施的发展,复杂性成为检测故障的障碍,需要熟练的专业人员来处理数据。近年来,一些研究利用BIM中的信息集成,为FDD模型提供BIM模型中存储的信息,以减少对专业人员的依赖。例如,Liu等人提出了一个用于暖通空调系统自动性能分析的综合信息框架,并确定了自我管理暖通空调系统框架的要求。该框架基于IFC、传感器建模语言(SensorML)和BACnet等现有标准,建立了相关信息的自动检索和集成机制。然后结合现有的算法,实现自动FDD。除了集成框架外,还提出了一些基于BIM的暖通空调系统信息知识库,以提高FDD过程的效率和准确性。Dong等人专注于基于BIM的量化FDD方法的数据建模过程通过检索和集成IFC和绿色建筑XML(gbXML)中的设施、拓扑、房间和空间的静态信息,以及BACnet协议中传感器的动态监测信息,建立了FDD的信息模型。开发了一个独立的FDD系统,根据室内外的监测温度和最小消息长度原则,在BIM环境中定位有缺陷的设施。这些研究证明,知识,尤其是综合信息对设施管理和FDD非常有用。

建筑能源管理是另一个依赖知识的领域。建筑能耗管理系统(BEMS)是一种通过收集和分析当前的能耗数据来提高建筑能效的系统。因此,从技术上讲,BEMS应集成BAS和相关的运行和能源参数,以及建筑物内的人类行为和环境参数,以提供决策知识。BEMS至少有三个物理层,即传感器层、计算层和应用层和四个模块,即传感器和驱动模块、中间件、处理引擎和用户界面。传感器和驱动器在数字基础设施和物理环境之间交换信息;中间件集成了通用数据接口;装卸引擎负责检索和分析收集的数据,包括环境数据(如温度、湿度和二氧化碳)和人类行为(如工作、开会和休息)。用户界面在将分析结果转换为一种知识后与用户进行交互。BIM通常集成了能源管理领域的知识,可以作为构建边界元管理系统的知识源。提出了从基于IFC的BIM到BEMS的转换工作流。

8. 讨论以及未来方向

尽管一些经过评审的出版物没有准确使用“知识”或“BIM”的术语,但数据集成、数据驱动方法、语义分析、知识发现等思想已被广泛接受,并表明人们越来越有兴趣将知识科学与BIM技术相结合,为AEC行业提供更好的支持。但其发展似乎还处于初级阶段,缺乏完整、系统、通用的成果。审查表明,我们至少仍面临以下四个挑战。

  1. 缺乏根本性创新。基础性创新是推动技术革命提升产业水平的助推器。然而,知识科学在大多数学科中都是一个通用术语,其基本原理主要来自生物学和计算机科学领域。这也是AI、KG等在信息和生物领域显示出更强大影响力的原因之一。BIM适用于建筑和土木工程,但其理念来自机械行业。与生产工业设备或组件相比,建筑物和基础设施的生命周期管理要复杂得多。因此,人们普遍认为,BIM并没有超出机械行业的产品信息模型(PIM)。AEC行业采用了许多新技术,但目前尚不清楚该行业在拼命争取哪种技术。
  2. 缺乏准确的现场数据。BIM平台或系统提供了一种集成介质,用于存储和管理项目生命周期内收集的大数据。这也引起了人们对AEC数据的态度。然而,由于信息化水平低,收集的数据不准确,无论数据驱动的项目管理如何,AEC行业都缺乏准确的现场数据。随着越来越多的先进信息技术的应用,这一缺点正在逐渐改变,但在一段时间内没有沿着正确的轨道运行。数据不可能完全可靠,管理数据或从数据中发现知识的方法也不可能完全可靠。
  3. 缺乏综合知识。本体、语义网络和KG为管理者提供了知识,但如今AEC行业的决策大多基于直觉或经验,因为这些知识是非唯一、不完整和难以使用的。经验可以看作是一种知识,但没有明确的表达方式。如何积累知识,然后以计算机可读和人类可重用的方式表示知识,以帮助项目决策,仍然是一个很好的解决方案。积累的、组织良好的、准确表示的、支持检索的知识还没有准备好在项目生命周期内循环活动。
  4. 应用程序级别不足。将知识与BIM相结合是有潜力的,因为BIM提供了集成和管理数据的环境和工具,而知识科学不仅可以从BIM模型及其数据中发现知识,还可以促进知识的利用。已经在不同的阶段和多个方面进行了大量的试验,但仍然可以得出结论,在没有明确和系统的路线图或解决方案的情况下,部分应用于项目并不能充分显示出光明的未来。事实上,大多数应用都在某种程度上证明了信息技术的有效性,而不是将建筑或基础设施提升到更智能的水平。

面对这些挑战,未来还有很多工作要做。下文总结了未来的一些方向。

  1. 扩展语义网络和KG。语义网络和KG越大,人们可以从中受益的智能就越多。因此,提高AEC行业智能水平的一个重要途径是通过创建和管理各种领域本体、法规集并向公众开放,来扩展语义网络和KG。然而,人工生成知识是不可接受的。因此,语义网络和KG的自动生成和更新的新方法具有重要意义。此外,考虑到知识的爆炸性增长,应考虑更准确的NLP和更有效的知识查询。
  2. 与其他先进技术相连接。知识科学和BIM被视为信息技术的子部门。它们可以进一步与其他先进技术集成。例如,深度学习和数据挖掘等人工智能算法有助于从现有数据中生成新知识。云计算可以提高知识存储的效率,以及知识检索和分析的计算能力。物联网支持数据采集和对环境的即时反馈,VR/AR/MR技术提供更沉浸式的环境来感知新世界等。只有将这些技术结合起来,知识科学才有可能发展成为新一代。
  3. 完善信息平台。另一种取得进展的方法是改进知识管理系统和BIM系统。当前大多数知识管理系统侧重于知识的存储和检索,缺乏根据积累的具有可靠规则的大数据生成新知识的能力。此外,知识管理系统在实际项目管理中仍然很流行。目前有许多软件公司和研究机构提供了许多BIM系统。,然而,由于AEC项目的多样性,这些系统只能是通用的,要么在管理上无法深入渗透,反之亦然。另一方面,BIM系统仍在数据分布、信息集成、管理活动集中等方面发展。
  4. 向高智能建筑和基础设施方向发展。BIM技术集成、共享和管理建筑物和基础设施的数据,同时知识科学拓宽了这些数据的应用道路。这两种技术的结合还可以预测AEC行业的智能发展趋势。这里的智能不仅包括为利用建筑或基础设施提供更智能的方式,还包括增强可感知和可控的环境,以及在管理项目生命周期中提供更多知识驱动的方法。随着这些发展,自动化设计、建筑机器人和智能操作将在未来几年实现,为工业和人民的日常生活带来巨大改善。
  5. 激发所积累知识的潜力。常识是,知识在AEC行业中并没有发挥关键作用,尽管今天的信息技术已经非常先进。随着BIM在过去十年中的发展,所有参与者都已意识到信息的价值,从而逐步积累数据、管理信息和生成知识。正如积累的数据为行业提供了新的知识一样,积累的知识能够改变行业的合作、活动和更多方面。知识驱动的智能世界即将到来。

9. 结束

在过去几十年中,AEC行业的知识主要来自经验,并且大多以纸质或电子形式记录在文档中。为了充分利用这些知识,很多研究都集中在通过应用本体、语义网络、数据挖掘算法等多种方法来检索知识。这些方法依赖于有价值的数据。BIM似乎是提供信息的一种有价值的媒介,因为它通过采用独特、可读的数据标准,为项目生命周期内的所有设施提供物理和功能数字模型。因此,知识科学与BIM的结合显示出巨大的潜力。本研究在回顾现有文献的基础上,总结了这两种技术在知识描述、知识发现、知识存储与管理、知识推理和知识应用等方面的最新研究成果。

通过对这些出版物的深入研究,表明数据集成、数据驱动方法、语义分析、知识发现等思想已被广泛接受,为AEC行业提供了更好的支持。但其发展似乎还处于初级阶段,缺乏完整、系统、通用的成果。本研究确定了当前形势下的四大挑战,即缺乏根本性创新、缺乏准确的现场数据、缺乏综合知识和应用水平不足

最后,本研究预测了知识驱动的智能AEC产业的未来发展方向,包括扩展语义网络和KG、与其他先进技术相连接、改进信息平台、向高度智能化的建筑和基础设施发展以及激活积累知识的潜力。

根据以上回顾和讨论,可以认为,知识科学与BIM相结合的研究,特别是在BIM的知识提取和发现领域,仍处于起步阶段,还有许多挑战需要克服。然而,进一步的研究和开发显示出巨大的潜力,可以改革AEC行业,为人们提供更智能的环境。


免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删

QR Code
微信扫一扫,欢迎咨询~

联系我们
武汉格发信息技术有限公司
湖北省武汉市经开区科技园西路6号103孵化器
电话:155-2731-8020 座机:027-59821821
邮件:tanzw@gofarlic.com
Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利
遇到许可问题?该如何解决!?
评估许可证实际采购量? 
不清楚软件许可证使用数据? 
收到软件厂商律师函!?  
想要少购买点许可证,节省费用? 
收到软件厂商侵权通告!?  
有正版license,但许可证不够用,需要新购? 
联系方式 155-2731-8020
预留信息,一起解决您的问题
* 姓名:
* 手机:

* 公司名称:

姓名不为空

手机不正确

公司不为空