地科學院碩士生陳陽光在人工智能領域頂刊《Advanced Engineering Informatics》發表題目為“BFA-YOLO: A balanced multiscale object detection network for building façade elements detection”的研究論文(Sci一區Top,CCF-B,影響因子8.0)。永利6774app手机版官网為論文第一署名單位,碩士研究生陳陽光為論文第一作者,其導師羅小龍副教授為共同作者,我院兼職碩士生導師張曉東教授為通訊作者。
論文鍊接:https://www.sciencedirect.com/science/article/pii/S147403462500182X
代碼開源倉庫:https://github.com/CVEO/BFA-YOLO.
檢測建築物上的外觀元素,如門、窗、陽台、空調外機、廣告牌和玻璃幕牆,是自動化創建建築信息模型(BIM)的關鍵一步。然而,該領域面臨着重大挑戰,包括立面元素分布不均、存在小物體和大量背景噪聲,這些因素阻礙了檢測的準确性。為了解決這些問題,該研究提出了BFA-YOLO模型和BFA-3D數據集。BFA-YOLO模型是一種先進的架構,專門用于檢測立面元素的多視圖圖像。它集成了三個新穎的組件:解決物體分布不均勻問題的特征平衡主軸模塊(FBSM);目标動态對準任務檢測頭(TDATH),可增強對小物體的檢測;以及旨在減少背景噪聲影響的位置記憶增強型自我注意機制(PMESA)。這些元素共同使BFA-YOLO能夠有效地應對每一個挑戰,從而提高模型的魯棒性和檢測精度。BFA-3D數據集提供了多視圖圖像,并在廣泛的外觀元素類别中提供了精确的注釋。該數據集的開發是為了解決現有的建築物立面檢測數據集中存在的局限性,這些數據集通常具有單一視角和類别覆蓋不足的特點。通過比較分析,與基線YOLOv8模型相比,BFA-YOLO在BFA-3D數據集和開源的Façade-WHU數據集上的mAP50分别提高了1.8%和2.9%。這些結果突顯了BFA-YOLO在立面元素檢測和智能BIM技術進步方面的卓越性能。

圖1:數據集渲染示意圖

圖2:BFA-YOLO模型網絡架構圖

圖3:BFA-3D測試集上BFA-YOLO和YOLOv8檢測結果的視覺比較。(a)表示要檢測的圖像。(b)圖示了标簽可視化。(c)(e)示出了BFA-YOLO檢測結果。(d)(f)是檢測結果的局部放大。圖片下方為類别标簽。

圖4:論文首頁