1 方案背景與目標
數據是產業發展的基礎支撐,高質量的數據集則是推動智能制造升級的核心驅動力,當前訓練范式正逐漸向“數據中心化”轉變。在離散行業中,快速響應生產系統面臨訂單波動、供應鏈擾動等不確定性因素,在此情況下,破解垂類模型與智能化應用落地過程中的“數據瓶頸”已成為亟待解決的問題。
聚焦破解離散行業快速響應生產中的“數據困境”,提升工業數據治理與利用效能,構建工業人工智能數據工程平臺。通過研究面向離散制造行業的垂類大模型數據多模態智能對齊與價值增強融合、人機協同智能標注、全解耦數據資源管理等技術,創新數據合成、加工和融合方法,解決離散制造業中數據多源異構、樣本稀缺和質量不均等核心痛點,為垂類模型提供高質量訓練數據基礎。面向離散行業快速響應生產的的數據工程平臺,構建數據安全防護和標準規范體系,助力工業數據資源綜合治理和開發利用。
計劃完成人工智能數據工程關鍵技術研究和平臺建設,實現:支持文本、圖片、音頻、視頻等4種不同模態數據清洗加工、人機標注及數據合成,支持ERP、CRM、SCM、MES、PDM和PLM等不少于6類工業系統的數據融合,在不少于10家工業企業開展示范應用。
2 方案詳細介紹
(1)研發一套AI數據工程技術產品賦能千行百業“數智化”轉型服務
項目研發團隊根據工程業務和用戶實際需求,研發支撐人工智能訓練資源庫的數據采集、數據標注、數據訓練、AI推理等一站式AI服務產品,以及數據資源管理中臺等技術產品。目前針對離散行業高質量數據集數據加工技術,包括智能化數據清洗、異構數據潛在特征提取等數據預處理關鍵技術,多模態數據融合、數據質量自動評估算法,小樣本數據增強合成、人機協同智能標注等技術展開攻關。以下對核心技術和產品展開介紹。
1)人機協同數據標注技術
數據標注子平臺提供數據接入、預處理以及數據標注等服務。同時,易華錄具備專業的標注團隊,實現數據采集1400萬+、標注數據3000萬+、標注標框3800萬+、標注需求900+、標注項目900+。基于工業、公安、交通、醫療等20+個行業數據的規模化應用。建設億級規模圖數據,千萬級規模視頻、音頻、文本數據,標注準確率超過99%,打造行業領先人工智能訓練資源庫,實現千級算法推理服務,豐富智能交通、智慧物流、智慧醫療等關鍵領域的算法訓練推理場景,推動賦能產業鏈協同轉型。

圖 1標注庫

圖 2標注數據統計

圖 3標注數據統計

圖 4 一站式加工服務
2)多模態數據資源管理平臺
研制多模態數據資源管理平臺,實現多模態數據自動化采集、數據管理、算法倉及AI推理、數據資源庫等功能,基于多模態數據匯聚、點位治理、視圖解析、數據治理、數據脫敏等技術手段,完成多模態數據“收存治用易”全生命周期管理,激活數據價值;研制數據治理一體化使能工具集,包括數據治理、數據處理等軟件工具,實現行業數據資源統一治理、高效管理、數據質量源頭監管。面向全域全數據,通過技術和運營手段,提升數據賦能成效,促進數據要素流入、生產、運營、管理千場萬景,激活數據潛能、釋放數據紅利。

圖 5數據資源目錄

圖 6數據融合
(2)產品應用推廣情況
1)大連亞明“5G+工業互聯網平臺”
項目基于工業領域數據技術產品,為汽車零部件企業提供輕量級定制化場景解決方案,從感知層、平臺設施、數據中心、應用平臺四個維度構建有行業特色的專業化平臺。在大連亞明企業的供應鏈協同、設備上云與互聯互通等方面開展數字化轉型與智能化升級合作。借助應用平臺研發成果,實現不少于20種缺陷高精度檢測支持,全種類缺陷綜合識別準確率超98%,產品不良品率降低27%。

圖 7 壓鑄車間3050T壓鑄設備生產看板

圖 8 數據可視化系統
2)大連華松智能工場可視化管理系統建設項目
易華錄AI數據工程技術產品,支撐了該項目數字孿生三維模型、視頻智能解析應急和數據中臺的搭建,形成含數據治理、管理、可視化的初期智慧大腦。
智能駕駛艙通過詳盡的指標體系,實時反映工場生產的運行狀態,將采集的生產過程各環節數據進行形象化、直觀化、可視化、具體化,一是為生產改善提供PDCA的基礎,二是給管理者提供決策支撐。

圖 9 智能駕駛艙
接入設備信息、訂單數據、人員數據、品質數據、倉庫數據、生產數據、視頻監控等數據并進行數據治理服務,支撐駕駛艙軟件的數據呈現和分析功能,進行器具臺賬使用狀態分析。

圖 10 器具臺賬使用狀態分析
從人機料法環測六方面,實現生產設備及能源終端的數據自動化采集、智能化控制及初步的能源管理。

圖 11 可視化管理
3)大連金華錄“SMT”項目
易華錄AI數據工程技術產品,支撐MES制造執行系統進行車間生產全流程優化閉環管理,降低企業生產中存在的風險,提高企業的生產效率,助推企業經濟效益逐年穩步提升。對人員、關鍵零部件以及關鍵工藝參數進行記錄、存檔并可以追溯;對產品質量進行監控管理,實現了產品質量管理的高效性;集成MES、ERP等生產核心系統,為調度指揮、大數據分析、數字化平臺等提供數據支撐,共享業務數據。

圖 12 設備管理

圖 13 數據分析與可視化
4)江蘇雙登數字化轉型項目
易華錄AI數據工程技術產品,圍繞業務系統數據的集成、展示、分析與決策展開,以提升企業數字化及協同效率為核心,通過數據接入、清洗、轉換形成原始庫,依標準規范建標準庫,按業務主題重組數據建主題庫、專題庫和指標庫,為數據可視化和上層應用服務。
雙登數字化管理駕駛艙能快速掌握運營情況,監控業務績效,支持深度分析。不僅展示表層核心指標,更能通過鉆取、聯動、過濾等操作,從現象深入探究原因。監控每日進度和產出,及時發現生產問題,確保戰略目標得以逐日分解和達成。

圖 14 雙登數字化管理駕駛艙
雙登數字孿生聚焦廠區室外場景和設備生產全流程的精細化管理。利用多視角三維重建技術,自動化生成覆蓋地上地下、室內室外、宏觀微觀的智慧工廠數字孿生體模型。為設備生產全流程的可視化管理提供精確的數據本底,滿足公司提升生產管理質量的要求。

圖 15 雙登數字孿生
5)天津智能交通設備生產線產業化升級
依托易華錄公司數據技術產品對已經建成交通運輸設備生產制造進行數字化改造,搭建人工智能數據工程平臺體系、提升安全保障能力為支撐,推動交通運輸設備制造全要素、全產業鏈連接,完善協同應用生態,建設數字化、網絡化、智能化制造和服務體系。實現一體化研發制造體系和全生命周期數據追溯與分析。
數字化改造生產制造裝備包括信控設備、電子警察、超速監測、視頻監控設備、移動警務通、高精度北斗車載終端、車路協同交通控制裝備、邊云協同交通控制裝備、車載數字娛樂設備、拼接顯示單元等幾大類,屬于智慧交通領域的核心產品。


圖 16、17 天津智能交通設備生產線產業化升級
6)天津未來科技園智算中心升級改造項目
依托易華錄公司數據技術產品,升級改造天津未來科技園智算基礎設施,以支持主流及行業垂直大模型,確保跨行業大模型高效適配與落地應用。信息技術(IT)層面:采集各類軟硬件運行狀態數據,為上層系統的故障分析、能耗分析及業務與能耗關系分析等提供支撐。人工智能(AI)預測性維護:通過平臺采集含故障特征數據的樣本,如溫度、電壓/電流等,結合人工經驗訓練高準確度故障預測模型,實現風險管理、故障預測等功能。

圖18 智算中心升級
7)包頭鋼鐵工業互聯網建設項目
針對包鋼集團實際的生產場景的痛點、難點,易華錄項目團隊圍繞數據資源管理子平臺、全流程質量管理、電機全生命周期管控、機器視覺安全等方面進行人工智能數據工程平臺的建設,提升了包鋼集團的數字化、自動化建設程度,實現了生產流程上的少人化、無人化管理,提高了巡檢、反饋控制的響應效率及準確率,大幅降低人力成本。同時,通過打通人流、物流、信息流、資金流中的關鍵瓶頸問題,實現企業降本增效、節能降耗和安全環保的總體目標。

圖19 能耗管理平臺架構
3 技術創新點
(1)提出面向離散制造的垂類模型數據融合與合成創新框架
解決離散制造業中數據多源異構、樣本稀缺和質量不均等核心痛點,研究多模態工業數據的特征提取與融合機制,以及基于縱向聯邦學習等技術在保護數據隱私前提下進行數據合成與增強的方法。框架的創新性體現在利用混成模型、強化學習與記憶網絡等自適應技術,實現數據融合與合成過程的動態優化,從而提升生產效率與決策智能水平。通過創新性的數據合成、加工和融合方法,為垂類模型提供高質量訓練數據基礎。
下一步:針對離散制造業多模態數據難統一處理問題,攻克跨模態時空對齊算法與小樣本生成式增強技術、注入行業知識的數據加工與質量提升技術等。

圖20 面向離散行業數智能效優化的磁光電融合存儲底座
(2)基于預訓練模型與主動學習的智能標注技術
基于多模態數據特征融合與跨模態協同技術研究,實現關鍵特征自動提取,提供高效、優質、高精度的數據標注服務,為人工智能模型訓練奠定數據基礎,支持規模化數據預標注與數據閉環校驗管理。實現單條數據標注時間壓縮至秒級,特征標注準確率不低于95%。通過多維度數據統計、多重審核機制、專業標注團隊和實時量化可視化管理系統,構建完備質量監督體系。
下一步:持續開發支持文本、圖像、音頻、視頻等多種數據類型的專業標注工具,集成智能標注輔助功能,建立包括人工抽檢、結果評估在內的質量控制機制,對標注數據進行統一的存儲、版本控制和查詢統計等。


圖21、22 智能標注子平臺
(3)面向離散智造的全解耦數據資源管理技術
構建業務導向的分層解耦架構,借助“云數解耦、存算解耦”策略,將數據從特定計算框架與業務應用中釋放,達成對離散制造多模態數據(時序參數、業務元數據、非結構化視頻等)的統一標準化管理與智能融合,支撐“采、治、用”一體化的數據價值鏈,最終以可配置的數據服務驅動業務敏捷創新。
下一步:為工業數據治理、管理、應用等人員提供全棧式全解耦的數據資源管理功能模塊,涵蓋多源異構數據采集、實時流處理、分布式處理分析和海量數據秒級檢索等,實現行業數據的集中匯聚、實時分析、融合關聯和深度挖掘。面向離散行業應用,構建多領域數據字典,實現工業數據應用融合、流程貫通、集成共享和價值挖掘,提升數據對業務的賦能能力。

圖23 全解耦數據資源管理子平臺





資訊頻道