11月22日,國家數據局公布《國家數據基礎設施建設指引(征求意見稿)》,其中提出要強化樞紐節點與非樞紐節點的協同聯動,支持綠電資源豐富的非樞紐節點融入全國一體化算力網建設。加強大型風光基地和算力樞紐節點協同聯動,把綠色電力轉換成綠色算力。積極推進風光綠電資源消納,助力實現碳達峰碳中和。支持利用“源網荷儲”等新型電力系統模式。加強數據中心智慧能源管理,開展數據中心用能監測分析與負荷預測,優化數據中心電力系統整體運行效率。探索綠電直供新模式,有序開展綠電、綠證交易。
原文如下:
關于向社會公開征求《國家數據基礎設施建設指引(征求意見稿)》意見的公告
為貫徹落實黨的二十屆三中全會關于“建設和運營國家數據基礎設施,促進數據共享”的改革任務,我們會同國家發展改革委、工業和信息化部,立足當前發展實際,組織起草了《國家數據基礎設施建設指引(征求意見稿)》,現向社會公開征求意見。
此次征求意見的時間是2024年11月22日至12月1日。歡迎社會各界人士提出意見,請通過電子郵件方式將意見發送至shjkjs2024@163.com。
感謝您的參與和支持!
附件:國家數據基礎設施建設指引(征求意見稿)
國家數據局
2024年11月22日
附件
國家數據基礎設施建設指引
(征求意見稿)
前 言
黨的十八大以來,以習近平同志為核心的黨中央,敏銳把握新一輪科技革命和產業變革的新機遇,統攬中華民族偉大復興的戰略全局和世界百年未有之大變局,對發展數字經濟作出重大部署,擘畫了新時代數字中國建設的宏偉藍圖。
黨的二十屆三中全會明確提出“建設和運營國家數據基礎設施,促進數據共享”。各地區各部門認真貫徹落實習近平總書記重要指示精神,積極探索數據基礎設施建設,為數據要素市場化配置改革、建設全國一體化數據市場奠定了良好基礎。同時也要看到,數字經濟蓬勃發展對數據流通利用和價值釋放提出了新的更高的要求,迫切需要更好發揮有為政府和有效市場作用,構建兼顧效率和公平、適應數據要素特征、發揮數據價值效用的國家數據基礎設施。
按照黨中央、國務院決策部署,國家發展和改革委員會、國家數據局、工業和信息化部在充分調研的基礎上,組織編制了《國家數據基礎設施建設指引》,力爭在當前情況下,說清楚數據基礎設施的概念、發展愿景和建設目標,指導推進數據基礎設施建設,推動形成橫向聯通、縱向貫通、協調有力的國家數據基礎設施基本格局,打通數據流通動脈,暢通數據資源循環,促進數據應用開發,培育全國一體化數據市場,夯實數字經濟發展基礎,為數字中國建設提供有力支撐。
一、概念內涵
縱觀人類經濟發展史,每一輪產業變革都會孕育新的基礎設施。農業經濟時代,基礎設施主要是農田水利設施。工業經濟時代,公路、鐵路、港口、機場、電力系統等成為新的基礎設施。數字經濟時代,網絡設施、算力設施、應用設施等構建了數字基礎設施。當前,數據成為關鍵生產要素,催生新的技術—經濟范式,重塑產業發展方式,推動數字基礎設施向數據基礎設施延伸和拓展。建設和運營國家數據基礎設施,進一步促進數據“供得出、流得動、用得好、保安全”,對于支撐數據基礎制度落地、構建全國一體化數據市場、培育發展新質生產力具有重要意義。
國家數據基礎設施是從數據要素價值釋放的角度出發,面向社會提供數據采集、匯聚、傳輸、加工、流通、利用、運營、安全服務的一類新型基礎設施,是集成硬件、軟件、模型算法、標準規范、機制設計等在內的有機整體。國家數據基礎設施在國家統籌下,由區域、行業、企業等各類數據基礎設施共同構成。網絡設施、算力設施與國家數據基礎設施緊密相關,并通過迭代升級,不斷支撐數據的流通和利用。
二、發展愿景
(一)主要目標
國家數據基礎設施是數據基礎制度和先進技術落地的重要載體。在數據流通利用方面,建成支持全國一體化數據市場、保障數據安全自由流動的流通利用設施,形成協同聯動、規模流通、高效利用、規范可信的數據流通利用公共服務體系;在算力底座方面,構建多元異構、高效調度、智能隨需、綠色安全的高質量算力供給體系;在網絡支撐方面,構建泛在靈活接入、高速可靠傳輸、動態彈性調度的數據高速傳輸網絡;在安全方面,構建整體、動態、內生的安全防護體系;在應用方面,支持傳統行業轉型升級,賦能人工智能等新興產業發展??傮w實現“匯通海量數據,惠及千行百業,慧見數字未來”的美好愿景。
(二)推進路徑
當前,我國數據基礎設施處于起步建設階段,圍繞流通利用業務場景,各地方各行業各領域探索形成多種有針對性的技術方案和解決路徑,并在不斷迭代發展。在推動技術設施化過程中,要注重發揮有為政府和有效市場雙重作用,堅持自上而下布局、自下而上探索雙向協同,鼓勵大膽創新,支持先行先試,加快技術收斂,推動技術規?;渴?、系統化應用,為構建高速互聯、高效調度、開放普惠、安全可靠的國家數據基礎設施奠定堅實基礎。
2024—2026年,利用2—3年左右時間,圍繞重要行業領域和典型應用場景,開展數據基礎設施技術路線試點試驗,支持部分地方、行業、領域先行先試,豐富解決方案供給。制定統一目錄標識、統一身份登記、統一接口要求的標準規范,夯實數據基礎設施互聯互通技術基礎。完成國家數據基礎設施建設頂層設計,明確國家數據基礎設施建設的技術路線和實踐路徑。
2027—2028年,建成支撐數據規模化流通、互聯互通的數據基礎設施,數網、數算相關設施充分融合,基本形成跨層級、跨地域、跨系統、跨部門、跨業務的規模化數據可信流通利用格局,實現全國大中型城市基本覆蓋。
到2029年,基本建成國家數據基礎設施主體結構,初步形成橫向聯通、縱向貫通、協調有力的國家數據基礎設施基本格局,構建協同聯動、規模流通、高效利用、規范可信的數據公共服務體系,協同構筑數據基礎設施技術和產業良好生態,國家數據基礎設施建設和運營體制機制基本建立。
三、總體功能
數字中國、數字經濟、數字社會建設提出了數據要素化、資源化、價值化要求,國家數據基礎設施圍繞打造高速互聯、高效調度、可信流通、安全可靠的體系化能力,持續賦能各行業數據融合與智能化發展。
(一)數據可信流通:開放普惠的數據流通
國家數據基礎設施需要打造低成本、高效率、可信賴的流通環境,便于人、物、平臺、智能體等快速接入,在符合統一目錄標識、統一身份登記、統一接口規范的基礎上,實現數據在不同組織、行業之間安全有序流動,精準匹配數據供需關系,面向電子商務、金融支付、跨境物流、航運貿易等典型場景創新融合數據應用,同時符合相關法律法規、社會倫理、個人隱私保護等要求。
(二)高效算力供給:多元異構的算力協同
算力資源多元異構、異地分布、動態變化,給大規模計算任務的統一調度與任務協同帶來挑戰。面向“東數西算”等場景中對異屬異構異地算力的調度需求,需要建立多元異構算力統籌調度的能力,實現算力和運力的高度融合,實現算力資源之間的無縫對接與協同計算,提高整體計算效率與資源利用率,實現算力最優配置與動態調整。
(三)數據高速傳輸:高效彈性的數據傳輸網絡
高效彈性的傳輸網絡可為數字金融、智慧醫療、交通物流、大模型訓練和推理等核心場景數據傳輸流動提供高速穩定服務。國家數據基礎設施在高效彈性傳輸網絡的支撐下,能夠顯著提升數據交換性能,降低數據傳輸成本,為數據大規模共享流通提供高質量通道。
(四)全程安全可靠:動態全面的安全保障
數據采集、匯聚、傳輸、加工、流通、利用、運營等多樣化活動,涉及多方主體、多個環節,需要在開放環境下對數據進行整體、動態保護。國家數據基礎設施需要構建標準化、多層次、全方位的安全防護框架,推動安全防護由靜態保護向動態保護、由邊界安全向內生安全、由封閉環境保護向開放環境保護轉變,形成貫穿數據全生命周期各環節的動態安全防護能力,系統保障數據基礎設施相關的網絡、算力、數據安全。
四、總體架構
(一)技術架構
圖1 國家數據基礎設施總體架構圖
國家數據基礎設施具有數據采集、匯聚、傳輸、加工、流通、利用、運營、安全八大能力。在數據采集方面,支持通過傳感器、業務系統等手段采集相關數據。在數據匯聚方面,通過標識編碼解析、數據目錄等,對數據進行高效接入、合理編目,實現數據廣泛匯聚、存儲和發布。在數據傳輸方面,支持節點即時組網、數據高效傳輸。在數據加工方面,為參與方提供高效便捷、安全可靠的數據清洗、計算服務,建立數據質量控制和評估能力,提高數據處理環節效率。在數據流通方面,通過數據分類分級策略實現共享、交易等流通功能,為不同行業、不同地區、不同機構提供可信流通環境。在數據利用方面,為數據應用方提供數據分析、數據可視化等能力,進一步降低數據應用門檻。在數據運營方面,提供數據登記、監督管理、數據認證、合規保障等功能,有效支撐數據要素市場有序運行。在數據安全方面,提供動態全過程數據安全服務,包括防竊取、防泄露、防破壞等。在賦能方面,促進數據多場景應用、跨主體復用,賦能工業制造、現代農業、跨境數字貨幣、數字金融、智慧醫療、智慧交通、跨境物流、航運貿易、綠色低碳等行業領域。
其中,數據流通利用設施是國家數據基礎設施的重要組成部分,為跨層級、跨地域、跨系統、跨部門、跨業務數據流通利用提供安全可信環境,包括可信數據空間、數場、數據元件、數聯網、區塊鏈網絡、隱私保護計算平臺等技術設施。網絡設施、算力設施適應數據價值釋放需要,向數據高速傳輸、算力高效供給方向升級發展。安全保障體系是國家數據基礎設施安全可靠運行的保障,包括監測預警、信息通報、應急處置等相關制度、能力和隊伍建設。
(二)主要構成
國家數據基礎設施以行業、區域數據基礎設施為主體,以企業數據基礎設施為重要組成。企業數據基礎設施是指服務企業生產、運營、管理的數據平臺,包括采集、存儲、處理、管理等相關硬件和軟件系統,以及企業整合、協同關聯數據方形成的數據服務平臺。行業數據基礎設施是指覆蓋某一行業領域,服務行業內企業、用戶及利益相關者,實現數據要素化、資源化、價值化的各類設施,包括行業數據流通交易平臺、行業數據歸集平臺、行業數據公共服務平臺等。區域數據基礎設施是指覆蓋本地區,服務區域內企業、用戶及利益相關者,實現數據要素化、資源化、價值化的各類設施,包括數據歸集平臺、數據資源管理服務平臺、公共數據運營平臺等。國家在企業、行業、區域數據基礎設施的基礎上,組織建設基于統一目錄標識、統一身份登記、統一接口要求的數據流通利用底座,搭建數據流通利用基礎設施管理平臺,以及建設數據產權登記、公共數據運營、數據資源管理、數據流通交易、算力資源監測調度等基礎公共服務的平臺。這些設施相互貫通、協同推進,共同促進國家數據基礎設施建設發展。
五、重點方向
(一)建設數據流通利用設施底座
按照統一目錄標識、統一身份登記、統一接口要求,建設數據流通利用設施底座。建立覆蓋政府、行業、企業等主體及國家、省、市、縣等層級的全國一體化的分布式數據目錄,形成全國數據“一本賬”,支撐跨層級、跨地域、跨系統、跨部門、跨業務的數據有序流通和共享應用。建立全國一體化的分布式數字身份體系,規范身份標識生成、身份注冊和認證機制。建立統一的數據憑證、交易憑證結構、生成與驗證機制,支持利用區塊鏈、加密技術、智能合約等手段提高憑證的可溯性和信任性。構建標準化、規范化的交互接口,實現數據基礎設施的互聯互通。建設數據泛在接入體系,支持數據資源、參與主體、第三方服務更大規模接入。建立與IPv6等網絡標識兼容的數據標識體系。建立數據目錄分類分級管理機制,加強數據分類管理和分級保護。
(二)建設數據高效供給體系
在數據標注產業的生態構建、能力提升和場景應用等方面先行先試。鏈接各類公共數據、企業數據、個人數據以及各類高質量數據集,對社會形成統一的數據資源開放目錄。研究制定高質量數據集建設相關標準,從數據生成、注釋定義到數據管理的全過程,確保數據標注的準確性和數據模型的專業性。制定高質量數據標注與交付規則,提高訓練數據質量。支持農業、工業、金融、自然資源、衛生健康、教育、科技、民航、氣象等行業領域打造高質量數據集。因地制宜推進公共數據運營平臺集約化、標準化建設,推進公共數據的規?;⒊B化供給。推進數據資源管理服務平臺互聯互通,完善平臺標準,促進平臺間互操作,實現全國數據資源的跨領域、跨層級、跨區域流通利用。支持各地積極建設政務服務大模型,推動政務服務智能化。
(三)建設數據可信流通體系
建立高效便利可信的數據流通機制,促進數據大規模、低成本、安全自由流通。支持建設企業可信數據空間、行業可信數據空間,探索建設城市可信數據空間、個人可信數據空間、跨境可信數據空間。支持基礎好、有條件、意愿強的行業和城市,先行先試數場建設。鼓勵行業、地方積極探索建設區塊鏈、隱私保護計算等新技術設施。支持因地制宜,探索數聯網、數據元件等數據流通基礎設施建設。支持建設數據流通交易公共服務平臺。支持探索建設數據跨境流動基礎設施。建立數據流通準入標準規則,鼓勵探索數據流通安全保障技術、標準、方案。
(四)建設數據便捷交付體系
加強數據交易場所體系設計,統籌數據交易場所優化布局。支持數據交易場所創新發展,鼓勵各類數據進場交易。構建集約、高效的數據交付基礎設施,為場內集中交易和場外分散交易提供低成本、高效率、可信賴的數據交付環境。促進各類交易所、交易平臺互聯互通。推動數據價值貢獻度評估、數據集推薦匹配、數據產品差異性分析等技術創新,實現供需精準匹配和便捷交付。鼓勵各地提升數據加工、測試、建模驗證、安全實驗等社會化服務能力,打造產學研用“一公里”工作圈。
(五)建設行業數據應用體系
加強場景牽引,建設面向工業制造、現代農業、數字金融、智慧醫療、智慧交通、跨境物流、航運貿易、衛生健康、綠色低碳等重點行業領域的數據應用基礎設施,促進行業數據應用創新。培育基于數據要素的新產品和新服務,促進數據多場景應用、跨主體復用,實現知識擴散、價值倍增。
六、算力底座
(一)推進算力資源科學布局
加快推動通用算力、智能算力、超級算力等多元異構算力的綠色發展、有機協同。促進各類新增算力向國家樞紐節點集聚,強化樞紐節點國家算力高地定位。建設全國一體化算力網監測調度平臺。探索采用存算分離架構建設新型智算中心和新材料大數據中心。
(二)推進東中西部算力協同
加強新興網絡技術創新應用,優化網絡計費方式,降低東西部數據傳輸成本,促進東部中高時延業務向西部轉移。構建算力多級調度策略引擎,實現跨平臺、跨層級、跨區域的算力資源混合部署和統一調度,促進算力資源高效對接,提升數據匯聚、處理、流通、交易效率。推動國家樞紐節點和需求地之間400G/800G高帶寬全光連接,引導電信運營商提升“公共傳輸通道”效能,推進算網深度融合。
(三)推進算力與數據、算法融合創新
推動實現“瓦特”產業向“比特”產業轉化,不斷壯大數算產業生態體系,助力打造具有國際競爭力的數字產業集群。推動行業數據和算力協同,實現數據可信流通,提升數據處理能力和治理水平。建立健全算法開發利用機制,積極開展大模型創新算法及關鍵技術研究,提升數據分析能力,降低大模型計算的算力消耗水平。
(四)推進算力與綠色電力融合
強化樞紐節點與非樞紐節點的協同聯動,支持綠電資源豐富的非樞紐節點融入全國一體化算力網建設。加強大型風光基地和算力樞紐節點協同聯動,把綠色電力轉換成綠色算力。積極推進風光綠電資源消納,助力實現碳達峰碳中和。支持利用“源網荷儲”等新型電力系統模式。加強數據中心智慧能源管理,開展數據中心用能監測分析與負荷預測,優化數據中心電力系統整體運行效率。探索綠電直供新模式,有序開展綠電、綠證交易。
(五)推進算力發展與安全保障協同
推動建設國家算力網基礎安全服務保障平臺,打造一體化的安全保障服務能力。打造網絡和數據安全攻防演習靶場,推動國家樞紐節點地區定期開展網絡和數據安全攻防演習。建設算力網安全應用技術試驗場。強化國家樞紐節點自主防護能力,統一應急處置、統一安全監測、統一運行監控,構筑全生命周期的安全管控措施。
七、網絡支撐
建設高速數據傳輸網,實現不同終端、平臺、專網之間的數據高效彈性傳輸和互聯互通,解決數據傳輸能力不足、成本較高、難以互聯等問題。支持基礎電信運營商疊加虛擬化組網、網絡協議創新和智能化任務調度等云網融合技術,形成多方快速組網和數據交換能力,支持面向數據傳輸任務的彈性帶寬和多量綱計費。
推動傳統網絡設施優化升級,有序推進5G網絡向5G-A升級演進,全面推進6G網絡技術研發創新。在東中西部地區均衡布局國際通信出入口局,加快擴展國際海纜、陸纜信息通道方向。建設時延確定、帶寬穩定保障、傳輸質量可靠的確定性網絡。布局“天地一體”的衛星互聯網。
八、安全防護
國家數據基礎設施安全保障體系建設重點是構建多層次、全方位、立體化的國家數據基礎設施安全保障框架,貫穿數據生命周期全流程,幫助各參與方提升數據安全保障能力,確保數據的可信性、完整性和安全性。
在國家數據基礎設施安全保障層面,實現可信接入、安全互聯、跨域管控和全棧防護等安全管理,建立網絡安全風險和威脅的動態發現、實時告警、全面分析、協同處置、跨域追溯和態勢掌控能力,提供芯片、軟件、硬件、協議等內置后門、漏洞安全威脅的內生防護能力。加強對合作伙伴、運維人員、平臺用戶等數據安全內部風險的防范應對。加強對入侵滲透、拒絕服務、數據竊取、勒索投毒等外部威脅的應急響應。
在數據流通利用安全層面,綜合利用隱私保護計算、區塊鏈、數據使用控制等技術手段,保證數據的可信采集、加密傳輸、可靠存儲、受控交換共享、銷毀確認及存證溯源等,規避數據隱私泄露、違規濫用等風險。加強算法、模型、數據的安全審計,增強模型魯棒性和安全性,保證高價值、高敏感數據“可用不可見”“可控可計量”“可溯可審計”,確保貫穿數據全生命周期各環節安全。
九、組織保障
(一)健全政策保障體系
建立健全數據基礎制度體系,加快出臺數據產權、流通交易、收益分配、安全治理等政策文件。在新型基礎設施規劃安排下,研究制定國家數據基礎設施建設規劃。加大中央投資對國家數據基礎設施建設的支持力度。各地區、各部門要在數據基礎設施規劃布局、資金安排、課題研究方面給予重點支持。積極引導社會資本力量參與國家數據基礎設施建設。
(二)加快技術創新探索
支持有條件的行業和地區開展先行先試探索建設數據基礎設施。鼓勵企業和科研機構加大研發投入,加快數據流通利用關鍵技術攻關和重大成果轉化。通過國家重點研發項目課題立項、揭榜掛帥、數據技術創新大賽等方式推動技術創新。
(三)強化標準和人才支撐
強化標準支撐,研究制定數據基礎設施相關標準規范。鼓勵企業、社會團體、科研機構參與數據基礎設施國際標準的制定工作。加強與ISO、IEC、IEEE、ITU、3GPP等國際標準化組織的合作,推動數據領域高水平專家在國際組織任職。推動人才隊伍建設,建立數據人才評價標準和評選機制。
附錄:
技術術語解釋
(一)數據流通利用技術
在數據流通利用領域,目前常用的技術路線主要包括隱私保護計算、區塊鏈、數據使用控制等。
1.隱私保護計算
隱私保護計算指在保證數據提供方不泄露原始數據的前提下,對數據進行分析計算的一類信息技術,保障數據在產生、存儲、計算、應用、銷毀等數據流轉全過程的各個環節中“可用不可見”。隱私保護計算的常用技術方案有安全多方計算、聯邦學習、可信執行環境、密態計算等;常用的底層技術有混淆電路、不經意傳輸、秘密分享、同態加密等。
2.區塊鏈
區塊鏈是分布式網絡、加密技術、智能合約等多種技術集成的新型數據庫軟件,具有多中心化、共識可信、不可篡改、可追溯等特性,主要用于解決數據流通過程中的信任和安全問題。
3.數據使用控制
數據使用控制是指在數據的傳輸、存儲、使用和銷毀環節采用技術手段進行控制,如通過智能合約技術,將數據權益主體的數據使用控制意愿轉化為可機讀處理的智能合約條款,解決數據可控的前置性問題,實現對數據資產使用的時間、地點、主體、行為和客體等因素的控制。
(二)數據流通利用實踐方案
在數據流通利用領域,目前業界的實踐方案主要包括可信數據空間、數場、數聯網、數據元件等。
1.可信數據空間
可信數據空間是指數據資源開放互聯、可信流通的一類數據流通利用設施,其以數據使用控制為核心,以連接器為技術載體,以實現數據可信交付,保障數據流通中“可用不可見”“可控可計量”為目標,具備數據可信管控、資源交互、價值創造三大核心能力。
圖2 可信數據空間架構圖
2.數場
數場是依托開放性網絡及算力和隱私保護計算、區塊鏈等各類關聯功能設施,面向數據要素提供線上線下資源登記、供需匹配、交易流通、開發利用、存證溯源等功能,支持多場景應用的一種綜合性數據流通利用設施。以高效流通、價值釋放、繁榮生態為核心,實現數據可見、可達、可用、可控、可追溯,具備開放性、融合性、擴展性等特點。
數場從點、線、面、場、安全五個維度構建標準化技術框架。點是數據主體進入數場的接入點。線是數場內連接各主體、各平臺的數據高速傳輸網,實現數場內各主體之間的互聯互通。面是數場中數據主體、傳輸網絡的集合,是實現數據大規模流通、高效安全利用的核心。由點到線、由線到面構成數場基礎設施。場是基于數場基礎設施構建的數據應用、場景化創新,以及相關能力、流程、規范的統稱。安全是覆蓋點、線、面、場的動態全流程保護措施。數場在技術架構上包括接入點、功能平臺、管理平臺、安全保障、網絡傳輸等基礎服務平臺。
圖3 數場功能架構圖
3.數聯網
數聯網由數據流通接入終端、數據流通網絡、數據流通服務平臺構成,提供一點接入、廣泛連接、標準交付、安全可信、合規監管、開放兼容的數據流通服務。
圖4 數聯網功能架構圖
4.數據元件
數據元件提供統一標準、自主可控、安全可靠、全程監管的數據存儲和加工服務,支持采用標準化工序完成數據產品規?;庸?、生產和再利用,適用于大規模數據加工和生產場景。數據元件作為連接數據供需兩端的“中間態”,將原始數據與數據應用“解耦”,基于數據元件相關組件,實現從數據歸集到數據元件加工交易全生命周期的數據要素開發和管控。
(三)數據安全技術
數據安全技術為數據收集、存儲、處理、傳輸、共享和銷毀等全生命周期提供安全保障,包括數據備份與恢復、應用數據加密、數據泄露檢測、流轉監測、身份認證與訪問控制、數據脫敏、數據水印、數據安全態勢感知等。