随着信息社会的发展和互联网的普及,特别是Web2.0、Web3.0等技术带来论坛、博客、微博、社交网络的快速发展,“人人都有麦克风”,由此各类信息呈现出传播渠道多、传播速度快、传播范围广的特点,互联网逐步深入到社会的各个领域,它提供了难以计数的有用信息,但同时也伴随着大量的不良信息,如计算机病毒、网络入侵与攻击、垃圾邮件、色情信息、反动言论以及泄露的机密信息等,这些不良信息不仅会造成重大的经济损失,而且会威胁国家的政治、科技、国防、宗教等的正常秩序,干扰人民群众的正常生活,甚至引发社会动荡,网络安全在国家安全中的地位和作用也越来越大。
互联网已经成为政府、企业、公安、军队、金融等各行各业获取信息的重要来源,由互联网上海量数据正在成为各行各业决策的重要依据。因此在新时代网络空间下,针对海量数据形成全面、智能、精炼、友好的深度分析,并及时快速应对处理,是一个非常重要、亟需解决的问题。近年来,随着互联网、云计算、移动物联网的迅猛发展,大数据作为主要的信息来源,已成为信息处理领域的主流。如何发现大数据所蕴含的价值,并发挥其价值,已经受到科研和企业单位的高度重视。大数据内容理解是我国新时期所面临的种种重大需求中的一个关键科学问题,是信息科技发展新的瓶颈,是走出“数据爆炸但知识贫乏”困境的一个突破口,对大数据内容进行“理解”与智能化分析处理,从而挖掘大数据中蕴含知识和信息。使大数据成为为国家、企业和社会服务的有效资源。
2003年9月7日中共中央办公厅、国务院办公厅发出通知贯彻落实《国家信息化领导小组关于加强信息安全保障工作的意见》(中办发[2003]27号),2007年中共中央办公厅、国务院办公厅联合印发《国家信息安全“十一五”规划》(国信安[2007]2号)。2013年11月12日,中国共产党十八届三中全会公报指出将设立国家安全委员会,完善国家安全体制和国家安全战略,确保国家安全。
挑战之一:面向网络空间大数据的并行存储与计算技术
现在的社会已全面进入大数据时代(Big Data),在人类社会的信息化过程中,数字信息数量正急剧增长,同时它们所需保存的时间也比以前大为延长,全人类每年要产生约10亿~20亿GB (1Exabytes -2Exabytes)的新信息,这一信息数量相当于全球每人每年要产生250MB的信息。
新型网络空间下,需要将从网络上搜集过来的大量数据进行存储,并对数据进行整理、建索引、以及各种快速有效的组织和处理,以便灵活方便高效地得出各种业务结论。随着互联网的快速发展,各种移动终端的迅速增加,结构化和非结构化的数据量越来越大。传统的文件系统已经不能满足海量数据的存储要求,分布式文件系统日益成为研究的热点;同时由于数据量过于庞大,传统的单机处理方式不能满足处理需求,并行的处理方式得到快速的发展。因此,急需研究面向网络空间大数据的新型并行存储与计算技术。
挑战之二:面向网络空间大数据的内容理解技术
大数据内容理解是我国新时期所面临的种种重大需求中的一个关键科学问题,是信息科技发展新的瓶颈,是走出“数据爆炸但知识贫乏”困境的一个突破口。大数据包含结构化和非结构化的种类繁多的数据,内容包括各种文档、视频、图像、语音等数据形式。据统计,互联网数据中约20%的数据是结构化的,约80%则是非结构化或半结构化的。当今世界结构化信息增长率大概是32%,而非结构化信息增长则是63%,非结构化信息占有比例将达到互联网整个数据量的75%以上,而非结构化信息中50%~75%的数据都来源于人与人的互动,都是以人为中心产生的。随着新时代网络空间的发展,非结构化信息越来越多,网络舆情也往往由非结构化信息引发。本系统研究非结构化信息理解技术,支持word、pdf等一百多种常见文档内容分析,支持图片、图像、电话交谈、网络聊天、视频等多媒体内容理解。只有通过理解所有信息的含义,计算机才能自动处理信息并使用户能够运用并最大化信息的价值。
针对这一特点,需要从3个层面展开深度研发。
(1)大数据内容理解的认知机理和数据基础
该层面主要研究大数据内容的各种信息来源及其表达方式,即研究感知信息的基本表达方式。探索通过感知系统获取的信息在计算机中应如何表达,确定对不同种类信息进行计算处理的基本单元,包括视觉信息的基本表达、语音信息的基本表达、语言信息的基本表达。构建数字内容理解的视觉、语音、语言知识资源等,并实现多信息源知识的有效融合,将局部的、不完整的信息组织整合成具有意义的一个个整体。
(2)大数据内容理解的计算模型与方法
本层面的研究主要对信息内容理解的各种计算模型与方法展开研究,包括语义层面的智能文档信息处理技术,口语语音信息的分析技术与方法,图像序列内容理解的模型与方法,大规模内容计算与内容监控的计算模型与方法。
(3)大数据内容理解的实践与验证环境
本层面的研究主要针对第二层面研究所的计算模型和方法,开展相应的实现与验证,检验所提出的计算模型和算法的有效性。
挑战之三:面向网络空间安全的数据包内容检测技术
为了保障网络中信息内容的安全,人们提出了深包检测(Deep Packet Inspection)技术,是很多网络安全系统的基础核心技术,如防病毒、网络入侵检测和防御(IDS/IPS)、防垃圾邮件、防恶意代码、网络审计、内容过滤、UTM(统一威胁管理)等安全系统。深包检测技术的核心环节是用特征匹配技术检测网包负载(packet payload)中是否出现预定义的特征(pattern)。根据具体网络安全应用,检测的特征可以是预先提取的恶意代码中的一个片断,也可以是垃圾邮件中的一段字符串,也可以是用户自己定义的关键字等,即可以用字符串表示,也可以用复杂的正则表达式(Regular Expression)表示。由于病毒变种的增多、攻击形式的多样化、入侵特征的提取难度增加、网络协议的复杂性增加等因素,特征形式变得越来越复杂,只用简单字符串很难准确描述,而正则表达式相对字符串具备更加强大和灵活的表达能力,正在逐渐成为新一代描述特征的语言,但由于其形式的复杂多样导致匹配难度的增加和性能的下降。
随着网络安全应用功能的丰富,其计算复杂性日益提高,防火墙、入侵检测、防毒墙、UTM等作为网络高端应用,对每个网络包的处理需要更多的指令数。可以看到,系统功能的丰富以“牺牲”性能为代价。现在的网络安全系统功能在不断增加,伴随着性能的需求也在不断提升。
挑战之四:支持移动互联网等新型接入方式
随着3G/4G/WIFI技术的普及和商业WIFI的迅速发展,越来越多的非经营上网场所对外提供了免费的WIFI接入服务。同时,商家越来越注重3G/4G/WIFI在营销方面的价值,对3G/4G/WIFI的增值需求也越发明显。 因此网络空间安全需要支持3G/4G/WIFI技术接入。
在全球信息化进程中,我国正处于从被动应对向自主发展转变的关键时期,加紧实施国家信息化发展战略,强化信息技术创新,已成为支撑现代化建设、增强国家综合实力的必然选择。如何通过创新与规范,促进新时代网络空间和谐发展,充分适应信息技术的发展和形势的变化,积极实施网络空间管理的监督职能、引导职能、规范职能、惩戒职能,加快建立法律规范、行政监督、行业自律、技术保障相结合的网络空间管理体制和机制,推动网络空间健康发展。(深圳广道高新技术有限公司 技术总监 张伟)
(作者:周婵)
编辑:更多资讯,欢迎扫描下方二维码关注湖北日报官方微博、微信。
瀵逛笉璧凤紝鎮ㄨ璁块棶鐨勯〉闈笉瀛樺湪鎴栧凡琚垹闄!
10 绉掍箣鍚庡皢甯︽偍鍥炲埌鑽嗘缃戦椤