1、网络安全技术网络安全技术一、内容安全技术概述互联网破坏行为增加了互联网用户进行业务活动的风险,也降低了互联网信息服务的管理水平和服务质量。要阻止这些网络破坏行为,营造良好的网络活动氛围,就需要建立一套功能完善、性能较好且易于维护和扩展的移动互联网信息内容安全技术体系。通过可靠的检测技术保护信息内容安全,这种技术被称为互联网信息内容安全技术。二、内容采集、过滤、审计技术用户要实现互联网信息内容安全,就必须依靠先进的技术体系来保障。目前,整个技术流程可以分为对信息的采集、过滤和内容审计3个步骤。1、内容采集技术数据采集主要是指从本地数据库、互联网、物联网等数据源导入数据,包括数据的提取、转换和加载
2、。由于数据源不一样,数据采集的技术体系也不尽相同。互联网内容采集主要采用的技术包括内容协商、身份认证、Web 信息采集和搜索引擎等。(1)内容协商机制由于客户端设备性能以及用户喜好的不同,对同一个网络对象质量及形式的要求也会有所不同。因此,在网络中,一个网络对象可能会有多种不同的表现形式,比如,同一个网络资源会有不同的媒体类型的版本,也可能有不同语言的版本等。在向Web服务器发送请求的时候,用户将其对网络资源的要求包含在请求中,Web服务器在接收到这样的请求后,会根据自身的情况对请求做出适当响应。双方在确定了请求资源的版本后再进行资源的获取。这种客户端和服务器之间通过协商的方式来获得内容的过程
3、被称为内容协商,内容协商机制已经得到了HTTP的支持。(2)基于Cookie的身份认证Web服务主要通过HTTP来实现浏览器和服务器之间的信息交互,由于HTTP是一种无状态协议,它并不能在同一用户不同时刻访问相同Web网站时进行用户信息的记忆与继承,即HTTP协议无法对各个不同的用户进行区分,Cookie就是为了弥补HTTP这一缺陷而诞生的。利用Cookie实现身份认证是在传统Cookie机制的基础上,Web服务器使用自行定义的认证方式,向通过认证的客户端传递一个代表客户端身份的Cookie信息。若客户端后续发送的请求中包含此Cookie,服务器就通过这个Cookie来识别特定的客户端,返回客
4、户端请求的页面。若客户端后续发送的请求中不包含 Cookie,或者包含了一个服务器无法识别的Cookie,则服务器认为这是一个新用户的请求,如果用户请求的是一个需要用户认证后才可以访问的页面,则服务器会返回一个认证失败的页面,并要求用户进行身份认证。(3)Web信息采集技术Web信息采集技术通过分析网页的HTML代码,获取网内的超级链接信息,使用广度优先搜索算法和增量存储算法,实现自动地连续分析链接、抓取文件、处理和保存数据的过程。系统在再次运行中通过应用属性对比技术,在一定程度上避免了对网页的重复分析和采集,提高了信息的更新速度和全部搜索率。由于网站内的资源常常分布在网内不同的机器上,信息采
5、集系统从某个给定的网址出发,根据网页中提供的超链接信息,连续地抓取网页(既可以是静态的,也可以是动态的)和网络中的文件,将网内的信息进行全部提取。(4)搜索引擎搜索引擎是指互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索做出响应,提供用户所需的信息或相关指针。用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的检索等。(5)其他采集技术爬虫技术。网络爬虫(Web Crawler),又称为网络蜘蛛(Web Spider)或Web信息采集器,是一个自动下载网页的计算机程序或自动化脚本,是搜索引擎的重要组成部分。网络爬虫通常从一个称为种子集的URL集合开始运行,它首先将这些URL全部放到一个有序的待爬行队列里,按照一定的顺序从中
《网络安全技术.doc》由会员分享,可在线阅读,更多相关《网络安全技术.doc(9页范文模板文档)》请在优智文库上查找。