• 介绍-体检项目-网站不良信息检测系统

网站不良信息检测系统是为净化校园网而提供的检测服务,面向教育网的“网站不良信息检测服务”是以互联网爬虫技术为核心,根据用户定制信息提供准实时、主动的网站不良信息的扫描分析,及时发现被网站被篡改或被放置不良信息的网站,对确认的网站提供及时的详细情况分析,帮助网站管理员进行快速的处置,协助提高教育网站点信息安全.该系统最大特点是能够进入语义深层处理自然语言语言的内容,而不是仅仅利用语言的表层信息进行处理。因此尽管涉及同样的关键词,能够区分不良信息和对不良信息进行批判的网络内容。“网络不良信息检测系统”的研发就是将这些自然语言理解处理技术与先进的网络技术结合而形成的。

  这一系统的主要特点包括:

  1、 针对网络上出现的色情、反动、低俗等不良信息文本内容进行检测。

  2、 利用网络爬虫自动对指定网站的网页内容进行下载、检测并给出检测报告。

  3、 基于最新的自然语言内容理解技术,不同于以往的基于关键字词的检测系统,能够区分出不良信息和反不良信息的网页内容。

  4、 快速处理海量文本内容。

  5、 支持简体中文、繁体中文。

  6、 高准确率。

  7、 对不能做出判断的内容能提出警告,供人工判别,和传统的检测系统相比能够大大地提高网页的处理数量和减少监管人员人工干预的工作量。

  总之,网络不良信息检测系统通过将网络技术技术和自然语言理解处理有机结合,形成了对网络内容进行智能判断的能力。在不良信息检测方面,能够准确有效地发现网页上的不良信息,从而大大减轻系统使用者的工作强度,也使得对存在不良信息网页的检测更加有效。这一系统还将在实际应用中根据用户的需求不断发展完善,更好服务于用户。