基于网页内容的URL分类并应用于信息过滤
负责人:戴新宇
研发目标:
随着互联网的迅猛发展,海量的信息资源满足的人们快速获取各种信息的需要。然后,由于互联网上的信息良莠不齐,互联网的发展和普及在满足人们信息获取得需要、提高生产力和促进社会发展的同时,也在安全、管理、道德等方面给国家、社会、企业和家庭带来了严峻的挑战。为应对互联网带来的问题,基于内容的网页过滤的研究和相关产品的开发成为国家、企业和研究者们所关注的热点。希望通过网页过滤,达到网络访问控制,精华网络环境的目的,从而能够对互联网进行行为控制和管理的关键。
本项目旨在通过及其学习的手段和技术进行网络数据的自动收集、处理和分类,自动构建增量的URL网址分类数据库,进而实现一个自适应的、面向用户的网页过滤系统。
预期成果:
一个能对企业内部员工上网内容进行高精度过滤的系统,过滤的类别可以惊醒设置。完善的满足企业、学校、家庭等多种用户需要的分类过滤体系。