免费获取|
论文天下网
  • 论文天下网 |
  • 原创毕业论文 |
  • 论文范文 |
  • 论文下载 |
  • 计算机论文 |
  • 论文降重 |
  • 毕业论文 |
  • 外文翻译 |
  • 免费论文 |
  • 开题报告 |
  • 心得体会 |

当前位置:论文天下网 -> 论文下载 -> 理工科论文

网页信息抽取模块研制-微机应用专业论文

本文ID:13564 字数:8911,页数:24

下载地址 全文下载链接(充值:¥50.00元) 

微机应用专业论文,论文字数:8911,页数:24

摘  要

 垂直搜索引擎和普通的网页搜索引擎的最大区别是垂直搜索引擎对网页信息进行了结构化信息抽取,因此信息抽取技术成为了构建垂直搜索引擎的核心技术。本文首先简介4种Web的信息抽取技术,然后结合Jtree和Xpath技术来实现动态网页信息抽取系统.
关键字:信息抽取;垂直搜索引擎;结构化信息提取;JTree;XPath

Abstract

 The difference between  search engine and simple search engine is that Plumb search engine structed the file that catch,and the search information become the core technology to build the Plumb search engine.This article talk about four different technology for web search first,and then combine the Jtree with xpath to build this search system.
 
Keywords: Information search;Plumb search engine;structed information extraction;Jtree;xpath;

目  录

引 言 5
第一章 开发概述 6
1.1 研究背景和意义 6
第二章 Web信息抽取相关技术 7
2.1垂直搜索引擎中的信息抽取技术的选用 7
2.2 几种Web的信息抽取技术简介 7
2.3 JTidy简介 10
2.4 XHTML简介 11
第三章 系统分析与设计 12
3.1需求分析 12
3.2系统设计 12
3.2.1网页抓取功能 12
3.2.2 样本页转换成XHTML功能 12
3.2.3 XHTML转换成XML功能 13
3.2.4  XpathViewer解析器 13
3.2.5 XSLT解析器文件 13
3.2.6 提取信息 13
第四章 信息抽取系统的实现 14
4.1 解析页面并生成Jtree 14
4.2 抽取规则的生成算法生成 15
4.3 根据Xpath生成XSLT文件 17
第五章 试验 18
5.1 获取抽取页面并测试 18
总结 21
致谢 23
参考资料

相关论文
上一篇:新闻发布系统-微机应用专业论文 下一篇:浅谈龙门吊的纠偏系统
推荐论文 本专业最新论文
Tags:网页 信息 抽取 模块 研制 微机 应用 专业论文 2011-01-07 17:08:55【返回顶部】

相关栏目

教育管理论文
汉语言文学
学前教育论文
心理学论文
小学教育论文
现代教育技术
数学与应用数学
数学教育论文
工商管理
人力资源管理
财务会计
法律论文
行政管理论文
物流专业论文
电子商务论文
理工科论文
物理学论文
乡镇企业管理
电视制片管理
文化产业管理
物业管理论文
毕业论文下载
包装工程论文
印刷工程论文
工业工程论文
信息管理论文
生物工程论文
制药工程论文
电子信息工程
通信工程论文
电气工程论文
信息计算科学
药学专业毕业论文


关于我们 | 联系方式 | 论文说明 | 网站地图 | 免费获取 | 钻石会员 | 原创毕业论文

 

论文天下网提供论文检测,论文降重,论文范文,论文排版,网站永久域名WWW.GEPUW.NET

本站部分文章来自网友投稿上传,如发现侵犯了您的版权,请联系指出,本站及时确认并删除  E-mail: 893628136@qq.com

Copyright@ 2009-2022 GEPUW.NET 论文天下网 版权所有