用PHPdig打造属于你自己的Google

http://tech.ddvip.com   2007年08月26日    社区交流

内容摘要:PHPdig是国外非常流行的垂直搜索引擎产品(与其说是产品,不如说是一项区别于传统搜索引擎的搜索技术),采用PHP语言编写,利用了PHP程序运行的高效性,极大地提高了搜索反应速度,它可以像Google或者Baidu以及其它搜索引擎一样搜索互联网

  至于右边的四个单选按钮,你可以视情况而定,初次使用(安装)选择默认的“建立数据库”

  确认上述信息无误后单击安装按钮,如果连接数据库不成功会提示“不能连接数据库”的错误信息,如果数据库连接成功则会直接跳入管理页面如下图:

  用PHPdig打造属于你自己的Google

  (图2)

  3. 界面区域介绍

  区域1是一个文本输入区,默认文字有三行,都是以http开头,大家一看就知道在这里输入要spider的站点的网站地址(建议每次只spider一个网站)。

  区域2是spider选项,搜索深度是指对这个网站spider到几级目录,每页链接数是指针对某个网页最多抓取多少个下面的链接网页。默认情况下都为0,指的是对这个站点进行全站spider。

  区域3显示数据库状态信息,包括已经spider的网站、关键词、索引以及正在spider的站点信息等。

  区域4是一个下拉列表框,罗列出已经spider的站点的网址,选中其中的一个站点,在区域5可以对其进行清除和更新操作。

  区域5不仅提供了对区域4中所选站点的清除和更新操作外,还提供了相关的统计信息入口和对spider的控制等。

  4. 针对特定站点运行spider

  如果你对天极软件频道的内容很感兴趣,你就可以做一个比google更专业的搜索引擎来搜索天极软件的内容,你的这个搜索引擎将比google更全面更深层次。下面我们以spider天极软件频道的内容为例介绍一下如何spider一个网站。

  1)在图2的区域1中输入http://soft.yesky.com,搜索深度和每页链接数都保持默认为0

  2)单击spider按钮,页面跳转到spider信息页面,程序开始自动spider站点http://soft.yesky.com的内容。

来源:天极网    作者:罗可龙    责编:豆豆技术应用

正在加载评论...