2008-10-04

一个PHP+MYSQL的搜索引擎解决方案


帮同学弄了个网站,NBA搜索网站 http://www.8gnba.com/

因为NBA的领域比较小,而且服务器资源有限,所以没有采用C++的方案,而且直接用PHP来完成搜索网站的几个核心步骤:爬虫html解析。用MYSQL来完成网页的索引和查询。

网页数据库只索引了网页的标题,所以用MYSQL就可以快速的进行查询。

系统的难点主要是爬虫和html的解析,爬虫主要是利用的php可以读取url文件。
至于HTML的解析,主要是用到了php的正则表达式的库。

这种PHP+MYSQL的搜索引擎比较适合小规模的垂直搜索,对某个小领域的搜索,特别适合于对某个新闻话题,就比如美国的救市什么的。主要是他的部属很快,比装一个discuz简单,爬虫的开启什么的都是在网页上进行,后台控制也是在浏览器上进行。

1 条评论:

  1. 兄弟,你好!
    我很崇拜你做了这么一个网站系统(http://www.8gnba.com/)
    我是学法律的,在检察院工作,业余时间也写过一些PHP的程序,目前也正在琢磨一个类似的所谓的垂直搜索引擎解决方案,希望能与您取得联系,向您多请教!

    我的联系方式:
    email: lawup@foxmail.com
    qq: 71520977
    在我的博客右侧框内可以免费给我发手机短信:http://lawup.cn

    盼望着您的来信!

    回复删除