本博客系统结合魔方采集器,可以实现自动采集文章,无需人工干预。
首先,对采集到的新闻(存储于Sql Server2005数据库MsDzw中)进行处理,比如删除丢失了图片的条目,提取图片新闻地址等;然后,将处理好的新闻数据导出到Access文件中;最后,将导出的数据与其图片等信息一并拷贝到内网进行上传发布
3.修复部分影视不能搜索4.修复电影页面相关链接5.增加电影页文字广告和分享6.增加错误页面提示7.优化SEO相关功能使用说明:修改static/config/general.config中相关网站信息放到虚拟主机上即可使用
等技术特点:支持在线生成静态,在线智能采集,在线sql备份,自主开发的模板引擎。
同时取消的模块如下:a.collect(采集:将其他网站的信息采集至本站)b.mtag(群组:根据自己的兴趣爱好简历兴趣小组)c.ezine(邮件订阅:定期给用户发送最新的动态)d.tools(工具箱:
同时取消的模块如下:a.collect(采集:将其他网站的信息采集至本站)b.mtag(群组:根据自己的兴趣爱好简历兴趣小组)c.ezine(邮件订阅:定期给用户发送最新的动态)d.tools(工具箱:
【注意事项】1.系统默认帐号密码均为:51aspx2.使用本程序的一般步骤:添加项目>>>采集>>>导出设置>>>导出数据3.匹配规则的填写:请先使用规则生成器生
二、添加好采集项目后,进行列表设置:列表页面地址列表开始标记列表结束标记三、采集测试数据库在App_Data文件夹中(ACCESS)
6、采集分普通采集和智能采集,完全自定义规则。App_Data下为Sql2005数据库文件管理地址:/manage/login.aspx默认管理帐/密码:51aspx/51aspx