您当前的位置:首页 > 电脑百科 > 程序开发 > 开源程序 > 帝国cms

帝国cms怎么采集信息

时间:2023-05-19 10:16:12  来源:  作者:

帝国cms怎么采集信息?

帝国cms是我们用得比较多得php的建站系统,在建站过程中,如果自己没有信息源,只能靠手工不断的重复copy和粘贴,这样费时费力,于是我们就要使用帝国cms自带的采集功能来完成信息的录入。为了深入了解帝国cms采集功能,下面我们以“新浪各地新闻”栏目为例来进行实战采集。

一、增加采集节点

1、添加节点:

c77d6e04a858022556bc3a180b83195.png

2、选择要增加采集的栏目:

97a8187103a04ad212e8b3ecf53fc08.png

3、进入增加节点表单:

366c3de5f80ae0263fb5dcc1318857e.png

4、在节点名称框里起个名字,然后把要采集的新浪各地新闻列表地址copy过来:

a9ad05387bd3a6c99116b1bbf0545ab.png

5、下来发现好多选项,如“采集页面地址方式二,内容页地址前缀...”先不要理他,后面再一一详解,直接拉到 “信息链接区域正则”这里:

03707487ddcd4a693891b2548711e8e.png

6、这里是设置采集的列表信息链接区域正则,我们点击查看新浪各地新闻列表“源文件”:

5ca6e61b74f083434f194c444078e17.png

 

7、把源文件代码copy到Dreamweaver里,在Dreamweaver里选定要采集的信息链接区域:

35bdb053e864053e228914162e994ef.png

8、切换到Dreamweaver代码方式,

就是信息链接区域:

 

46a21ae7480eabdee4d58f357845e1f.png

9、得到信息链接区域正则:

2700a9f7f3c3829d23ba2c239236123.png

10、得到信息页链接正则:

0adde0683505e75ded9eb6f02fe770d.png

 

11、注意:如果信息页链接是相对地址,例如,那么“内容页地址前缀”要加域名:

3f346f41c072d6c2e6911f9bc9bddd3.png

12、现在要采集内容页的标题和内容:

451b33318001c03fd88cd2779925480.png

 

13、查看新闻页“源文件”,找title标签:

e1aae957ecb2a4a3b765a3c0928a873.png

14、取得标题正则:

015d08fbd6c09cbd9bdd053187348f4.png

15、这里是要采集的内容区域:

d7de2b2c6798ef0fa83933fe37cf8f8.png

16、取得新闻内容正则:

56419f99bfbba2e9a4cd86308c9dfea.png

(注意:新闻内容正则里的 d_id='*' 用了通配符,因为每一篇新闻的d_id值是不同的,所以可以用*来代替它,“*”可以代替任意字符。)

17、点击提交按钮就完成了整个采集节点:

3179db0ad7e4eb76ddd80266d436d99.png

 

二、预览采集节点是否正确

1、提交按钮后返回管理节点:

2860bbb31f72d3bc7c3c82aabdb1f9a.png

2、点击“预览”采集,进入节点预览结果:

94dde933c97b75d64160c78458ca5bf.png

3、采集内容页列表:

f2715a844224b60fc9990b507eee524.png

4、采集内容页页面:

93641ec11c00928da6b9c90f6b9fb18.png

 

三、采集

1、预览采集节点无误后,然后返回“管理节点”,点击“开始采集”链接就开始进行采集:

d1b0992cd2df13e95f59e92f669d530.png

2、系统正在采集中:

5edfd08d00999b5a157f0a8e82782c9.png

3、采集完后显示本地临时入库的信息,这时可以对临时入库的信息进行修改或者删除:

88018aecfa3f81988f5bd821cd72001.png

4、修改信息页面如图:

fb4b442b48999bed6d73d18d07f39d7.png

5、对采集的信息进行审核并入库,点击“入库全部信息按钮”:

689f7faaba9903653db396f0f6a8e1b.png

6、确定操作:

cca441b91e0c086d0a8af862b9ec62b.png

7、信息入库完毕提示:

58f5d91dc63c6427f633690bf3d41ad.png

信息入库完毕后下来点击”管理信息“:

2e19fe433b30ca821f414427319a117.png

我们可以看到刚刚采集入库的新闻信息:

e51a4d71b9f7b42ea158487c4ce53e7.png

最后到“数据更新”刷新首页、栏目、和内容页就可以完成网站的信息采集了。



Tags:帝国cms   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
帝国cms怎么采集信息
帝国cms怎么采集信息?帝国cms是我们用得比较多得PHP的建站系统,在建站过程中,如果自己没有信息源,只能靠手工不断的重复copy和粘贴,这样费时费力,于是我们就要使用帝国cms自带的采...【详细内容】
2023-05-19  Search: 帝国cms  点击:(434)  评论:(0)  加入收藏
帝国CMS的安装方法
给大家介绍一下帝国CMS的安装方法。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。相关推荐:《帝国cms教程》帝国CMS的安装方法1、将帝国cms源码上传至域名...【详细内容】
2023-05-19  Search: 帝国cms  点击:(283)  评论:(0)  加入收藏
帝国cms信息归档是什么意思
帝国cms信息归档是什么意思?帝国cms信息归档的意思就是指帝国cms支持信息归档,用于将过期的信息归档到其它数据表,以减轻主数据表的负担,使系统稳定性与效率更高。帝国cms简介:《...【详细内容】
2023-04-20  Search: 帝国cms  点击:(272)  评论:(0)  加入收藏
帝国cms设置伪静态的方法
相关推荐:《帝国cms教程》众所周知,动态页面不利于收录和排名。伪静态可以完美的解决这问题,配合百度云加速CDN,可以让动态页面有静态页面一样快的访问速度。今天开拓族给大家带...【详细内容】
2023-04-12  Search: 帝国cms  点击:(231)  评论:(0)  加入收藏
帝国CMS安装成功后登录后台就提示错误的解决办法
有时候帝国CMS虽然安装成功了,但是登录后台就出现下面的错误提示:“Parse error: parse error, unexpected ')' in …/functions.php on line…或者:zend...【详细内容】
2023-03-07  Search: 帝国cms  点击:(173)  评论:(0)  加入收藏
教你如何给帝国CMS系统添加登陆失败次数限制
如果您的浏览器没有自动跳转,请点击这里就是输入,密码,输入了很多次,错了。------------------解决办法-------------------修改e/class/config.php文件里这个'loginnum&#39...【详细内容】
2023-03-07  Search: 帝国cms  点击:(202)  评论:(0)  加入收藏
帝国cms全局站点标题调用标签
在制作帝国cms模板的时候为了有一个完整高效的帝国cms模板,我们往往会用到帝国cms全局站点标题吊阴功的标签,然而很多时候,我们队全局调用的标签还是比较陌生的,比如帝国网站名...【详细内容】
2023-03-07  Search: 帝国cms  点击:(167)  评论:(0)  加入收藏
帝国CMS无法远程保存没有后缀图片的解决方法
帝国cms编辑器“远程保存图片”功能默认是无法远程保存没有任何后缀的图片附件的,下面精准像素教大家如何修复这个小缺陷。1.修改文件:/e/class/functions.php查找:$zz1="/\<(i...【详细内容】
2023-01-29  Search: 帝国cms  点击:(260)  评论:(0)  加入收藏
帝国CMS点击量onclick的数值过万时,换成万为单位的方法
比如:点击量的数值过万时怎样变成 如: 10009变成1.09万找到显示点击量的地方换成如下代码,下面是内容模板使用的代码:<?=$navinfor[onclick]>=10000?($navinfor[onclick]/10000)...【详细内容】
2022-06-12  Search: 帝国cms  点击:(392)  评论:(0)  加入收藏
帝国CMS刷新内容页提示Table '***.表前缀_ecms_news_data_' doesn't exist错误的解决方法
问题:刷新所有信息内容页面时--提示"Table &#39;*.phome_ecms_article_data_&#39; doesn&#39;t exist",进行不下去了!解答:1、原因是数据本身有问题,信息索引表phome_ecms_表名_...【详细内容】
2022-06-12  Search: 帝国cms  点击:(473)  评论:(0)  加入收藏
▌简易百科推荐
帝国7.0伪静态Apache的Rewrite设置方法
帝国CMS7.0提供了伪静态的设置,本文就帝国7.0下伪静态Apache的Rewrite设置方法简述如下:代码如下:# 将 RewriteEngine 模式打开 RewriteEngine On #信息内容页:showinfo-&#091;!--cl...【详细内容】
2023-05-19      Tags:帝国   点击:(270)  评论:(0)  加入收藏
帝国cms怎么采集信息
帝国cms怎么采集信息?帝国cms是我们用得比较多得PHP的建站系统,在建站过程中,如果自己没有信息源,只能靠手工不断的重复copy和粘贴,这样费时费力,于是我们就要使用帝国cms自带的采...【详细内容】
2023-05-19      Tags:帝国cms   点击:(434)  评论:(0)  加入收藏
帝国CMS的安装方法
给大家介绍一下帝国CMS的安装方法。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。相关推荐:《帝国cms教程》帝国CMS的安装方法1、将帝国cms源码上传至域名...【详细内容】
2023-05-19      Tags:帝国CMS   点击:(283)  评论:(0)  加入收藏
帝国cms信息归档是什么意思
帝国cms信息归档是什么意思?帝国cms信息归档的意思就是指帝国cms支持信息归档,用于将过期的信息归档到其它数据表,以减轻主数据表的负担,使系统稳定性与效率更高。帝国cms简介:《...【详细内容】
2023-04-20      Tags:帝国cms   点击:(272)  评论:(0)  加入收藏
帝国cms设置伪静态的方法
相关推荐:《帝国cms教程》众所周知,动态页面不利于收录和排名。伪静态可以完美的解决这问题,配合百度云加速CDN,可以让动态页面有静态页面一样快的访问速度。今天开拓族给大家带...【详细内容】
2023-04-12      Tags:帝国cms   点击:(231)  评论:(0)  加入收藏
帝国CMS安装成功后登录后台就提示错误的解决办法
有时候帝国CMS虽然安装成功了,但是登录后台就出现下面的错误提示:“Parse error: parse error, unexpected &#39;)&#39; in &hellip;/functions.php on line&hellip;或者:zend...【详细内容】
2023-03-07    帝国CMS  Tags:帝国CMS   点击:(173)  评论:(0)  加入收藏
教你如何给帝国CMS系统添加登陆失败次数限制
如果您的浏览器没有自动跳转,请点击这里就是输入,密码,输入了很多次,错了。------------------解决办法-------------------修改e/class/config.php文件里这个&#39;loginnum&#39...【详细内容】
2023-03-07      Tags:帝国CMS   点击:(202)  评论:(0)  加入收藏
帝国cms全局站点标题调用标签
在制作帝国cms模板的时候为了有一个完整高效的帝国cms模板,我们往往会用到帝国cms全局站点标题吊阴功的标签,然而很多时候,我们队全局调用的标签还是比较陌生的,比如帝国网站名...【详细内容】
2023-03-07      Tags:帝国cms   点击:(167)  评论:(0)  加入收藏
帝国CMS无法远程保存没有后缀图片的解决方法
帝国cms编辑器“远程保存图片”功能默认是无法远程保存没有任何后缀的图片附件的,下面精准像素教大家如何修复这个小缺陷。1.修改文件:/e/class/functions.php查找:$zz1="/\<(i...【详细内容】
2023-01-29    余斗  Tags:帝国CMS   点击:(260)  评论:(0)  加入收藏
帝国CMS点击量onclick的数值过万时,换成万为单位的方法
比如:点击量的数值过万时怎样变成 如: 10009变成1.09万找到显示点击量的地方换成如下代码,下面是内容模板使用的代码:<?=$navinfor[onclick]>=10000?($navinfor[onclick]/10000)...【详细内容】
2022-06-12    帝国模板网  Tags:单位   点击:(392)  评论:(0)  加入收藏
站内最新
站内热门
站内头条