- 发布者:源码哥 时间:2022-05-03 10:34 阅读:330
- 扫一扫,手机访问
摘要:phome_enewsinfoclass 数据表字段解释(采集规则主表)字段名类型解释附加说明classidint(11)节点IDbclassidint(11)父节点IDclassnamevarchar(100)节点名称infourlmediumtext采集页面地址多个地址用回车隔开newsclassidsmallint(6)入库栏目IDstartdaydate开始时间enddaydate结束时间bztext备注numsmallint(
| phome_enewsinfoclass 数据表字段解释(采集规则主表) |
| classid | int(11) | 节点ID |
|
| bclassid | int(11) | 父节点ID |
|
| classname | varchar(100) | 节点名称 |
|
| infourl | mediumtext | 采集页面地址 | 多个地址用回车隔开 |
| newsclassid | smallint(6) | 入库栏目ID |
|
| startday | date | 开始时间 |
|
| endday | date | 结束时间 |
|
| bz | text | 备注 |
|
| num | smallint(6) | 采集记录数 |
|
| copyimg | tinyint(1) | 远程保存图片到本地 | 1为开启,0为关闭 |
| renum | smallint(6) | 每组信息采集个数 |
|
| keyboard | text | 包含采集关键字限制 |
|
| oldword | text | 内容替换原字符 |
|
| newword | text | 内容替换新字符 |
|
| titlelen | smallint(6) | 不采集标题相似超过字数 |
|
| retitlewriter | tinyint(1) | 不采集标题相同的信息 | 1为限制,0为不限制 |
| smalltextlen | smallint(6) | 截取内容简介字数 |
|
| zz_smallurl | text | 信息链接区域正则 |
|
| zz_newsurl | text | 信息页链接正则 |
|
| httpurl | varchar(255) | 内容页地址前缀 |
|
| repad | text | 过滤广告正则 |
|
| imgurl | varchar(255) | 图片/FLASH地址前缀 |
|
| relistnum | smallint(6) | 每组列表采集个数 |
|
| zz_titlepicl | text | 列表页标题图片正则 |
|
| z_titlepicl | varchar(255) | 列表页标题图片预定义值 |
|
| qz_titlepicl | varchar(255) | 列表页标题图片地址前缀 |
|
| save_titlepicl | varchar(10) | 列表页标题图片远程保存 |
|
| keynum | tinyint(4) | 关键字截取标题字数 |
|
| insertnum | smallint(6) | 每组入库数 |
|
| copyflash | tinyint(1) | 远程保存FLASH到本地 | 1为开启,0为关闭 |
| tid | smallint(6) | 数据表ID |
|
| tbname | varchar(60) | 数据表名 |
|
| pagetype | tinyint(1) | 分页形式 | 0为上下页导航式,1为全部列出式 |
| smallpagezz | text | 分页区域正则(上下页式) |
|
| pagezz | text | 分页链接正则(上下页式) |
|
| smallpageallzz | text | 分页区域正则(全部列出) |
|
| pageallzz | text | 分页链接正则(全部列出) |
|
| mark | tinyint(1) | 图片加水印 | 1为开启,0为关闭 |
| enpagecode | tinyint(1) | 页面编码转换 | 0为不转码 |
| recjtheurl | tinyint(1) | 是否重复采集同一链接 | 1为重复采集,0为不重复采集 |
| hiddenload | tinyint(1) | 是否隐藏已导入的信息 | 0为不显示,1为显示 |
| justloadin | tinyint(1) | 采集后是否自动入库 | 1为开启,0为关闭 |
| justloadcheck | tinyint(1) | 自动入库是否直接审核 | 1为审核通过,0为需审核 |
| delloadinfo | tinyint(1) | 入库后是否删除已导入的记录 | 1为开启,0为关闭 |
| pagerepad | mediumtext | 整体页面过滤正则 |
|
| newsztid | text | 入库专题ID | 多个专题ID用“|”隔开,例如:|1|5| |
| getfirstpic | tinyint(4) | 提取第几张图片为标题图片 |
|
| oldpagerep | text | 整体页面替换原字符 |
|
| newpagerep | text | 整体页面替换新字符 |
|
| keeptime | smallint(6) | 每组采集时间间隔 |
|
| lasttime | int(11) | 最后采集时间 | unix时间戳 |
| newstextisnull | tinyint(1) | 内容为空不采集 | 1为开启,0为关闭 |
| getfirstspic | tinyint(1) | 提取标题图片生成缩略图 | 1为开启,0为关闭 |
| getfirstspicw | smallint(6) | 提取标题图片生成缩略图宽度 |
|
| getfirstspich | smallint(6) | 提取标题图片生成缩略图高度 |
|
| doaddtextpage | tinyint(1) | 入库是否保留原分页 | 0为保留分页,1为不保留分页 |
| infourlispage | tinyint(1) | 采集页面为直接内容页 | 1为是,0为否 |
相关连接:
网站源码
企业网站源码