- 发布者:源码哥 时间:2022-05-03 10:34 阅读:215
- 扫一扫,手机访问
摘要:phome_enewsinfoclass 数据表字段解释(采集规则主表)字段名类型解释附加说明classidint(11)节点IDbclassidint(11)父节点IDclassnamevarchar(100)节点名称infourlmediumtext采集页面地址多个地址用回车隔开newsclassidsmallint(6)入库栏目IDstartdaydate开始时间enddaydate结束时间bztext备注numsmallint(
phome_enewsinfoclass 数据表字段解释(采集规则主表) |
classid | int(11) | 节点ID |
|
bclassid | int(11) | 父节点ID |
|
classname | varchar(100) | 节点名称 |
|
infourl | mediumtext | 采集页面地址 | 多个地址用回车隔开 |
newsclassid | smallint(6) | 入库栏目ID |
|
startday | date | 开始时间 |
|
endday | date | 结束时间 |
|
bz | text | 备注 |
|
num | smallint(6) | 采集记录数 |
|
copyimg | tinyint(1) | 远程保存图片到本地 | 1为开启,0为关闭 |
renum | smallint(6) | 每组信息采集个数 |
|
keyboard | text | 包含采集关键字限制 |
|
oldword | text | 内容替换原字符 |
|
newword | text | 内容替换新字符 |
|
titlelen | smallint(6) | 不采集标题相似超过字数 |
|
retitlewriter | tinyint(1) | 不采集标题相同的信息 | 1为限制,0为不限制 |
smalltextlen | smallint(6) | 截取内容简介字数 |
|
zz_smallurl | text | 信息链接区域正则 |
|
zz_newsurl | text | 信息页链接正则 |
|
httpurl | varchar(255) | 内容页地址前缀 |
|
repad | text | 过滤广告正则 |
|
imgurl | varchar(255) | 图片/FLASH地址前缀 |
|
relistnum | smallint(6) | 每组列表采集个数 |
|
zz_titlepicl | text | 列表页标题图片正则 |
|
z_titlepicl | varchar(255) | 列表页标题图片预定义值 |
|
qz_titlepicl | varchar(255) | 列表页标题图片地址前缀 |
|
save_titlepicl | varchar(10) | 列表页标题图片远程保存 |
|
keynum | tinyint(4) | 关键字截取标题字数 |
|
insertnum | smallint(6) | 每组入库数 |
|
copyflash | tinyint(1) | 远程保存FLASH到本地 | 1为开启,0为关闭 |
tid | smallint(6) | 数据表ID |
|
tbname | varchar(60) | 数据表名 |
|
pagetype | tinyint(1) | 分页形式 | 0为上下页导航式,1为全部列出式 |
smallpagezz | text | 分页区域正则(上下页式) |
|
pagezz | text | 分页链接正则(上下页式) |
|
smallpageallzz | text | 分页区域正则(全部列出) |
|
pageallzz | text | 分页链接正则(全部列出) |
|
mark | tinyint(1) | 图片加水印 | 1为开启,0为关闭 |
enpagecode | tinyint(1) | 页面编码转换 | 0为不转码 |
recjtheurl | tinyint(1) | 是否重复采集同一链接 | 1为重复采集,0为不重复采集 |
hiddenload | tinyint(1) | 是否隐藏已导入的信息 | 0为不显示,1为显示 |
justloadin | tinyint(1) | 采集后是否自动入库 | 1为开启,0为关闭 |
justloadcheck | tinyint(1) | 自动入库是否直接审核 | 1为审核通过,0为需审核 |
delloadinfo | tinyint(1) | 入库后是否删除已导入的记录 | 1为开启,0为关闭 |
pagerepad | mediumtext | 整体页面过滤正则 |
|
newsztid | text | 入库专题ID | 多个专题ID用“|”隔开,例如:|1|5| |
getfirstpic | tinyint(4) | 提取第几张图片为标题图片 |
|
oldpagerep | text | 整体页面替换原字符 |
|
newpagerep | text | 整体页面替换新字符 |
|
keeptime | smallint(6) | 每组采集时间间隔 |
|
lasttime | int(11) | 最后采集时间 | unix时间戳 |
newstextisnull | tinyint(1) | 内容为空不采集 | 1为开启,0为关闭 |
getfirstspic | tinyint(1) | 提取标题图片生成缩略图 | 1为开启,0为关闭 |
getfirstspicw | smallint(6) | 提取标题图片生成缩略图宽度 |
|
getfirstspich | smallint(6) | 提取标题图片生成缩略图高度 |
|
doaddtextpage | tinyint(1) | 入库是否保留原分页 | 0为保留分页,1为不保留分页 |
infourlispage | tinyint(1) | 采集页面为直接内容页 | 1为是,0为否 |
相关连接:
网站源码
企业网站源码