阅读使人成长---豪仕阅读网

火车头采集发布后 空格号变成了问号解决办法

作者 : 2020-01-09 08:40:25 审稿人 : admin 围观 : 评论
我采集的文章是来着utf-8的,发布的站点是gbk的phpcms,不知道是不是这个原因,导致发布时空格变问号呢?请问有什么解决办法呢?mRe豪仕阅读网
mRe豪仕阅读网
把空格替换一下。就是空格重新替换成新输入的空格试试。

1.在发布配置那里,无法刷新列表,总提示“格式不符”?mRe豪仕阅读网

mRe豪仕阅读网

答:这个有很多原因,请依次确认下,一是否登陆成功,请开启查看返回代码功能,比如说您刷新列表的页面只有登陆后才可以访问的话您必须先登陆网站才可以,看一下是不是登陆的cookie正确否;二可能您选错了模块,不同的版本或是网站系统的模块,一般是不通用的,请使用对应版本的模块;三可能是您的网站和默认模块刷新列表的页面里有不同的地方,比如模块是用默认风格做的,您又换了另一个风格,请参照模开发相关手册部分进行修改,或者使用‘使用自定义分类参数’;四,您在选区项设置里选择了使用蜘蛛做模拟浏览功能,请改成本地浏览器浏览。mRe豪仕阅读网
2.发内容–WEB发布错误,返回代码请查看,采集的内容重复发布,显示发布成功未知mRe豪仕阅读网

答:出现类似这个错误:发内容–WEB发布错误,返回代码请查看:File:///E:\Documents and Settings\Administrator\桌面\2008标准版\Data\1-admin5-seo\WebError.log。请一定要记得打开这个log文件。看里边返回什么代码。mRe豪仕阅读网

如果返回代码为空,那可能就是发布的太快,您的服务器反应不过来,没有返回任何字符。这时可能是发布成功了,也可能是发布失败了。具体请上网站查看。如何处理呢?请修改发布速度(问题3)。不要太短,主要以能发布成功为准。mRe豪仕阅读网

如果返回代码不为空,且显示的意思是已经成功,这时请看下网站上是否成功:如果成功,那么说明 模块里的成功返回值和您的系统返回的不一样,这样的话请修改模块里的成功标志为您的系统的成功返回值,如果显示成功但实际上不成功,可能是您提交的数据格式有误,而您的程序没有报错,但在入数据库时失败,导致发布失败,这时就需要您仔细查看发布的代码是否有问题。;如果返回代码显示不成功,那请注意是什么问题,比如标题太长,没有关键字,或是其它问题。这时请注意修改您的规则的对应部分。mRe豪仕阅读网
采集的内容重复发布,一个可能是您选择了多种发布方式,请在“编辑任务”里”文件保存及高级设置里”设置“成功发布到哪儿定义为成功”。另一 据个原因是上次成功发布了,但是当时显示的是未知。如果您不再需要发布,可以在数据库里将所有记录更改成已发。mRe豪仕阅读网

3.Discuz中出现” 您的请求来路不正确或验证字串不符,无法提交”:mRe豪仕阅读网

答:这个是discuz在发布时会发一个formhash,这个值是在发布页面获取到的。出现此情况是获取到的formhash不正确引起的。请使用火车头内置浏览器登录并查看源码,查找”formhash=”,然后修改在线发布模块,将其值替换掉原发布模块里面的[登录随机值1](当然有可能是登录随机值X,与模块作者使用的有关)或是您自己修改模块使程序可以正确获取到formhash.mRe豪仕阅读网

4.发布到网站上,发现所有内容挤在一块,查看源代码,发现空格丢失了?mRe豪仕阅读网

答:有两种可能:一是您做规则时过滤空格所致:另一个是您的系统会过滤,这时,请在“内容发布设置”里选中“数据发布时进行UrlEncode处理”。风讯就属于些类。mRe豪仕阅读网

5.图片发布时总是相对地址,不是远程地址?mRe豪仕阅读网

答:请在标签编辑里选中“将相对地址补全为绝对地址”。默认您选了下载图片后,就不需要选中这个选项了。mRe豪仕阅读网

6.发表测试成功,但就是实际发布时显示成功却没文章?mRe豪仕阅读网

答:也有多种可能,一是您的模块成功标识码不唯一,也就是发布成功失败都是一样的标识代码;另一种是实际发布成功了,但模块默认的是未审核的,所以您得先到网站审核的地址去审核;三也有可能是因为火车连续不断的post数据,被您的防火墙或是您服务器的防火墙给拦截了,请关了防火墙试下。还有一种是登陆信息失效了,比如您的网站一段时间不操作会自动退出,而您在实际发布前有相当一些时间了。所以原来获得的登陆信息就失效了。mRe豪仕阅读网

7.发布到我论坛上,显示的是代码?mRe豪仕阅读网

答:请在发布配置里边选择UBB发表。一般discuz,phpwind等论坛,都要选上ubb发表。如果您想用html方式发帖,请在后台对相关发帖人开启发html帖权限。mRe豪仕阅读网

8.怎样继续上一次未完成的发布?mRe豪仕阅读网

答:在任务栏里只勾选“发内容”这个复选框就可以了,程序会将采集来的但没有发布的数据发布出去。mRe豪仕阅读网

9.文章发布出去后,发现有[标签:作者]和[标签:来源]之类的东东,怎么回事?mRe豪仕阅读网

答:这是模块里的标签没有被替换,您在做任务规则时没有做相应的标签,所以发布上去是这样,您可以修改模块里相应的文字为固定值或删除[标签:来源]这类您不需要的标签。比如说source=[标签:来源],改成固定值如source=火车采集器,删除是直接将source=[标签:来源]删掉。mRe豪仕阅读网

10.未找到任何可发布的内容.mRe豪仕阅读网

答:这个是程序在本地数据库里找不到未标记为未发的记录。这种情况是您将所有数据已发布过了,或是您在任务栏目里没有选 发内容。mRe豪仕阅读网

11.测试时或发布时出现 “出现同一帐号同时只能一个在线,或是您的帐号已被禁用”mRe豪仕阅读网

答:这个是网站系统不允许一个帐号同时在多个在线,比如帝国系统。这个情况下建议您使用专门的一个帐号用来采集发布。不要用它来登陆网站。mRe豪仕阅读网

12.有些时候,明明已经正确获取web cookie,但是测试的时候仍然是没有登录呢?mRe豪仕阅读网

答:这个一个是cookie 过期的问题,另一个可能是我们程序获取的不正确(很抱歉,程序目前还无法正确获取所有的cookie)。这种情况下,建议您使用专业的抓包软件,如WSockExpert.用来抓取cookie,然后将抓取到的cookie填写到程序保存cookie的地方。mRe豪仕阅读网

13.如何设置发表的速度?mRe豪仕阅读网

答:请在“编辑任务”里”文件保存及高级设置里”设置采集及发布速度,时间单位是毫秒。mRe豪仕阅读网

14.采集地址重复.mRe豪仕阅读网

答:程序会保存采集页的地址,默认是采过的是不再再去采集。如果你是需要重新采的话可以将原来的任务地址库和本地已采数据全部删掉。如果您要采的网页里内容是不断变化的,你可以选不检测重复的选项 mRe豪仕阅读网

15.论坛怎么能更换用户发帖,一个用户发太假了?mRe豪仕阅读网

  答:如果你使用web在线发布的方式,那么程序发帖就相当于你手工发,你不能同时登陆多个帐号,所以程序也不能。要实现多个帐号发布,你需要修改原来的论坛程序,使他可以使用多个用户名发布。discuz随机发布接口就是修改后的程序,用不同用户来向自己论坛发帖的。mRe豪仕阅读网

16.测试网址采集正常,但真正采集的时候漏掉许多 。mRe豪仕阅读网

  答:程序默认是会过滤掉重复网址的。在同一个站点下如果一个网址已采过,就不会再去采集。mRe豪仕阅读网

17.采集的数据入库后,显示出很多问号 ?mRe豪仕阅读网

  答:这个一般是你入库时没有选对编码所引起的,请注意选择编码;mRe豪仕阅读网

相关文章

  • 中学生必读名家:一百个问号之后
    中学生必读名家:一百个问号之后

    中学生必读名家:一百个问号之后内容介绍:《中学生必读名家:一百个问号之后》编辑推荐:叶永烈被选入各种版本的中小学语文课本的作品达35篇之多。《中学生必读名家:一百个问号之...

    2020-02-09 08:08:53
  • 黑人问号球星求婚 表情包本尊尼克杨女友及资料起底
    黑人问号球星求婚 表情包本尊尼克杨女友及资料起底

    说起黑人问号的表情包,很多网友应该都看过吧,甚至还用过他来发过表情包吧!其实,黑人问号本尊是球星尼克杨,近日他向女友求婚成功,上了热搜,大家认出来是他了吗?下面,有关于黑人问号球星尼克杨女友及资料起底,一起去看看吧!...

    2019-12-27 15:51:37
  • 张韶涵发问号疑回应 范玮琪张韶涵恩怨起因是什么
    张韶涵发问号疑回应 范玮琪张韶涵恩怨起因是什么

    近日,范玮琪回复网友的“未伤害”言论再次引发热议,9月16日,张韶涵微博发问号疑回应范玮琪,张韶涵范玮琪不由来已久,两人多次捆绑上热搜,而从种种迹象表明,张韶涵范玮琪两人的关系闹...

    2019-09-16 17:33:25
  • 张韶涵发问号 这到底是个什么梗?
    张韶涵发问号 这到底是个什么梗?

    张韶涵发问号近日,张韶涵发问号登上热搜,9月16日,张韶涵发了一条仅有 ? 的微博,并配了一张自己的照片,照片中也满是问号,疑似回应近期范玮琪对于两人关系的评论。据悉,近期范玮琪因曝出梁静茹离婚消息而引起争议,她在回复网友恶评时讲道希望能放下对她的偏见,还有网友提到她伤害张韶涵的事情,范玮琪回应称: 我到底做了什么伤害她的事?你们自己幻想出来的吗?我从来没有伤害过任何人。 范玮琪和张韶涵当年是好姐妹,虽然两人一度关系很亲密,不过到了危难时,也就散了。也正为此,范玮琪也就变成了很多人心目中的 坏人 。最近,...

    2019-09-16 16:01:42
  • 火车头采集器上传采集图片附件时FTP/SFTP文件上传设置
    火车头采集器上传采集图片附件时FTP/SFTP文件上传设置

    我们在使用网页图片采集器的过程中,有时还需要将采集到的图片文件上传,以火车采集器V9为例,为大家讲解FTP/SFTP文件上传功能。在火车采集器V9中,此项功能包含不上传,使用FTP上传,...

    2018-08-18 11:57:30
  • 当问号变成人
    当问号变成人

    晋江金榜VIP2017.03.11完结  当前被收藏数:18819 文章积分:223,061,760  文案  通过古书《千问》,一丝代表求知欲和分享精神的灵识产生了,在它强大到能获取所有通过各种媒...

    2017-03-16 00:00:00
留言与评论(共有 0 条评论)
   
验证码: