所有分类
  • 所有分类
  • 站长推荐
  • WP主题
  • WP插件
  • WP模板库
  • 前端模板
  • 延伸阅读

WP Content Crawler v1.14.0 自动爬取采集任意网站的任意内容

详细介绍 !必读!
WP Content Crawler v1.14.0 自动爬取采集任意网站的任意内容插图-WordPress资源海

WP Content Crawler v1.14.0 最新中文汉化版插件下载 持续免费更新

功能十分强大的 WordPress 专业版内容采集插件,支持多种翻译接口,支持自动翻译,支持OpenAI GPT (ChatGPT)!

注意:采集类插件有一定技术门槛,需要懂CSS选择器基础知识,需要自己设置采集方案,因此不建议新手小白购买哦!

另外:该插件无法检索使用 JavaScript 创建的内容。有关详细信息,请参阅我可以从 X 站点获取内容吗?

汉化效果截图

WP Content Crawler v1.14.0 自动爬取采集任意网站的任意内容插图1-WordPress资源海

该插件无法使用常规方式进行汉化,本站已解决此问题,汉化率100%,强迫症手动精校正,一次购买,永久免费更新。

WP Content Crawler v1.14.0 自动爬取采集任意网站的任意内容插图2-WordPress资源海

插件用途

  • 创建一个个人网站,从您喜爱的网站收集新闻、帖子等,以便在一个地方查看它们
  • 将其与 WooCommerce 结合使用从购物网站收集产品
  • 从联属计划收集产品来赚钱
  • 收集帖子为您的插件/主题创建测试环境
  • 从其他网站收集插件、主题、应用程序、图像以创建它们的集合
  • 跟踪竞争对手
  • 你可以想象任何事情。互联网充满了内容:)
WP Content Crawler v1.14.0 自动爬取采集任意网站的任意内容插图4-WordPress资源海

主要特点

保存每个帖子的详细信息
标题、摘录、内容、标签、类别、slug、日期、自定义元、分类法、元关键字、元描述、特色图像、帖子图像、状态……一切。
视觉检查器
只需单击一个元素即可找到其 CSS 选择器。您还可以获得您可能感兴趣的替代 CSS 选择器。无需再离开管理面板。
抓取(抓取、抓取、保存)帖子
配置设置后,插件会查找帖子的 URL 并在后台自动抓取它们。

重新抓取(更新)帖子
自动重新抓取帖子以使其始终保持更新。您可以限制帖子的更新次数、设置更新间隔并忽略旧帖子。
删除帖子
您想删除旧的已爬网帖子吗?该插件可以自动删除它们。




控制计划
您可以设置每次为站点运行 URL 收集和帖子爬网事件的次数。例如,您可以每分钟保存 3 个帖子,或每 2 分钟运行 URL 收集 5 次。

保存类别
您的网站中不存在目标类别?没问题。该插件可以为您创建目标类别。只需定义查找类别名称的 CSS 选择器即可。它们甚至可以创建为子类别。
保存链接(永久链接)
您可以定义帖子的永久链接。您可以从目标站点获取永久链接,输入自定义文本,甚至使用短代码为 slugs 创建模板。
保存分类
通过从目标站点检索或手动输入来保存分类值。保存自定义帖子类型的详细信息比以往更容易。



将帖子保存到自定义类别
自定义帖子类型是否具有自定义类别?没问题。您可以定义自定义帖子类型使用的自定义类别分类法,并在定义帖子类别时选择这些类别。该插件还可以为您创建自定义类别。
自定义帖子元
将任何内容保存为自定义帖子元。您可以使用 CSS 选择器或仅键入值。


内容模板
使用短代码准备帖子内容、标题、摘录、列表项和图库项模板。此外,您可以使用选项框为每个 CSS 选择器的值定义模板。
替代选择器
即使目标站点的帖子页面设计彼此不同,您也可以编写替代选择器来获取数据。




查找和替换任何内容
您可以使用纯文本或正则表达式来查找和替换任何内容。您甚至可以修改页面的 HTML、创建自己的 HTML 元素并编写选择器来使用它们。您甚至可以更改图像 URL。你有权力。
分页帖子
目标帖子有多于一页?不用担心。您也可以保存分页帖子。

列表类型帖子
有些网站创建的帖子中包含列表。您可以从帖子中提取列表,创建应应用于每个列表项的模板,甚至反转列表。

删除不必要的元素
有时您需要删除一些元素,例如广告、评论等等。只需编写其 CSS 选择器即可将其删除。

自动插入类别 URL
目标站点有数百个类别?小菜一碟。只需编写 CSS 选择器,插件就会为您插入它们。

帖子类型
设置帖子类型。它可以是帖子、页面、产品或 WordPress 安装中可用的任何其他帖子类型。

删除链接
您可以从帖子中删除链接。只需选中复选框,链接就会消失。就这么简单。
密码保护
您可以为帖子设置密码,仅向拥有密码的用户显示。
注释
您可以为自己添加注释,以提醒您有关该网站的信息。CSS 选择器、TODO 列表等等。


动态测试所有内容动态
测试帖子爬行、URL 收集、CSS 选择器、正则表达式、查找和替换选项以及代理。您还可以启用缓存以更快地执行测试并减少发送到目标站点的请求。
一次测试站点的所有设置
使用测试器,您可以测试在站点设置中配置的所有选项,以确保在启用自动爬网之前一切都按您想要的方式工作。
工具
使用这些工具,您可以手动保存帖子及其 URL、使用其 ID 重新抓取帖子或删除已保存的 URL。
每个站点的自定义常规设置
您可以为每个帖子提供自定义常规设置以覆盖它们并使它们适合站点。
帖子状态
您可以直接发布已保存的帖子或将其保留为草稿以便在发布前进行检查。
保存帖子内容中的所有图像
保存帖子内容中的所有图像就像选中单个复选框一样简单。



将图像另存为图库
您可以将目标页面中的图像另存为图库,并为每个图像提供一个模板,以使其适合您在前端使用的图库库。您还可以通过选中一个复选框将图像保存为 WooCommerce 图库。
任何数据作为短代码
从目标页面获取任何内容作为短代码,并使用插件模板中的短代码将任何数据放置在您想要的任何位置。
代理
使用一个或多个代理从您的 IP 无法访问的站点获取内容。

Cookie
将 cookie(例如会话 cookie)附加到每个请求。例如,通过这种方式,您可以像登录一样抓取目标站点。
抓取任意数量的帖子
您可以设置帖子抓取或 URL 收集 CRON 事件应运行的次数。通过这种方式,您可以每分钟保存 100 个帖子。请小心并考虑服务器的容量。
电子邮件通知
设置 CSS 选择器,其值对于类别和帖子页面不应为空。当使用这些选择器发现空值时,您可以收到电子邮件通知。
从 JSON 获取数据
当您为 CSS 选择器启用 JSON 解析时,您可以轻松地从 JSON 获取值。


高级 HTML 操作
在响应 HTML 中查找替换、在元素属性中查找和替换、交换元素属性、删除元素属性、操作元素的 HTML、删除 HTML 元素…


自动翻译
使用 DeepL Translate API、Google Cloud Translation API、Microsoft Translator Text API、Yandex Translate API 或 Amazon Translate API 的人工智能自动翻译帖子。请注意,这些都是付费服务。他们通常在有限的时间内免费提供该服务。您可以查看他们的定价页面以了解更多信息。
自动旋转
使用旋转自动重写已爬网帖子的内容,以改进搜索引擎优化。该插件目前实现了 Spin Rewriter API 和 Turkce Spin API,这些都是付费服务。您可以访问他们的网站以了解定价详细信息。


重复帖子检查
按 URL、帖子标题和/或帖子内容检查重复帖子。如果您使用的是 WooCommerce,其 SKU 已存在的产品将被视为重复,并且不会添加到您的网站。
预定帖子
您可以在发布日期中添加/删除分钟数。通过这种方式,您可以安排帖子发布。

保存 WooCommerce 产品
保存价格、库存、运输、属性和高级选项。您可以将产品另存为简单产品或外部产品。您还可以设置可下载文件选项并将产品定义为虚拟产品。这些选项适用于大于或等于 3.3 的 WooCommerce 版本。
选项框
您拥有控制权!为 CSS 选择器找到的值定义许多选项。这些选项包括查找替换、计算、模板和 JSON 解析设置。您还可以轻松导入/导出选项框中定义的选项。
像专业人士一样处理文件
轻松重命名、复制和移动已保存的文件。您还可以使用可在其中使用任何短代码的模板来定义已保存媒体文件的标题、说明、标题和替代文本。还可以为保存的文件指定随机名称。

像专业版一样处理 iframe 和脚本
WordPress 不允许显示 iframe 和脚本,因为它们会带来安全风险。您只需选中复选框即可将 iframe 和脚本 HTML 元素转换为短代码。短代码将显示来自您定义的允许源域的 iframe 和脚本。
快速保存
使用快速保存按钮,您可以更快地保存设置。无需等待页面重新加载。

正则表达式
在查找-替换选项中定义正则表达式以查找-替换任何内容。您还可以使用分隔符和修饰符来更精确地匹配。

保存“srcset”属性
当保存的图像的替代尺寸可用时,插件会将它们分配到 img 元素的 srcset 属性中,以便您的页面在不同的屏幕尺寸下加载速度更快。


保存“alt”和“title”属性
保存图像时,会自动从目标站点检索其“alt”和“title”属性并将其分配给保存的媒体。您还可以为他们定义模板来应用您的 SEO 策略。
警告
出现问题时了解。该插件将向您显示错误的详细信息,以便您可以立即修复它。


处理字符编码问题
该插件能够处理不同的字符编码,即使目标站点包含混合编码。您可以通过选中单个复选框来转换编码。
轻松在设置之间导航
将导航固定到顶部!该插件会存储您在切换到新选项卡之前所在的位置,并在您再次激活该选项卡时恢复您之前的位置。不再迷失在各种设置中。

手动抓取工具
使用手动抓取工具,通过输入 URL 来保存多个帖子。您还可以输入类别 URL,以便该工具可以从那里获取帖子 URL。此外,您可以将其设置为同时抓取多个帖子。




将 URL 添加到数据库
该插件会自动收集 URL。但是,如果您希望它只抓取某些 URL,您可以使用手动抓取工具将它们手动添加到数据库中。通过这种方式,将使用您的计划选项自动抓取指定的 URL。
启用/禁用特定站点的自动爬网
您可以单独启用或禁用每个站点的自动爬网。

导入/导出
您可以轻松导入和导出站点设置。只需复制并粘贴插件创建的代码即可。
无限
将无限的站点添加到插件并激活您想要的数量。


详细的仪表板
查看后台发生的情况。活跃站点、爬行的帖子数量、更新的帖子数量、上次爬行和更新的帖子、上次添加的 URL、上次和下次运行的 CRON 事件、当前保存的帖子和 URL…
从管理面板获取更新
每当更新准备就绪时,您只需单击一下即可更新插件。只需转到管理面板中的更新页面即可。
使用最安全的PHP
该插件支持最新版本的PHP。
使用最现代的浏览器
该插件支持 Chrome、Firefox、Safari、Opera 和 Edge。
交互式指南
交互式指南向您展示如何逐步配置设置以实现某些目标,就像实时文档一样。您可以随时启动这些指南。您甚至可以从特定步骤开始。
在线文档
您可以随时查看在线文档。

设置旁边的快速指南
插件中的每个设置都有一个快速指南,可帮助您了解每个设置的用途。
视频教程
观看视频教程以轻松学习如何使用该插件。
准备翻译
您可以使用 Poedit 将插件翻译成您自己的语言。



过滤器
使用过滤器,您可以有条件地执行操作。例如,如果产品的属性值之一包含特定单词,您可以提高产品的价格。过滤器包含许多操作命令。请参阅 文档中的 命令。
使用 OpenAI GPT (ChatGPT)
您可以使用 OpenAI GPT 模型更改标题、内容、标签、文件名等。您可以使用 GPT-3.5 和 GPT-4。通过高级短代码生成器,您可以使用聊天、完成、编辑和插入模式。要了解更多信息,请观看此视频
要求PHP >= 7.3、json、mbstring、curl、dom、fileinfo、WP-Cron。这些已经在大多数主机中可用。即使扩展尚未激活,大多数托管站点也允许您从其控制面板启用这些扩展。请参阅文档以获取更多信息。
语言英语、土耳其

站长时间有限,不想把过多的时间一直花在解答重复且极其简单的问题上,所以把用户经常问的问题集中汇总在了这里,希望你在遇到问题之后和咨询问题之前都能先仔细阅读下面的内容,感谢理解!尤其是WP使用经验不多的新手以及小白用户,求你们务必务必仔细反复多阅读几遍,再次感谢!

!必读前言!必读!

  1. 如果资源不是最新版本,请在资源下方评论区进行催更,我们会尽快更新并通过邮箱通知你。
  2. 在线咨询时勿问在否,请直接描述你的问题,高效沟通,不说问题或问题描述不清楚的一律不予回复哦!
  3. 主题安装失败提示缺少主题缺少style.css样式表?插件安装失败提示没有找到有效的插件?点我查看原因
  4. 支付成功后未到账?付款后系统会与支付服务方进行交互读取数据,偶尔会出现到账延迟的情况,一般不会超过10分钟。如果超过30分钟后订单或充值还是未到账,此时可以联系我们为你手动补单。另外USDT不会自动到账,付款后需要联系我们手动确认。
  5. ⚠️WP主题下载和安装注意:如果是初次安装且需要导入demo的用户,请按顺序优先选择带有”已测试”、“破解版”、“激活版”、”n”、“null”、“nulled”等字样或后缀的历史版本,导入demo完成以后再更新至最新版,否则可能会出现demo导入失败的情况。
  6. 本站会及时对资源进行更新,但是最新版有可能暂未破解或没破解成功,这时请先尝试使用历史版本带n、null、nulled后缀的均为破解版,可以优先选择)。
  7. 有的资源不需要输入激活码也可以正常使用所有功能,有的可以尝试随便输入一串字符保存后即可激活
  8. 关于破解和license激活:并不是所有资源都有授权限制(指不激活就没法用,大多数资源是没有此限制的,里面的激活只是起一个后台在线更新的作用,所以此类资源无需激活也无需破解,至于后台那些激活提示请直接关闭或忽略即可,不影响正常使用特别提醒:插件或主题安装后直接看能不能正常使用,设置项是否可以正常保存,如果这些都没问题,那么此时其他的各种提醒诸如让你输入激活码之类的这些都可以直接忽略,我们装它的目的就是拿来用,能用就行,为什么非得关注那个激活的地方呢?)。
  9. 部分文章内有“购买后可见”的教程或提示内容,请务必仔细阅读!

!售后服务说明!

  1. 本站只处理由于产品本身质量问题而导致无法使用的售后服务,其他问题需要自行查阅产品文档或者自行百度/google搜索解决如果需要完美售后服务(指解答各种小白问题和产品使用问题),请直接去购买正版,感谢理解!
  2. 本站资源(如无特殊说明)都是免费包后续更新的,有任何质量问题请联系我们,我们会尽力解决,解决不了全额退款。
  3. 评论区不处理不审核任何售后类问题!如果需要售后服务,请前往用户中心提交工单反馈你的问题,感谢理解!
  4. 如何更加高效的进行售后咨询?请在登录后提交工单反馈你的问题,提供遇到问题的前因后果信息、问题截图、网站环境信息(nginx/apache/openlitespeed/php/mysql版本)、WordPress版本号、主题/插件的版本号,总之你要尽可能详细的提供信息给到我们,以便我们更好的理解,更快的帮到你。如果只简单粗暴的发一句“我遇到了xxx问题”,或者只发个截图没有任何标注和说明,我们都是无法帮到你的,因为我们无法通过一句话或一个图片就判断出你的问题出来哪里,所以你提供的信息需要尽可能让我们容易理解且尽可能的详细。
  5. 如果需要非售后范围内的人工帮助,比如自己技术有限,有些问题不知道如何解决,这时也可以联系我们提供付费服务,服务价格与服务流程请查看此文章–>付费增值服务-WP问题调试/建站/方案定制

常见问题汇总

汉化服务与汉化文件

标有“汉化服务”、“汉化文件”字样的下载项里只提供汉化服务或汉化文件,如需下载插件和主题,需要单独购买。

  1. 汉化服务:资源暂未汉化,先下单后提供汉化服务,1小时左右完成。
  2. 汉化文件:资源已经汉化完毕,购买后即可下载到汉化文件。

关于汉化质量:本人有中度强迫症,不做傻瓜式无脑机翻,机翻质量太差很多地方不准确,不仅没有帮助反而会起反作用,因此本站只做人工精校正的高质量汉化服务(强迫症式汉化),一次购买,免费包后续更新。

关于更新频率:理论上每当有人购买一次后就会对汉化包更新完善一次,买的人越多更新频率越快,细节越完善,反之亦然。

网盘区别说明

下载地址由上至下,建议优先选择靠前的网盘进行下载。

  • 百度网盘:首选推荐,全资源覆盖,有子文件夹 目录清晰,仅保留资源的最近4个版本,较早版本会被删除,非百度VIP下载会有限速。
  • 海外专用:专门给非中国大陆用户提供的下载地址(有科学上网工具的国内用户也可以用),部分热门资源覆盖,有子文件夹 目录清晰,仅保留资源的最近几个版本,较早版本会被删除,下载无限速。
  • 蓝奏云盘:备选,大部分资源覆盖(仅能上传100M以内的资源,所以小部分体积太大的资源无法上传),无子文件夹 目录不清晰,会保留上传资源的所有历史版本 不会删除,下载不限速。
  • 海外最新:不推荐,仅有资源的一个最新版本,适合无法访问百度网盘的海外用户。
  • 海外备用:不推荐,仅有资源的一个历史旧版本,适合无法访问百度网盘的海外用户。

网盘很多文件 下载哪个?压缩包内很多文件 上传哪个?

我们一般会保留最新的几个版本

您只需要根据版本号和上传时间下载其中最新的一个版本即可,不需要全部下载下来(主题类资源第一次安装且需要导入demo的,建议优先选择带有”已测试”、“破解版”、“激活版”、”n”、“null”、“nulled”等字样或后缀的版本)。

如果有汉化文件会在文章介绍里注明,文章里没说的就是没有汉化包。

压缩包内很多文件 上传哪一个?

一般压缩包内会有主文件、文档、设计素材、授权说明等等,我们需要用到的文件一般是以商品名字命名的压缩包,只要找到这个包即可。(如:主题名字为avada,那么主题包一般为 avada.zip 我们只需要在后台上传安装这个文件即可,至于其他文件可以暂时忽略,基本用不到)

另外如有“Doucumention”字样的文件或文件夹,这是作者提供的使用文档,里面有各种安装和使用教程,可以打开进行阅读,现在很多浏览器(如你没有则推荐Edge)都有网页在线翻译功能了,所以不必担心看不懂英语的问题!

如果WP主题,里面可能还会有个 ***-child.zip 文件(如:avada-child.zip),这是子主题,是给开发人员修改主题用的,你如果不懂技术,直接忽略这个文件即可,不用上传安装这个子主题。

下载好的主题/插件 怎么安装到wordpress

https://wpzyh.com/anzhuang.html

【主题或插件安装失败】提示无效插件 主题缺少style.css样式表

WP Content Crawler v1.14.0 自动爬取采集任意网站的任意内容插图-WordPress资源海

在wordpress.org官方下载的是标准的安装包,可以直接在WP后台上传安装,但是从本站下载的很多包,不是标准安装包,里面还有其他文件,经历了二次压缩,如下图所示,所以对于这类资源,下载后需要先本地解压,然后找到真正的主题包或插件安装包(一般为主题或插件名字.zip)以后再去上传安装。

***-child.zip 文件(如下图中的:Avada-Child-Theme.zip),这是子主题,是给开发人员修改主题用的,你如果不懂技术,直接忽略这个文件即可,不用上传安装这个子主题。

WP Content Crawler v1.14.0 自动爬取采集任意网站的任意内容插图1-WordPress资源海

其他常见问题与技巧(选择性阅读即可)

资源下载
插件下载
下载价格390 金币
包年VIP免费
汉化文件(不含插件)
下载价格490 金币
终身VIP免费
产品文档: 查看
原价:200¥
售后:持续免费更新
声明:1、本站大部分资源均为网络采集所得,仅供用来学习研究,请于下载后的24h内自行删除,正式商用请购买正版。2、所有汉化类文件和个别标注了“原创”的产品均为本站原创发布,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。3、如若本站内容侵犯了原著者的合法权益,请携带相关版权文件联系我们进行下架或删除。4、虚拟下载类资源具有可复制性,一经下载后本站有权拒绝退款或更换其他商品!
分享海报

评论0

请先
显示验证码
没有账号?注册  忘记密码?

社交账号快速登录