YANGGE的文章

巧用百度 APP 代理规避网站反爬

爬虫是一种程序,它可以自动地访问网站并抓取数据。但是,如果爬虫发送的请求过于频繁,服务器可能会将其 IP 地址屏蔽,这就需要使用代理 IP 来访问,然而高质量的代理 IP 价格通常较贵。因此,我们可以使用百度 APP 的代理进行数据抓取。 ...

2023年如何注册一个 @msn.com 邮箱

很早之前(2012 年?)微软就将邮箱服务全面迁移到 outlook,并且无法再免费注册到 @msn.com 的邮箱地址。但时至今日,你依旧可以通过某些方法注册到 @msn.com 的邮箱地址。这里介绍一下我是如何注册的。 订阅 MSN P...

自建 PowerDNS 智能解析服务器

最近我越来越喜欢自建一些东西,比如 GitLab。今天我又把 DNS 服务器改成自建的了,分享一下经验(PS:现在为了实现根域名 CDN,我用换成了 Route 53): 本文的自建 DNS 是指的是权威 DNS,即给自己的域名配置的 DN...

服务器超售检测方法

我们用到的博客肯定是要使用服务器的,对于无良商家,服务器肯定是超售的,而且我们也不会知道,主机商肯定不会告诉我们,现在公布一种检测是否超售的工具脚本,希望对自己有用。 一键脚本 curl https://raw.githubusercont...

服务器宝塔面板如何设置防CC

最好的防cc办法——别到处乱发自己的网站域名,不要到处求打,不要对自己的服务器有过大的信心。 宝塔防火墙设置: 插件页面→全局配置→cc防御→初始规则 建议规则: 个人博客——周期:1秒 频率:5次~15次 封锁时间:3600秒 增强模式:...

如何禁止搜索引擎爬虫抓取网站页面?

以下列举了屏蔽主流搜索引擎爬虫(蜘蛛)抓取/索引/收录网页的几种思路,如果你不希望搜索引擎抓取你的页面,或者不希望web.archive.org留下历史信息,可以试一下这么做。 注意:是整站屏蔽,而且是尽可能的屏蔽掉所有主流搜索引擎的爬虫(...