您当前的位置:首页 > 电脑百科 > 网络技术 > 网络技术

怎么用python批量获取免费代理IP

时间:2021-05-25 09:54:04  来源:今日头条  作者:最咸鱼

如今,需要使用代理IP的地方有很多,例如网络投票、大数据分析、人工智能等领域。那么如何获取代理IP呢?很多人想到了免费代理IP,免费不用钱,岂不美哉。虽然个人不太建议使用免费代理IP,但还是给大家分享下思路方法。

怎么用python批量获取免费代理IP

 

一、收集网站

想要获取免费代理IP,首先得收集一些有免费代理IP的网站,然后编写代码去批量获取网站上的免费代理IP。这里就不说有哪些网站呢,自己去百度一搜,大把的有。

二、分析网站

收集到网站后,对含有免费代理IP的网页进行分析,比如总共有多少页,想要的数据是在哪里,要怎么来获取。

三、编写代码

分析完网站后,就可以开始编写代码了,这里贴出代码,仅供参考。

import requests
import csv
import pandas as pd
from fake_useragent import UserAgent
import time

#获取含有免费代理IP的所有页面url
def get_pageUrls(startUrl,endUrl,pageCount):
    page_url_list = []

# range 从1开始,所以pageCount+1,左闭右开

    for i in range(1,pageCount+1):
    
    #页面URL一般由三部分组成,前半部分url+第几页+后半部分url,
    #有的页面URL最后以页数结尾,没有后半部分,那么endUrl设置为空字符串即可
    
        page_url = startUrl + str(i) + endUrl
        page_url_list.Append(page_url)

    return page_url_list

#请求所有免费代理IP的页面url,获取免费代理IP
def get_content(page_url_list):
    ua =UserAgent()
    data_list = []
    for page_url in page_url_list:
        try:
            resp = requests.get(page_url, headers={'User-Agent': ua.random})
          #如果免费代理IP是放在表格里,可以直接使用 pandas来获取,比较简单,
          #若不是,则需要用BeautifulSoup,或者xpath,或正则表达式来提取
            datas = pd.read_html(resp.text)
            # print(datas)
            data_list.append(datas)
            time.sleep(2)
            
        except:
            print('错误的请求URL:'+page_url)

    # print(data_list)
    return data_list

# 将获取到的免费代理IP保存到本地的Excel表格里,留待后用,也可以保存到TXT文本,或数据库里
def save_csv(data_list,save_path):
    for datas in data_list:
        for data in datas:
            # print(data)
            data.to_csv(sava_path,mode='a',encoding='utf-8',header=1,index=0)




if __name__ == '__main__':
    #前半部分url
    startUrl = 'https://*******/free/inha/'
   #页数
    pageCount = 4
   #若页面URL最后是以页数结尾,后半部分url设置为空字符串
    endUrl = ''
     #文件保存路径
    save_path = r'D:3.xlsx'

    page_url_list = get_pageUrls(startUrl,endUrl,pageCount)
    data_list = get_content(page_url_list)
    save_csv(data_list,save_path)

也许代码不够完善,不当之处欢迎指正,希望和大家一起交流。



Tags:代理IP   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
如今,需要使用代理IP的地方有很多,例如网络投票、大数据分析、人工智能等领域。那么如何获取代理IP呢?很多人想到了免费代理IP,免费不用钱,岂不美哉。虽然个人不太建议使用免费代...【详细内容】
2021-05-25  Tags: 代理IP  点击:(173)  评论:(0)  加入收藏
很多人在网上看到过这样的文章:代理IP能突破访问限制,提高访问速度,隐藏真实IP,等等一大堆的优点,颇有点无所不能的感觉。等到自己使用代理IP时,却发现这不行,那不行,感觉自己使用的...【详细内容】
2021-05-25  Tags: 代理IP  点击:(183)  评论:(0)  加入收藏
在使用代理IP前,很多人都有验证代理IP是否有效的习惯;在使用代理IP时,经常会遇到各种问题,于是想验证下代理IP是否有效。那么,如何验证代理IP是否有效呢?下面以python为例来说明。...【详细内容】
2021-05-25  Tags: 代理IP  点击:(268)  评论:(0)  加入收藏
众所周知,代理IP可以助力爬虫工作更好的进行,很多人认为:如果没有代理IP,爬虫工作寸步难行。那么,如果爬虫不使用代理IP会出现什么情况呢? 一、小型爬虫:可有可无爬几百篇文章,几百...【详细内容】
2021-05-07  Tags: 代理IP  点击:(187)  评论:(0)  加入收藏
如果不使用代理ip,爬虫工作必定无路可行,因此大部分爬虫工作者都会去购买安全稳定的代理ip。使用了高质量的代理ip后,会不会就能够无后顾之忧了呢?这个可不会这么容易,还要改进方案,有效分配资源,提升工作效率,又快速又稳定又...【详细内容】
2019-11-05  Tags: 代理IP  点击:(181)  评论:(0)  加入收藏
当我们对某些网站进行爬去的时候,我们经常会换IP来避免爬虫程序被封锁。代理ip地址如何获取?其实也是一个比较简单的操作,目前网络上有很多IP代理商,例如西刺,芝麻,犀牛等等。这些...【详细内容】
2019-10-10  Tags: 代理IP  点击:(227)  评论:(0)  加入收藏
▌简易百科推荐
前言经过了多年的努力,在 6 月 6 号,IETF (互联网工程任务小组) 正式发布了 HTTP/3 的 RFC。HTTP 历史 1991 HTTP/1.1 2009 Google 设计了基于TCP的SPDY 2013 QUIC 2015 HTTP/2...【详细内容】
2022-07-15  Java机械师    Tags:HTTP/3   点击:(2)  评论:(0)  加入收藏
关于万维网的一点历史没有过去,就没有未来。要了解未来会发生什么,我们需要知道我们现在和以前拥有什么。因此,与其一下跳到web3.0的技术和示例上,我们需要了解 Web 1.0 的基本...【详细内容】
2022-07-05  木偶跳舞    Tags:Web 3.0   点击:(24)  评论:(0)  加入收藏
在刚刚拿到购买的CS10无线网关设备,应该如何开始使用呢?请看下面的几个步骤: Step1:首先我们找到产品包装内的一张带有初始WIFI名称和密码的贴纸,将它贴在产品的背面(以备未来使用...【详细内容】
2022-06-30  PLUS1软件教学频道    Tags:CS10   点击:(32)  评论:(0)  加入收藏
企业局域网内外网分离方案一些企事业单位出于安全考虑,需要做内外网分离。举例来说,需要达到如下的技术要求: 生产网、办公网、外网三网隔离。 启用网络准入,对非规定允许接入的...【详细内容】
2022-06-30  运维幼儿    Tags:内外网分离   点击:(31)  评论:(0)  加入收藏
在这个时代,我们至少有一半的重要信息都在手机上。无论是个人信息或是财务信息,还是敏感项目和工作机密,所有的这些都被我们驻留在手机上。现在越来越多的手机诈骗出现,这种第三...【详细内容】
2022-06-28  AirDroid    Tags:移动设备   点击:(26)  评论:(0)  加入收藏
最近各个方面的事情逐渐地恢复,继续写家庭网络实验室的文章。在考虑洁净和需求之后,我们就需要考虑家庭网络实验室的空间了。首先先亮一个观点——如果你真的想在家...【详细内容】
2022-06-28  iN在    Tags:家庭网络   点击:(29)  评论:(0)  加入收藏
背景:网络穿透互联是方便我们技术人员的一种工具,通过各种协议实现您想要的网络互联。家庭组网可以参照低成本电信家庭宽带架构网络拓扑今天,我们需要在这个基础上扩展网络应...【详细内容】
2022-06-27  应用技术    Tags:局域网互联   点击:(28)  评论:(0)  加入收藏
FTP是File Transfer Protocol(文件传输协议),用来进行服务器和客户端之间文件传输的协议。非常常用的服务,应用场景主要在设备间文件共享,服务程序发布,日志文件管理等方面。这里...【详细内容】
2022-06-27  影三分plus    Tags:FTP   点击:(37)  评论:(0)  加入收藏
一、后台确认监控/录像机在局域网内的IP地址如:192.168.1.158 ,在浏览器内输入后回车,即可进入监控/录像机WEB登录界面 二、输入用户名及密码进入WEB管理界面 三、如果进...【详细内容】
2022-06-23  一往直前的冲吧    Tags:监控   点击:(41)  评论:(0)  加入收藏
人在家中坐,网速突然断。相信这样的情况大家都不陌生。那么,怎么样才能在装维小哥上门前快速自助排查解决简单问题呢?相信这份攻略能够帮到你~ 一旦出现家中断网,而且在重启光猫...【详细内容】
2022-06-22  安利小丸子    Tags:网速   点击:(26)  评论:(0)  加入收藏
站内最新
站内热门
站内头条