Linux系统TIPS

这篇文章用来记录使用linux时遇到的各种BUG与解决方案1. ubuntu18.04输入法不能选择备选汉字在使用ubuntu18.04的过程中,遇到了每次打中文,只能按空格,不能按数字,例如我想要选择第二个被选词,结果却得到了数字2.解决方法:rm -rf ~/.cache/ibus/libpinyin

继续阅读 »

初学数据库—sqlite3 创建示例数据库

编写SQL语句需要对基础数据库的设计有良好的理解,不知道什么信息存储在什么表中,表之间如何相互关联以及行内数据如何分解,是不可能编写出高效的SQL的。本博客关于数据库这一系列文章是我花了半天时间学习了《MySQL必知必会》这本书的基础上,产生的学习笔记,记录在博客上,以便于将来查找阅读。那本书讲的是MySQL,我这里用的是sqlite3,书中的命令会有微小修改。安装sqlite3可以从这里下...

继续阅读 »

初学数据库—sqlite3 简介

通过最近几天的学习,对数据库终于有了一些认识,现在记录一下。什么是数据库,为何需要使用数据库?我们先来想想几个问题:1. 如果现在市面上没有数据库,你会怎样管理数据有的人可能会立马想到,电脑上新建几个txt文件,例如A.TXT, B.TXT, C.TXT。用来存放不同类型的数据。例如,你正在做一个推销商使用的订单录入系统,你有管理供应商,管理产品目录,管理顾客列表,录入顾客订单这些数据,你现...

继续阅读 »

发布自己的Python包到pypi

大佬们写的包,我们只需要pip install就能安装了,但是,其实人人都能发布包到pypi。本教程将指导您如何打包一个简单的Python项目。它将向您展示如何添加必要的文件和结构来创建包,如何构建包以及如何将其上载到Python包索引。一个简单的项目本教程使用名为example_pkg_xujhtop的简单项目。 要在本地创建此项目,请创建以下文件结构:/example_pkg_xujht...

继续阅读 »

维护爬虫代理IP池——采集并验证

本文是维护爬虫代理IP池系列文章的第一篇文章,系列教程将会一步步教你搭建你自己的代理IP池。本文介绍了如何采集互联网上的免费的代理IP,并验证IP是否有效。任务分析我们爬的免费代理来自于https://www.kuaidaili.com这个网站。用requests将ip地址与端口采集过来,将IP与PORT组合成requests需要的代理格式,用requests访问[http://ipchec...

继续阅读 »

利用虚拟主机搭建一个验证爬虫代理IP是否有效的服务

经常写爬虫的小伙伴们肯定有自己的代理IP池,我们在验证代理IP是否有效时,往往是利用response=requests.get(ipcheck_url,proxies=proxy)这样的方法去验证,通过访问ipcheck_url,response能返回当前访客的ip地址,通过和代理ip对比一下,若一样,则代理ip有效,若response中的ip和你的电脑ip相同,则代理无效。ipcheck_...

继续阅读 »

采集wordpress并自动发布文章

这是一篇去年的老文章了,我的博客的域名从xujh.top->ikeji8.com->xujh.top,建站程序从wordpress变为了typecho静态博客。最近,我将把之前的文章慢慢迁移过来最近我的博客新开了,一直在申请Google AdSense, 结果申请一次被拒一次,google发邮件说我的内容太少了, 这就让我很不爽了,虽然被拒绝的原因可能是其他的比如网站建站时间短等...

继续阅读 »

Flask速成项目:Flask实现计算机资源的实时监控

很多人都说使用Python开发WEB应用非常方便,那么对于WEB新手来说,到底有多方便呢?本文即将展示给你Python的魔法。本文将通过一个实例:Flask实现计算机资源的实时监控,迅速带你入门Flask开发。先说一下我的水平,博主的专业并不是做WEB开发的,对于WEB方面,只会写爬虫,因此,只能看懂html,略看得懂css与js,我估计有很多像我一样的小伙伴,因此,如果你的WEB掌握的水平...

继续阅读 »

Flask项目结构

拥有良好的项目结构对于开发与维护有着巨大的作用boss@boss-N501JW:~/Desktop/projects$ tree . `-- ProjectName |-- app # 整个程序的包目录 | |-- config.py # 配置文件 | |-- email.py ...

继续阅读 »