HExLL-迷雾日志 - 记录技术与思考

发表于09-08-2022|Python-100-DaysDay41-55

异步任务和定时任务在Web应用中，如果一个请求执行了耗时间的操作或者该请求的执行时间无法确定，而且对于用户来说只需要知道服务器接收了他的请求，并不需要马上得到请求的执行结果，这样的操作我们就应该对其进行异步化处理。如果说使用缓存是优化网站性能的第一要义，那么将耗时间或执行时间不确定的任务异步...

55.项目上线

发表于09-08-2022|Python-100-DaysDay41-55

项目上线请各位读者移步到《项目部署上线和性能调优》一文。

52.接入三方平台

发表于09-08-2022|Python-100-DaysDay41-55

接入三方平台在Web应用的开发过程中，有一些任务并不是我们自己能够完成的。例如，我们的Web项目中需要做个人或企业的实名认证，很显然我们并没有能力判断用户提供的认证信息的真实性，这个时候我们就要借助三方平台提供的服务来完成该项操作。再比如说，我们的项目中需要提供在线支付功能，这类业务通常也是...

54.单元测试

发表于09-08-2022|Python-100-DaysDay41-55

单元测试请各位读者移步到《使用Django开发商业项目》一文。

61.网络数据采集概述

发表于09-08-2022|Python-100-DaysDay61-65

网络数据采集概述爬虫（crawler）也经常被称为网络蜘蛛（spider），是按照一定的规则自动浏览网站并获取所需信息的机器人程序（自动化脚本代码），被广泛的应用于互联网搜索引擎和数据采集。使用过互联网和浏览器的人都知道，网页中除了供用户阅读的文字信息之外，还包含一些超链接，网络爬虫正是通过...

62.用Python获取网络资源-1

发表于09-08-2022|Python-100-DaysDay61-65

用Python获取网络数据网络数据采集是 Python 语言非常擅长的领域，上节课我们讲到，实现网络数据采集的程序通常称之为网络爬虫或蜘蛛程序。即便是在大数据时代，数据对于中小企业来说仍然是硬伤和短板，有些数据需要通过开放或付费的数据接口来获得，其他的行业数据和竞对数据则必须要通过网络数据采...

63.Python中的并发编程-2

发表于09-08-2022|Python-100-DaysDay61-65

Python中的并发编程-2 在上一课中我们说过，由于 GIL 的存在，CPython 中的多线程并不能发挥 CPU 的多核优势，如果希望突破 GIL 的限制，可以考虑使用多进程。对于多进程的程序，每个进程都有一个属于自己的 GIL，所以多进程不会受到 GIL 的影响。那么，我们应该如何在 P...

62.用Python解析HTML页面-2

发表于09-08-2022|Python-100-DaysDay61-65

用Python解析HTML页面在前面的课程中，我们讲到了使用request三方库获取网络资源，还介绍了一些前端的基础知识。接下来，我们继续探索如何解析 HTML 代码，从页面中提取出有用的信息。之前，我们尝试过用正则表达式的捕获组操作提取页面内容，但是写出一个正确的正则表达式也是一件让人头疼...

63.Python中的并发编程-3

发表于09-08-2022|Python-100-DaysDay61-65

Python中的并发编程-3 爬虫是典型的 I/O 密集型任务，I/O 密集型任务的特点就是程序会经常性的因为 I/O 操作而进入阻塞状态，比如我们之前使用requests获取页面代码或二进制内容，发出一个请求之后，程序必须要等待网站返回响应之后才能继续运行，如果目标网站不是很给力或者网络状况...

63.Python中的并发编程-1

发表于09-08-2022|Python-100-DaysDay61-65

Python中的并发编程-1 现如今，我们使用的计算机早已是多 CPU 或多核的计算机，而我们使用的操作系统基本都支持“多任务”，这使得我们可以同时运行多个程序，也可以将一个程序分解为若干个相对独立的子任务，让多个子任务“并行”或“并发”的执行，从而缩短程序的执行时间，同时也让用户获得更好的体...