HExLL-迷雾日志 - 记录技术与思考

发表于09-08-2022|Python-100-DaysDay66-80

NumPy的应用-2 数组的运算使用 NumPy 最为方便的是当需要对数组元素进行运算时，不用编写循环代码遍历每个元素，所有的运算都会自动的矢量化（使用高效的、提前编译的底层代码来对数据序列进行数学操作）。简单的说就是，NumPy 中的数学运算和数学函数会自动作用于数组中的每个成员。数组跟...

70.Pandas的应用-1

发表于09-08-2022|Python-100-DaysDay66-80

Pandas的应用-1 Pandas是Wes McKinney在2008年开发的一个强大的分析结构化数据的工具集。Pandas以NumPy为基础（数据表示和运算），提供了用于数据处理的函数和方法，对数据分析和数据挖掘提供了很好的支持；同时Pandas还可以跟数据可视化工具Matplotlib很...

72.Pandas的应用-3

发表于09-08-2022|Python-100-DaysDay66-80

Pandas的应用-3 DataFrame的应用数据清洗通常，我们从 Excel、CSV 或数据库中获取到的数据并不是非常完美的，里面可能因为系统或人为的原因混入了重复值或异常值，也可能在某些字段上存在缺失值；再者，DataFrame中的数据也可能存在格式不统一、量纲不统一等各种问题。因此...

74.Pandas的应用-5

发表于09-08-2022|Python-100-DaysDay66-80

Pandas的应用-5 DataFrame的应用窗口计算 DataFrame对象的rolling方法允许我们将数据置于窗口中，然后就可以使用函数对窗口中的数据进行运算和处理。例如，我们获取了某只股票近期的数据，想制作5日均线和10日均线，那么就需要先设置窗口再进行运算。我们可以使用三方库pa...

73.Pandas的应用-4

发表于09-08-2022|Python-100-DaysDay66-80

Pandas的应用-4 DataFrame的应用数据分析经过前面的学习，我们已经将数据准备就绪而且变成了我们想要的样子，接下来就是最为重要的数据分析阶段了。当我们拿到一大堆数据的时候，如何从数据中迅速的解读出有价值的信息，这就是数据分析要解决的问题。首先，我们可以获取数据的描述性统计信息，...

76.数据可视化-2

发表于09-08-2022|Python-100-DaysDay66-80

数据可视化-2 通过前面的学习，我们已经对数据可视化工具 matplotlib 有一个初步的认知。大家可能也会发现了，matplotlib 提供的函数虽然强大，但是参数太多，要想对图表进行深度的定制就需要修改一系列的参数，这一点对新手并不友好。另一方面，使用 matplotlib 定制的统计图...

75.数据可视化-1

发表于09-08-2022|Python-100-DaysDay66-80

数据可视化-1 在完成了对数据的透视之后，我们可以将数据透视的结果通过可视化的方式呈现出来，简单的说，就是将数据变成漂亮的统计图表，然后进一步发现和解读数据背后隐藏的商业价值。在之前的课程中，我们已经为大家展示过用使用Series或DataFrame对象的plot方法生成可视化图表的操作，本章...

77.概率统计基础

发表于09-08-2022|Python-100-DaysDay66-80

概率统计基础概率论源于赌博游戏。意大利文艺复兴时代，百科全书式的学者卡尔达诺（死后）发表的《论赌博游戏》被认为是第一部论述概率论的著作。到了17世纪的法国，宫廷贵族里盛行着掷骰子游戏，游戏规则是玩家连续掷4次骰子，如果其中没有6点出现，玩家赢，如果出现一次6点，则庄家（相当于现在的赌场）赢；...

79.相关和回归

发表于09-08-2022|Python-100-DaysDay66-80

相关和回归我们知道，可以通过对指标的维度拆来解寻找指标变化的原因。当我们找到问题的原因时，自然会进一步思考一个问题：指标变化的原因这么多，其中的关键因素又是哪个呢？例如，我们在工作场景中时不时会讨论这些问题：电商类产品想知道哪个品类销售对整体销售贡献更大；渠道运营想知道哪个渠道的用户对...

80.数据分析方法论

发表于09-08-2022|Python-100-DaysDay66-80

数据分析方法论