您当前的位置:首页 > 电脑百科 > 程序开发 > 语言 > Python

必须学会的Python数据分析利器

时间:2022-04-12 14:08:20  来源:  作者:Python老班

大家好,我是老班~很多读者问过我,文章中的Python/ target=_blank class=infotextkey>Python代码都是用的什么编辑器写的?

今天就公开啦:Jupyter Notebook,没有Pycharm,没有Vscode,没有Sublime text。只有一款工具:Jupyter Notebook。从2019年至今,使用了两年半多的时间,今天就好好聊聊它~

工欲善其事,必先利其器

大揭秘:必须学会的Python数据分析利器

 

1、官网学习地址:

https://jupyter.org/

2、使用说明:

https://jupyter-notebook.readthedocs.io/en/stable/notebook.html

一、目录

大揭秘:必须学会的Python数据分析利器

 

二、谁在用Jupyter Notebook

也许还有朋友不知道Jupyter Notebook,到底都是谁在用它?

这是从官网上看到的使用者:谷歌、微软、NASA、IBM等国际知名公司都在其中。所以,你确定还不用吗?

大揭秘:必须学会的Python数据分析利器

 

三、什么是Jupyter Notebook

3.1简介

Jupyter Notebook是基于网页的用于交互计算的一款应用程序。它可被应用于整个计算过程:从开发文档编写、运行代码和到展示结果。

简而言之,Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码运行代码,代码的运行结果也会直接在代码块下显示的程序。

如在编程过程中需要编写说明文档,可在同一个页面中使用Markdown语法直接编写,便于作及时的说明和解释。

 

 

3.2组成

Jupyter notebook主要是由两个部分组成:网页和文档

上面已经介绍了Jupyter Notebook中基于网页的应用程序,在Jupyter 的整个网页应用中结合了多个元素:说明文档、计算公式、文档编写、可视化动态图、甚至是可以嵌入PPT等。总之,这款网页应用的程序能够实现各种功能

Jupyter Notebook中的所有程序都能够以各种形式的输入和输出:公式、文档、富媒体形式等。

Jupyter的文档是保存为后缀名为.ipynb的JSON格式文件,不仅便于版本控制,也方便与他人共享。

此外,文档还可以导出为:HTML、LaTeX、PDF、Markdown等格式的文件,十分方便和互联网化!

3.3特点

  • 编程便捷:在jupyter notebook中编程,具有语法高亮、缩进、tab补全等功能;同时能够在浏览器中直接运行代码
  • 支持Markdown:在在jupyter notebook中支持Markdown语法的,能够直接编写Markdown文档
  • 具有记忆功能:在jupyter notebook中产生的信息(同一次运行)具有记忆功能
  • 文档输出多样化:除了支持Markdown,还支持PDF、PPT、Latex公式、HTML、py文件等多种格式
  • 动态可视化:jupyter notebook中生成的图形可以是动态可视化的

 

四、安装

建议直接通过anaconda来安装Jupyter notebook,这样后续省去很多麻烦。

anacoda是全球最大的数据科学平台,一个基于Python的环境管理工具,相比其他库管理工具,它更适合数据工作者。

安装了anaconda之后,不仅是Jupyter notebook,很多python的第三方库,比如:pandas、numpy等都会自动安装好,实在是方便。

大揭秘:必须学会的Python数据分析利器

 

anaconda安装可自行搜索教程,傻瓜式安装

安装包下载地址:
https://www.anaconda.com/products/individual#Downloads

大揭秘:必须学会的Python数据分析利器

 

五、启动

(1)在安装好了Jupyter notebook之后,我们可以在任意位置启动它,直接输入jupyter notebook即可启动。

执行命令之后,在终端中将会显示一系列notebook的服务器信息,同时浏览器将会自动启动Jupyter Notebook:

(base) peter:pandas系列教程 peter$ pwd     -- 查看当前的目录
/Users/peter/Desktop/WeChat/文章/pandas系列教程  

(base) peter:pandas系列教程 peter$ jupyter notebook   -- 输入 jupyter notebook 表示启动

!!!注意:启动Jupyter之后我们的全部操作都不要关闭终端,否则的话notebook就会断开和本地服务器的连接。

(2)启动之后就来到了初始页面,包含你当前目录的全部文件(文件夹和文档):

我们看到notebook默认的地址是localhost:8888,也就是默认本机的8888端口。当我们开启了多个notebook,会自动变成8889,8890等端口。

大揭秘:必须学会的Python数据分析利器

 

当然,我们也可以自定义端口:

jupyter notebook --port 9988   # 使用9988端口

(3)启动之后我们可以新建一个ipynb的文件:

大揭秘:必须学会的Python数据分析利器

 

六、使用

在启动Jupyter Notebook,并且创建了新的文件之后,我们便可以开始在里面进行编码和文档写作。下面讲讲如何使用Jupyter Notebook。

首先我们需要明白一点:在Jupyter Notebook中有两种模式

  • 命令模式:键盘输入运行程序命令,此时单元格是蓝色
  • 编辑模式:允许你向单元格中输入代码或者文本内容,此时单元格是绿色

6.1主页面

主页面分为4个部分:

  • notebook名称,可重命名
  • 菜单栏
  • 工具栏
  • 代码单元格
大揭秘:必须学会的Python数据分析利器

 

6.2帮助文档

如果你是个新手,可以在notebook中直接查看帮助文档:

!jupyter notebook -h    # 感叹号!不能少
大揭秘:必须学会的Python数据分析利器

 

6.3重命名

默认的名字是“未命名”,给文件重命名:图解Pandas的Apply函数

大揭秘:必须学会的Python数据分析利器

 

6.4文件

【文件】菜单中主要是对各种文件的输入和输出操作,特别是将ipynb文件下载成各种形式进行输出,十分方便:

大揭秘:必须学会的Python数据分析利器

 

6.5运行代码

当我们在代码的单元格中输入了代码,如何运行?

1、单击【运行】按钮

大揭秘:必须学会的Python数据分析利器

 

2、快捷键

将光标放在我们需要运行的代码框中,然后 Shift+Enter 即可运行~

大揭秘:必须学会的Python数据分析利器

 

3、运行全部代码

如果我们想直接从头运行整个notebook中的全部代码,如下操作:【服务】到【重启&运行所有】

大揭秘:必须学会的Python数据分析利器

 

6.6内省

在一个对象的前后使用问号?可以显示出关于该对象的概要信息,这个对象可以是自建的,也可以是Python中自带的:

大揭秘:必须学会的Python数据分析利器

 

print函数和自定义函数的自省概要信息:

大揭秘:必须学会的Python数据分析利器

 


大揭秘:必须学会的Python数据分析利器

 

使用双问号?还有个用途是显示函数的源代码:

大揭秘:必须学会的Python数据分析利器

 

6.7%run

%run命令可以用来运行任意的python文件:

  • Python文件的后缀为“.py”
  • “%run”后跟的是Python文件的绝对路径
%run Python文件的绝对路径

假设我们在当前目录下有个python文件:

  • 定义了3个变量
  • 给定了一个返回值result
大揭秘:必须学会的Python数据分析利器

 

我们在notebook中运行py文件:查看3个变量和返回值的情况

大揭秘:必须学会的Python数据分析利器

 

七、扩展功能

7.1安装

Jupyter notebook本身功能其实不是很多,所以通常会给它安装一个扩展,安装之后就可以起飞了。

安装和启动命令如下:

# 安装Jupyter的配置器
pip install jupyter_nbextensions_configurator

# 启动配置器
jupyter nbextensions_configurator enable --user
大揭秘:必须学会的Python数据分析利器

 


大揭秘:必须学会的Python数据分析利器

 

7.2显示代码行数

当一个单元格中的代码很多行,我们想显示行数:

大揭秘:必须学会的Python数据分析利器

 

7.3编码Markdown文档

当需要在notebook中做笔记的时候,都是使用的Markdown。在Jupyter notebook中是可以直接Markdown语法来编写内容的,两种方式可以实现。

方法1:下拉选项中选择【标记】

大揭秘:必须学会的Python数据分析利器

 


大揭秘:必须学会的Python数据分析利器

 

方法2:快捷键的使用:【左侧蓝+M键】,常用

大揭秘:必须学会的Python数据分析利器

 


大揭秘:必须学会的Python数据分析利器

 


大揭秘:必须学会的Python数据分析利器

 

7.4生成目录

在使用Markdown的时候是有不同层级的目录,可以显示在notebook中。首先在扩展中需要开启这个功能:

大揭秘:必须学会的Python数据分析利器

 

点击启用目录生成:目录默认是在左边,也是按照层级来实现的

大揭秘:必须学会的Python数据分析利器

 


大揭秘:必须学会的Python数据分析利器

 

我们把光标放在目录上,呈现带+的符号,可以拖到右边:

大揭秘:必须学会的Python数据分析利器

 

除了在左侧生成目录,还可以在整个ipynb文件的最上面生成目录:

大揭秘:必须学会的Python数据分析利器

 


大揭秘:必须学会的Python数据分析利器

 


大揭秘:必须学会的Python数据分析利器

 

不管是左侧还是最上面的目录,当我们点击其中某个标题的时候,都会自动跳转到相应的位置,查看、定位文档或者代码超级方便。

7.5标题高亮

安装了扩展之后,我们还可以对标题进行高亮显示:

  • 有3种颜色可供选择
  • 设置了高亮之后标题中便会高亮
大揭秘:必须学会的Python数据分析利器

 


大揭秘:必须学会的Python数据分析利器

 

7.6LaTex公式

既然Jupyter notebook能够使用Markdown,那么我们可以是Jupyter Notebook中编辑LaTex公式,举一个例子:在Markdown格式下的cell中输入如下内容:

$$ P(A mid B) = frac{P(B mid A) , P(A)}{P(B)} $$

便会生成相应的LaTeX公式:

大揭秘:必须学会的Python数据分析利器

 

7.7输出多个结果

一般在notebook中只会输出一个结果,通过设置能够同时输出多个。

大揭秘:必须学会的Python数据分析利器

 

默认情况下只会输出最近一个变量的值**,例子中是b**。

通过设置InteractiveShell.astnodeinteractivity参数为all,就可以让所有的变量或者声明都能显示出来,添加两行代码便可实现输出多个变量的效果:

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all'
大揭秘:必须学会的Python数据分析利器

 

7.8拼写检查

这是检查拼写错误的一个扩展,能够快速的发现我们拼写中的错误。需要主要的是这个插件是在Markdown格式下作用的:

本意表达的是:This is wrong question

大揭秘:必须学会的Python数据分析利器

 

7.9隐藏输入

当我们只想查看输出out部分的内容,可以将输入的代码进行隐藏:

大揭秘:必须学会的Python数据分析利器

 


大揭秘:必须学会的Python数据分析利器

 

下面是隐藏之前的效果:

大揭秘:必须学会的Python数据分析利器

 

八、快捷键

1、命令模式快捷键(按 Esc 键开启):

  • 命令模式将键盘命令与Jupyter Notebook笔记本命令相结合,可以通过键盘不同键的组合运行笔记本的命令。
  • 按esc键进入命令模式。
  • 命令模式下,单元格边框为灰色,且左侧边框线为蓝色粗线条

快捷键作用Enter转入编辑模式Shift-Enter运行本单元,选中下个单元Ctrl-Enter运行本单元Alt-Enter运行本单元,在其下插入新单元Y单元转入代码状态M单元转入 markdown 状态R单元转入 raw 状态1、2、6设定 1 、2、6级标题Up选中上方单元K选中上方单元Down选中下方单元J选中下方单元Shift-K连续选择上方单元Shift-J连续选择下方单元A在上方插入新单元B在下方插入新单元X剪切选中的单元C复制选中的单元Shift-V粘贴到上方单元V粘贴到下方单元Z恢复删除的最后一个单元D,D删除选中的单元Shift-M合并选中的单元Ctrl-S保存当前 NoteBookS保存当前 NoteBookL开关行号O转换输出Shift-O转换输出滚动Esc关闭页面Q关闭页面H显示快捷键帮助I,I中断 NoteBook 内核0,0重启 NoteBook 内核Shift忽略Shift-Space向上滚动Space向下滚动

2、编辑模式快捷键( 按 Enter 键启动)

  • 编辑模式使用户可以在单元格内编辑代码或文档。
  • 按enter或return键进入编辑模式。
  • 编辑模式下,单元格边框和左侧边框线均为绿色

快捷键作用Tab代码补全或缩进Shift-Tab提示Ctrl-]缩进Ctrl-[解除缩进Ctrl-A全选Ctrl-Z撤销Ctrl-Shift-Z重做Ctrl-Y重做Ctrl-Home跳到单元开头Ctrl-Up跳到单元开头Ctrl-End跳到单元末尾Ctrl-Down跳到单元末尾Ctrl-Left跳到左边一个字首Ctrl-Right跳到右边一个字首Ctrl-Backspace删除前面一个字Ctrl-Delete删除后面一个字Esc切换到命令模式Ctrl-M切换到命令模式Shift-Enter运行本单元,选中下一单元Ctrl-Enter运行本单元Alt-Enter运行本单元,在下面插入一单元Ctrl-Shift–分割单元Ctrl-Shift-Subtract分割单元Ctrl-S保存当前 NoteBookShift忽略Up光标上移或转入上一单元Down光标下移或转入下一单元Ctrl-/注释整行/撤销注释

 

 

九、魔术命令

IPython的特殊命令被称为魔术命令,这些命令被设计用于简化常见任务。

官网地址:
https://ipython.readthedocs.io/en/stable/interactive/magics.html

魔术命令的前缀符号是百分号%,例如%timeit用来检查一段Python代码执行的时间。魔术命令可以直接使用,也可以赋值给变量再使用:

大揭秘:必须学会的Python数据分析利器

 

下面记录的是IPython的几个常用的魔法命令:

魔术命令作用%pwd查看当前的工作目录%cd更改当前的工作目录%ls查看目录文件列表%writefile写入文件%run运行脚本;%run可以从.py文件中执行python代码,也可以指定ipynb文件%whos查看当前变量%reset清楚当前变量%timeit测试单行代码运行时间%hist打印命令输入历史%paste从剪贴板中执行已经预先格式化的Python代码%cpaste打开一个提示符,手动粘贴执行的python代码%debug从最后发生报错的底部进入交互式调试器

 

十、Jupyter Notebook换主题

在上面的图形中都是使用的默认主题:白色,实际上主题是可以更换的:

在jupyter notebook中安装并使用不同的主题

# 安装
pip install jupyterthemes
pip install --upgrade jupyterthemes

切换不同主题

# 查看所有颜色主题 --list
jt -l

# 选择主题 --theme
jt -t 主题名称

# 恢复默认主题 --recover
jt -r

1、查看主题

大揭秘:必须学会的Python数据分析利器

 

$jt -t monokAI  # 选择某个主题
$jt -t oceans16

# 然后重新启动jupyter notebook

$jupyter notebook   # 启动命令
大揭秘:必须学会的Python数据分析利器

 


大揭秘:必须学会的Python数据分析利器

 

如果想改回原来的主题输入 jt -r 即可

原文链接:

https://mp.weixin.qq.com/s/Qak18eniqpD7W965QcvX7A



Tags:数据分析   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
自媒体运营 运营媒体数据分析怎么写
数据分析之旅自媒体运营工作充满挑战,但也令人陶醉。在此,我愿意与您分享我在该领域的八段独特体验及感悟。1.初入行业的激动与迷茫初识数据分析及自媒体运营领域,我心潮澎湃,对...【详细内容】
2024-01-26  Search: 数据分析  点击:(45)  评论:(0)  加入收藏
抖音万粉达人,是怎么做数据分析的?
在运营抖音账号的过程中,我们需要建立起对于抖音账号、短视频、直播等数据整体的认知,才能够对照实际数据去科学调整阶段性的运营目标,实现持续变现。那么知识达人该如何对抖音...【详细内容】
2024-01-15  Search: 数据分析  点击:(57)  评论:(0)  加入收藏
使用Python进行数据分析,需要哪些步骤?
Python是一门动态的、面向对象的脚本语言,同时也是一门简约,通俗易懂的编程语言。Python入门简单,代码可读性强,一段好的Python代码,阅读起来像是在读一篇外语文章。Python这种特...【详细内容】
2024-01-15  Search: 数据分析  点击:(173)  评论:(0)  加入收藏
网站优化数据你分析过吗?做SEO优化离不开数据分析
作为一名网站管理员,你是否曾经感到困惑,为什么你的网站在搜索引擎中的排名总是不如人意?为什么你的网站流量总是无法突破某个瓶颈?其实,这些问题很可能是因为你忽略了网站优化数...【详细内容】
2024-01-01  Search: 数据分析  点击:(63)  评论:(0)  加入收藏
大数据如何实时拯救生命:车联网的数据分析有助预防交通事故
译者 | 李睿审校 | 重楼车联网(IoV)是汽车行业与物联网相结合的产物。预计车联网数据规模将越来越大,尤其是当电动汽车成为汽车市场新的增长引擎。问题是:用户的数据平台准备...【详细内容】
2023-12-19  Search: 数据分析  点击:(43)  评论:(0)  加入收藏
在Linux系统中实现容器化的大规模数据分析平台:Hadoop和Spark
在Linux系统中实现容器化的大规模数据分析平台,我们可以利用Hadoop和Spark这两个强大的开源工具。Hadoop是一个分布式计算框架,适用于处理大规模数据集。它提供了分布式文件系...【详细内容】
2023-12-15  Search: 数据分析  点击:(163)  评论:(0)  加入收藏
数据库优化:提升网站SEO数据分析能力的关键
摘要:在当今数字化时代,网站的SEO(搜索引擎优化)数据分析能力对于吸引流量和提升用户体验至关重要。而数据库优化作为一项关键的技术手段,能够显著提升网站的数据处理效率和分析...【详细内容】
2023-12-13  Search: 数据分析  点击:(124)  评论:(0)  加入收藏
高级数据分析师必备的八大能力
到底高级的数据分析师需要啥能力?这是很多人心中的疑惑。网上流行的都是Excel,SQL,Python,都是数据分析从0到1,那到底从1到100该弄些啥?陈老师给大家准备了一个《数据分析年底盘点...【详细内容】
2023-11-29  Search: 数据分析  点击:(65)  评论:(0)  加入收藏
Python:打造可视化数据分析应用的实战指南!
随着数据科学和人工智能的快速发展,数据分析变得越来越重要。在数据分析的过程中,可视化是一个非常关键的环节。它可以帮助我们更好地理解数据、发现规律和趋势。Python作为一...【详细内容】
2023-11-24  Search: 数据分析  点击:(237)  评论:(0)  加入收藏
聚类算法在大规模数据分析中的效果评估
在大规模数据分析中,聚类算法是一种常用的数据挖掘技术,用于将数据集划分为具有相似特征的群组。然而,对于大规模数据集,评估聚类算法的效果变得尤为重要。本文将探讨聚类算法在...【详细内容】
2023-11-21  Search: 数据分析  点击:(275)  评论:(0)  加入收藏
▌简易百科推荐
一篇文章教会你使用Python中三种简单的函数
所谓函数,就是指:把某些特定功能的代码组成为一个整体,这个整体就叫做函数。一、函数简介所谓函数,就是指:把某些特定功能的代码组成为一个整体,这个整体就叫做函数。二、函数定义...【详细内容】
2024-04-11  Go语言进阶学习  微信公众号  Tags:Python   点击:(10)  评论:(0)  加入收藏
一篇文章带你了解Python的分布式进程接口
在Thread和Process中,应当优选Process,因为Process更稳定,而且,Process可以分布到多台机器上,而Thread最多只能分布到同一台机器的多个CPU上。一、前言在Thread和Process中,应当优...【详细内容】
2024-04-11  Go语言进阶学习    Tags:Python   点击:(8)  评论:(0)  加入收藏
Python 可视化:Plotly 库使用基础
当使用 Plotly 进行数据可视化时,我们可以通过以下示例展示多种绘图方法,每个示例都会有详细的注释和说明。1.创建折线图import plotly.graph_objects as go# 示例1: 创建简单...【详细内容】
2024-04-01  Python技术    Tags:Python   点击:(13)  评论:(0)  加入收藏
Python 办公神器:教你使用 Python 批量制作 PPT
介绍本文将介绍如何使用openpyxl和pptx库来批量制作PPT奖状。本文假设你已经安装了python和这两个库。本文的场景是:一名基层人员,要给一次比赛活动获奖的500名选手制作奖状,并...【详细内容】
2024-03-26  Python技术  微信公众号  Tags:Python   点击:(21)  评论:(0)  加入收藏
Python实现工厂模式、抽象工厂,单例模式
工厂模式是一种常见的设计模式,它可以帮助我们创建对象的过程更加灵活和可扩展。在Python中,我们可以使用函数和类来实现工厂模式。一、Python中实现工厂模式工厂模式是一种常...【详细内容】
2024-03-07  Python都知道  微信公众号  Tags:Python   点击:(36)  评论:(0)  加入收藏
不可不学的Python技巧:字典推导式使用全攻略
Python的字典推导式是一种优雅而强大的工具,用于创建字典(dict)。这种方法不仅代码更加简洁,而且执行效率高。无论你是Python新手还是有经验的开发者,掌握字典推导式都将是你技能...【详细内容】
2024-02-22  子午Python  微信公众号  Tags:Python技巧   点击:(41)  评论:(0)  加入收藏
如何进行Python代码的代码重构和优化?
Python是一种高级编程语言,它具有简洁、易于理解和易于维护的特点。然而,代码重构和优化对于保持代码质量和性能至关重要。什么是代码重构?代码重构是指在不改变代码外部行为的...【详细内容】
2024-02-22  编程技术汇    Tags:Python代码   点击:(42)  评论:(0)  加入收藏
Python开发者必备的八个PyCharm插件
在编写代码的过程中,括号几乎无处不在,以至于有时我们会拼命辨别哪个闭合括号与哪个开头的括号相匹配。这款插件能帮助解决这个众所周知的问题。前言在PyCharm中浏览插件列表...【详细内容】
2024-01-26  Python学研大本营  微信公众号  Tags:PyCharm插件   点击:(91)  评论:(0)  加入收藏
Python的Graphlib库,再也不用手敲图结构了
Python中的graphlib库是一个功能强大且易于使用的工具。graphlib提供了许多功能,可以帮助您创建、操作和分析图形对象。本文将介绍graphlib库的主要用法,并提供一些示例代码和...【详细内容】
2024-01-26  科学随想录  微信公众号  Tags:Graphlib库   点击:(92)  评论:(0)  加入收藏
Python分布式爬虫打造搜索引擎
简单分布式爬虫结构主从模式是指由一台主机作为控制节点负责所有运行网络爬虫的主机进行管理,爬虫只需要从控制节点那里接收任务,并把新生成任务提交给控制节点就可以了,在这个...【详细内容】
2024-01-25  大雷家吃饭    Tags:Python   点击:(62)  评论:(0)  加入收藏
站内最新
站内热门
站内头条