暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

python模块分享

DATA ANALYSIS SHARING 2021-09-18
334

点击蓝字 关注我们


anaconda主要功能介绍

1.环境 Environments

    自动下载了362包/模块

2.学习资料 Learning

    python中文文档 Simplified Chinese(重点)

    数据分析相关学习资料

3.社区 community

    技术讨论 类似百度贴吧

notebook主要功能及快捷键

1.ipynb文件名修改 双击即可

2.notebook底层使用的就是ipython模块环境

3.主要英文单词

    cells单元格

    cut剪切

    copy复制

    paste粘贴

    above在...上面

    below在...下面

    replace替换

    delete删除

    undo撤销

    split切割

    merge合并

    up上面

    down下面

4.快捷键

    命令行模式

        蓝色

    编辑模式

        绿色

    上述两种模式的切换主要通过以下两个按键:

        esc进入命令行模式

        enter进入编辑模式


快捷键

1.运行当前单元格

    ctrl + enter

2.运行当前单元格并且自动选择下一个(没有下一个自动创建有则选择)

    shift + enter

3.删除当前单元格

    先按esc进入命令行模式

    之后快速的按两下d键

4.撤销删除操作

    先按esc进入命令行模式

    之后再按z键

5.在当前单元格的上方创建一个新的单元格

    先按esc进入命令行模式

    之后按a键

6.在当前单元格的下方创建一个新的单元格

    先按esc进入命令行模式

    之后按b键

7.单元格默认写的是代码如果需要写标题

    先按esc进入命令行模式

    之后按m键

    按照markdown语法用#来表示几级标题即可

    最好执行单元格


    骚操作:先写文字之后按esc进入命令行模式再通过数字按键控制几级标题

8.给代码加注释

    用法与pycharm一致 

    ctrl + ?

numpy模块

1.Numpy是高性能科学计算和数据分析的基础包

2.也是pandas等其他数据分析的工具的基础

3.Numpy具有多维数组功能,运算更加高效快速


在导入模块的时候可以使用关键字as给模块命别名

1.正常使用

    import numpy

    2.另起别名

    import numpy as np

· 数组 ·

一维数组(使用频率较高)

np.array([11,22,33,44])

np.array((11,22,33,44))


二维数组(使用频率最高)

np.array([[11,22,33,44],[55,66,77,88]])

np.array([(11,22,33,44),(55,66,77,88)])


三维数组(使用频率很低 了解即可)

np.array([[[1,2,3],[4,5,6],[7,8,9]]])

np.array([[(1,2,3),(4,5,6),(7,8,9)]])


"""数组在做数学运算的时候是按照对应位置一一计算"""

· 河灯寄哀思 ·


布尔型bool_

整型int_ int8 int16 int32 int64

int32只能表示(-2**31,2**31-1),因为它只有32个位,只能表示2**32个数

无符号整型uint8 uint16 uint32 uint64

浮点型float_ float16 float32 float64

复数型complex_ complex64 complex128


"""为了避免跟python数据类型关键字冲突 默认加下划线区分"""


# 复习mysql创建表的完整语法对应的知识点字段类型 约束条件


numpy由于主要做数学计算所以数字类型居多

常用方法


a1 = np.array([[11,22,33,44],[55,66,77,88]])

a1  # 在ipynb环境下 打印一个变量可以不使用print直接写变量名即可


# 1.转置(行列互换)

a1.T

# 2.查看数据类型

a1.dtype

# 3.查看数组内元素个数

a1.size

# 4.查看数组的维度

a1.ndim

# 5.查看数组的行列数

a1.shape  # (行数,列数)

数组创建方式

array()将列表转换为数组,可选择显式指定dtype

arange()range的numpy版,支持浮点数

    np.arange(1,10,2)

    np.arange(1.2,10,0.4)

linspace()类似arange(),第三个参数为数组长度

    np.linspace(1,10,20)

  # 这个方法与arange有一些区别,arange是顾头不顾尾,而这个方法是顾头又顾尾,在1到10之间生成的二十个数每个数字之间的距离相等的,前后两个数做减法肯定相等

zeros()根据指定形状和dtype创建全0数组

    np.zeros((3,4))

ones()根据指定形状和dtype创建全1数组

    np.ones((3,4))

empty()根据指定形状和dtype创建空数组(随机值)

    np.empty(10)

eye()根据指定边长和dtype创建单位矩阵

    np.eye(5)

#索引与切片#

1、在一维数组中,列表的所有索引方法都可以使用在数组中,而且还可以使用间断索引(花式索引)和逻辑索引;

2、在二维数组中,位置索引必须写成[rows,cols]的形式,方括号的前半部分用于锁定二维数组的行索引,后半部分用于锁定数组的列索引;

3、如果需要获取二维数组的所有行或列元素,那么,对应的行索引或列索引需要用英文状态的冒号表示;


'''一维数组'''

age = np.array([13,19,22,14,19,11])

age[-1]

age[:3]

# 间断索引(花式索引)

age[[0,3,5]]

# 逻辑索引(布尔索引)  使用较为频繁

age < 18

age[age < 18]


'''二维数组'''

array([[  1,   3,   5,   7],

       [  2,   4,   6,   8],

       [ 11,  13,  15,  17],

       [ 12,  14,  16,  18],

       [100, 101, 102, 103]])

arr1[3,3]  # 18

arr1[3,:]  # array([12, 14, 16, 18])

arr1[:,1]  # array([  3,   4,  13,  14, 101])

arr1[0:2,1:3]  # array([[3,5],[4,6]])

BMI指数 /


####### 通过pycharm实现

# 列表定义身高体重

W = [60, 65, 70, 75, 80, 85]

H = [175, 180, 185, 190, 195, 196]

# 定义一个空列表,存放计算值

bim_list = []

# 将计算值加入列表中

for i in range(len(H)):

    bim_list.append(W[i]/(H[i]/100)**2)

print(bim_list)


######## 通过numpy实现

import numpy as np

# 列表定义身高体重

H = [170,172,175,178,180,185]

W = [60,65,67,68,75,80]

# 定义数组

h = np.array(H)

w = np.array(W)

BMI = w / (h / 100) ** 2

BMI


文章转载自DATA ANALYSIS SHARING,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论