格发软件

首页

许可优化

产品

解决方案

服务支持

关于

在线咨询

申请试用

QR-code-company

155-2731-8020

QR-code-self

许可优化

CAD设计软件
CAE仿真软件
PLM产品周期软件
Adobe全家桶

产品

projectHover_1

许可分析

实现专业软件许可精细化管理

projectHover_2

AI分析

让数据分析更简单，决策更智能

projectHover_3

许可调配

合理管控调配许可资源

终端软件管理

终端软件管理和合规性管理共同保障终端安全

多角度管控软件使用权限，保证软件安全性

实用、强大的资产台账管理工具

行业分类

船舶行业

船舶行业

船舶行业

网络行业

网络行业

网络行业

半导体行业

半导体行业

半导体行业

半导体行业

医疗行业

医疗行业

医疗行业

军工行业

军工行业

军工行业

服务支持

服务保障

服务保障

服务保障

软件文章

软件文章

软件文章

产品教程

产品教程

产品教程

技术文档

技术文档

技术文档

关于

关于我们

关于我们

关于我们

试用产品

试用产品

试用产品

合作伙伴

合作伙伴

合作伙伴

品牌标志

品牌标志

品牌标志

apextopmenu

许可优化

许可优化

产品

解决方案

解决方案

服务支持

服务支持

关于

软件

Autocad

二维三维设计绘图软件

Solidworks

三维机械设计建模软件

jiantou

CATIA

高端三维设计制造软件

jiantou

NXUG

集成设计仿真制造平台

jiantou

Alias

曲面造型工业设计软件

jiantou

Altium Designer

Altium Designer

电子电路设计EDA工具

jiantou

Cadence

芯片系统设计EDA平台

jiantou

Matlab

科学计算仿真编程软件

jiantou

Eplan

电气工程设计管理软件

jiantou

NAPA

船舶设计分析软件

jiantou

Ansys

工程仿真分析软件

jiantou

Hyperworks

多学科CAE平台

jiantou

Adams

多体动力学仿真软件

jiantou

Abaqus

有限元分析软件

jiantou

Masta

轴系零部件强度校核软件

jiantou

Hypermill

数控加工编程CAM软件

jiantou

Ansa

有限元前处理软件

jiantou

StarCCM+

流体仿真分析软件

jiantou

Autoform

冲压成形仿真软件

jiantou

ls-dyna

显式动力学仿真软件

jiantou

3DEXPERIENCE

达索协同设计平台

jiantou

Teamcenter

产品生命周期管理软件

jiantou

Windchill

产品数据管理软件

jiantou

Systemweaver

系统工程协作平台

jiantou

Photoshop

图像处理设计软件

jiantou

Illustrator

矢量图形设计软件

jiantou

产品

许可分析

实现专业软件许可精细化管理

jiantou

AI分析

智能分析许可数据，提升使用效率

jiantou

许可调配

合理管控调配许可资源

jiantou

终端软件管理

终端软件管理

终端软件管理和合规性管理共同保障终端安全

jiantou

软件商店

多角度管控软件使用权限，保证软件安全性

jiantou

资产台账

实用、强大的资产台账管理工具

jiantou

解决方案

解决方案

汽车行业

jiantou

船舶行业

jiantou

网络行业

jiantou

半导体行业

半导体行业

jiantou

医疗行业

jiantou

军工行业

jiantou

服务支持

服务支持

服务保障

jiantou

软件文章

jiantou

产品教程

jiantou

技术文档

jiantou

关于

关于我们

jiantou

试用产品

jiantou

合作伙伴

jiantou

品牌标志

jiantou

当前位置：服务支持 > 软件文章 > Pandas五、数据类型和丢失值初窥：Pandas入门（五）：数据类型与缺失值处理

Pandas五、数据类型和丢失值初窥：Pandas入门（五）：数据类型与缺失值处理

阅读数 221

点赞 0

copyright

article_banner

读入数据：

import pandas as pd reviews = pd.read_csv("winemag-data-130k-v2.csv", index_col=0)

1、查看数据集中评分列的数据类型

dtype = reviews.points.dtypedtype'''dtype('int64')'''

2、创建一个Series，其数据来自评分（points）中的项数，要求把这些项数转换成字符串型。提示：在python中string 是 “str”

point_strings = reviews.points.astype(str)

3、有时候价格（price）列是空的，那么我们怎么统计有多少空值？

# 第一种missing_price_reviews = reviews[reviews.price.isnull()]len(missing_price_reviews)# 第二种n_missing_prices = reviews.price.isnull().sum()# 第三种n_missing_prices = pd.isnull(reviews.price).sum()'''8996'''

4、创建一个序列Series，它能够统计在region_1中的值出现的次数。需要注意的是用Unknown替换丢失的值，并降序排序。输出应有下面的样子：

'''Unknown 21247Napa Valley 4480 ... Bardolino Superiore 1Primitivo del Tarantino 1Name: region_1, Length: 1230, dtype: int64'''

我们先来处理空值，使用pandas的fillna能够让我们替代空值。下面我们用Unknown替换Nan丢失的值。

reviews_per_region = reviews.region_1.fillna('Unknown')reviews_per_region'''0 Etna1 Unknown2 Willamette Valley3 Lake Michigan Shore4 Willamette Valley5 Navarra6 Vittoria7 Alsace8 Unknown9 Alsace10 Napa Valley11 Alsace12 Alexander Valley ...'''

蓝后再统计有多少这样的这些项。这里要用到value_counts()这个函数。

reviews_per_region = reviews.region_1.fillna('Unknown').value_counts()type(reviews.region_1.fillna('Unknown'))reviews_per_region'''pandas.core.series.SeriesUnknown 21247Napa Valley 4480Columbia Valley (WA) 4124Russian River Valley 3091California 2629Paso Robles 2350Mendoza 2301Willamette Valley 2301Alsace 2163Champagne 1613Barolo 1599Finger Lakes 1565 ...'''

最后再进行降序排序：

reviews_per_region = reviews.region_1.fillna('Unknown').value_counts().sort_values(ascending=False)# type(reviews.region_1.fillna('Unknown'))reviews_per_region'''Unknown 21247Napa Valley 4480Columbia Valley (WA) 4124Russian River Valley 3091California 2629Paso Robles 2350Mendoza 2301Willamette Valley 2301Alsace 2163Champagne 1613Barolo 1599'''

注明：

以上数据来自kaggle learn

免责声明：本文系网络转载或改编，未找到原创作者，版权归原作者所有。如涉及版权，请联系删

返回上级列表

，获取更多内容

Pandas:1.创建、读和写操作：Pandas教程（一）：数据创建、读取与写入操作

UITableView基础入门：iOS UITableView基础教程：从零开始

相关文章

Pandas:1.创建、读和写操作：Pandas教程（一）：数据创建、读取与写入操作

大数据五大误区破解：挖掘数据价值的关键

时装分类与检索：DeepFashion数据集与模型

西门子PLC编程基础：数据类型深度解析

Pandas数据分析神器推荐：四款易用工具

Pandas教程（二）：索引、选择与赋值操作

NX闲置回收四种阈值场景，对比五家实测数据

AutoCAD小秘密068：保存技巧大揭秘，数据不丢失

数据挖掘软件工具：挖掘数据价值

数据科学家必备：五种数据可视化方式

维护简单高效：格发软件自动备份防止数据丢失

五轴联动数控机床战略价值与应用

数据“永不丢失”的迷思：区块链存储在实践中的挑战

数据科学导论：NoSQL数据库入门

Pandas绘图教程：pandas绘图功能详解

五金配件分类

企业软件非合规使用可能导致的法律罚款与数据丢失风险

数控钻床钻头类型与应用

转换3D数据为STP格式后，解决零件颜色信息丢失的策略

如何建立数据库模型并导入数据库：完整流程

技术文档

Pandas:1.创建、读和写操作：Pandas教程（一）：数据创建、读取与写入操作

大数据五大误区破解：挖掘数据价值的关键

时装分类与检索：DeepFashion数据集与模型

西门子PLC编程基础：数据类型深度解析

Pandas数据分析神器推荐：四款易用工具

Pandas教程（二）：索引、选择与赋值操作

NX闲置回收四种阈值场景，对比五家实测数据

AutoCAD小秘密068：保存技巧大揭秘，数据不丢失

数据挖掘软件工具：挖掘数据价值

数据科学家必备：五种数据可视化方式

维护简单高效：格发软件自动备份防止数据丢失

五轴联动数控机床战略价值与应用

数据“永不丢失”的迷思：区块链存储在实践中的挑战

数据科学导论：NoSQL数据库入门

Pandas绘图教程：pandas绘图功能详解

推荐好文

竞争优势从何而来？我们的优势全解析

支持定制的许可证管理方案，满足企业个性化需求

许可采购与许可优化：全链路成本管控方案

基于许可分析的授权规划：实现资源最优配置

软件授权解决方案：高可靠性与品质保证的完美结合

从客户需求出发：周到的服务贯穿许可管理全流程

gotoDetail

武汉格发信息技术有限公司

湖北省武汉市经开区科技园西路6号103孵化器

电话：155-2731-8020 座机：027-59821821

电子邮件：tanzw@gofarlic.com

links

友情链接

格发

发现

终端软件管理

方案

半导体行业

服务

关于

© gofarlic.com 武汉格发信息技术有限公司 - 鄂ICP备18026411号-1 - 鄂公网安备42011302000881号

隐私声明 | 使用条款 | 网站地图

联系我们

武汉格发信息技术有限公司

湖北省武汉市经开区科技园西路6号103孵化器

电话：155-2731-8020 座机：027-59821821

邮件：tanzw@gofarlic.com

发现

终端软件管理

方案

半导体行业

服务

关于

隐私声明 | 使用条款

Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利

鲁ICP备14018425号-1 鄂公网安备42011302000881号

遇到许可问题？该如何解决！？

评估许可证实际采购量？

不清楚软件许可证使用数据？

收到软件厂商律师函!?

想要少购买点许可证，节省费用？

收到软件厂商侵权通告!?

有正版license，但许可证不够用，需要新购？

联系方式

board-phone

155-2731-8020

close1

预留信息，一起解决您的问题

* 姓名：

* 手机：

* 公司名称：

姓名不为空

姓名不为空

手机不正确

手机不正确

公司不为空

公司不为空