2026/3/30 21:23:38
网站建设
项目流程
厚街网站建设价格,微信页面,百度上如何发广告,wordpress 密码看贴Pandas数据处理技巧全解析
主要章节与要点UFO 报告数据#xff08;uforeports.csv#xff09;
读取#xff1a;ufo pd.read_csv(uforeports.csv)统计并查看类别分布#xff1a;ufo[Shape Reported].value_counts(dropnaFalse)#xff08;包括缺失值#xff09;填充缺失值…Pandas数据处理技巧全解析主要章节与要点UFO 报告数据uforeports.csv读取ufo pd.read_csv(uforeports.csv)统计并查看类别分布ufo[Shape Reported].value_counts(dropnaFalse)包括缺失值填充缺失值ufo[Shape Reported].fillna(valueVARIOUS, inplaceTrue)将缺失值用VARIOUS替换常见行/列选择使用loc选择指定行/列例如ufo.loc[[0,1,2], :]、ufo.loc[:, [Colors Reported,Shape Reported,State]]条件过滤ufo[ufo.City Oakland]或ufo.loc[ufo.City Oakland,State]用例演示删除列.drop()、查看尾部数据.head()/.tail()等pandas 索引Index及drinksbycountry.csv读取drinks pd.read_csv(drinksbycountry.csv)查看索引与列drinks.index、drinks.columns、drinks.shape将列设为索引drinks.set_index(country, inplaceTrue)随后可用drinks.loc[Brazil,beer_servings]用国家名访问行。重置索引并恢复默认整数索引drinks.reset_index(inplaceTrue)修改索引名称drinks.index.name country或drinks.index.name None按索引或列进行统计drinks.describe()和对统计结果的定位例如drinks.describe().loc[25%,beer_servings]选择多行多列与位置索引loc用法基于标签选择行列可用行标签切片、列表或布尔掩码。iloc用法基于整数位置选择例如ufo.iloc[:,0:4]。列范围切片ufo.loc[:, Colors Reported:Time]使用列名范围切片其它实用示例读取无表头、使用自定义分隔符的文件pd.read_table(movieusers.csv, headerNone, sep|)统计并排序drinks.continent.value_counts().sort_index()关键代码片段摘录并简短说明填充缺失值并统计ufo[Shape Reported].value_counts(dropnaFalse)ufo[Shape Reported].fillna(valueVARIOUS,inplaceTrue)ufo[Shape Reported].value_counts()说明先查看包含 NaN 的统计再用fillna填充最后确认填充结果。索引设置与定位drinkspd.read_csv(drinksbycountry.csv)drinks.set_index(country,inplaceTrue)drinks.loc[Brazil,beer_servings]说明把country设置为索引后可直接用国家名定位对应行的数据。loc/iloc示例# 基于标签选择ufo.loc[[0,1,2],:]# 基于位置选择ufo.iloc[:,0:4]# 选择列范围ufo.loc[:,Colors Reported:Time]描述性统计定位drinks.describe().loc[25%,beer_servings]