1、问题?
大都数数据并不是咱们自己构造的,存在文件其中。咱们必须工具去获取,然则Numpy其实并不适合去读取处理数据,这儿咱们认识关联API,以及Numpy不方便的地区就可。
2、Numpy读取genfromtxt(fname[, dtype, comments, ...]) Load data from a text file, with missing values handled as specified.
# 读取数据 test = np.genfromtxt(" ./data/numpy_test/test.csv", delimiter=,)
3、怎样处理缺失值
3.1什么是缺失值
什么时候numpy中会显现nan:当咱们读取本地的文件为float的时候,倘若有缺失(或为None),就会显现nan
3.2缺失值处理?
那样,在一组数据中单纯的把nan替换为0,合适么?会带来什么样的影响?
例如,所有替换为0后,替换之前的平均值倘若大于0,替换之后的均值肯定会变小,因此更通常的方式是把缺失的数值替换为均值(中值)或是直接删除有缺失值的一行
因此: 怎样计算一组数据的中值或是均值怎样删除有缺失数据的那一行(列)在pandas中间商绍
t中存在nan值,怎样操作把其中的nan填充为每一列的均值 t = array([[ 0., 1., 2., 3., 4., 5.], [ 6., 7., nan, 9., 10., 11.], [ 12., 13., 14., nan, 16., 17.], [ 18., 19., 20., 21., 22., 23.]])
处理规律:
|