预备知识2-数据预处理学习笔记
为了能用深度学习来解决现实世界的问题,我们经常从预处理原始数据开始,而不是从那些准备好的张量格式数据开始。在Python中常用的数据分析工具中,我们通常使用pandas软件包。像庞大的Python生态系统中的许多其他扩展包一样, pandas可以与张量兼容。一、读取数据集创建一个虚拟数据集利用pandas读取csv数据二、缺失值处理“NaN”项代表缺失值。为了处理缺失的数据,典型的方法包括插值法和删除法,其中插值法用一个替代值弥补缺失值,而删除法则直接忽略缺失值。三、转换为张量格式来源:檐苔