心本无一物 何处惹尘埃
数据科学/机器学习中如何应对超大型数据集的处理 数据科学/机器学习中如何应对超大型数据集的处理
说明在数据科学领域,python应当是目前最为常用的开发语言。由于数据分析、机器学习大部分时间基本在处理数据集,对于一般大小的数据文件,采用pandas读取基本已经足够。但若一个数据集大小达到1G甚至10G,pandas读取就显得效率太低,
2022-10-22