![]() ![]() |
Python程序设计与数据科学
本书首先介绍了Python编程语言的主要规范、语法和结构等内容,强调Python在数据分析、数据处理和数据组织结构中的应用,以建立起运用Python语言进行数据处理的基础。同时系统介绍进行计算机系统操作及文件读写、数据的可视化、科学计算、图像处理、数据生成和数据分析等任务的实现方法,本书主以介绍Python编程环境下数据分析软件包为主要内容,各软件包均以Python为基础,向上一层是科学计算的基础包NumPy,它对多维数组的支持和提供的数学工具远胜于原始Python,毫不夸张的说,NumPy是科学计算领域最重要的软件包之一。接着是SciPy、Matplotlib和Pandas,这三个包均以NumPy为基础。SciPy相比NumPy在统计、线性代数和微分方程求解等方面提供高阶功能。Matplotlib是一个面向绘图的软件包,在数据可视化中发挥作用。Pandas提供了名为DataFrame的数据结构,与notebook结合使数据分析变得十分高效。Seaborn是基于Matplotlib的绘图软件包,数据参数主要采用Pandas数据类型,支持用少量语句绘制出美观的图表。Scikit-learn基于NumPy和SciPy,是一个预测性分析(predictiveanalysis)工具包,提供了大量开箱即用的机器学习算法。本教材在介绍完每一个软件包后通过案例分析综合运用这些工具演示数据分析的方法和技巧。
你还可能感兴趣
我要评论
|