Python机器学习入门:机器学习算法的理论与实践
定 价:79 元
《Python机器学习入门:机器学习算法的理论与实践》全面细致地讲解了机器学习的基础知识及其应用,具体内容包括机器学习中必要的环境搭建和Python的基础知识、有监督学习和无监督学习的理论及其实际应用案例、有监督学习和无监督学习的机器学习模式,并以理论结合公式的方式讲解了Python代码的编写方法,以及数据的采集、处理和实际操作中机器学习的模式。本书适合人工智能、机器学习方向的学生和技术人员学习、使用,也适合广大人工智能爱好者阅读。
人工智能无疑是近年来热门词汇,而机器学习作为其基础的理论占有举足轻重的地位,杜宇想要进入人工智能行业的您来说,节省时间、快速入门首要问题。再多的知识也要实践,现场实操,才是快速学习、消化的通路。《Python机器学习入门:机器学习算法的理论与实践》正是这样一本,从基础理论讲起,以实操驱动的方式全面展示技巧和方法,为您提供了快速入门机器学习的途径,找到了学习的方法。
原 书 前 言人工智能将为商务活动带来变革这个说法由来已久。商业界的注目使得更多的人都不断地加入这个领域中来。生活中关于人工智能的信息,从面向一般人的文章,到面向专业人士的论文,以及真假难辨的报道,层出不穷。而泛滥的信息使得初学者面临着较难的取舍选择,使得从零基础开始自学变得非常困难。着笔写这本书的时候,人工智能大多指的是,诸如本书主要讲解的机器学习算法机器学习模型以及为一般用户提供的系统课题。然而,为了实现人工智能在商务活动中的应用,理解机器学习算法和构建系统的顺序是很有必要的。本书将采用机器学习中常使用的Python程序语言,不仅从算法的理解方面,还从实际操作方面,带领大家零基础学习机器学习的模型设计。我们期待读者通过这本书,掌握机器学习在商务活动应用中的技巧。除此之外,也希望读者能明白人工智能和机器学习关于技术上指的是什么擅长做什么不擅长做什么等问题的关键。读完这本书,相信您对人工智能、机器学习会有更深入学习的兴趣。不论是想要掌握机器学习的技能从而在职场大展身手的IT工程师,还是将来想成为数据分析师的学生,如果这本书对您有帮助,我们将深感荣幸。本书的读者对象及阅读必要知识机器学习是在人工智能相关产品、服务的开发中,基础的学习领域。本书是讲解机器学习的基础和实践的书籍。本书包括机器学习开发环境的准备、实际使用方法、简单易懂的理论部分,以及数据收集、处理和相应的机器学习模式的使用方法。 Python基础的程序语言知识 大学线性代数和微积分知识本书的构成本书分为4个章节。第1章将介绍机器学习中必要的环境搭建和Python的基础知识。第2章将分别举例讲解有监督学习和无监督学习。第3章将介绍有监督学习和无监督学习的机器学习模式,主要以理论结合公式的方式讲解Python代码的编写方法。第4章将对数据的采集、处理和实际操作中机器学习模式的利用进行说明。本书样本的运行环境及样本程序本书各章的样本都是在下表给出的操作环境中运行的,并且已确认没有问题。另外,本书是以macOS操作环境为基础进行叙述的,并通过pip命令指定库解析进行安装,具体参见1.4节。运行环境项目内容项目内容OSmac OS Sierra/MohevaPandas0.24.2Python3.6.1/3.6.2/3.7.0Pillow6.0.0graphviz2.40.1scikit-learn0.20.3NumPy1.16.2SciPy1.2.1matplotlib3.0.3seaborn0.9.0mecab0.996swig3.0.12mecab-ipadic2.7.0Homebrew(版本号2.1.1)mecab-python30.996.1开发环境IPython(版本号6.2.1~7.4.0)jupyter(版本号1.0.0)
目录译者的话原书前言第1章阅读本书前的准备1.1Python的安装1.1.1何为Python1.1.2Homebrew的安装1.1.3Python3的安装1.1.4虚拟环境的创建1.1.5为何使用venv(为何不用pyenv、anaconda)1.2Python的使用方法1.2.1输出Hello World!1.2.2IPython的使用1.2.3四则运算1.2.4字符串的使用1.2.5列表类型的使用1.2.6字典类型的使用1.2.7其他数据类型1.2.8条件分支1.2.9循环1.2.10函数的使用1.2.11类的使用1.2.12标准库的使用1.3Jupyter Notebook的安装和使用1.3.1Jupyter Notebook的安装和启动1.3.2Jupyter Notebook的使用1.4NumPy、scikit-learn、matplotlib、Pandas的使用1.4.1NumPy的安装和使用1.4.2scikit-learn的安装和使用1.4.3matplotlib的安装和使用1.4.4Pandas的安装和使用第2章机器学习在实际中的使用2.1在工作中运用机器学习2.1.1关于机器学习2.1.2输入输出的格式化2.1.3分析任务的本质2.1.4实际问题的分析案例2.2用样本数据尝试有监督学习2.2.1尝试分类的案例2.2.2运用决策树分类2.2.3尝试解决实际问题2.2.4解决实际问题的注意要点2.3用样本数据尝试无监督学习2.3.1无监督学习2.3.2使用样本尝试scikit-learn2.4小结第3章机器学习基础理论3.1数学知识的准备3.1.1本节的学习流程3.1.2为什么数学是必要的3.1.3集合和函数基础3.1.4线性代数基础3.1.5微分基础3.1.6概率统计基础3.2机器学习的基础3.2.1机器学习的目的3.2.2技术性的假设和用语3.2.3有监督学习概述3.2.4从泛化误差看有监督学习3.2.5无监督学习概述3.3有监督学习3.3.1分类模型的精度评价3.3.2逻辑回归3.3.3神经网络3.3.4梯度提升决策树3.4无监督学习3.4.1混合高斯模型3.4.2k-均值3.4.3层次聚类3.4.4核密度估计3.4.5t-SNE第4章数据的整合与处理4.1机器学习中数据的使用流程4.2数据的获取和整合4.2.1数据结构的理解4.2.2从结构化数据中读取数据4.2.3读取数据4.2.4分组聚合4.2.5时间格式的操作方法4.2.6合并4.3数据的格式化4.3.1数据种类的理解4.3.2标准化4.3.3缺省值4.4非结构化数据的处理4.4.1文本数据的预处理4.4.2终端中MeCab的应用4.4.3Python中MeCab的应用4.4.4图片数据的处理4.5不平衡数据的处理4.5.1分类问题中的不平衡数据4.5.2数据不平衡问题4.5.3一般的处理方法4.5.4样本权重的调整4.5.5降采样法